Lightning-AI · carmocca · Jul 7, 2021 · Jul 5, 2021
@@ -171,7 +171,6 @@ def on_advance_end(self):
 
         # update plateau LR scheduler after metrics are logged
         self.update_lr_schedulers('step', update_plateau_schedulers=True)
-        self.trainer.checkpoint_connector.has_trained = True
 
         self.total_batch_idx += 1
 

@@ -278,7 +278,7 @@ def should_accumulate(self) -> bool:
     def _check_checkpoint_callback(self, should_update: bool, is_last: bool = False):
         """Checks if checkpointing needs to be done"""
         # TODO: bake this logic into the ModelCheckpoint callback
-        if should_update and self.trainer.checkpoint_connector.has_trained:
+        if should_update:
             callbacks = self.trainer.checkpoint_callbacks
 
             if is_last and any(cb.save_last and cb.verbose for cb in callbacks):

@@ -34,8 +34,6 @@ class CheckpointConnector:
     def __init__(self, trainer, resume_from_checkpoint: Optional[Union[str, Path]] = None):
         self.trainer = trainer
         self.resume_checkpoint_path = resume_from_checkpoint
-        # used to validate checkpointing logic
-        self.has_trained = False
         self._loaded_checkpoint = dict()
 
     @property

@@ -959,8 +959,6 @@ def _run_train(self) -> None:
 
         self._run_sanity_check(self.lightning_module)
 
-        self.checkpoint_connector.has_trained = False
-
         # enable train mode
         self.model.train()
         torch.set_grad_enabled(True)

@@ -1021,7 +1021,6 @@ def validation_epoch_end(self, *_):
             ...
 
     def assert_trainer_init(trainer):
-        assert not trainer.checkpoint_connector.has_trained
         assert trainer.global_step == 0
         assert trainer.current_epoch == 0
 
@@ -1057,7 +1056,6 @@ def assert_checkpoint_log_dir(idx):
 
     model = ExtendedBoringModel()
     trainer.fit(model)
-    assert trainer.checkpoint_connector.has_trained
     assert trainer.global_step == epochs * limit_train_batches
     assert trainer.current_epoch == epochs - 1
     assert_checkpoint_log_dir(0)
@@ -1081,19 +1079,16 @@ def assert_checkpoint_log_dir(idx):
         model = ExtendedBoringModel()
 
         trainer.test(model)
-        assert not trainer.checkpoint_connector.has_trained
         # resume_from_checkpoint is resumed when calling `.fit`
         assert trainer.global_step == 0
         assert trainer.current_epoch == 0
 
         trainer.fit(model)
-        assert not trainer.checkpoint_connector.has_trained
         assert trainer.global_step == epochs * limit_train_batches
         assert trainer.current_epoch == epochs
         assert_checkpoint_log_dir(idx)
 
         trainer.validate(model)
-        assert not trainer.checkpoint_connector.has_trained
         assert trainer.global_step == epochs * limit_train_batches
         assert trainer.current_epoch == epochs