make style && slight fix of test

rangehow · rangehow · commit 37ff9888a5fa · 2025-08-22T10:31:27.000+08:00
diff --git a/src/transformers/trainer.py b/src/transformers/trainer.py
@@ -2523,7 +2523,6 @@ def _inner_training_loop(
         start_time = time.time()
         epochs_trained = 0
         steps_trained_in_current_epoch = 0
-        steps_trained_progress_bar = None
 
         # Check if continuing training from a checkpoint
         if resume_from_checkpoint is not None and os.path.isfile(
@@ -2596,7 +2595,6 @@ def _inner_training_loop(
                 elif steps_trained_in_current_epoch == 0:
                     self._load_rng_state(resume_from_checkpoint)
 
-
             epoch_iterator = iter(epoch_dataloader)
             # We chunkify the epoch iterator into gradient accumulation steps `n` batches
             remainder = steps_in_epoch % args.gradient_accumulation_steps
@@ -2631,13 +2629,11 @@ def _inner_training_loop(
                             input_tokens = inputs[main_input_name].numel()
                             input_tokens = torch.tensor(input_tokens, device=self.args.device, dtype=torch.int64)
                             self.state.num_input_tokens_seen += self.accelerator.gather(input_tokens).sum().item()
-                
+
                     if rng_to_sync:
                         self._load_rng_state(resume_from_checkpoint)
                         rng_to_sync = False
 
-                   
-
                     if step % args.gradient_accumulation_steps == 0:
                         self.control = self.callback_handler.on_step_begin(args, self.state, self.control)
 
diff --git a/tests/trainer/test_trainer_resume.py b/tests/trainer/test_trainer_resume.py
@@ -1,14 +1,15 @@
 import os
-import shutil
+
 import torch
-from torch.utils.data import TensorDataset, Dataset
+import torch.nn as nn
+from torch.utils.data import Dataset
+
 from transformers import (
-    AutoModelForSequenceClassification,
-    AutoTokenizer,
     Trainer,
     TrainingArguments,
 )
-import torch.nn as nn
+
+from transformers.testing_utils import TestCasePlus
 
 
 class DummyModel(nn.Module):
@@ -24,6 +25,7 @@ def forward(self, input_ids=None, attention_mask=None, labels=None):
             loss = loss_fn(logits, labels)
         return {"loss": loss, "logits": logits}
 
+
 class DummyDictDataset(Dataset):
     def __init__(self, input_ids, attention_mask, labels):
         self.input_ids = input_ids
@@ -40,6 +42,7 @@ def __getitem__(self, idx):
             "labels": self.labels[idx],
         }
 
+
 def create_dummy_dataset():
     """Creates a dummy dataset for testing."""
     num_samples = 13
@@ -49,72 +52,71 @@ def create_dummy_dataset():
     dummy_labels = torch.randint(0, 2, (num_samples,))
     return DummyDictDataset(dummy_input_ids, dummy_attention_mask, dummy_labels)
 
-def test_resume_with_original_trainer():
-    """Tests the original transformers Trainer."""
-    print("Testing the original transformers Trainer...")
-    
-    # 1. Set up a dummy model
-    model = DummyModel(input_dim=10, num_labels=2)
-    dummy_dataset = create_dummy_dataset()
-
-    # 3. First training (simulate interruption)
-    output_dir_initial = "./test_original_trainer_initial"
-    training_args_initial = TrainingArguments(
-        output_dir=output_dir_initial,
-        num_train_epochs=1,
-        per_device_train_batch_size=2,
-        gradient_accumulation_steps=3,
-        save_strategy="steps",
-        save_steps=1, # Save at every step
-        report_to=[], # Disable wandb/tensorboard and other loggers
-        max_steps=2,  # Stop after step 2 to simulate interruption
-    )
-
-    trainer_initial = Trainer(
-        model=model,
-        args=training_args_initial,
-        train_dataset=dummy_dataset,
-    )
-    trainer_initial.train()
-
-    # Make sure we have a checkpoint before interruption
-    checkpoint_path = os.path.join(output_dir_initial, "checkpoint-2")
-    assert os.path.exists(checkpoint_path)
-
-    print("Second phase")
-    # 4. Resume training from checkpoint
-    output_dir_resumed = "./test_original_trainer_resumed"
-    training_args_resumed = TrainingArguments(
-        output_dir=output_dir_resumed,
-        num_train_epochs=1,
-        per_device_train_batch_size=2,
-        gradient_accumulation_steps=3,
-        save_strategy="steps",
-        save_steps=1, # Keep the same save strategy
-    )
-
-    trainer_resumed = Trainer(
-        model=model,
-        args=training_args_resumed,
-        train_dataset=dummy_dataset,
-    )
-    # Resume from the interrupted checkpoint and finish the remaining training
-    trainer_resumed.train(resume_from_checkpoint=checkpoint_path)
-
-    # 5. Assertion: Check if the final model has been saved
-    final_model_path = os.path.join(output_dir_resumed,'checkpoint-3',  "model.safetensors")
-    try:
-        assert os.path.exists(final_model_path), "Original Trainer: Final model checkpoint was not saved!"
-        print("✓ Original Trainer: Final model has been saved.")
-    except AssertionError as e:
-        print(f"✗ Original Trainer: {e}")
-
-
-    # Clean up test directories
-    shutil.rmtree(output_dir_initial)
-    shutil.rmtree(output_dir_resumed)
+
+class TestTrainerResume(TestCasePlus):
+    def test_resume_with_original_trainer(self):
+        """Tests the original transformers Trainer."""
+        print("Testing the original transformers Trainer...")
+
+        # 1. Set up a dummy model
+        model = DummyModel(input_dim=10, num_labels=2)
+        dummy_dataset = create_dummy_dataset()
+
+        # 3. First training (simulate interruption)
+        output_dir_initial = self.get_auto_remove_tmp_dir()
+        training_args_initial = TrainingArguments(
+            output_dir=output_dir_initial,
+            num_train_epochs=1,
+            per_device_train_batch_size=2,
+            gradient_accumulation_steps=3,
+            save_strategy="steps",
+            save_steps=1,  # Save at every step
+            report_to=[],  # Disable wandb/tensorboard and other loggers
+            max_steps=2,  # Stop after step 2 to simulate interruption
+        )
+
+        trainer_initial = Trainer(
+            model=model,
+            args=training_args_initial,
+            train_dataset=dummy_dataset,
+        )
+        trainer_initial.train()
+
+        # Make sure we have a checkpoint before interruption
+        checkpoint_path = os.path.join(output_dir_initial, "checkpoint-2")
+        assert os.path.exists(checkpoint_path)
+
+        print("Second phase")
+        # 4. Resume training from checkpoint
+        output_dir_resumed = self.get_auto_remove_tmp_dir()
+        training_args_resumed = TrainingArguments(
+            output_dir=output_dir_resumed,
+            num_train_epochs=1,
+            per_device_train_batch_size=2,
+            gradient_accumulation_steps=3,
+            save_strategy="steps",
+            save_steps=1,  # Keep the same save strategy
+        )
+
+        trainer_resumed = Trainer(
+            model=model,
+            args=training_args_resumed,
+            train_dataset=dummy_dataset,
+        )
+        # Resume from the interrupted checkpoint and finish the remaining training
+        trainer_resumed.train(resume_from_checkpoint=checkpoint_path)
+
+        # 5. Assertion: Check if the final model has been saved
+        final_model_path = os.path.join(output_dir_resumed, "checkpoint-3", "model.safetensors")
+        try:
+            assert os.path.exists(final_model_path), "Original Trainer: Final model checkpoint was not saved!"
+            print("✓ Original Trainer: Final model has been saved.")
+        except AssertionError as e:
+            print(f"✗ Original Trainer: {e}")
 
 
 # Run all tests
 if __name__ == "__main__":
-    test_resume_with_original_trainer()
+    import unittest
+
+    unittest.main()