debug eval script times

Signed-off-by: adithyare <adithyare@nvidia.com>
NVIDIA · Nov 19, 2024 · ca902fd · ca902fd
1 parent 15fdf8a
commit ca902fd
Showing 1 changed file with 17 additions and 9 deletions.
diff --git a/examples/nlp/language_modeling/megatron_mamba_eval.py b/examples/nlp/language_modeling/megatron_mamba_eval.py
@@ -352,23 +352,31 @@ def main(cfg) -> None:
     prompts = load_prompts(cfg)
 
     # First method of running text generation, call model.generate method
-    response = model.generate(inputs=prompts, length_params=length_params, sampling_params=sampling_params)
+    for i in range(3):
+        st = time.perf_counter()
+        response = model.generate(inputs=prompts, length_params=length_params, sampling_params=sampling_params)
+        tdiff = time.perf_counter() - st
+        print(f"[Try{i} model.generate took {tdiff} seconds...")
 
-    print("***************************")
-    print(response)
-    print("***************************")
+    #print("***************************")
+    #print(response)
+    #print("***************************")
 
     # Second method of running text generation, call trainer.predict [recommended]
     bs = 2
     ds = RequestDataSet(prompts)
     request_dl = DataLoader(dataset=ds, batch_size=bs)
     config = OmegaConf.to_container(cfg.inference)
     model.set_inference_config(config)
-    response = trainer.predict(model, request_dl)
-
-    print("***************************")
-    print(response)
-    print("***************************")
+    for i in range(3):
+        st = time.perf_counter()
+        response = trainer.predict(model, request_dl)
+        tdiff = time.perf_counter() - st
+        print(f"[Try{i} trainer.predict took {tdiff} seconds...")
+
+    #print("***************************")
+    #print(response)
+    #print("***************************")
 
     # Third method of running text generation, use inference server
     if cfg.server: