nits

robertgshaw2-redhat · robertgshaw2-redhat · commit 7c31e29199e7 · 2025-04-09T17:03:55.000Z
Signed-off-by: rshaw@neuralmagic.com &lt;robertgshaw2@gmail.com&gt;
diff --git a/vllm/v1/core/kv_cache_manager.py b/vllm/v1/core/kv_cache_manager.py
@@ -30,7 +30,7 @@ def __init__(
         caching_hash_algo: str = "builtin",
         num_preallocate_tokens: int = 64,
         log_stats: bool = False,
-        connector: "KVConnectorBase_V1" = None,
+        connector: Optional["KVConnectorBase_V1"] = None,
     ) -> None:
         assert len(kv_cache_config.kv_cache_groups) == 1, (
             "KVCacheManager does not support hybrid models with more than 1 "
diff --git a/vllm/v1/core/sched/output.py b/vllm/v1/core/sched/output.py
@@ -124,5 +124,5 @@ class SchedulerOutput:
     # the bitmask for the whole batch
     grammar_bitmask: Optional[npt.NDArray[np.int32]]
 
-    # the connector metadata
+    # KV Cache Connector metadata.
     kv_connector_metadata: Optional[KVConnectorMetadata] = None
diff --git a/vllm/v1/core/sched/scheduler.py b/vllm/v1/core/sched/scheduler.py
@@ -66,11 +66,10 @@ def __init__(
         # Create KVConnector for the Scheduler. Note that each Worker
         # will have a corresponding KVConnector with Role=WORKER.
         # KV Connector pushes/pull of remote KVs for P/D and offloading.
+        self.connector = None
         if self.vllm_config.kv_transfer_config is not None:
-            self.connector = KVConnectorFactory.create_connector(
+            self.connector = KVConnectorFactory.create_connector_v1(
                 config=self.vllm_config, role=KVConnectorRole.SCHEDULER)
-        else:
-            self.connector = None
 
         num_gpu_blocks = self.cache_config.num_gpu_blocks
         assert isinstance(num_gpu_blocks, int) and num_gpu_blocks > 0