[Bugfix] Allow --skip-tokenizer-init with echo and return_token_ids (#26238)

DarkLight1337 · web-flow · commit a964e5e6c35e · 2025-10-05T05:38:53.000Z
Signed-off-by: DarkLight1337 &lt;tlleungac@connect.ust.hk&gt;
diff --git a/tests/entrypoints/openai/test_token_in_token_out.py b/tests/entrypoints/openai/test_token_in_token_out.py
@@ -54,7 +54,7 @@ async def test_token_in_token_out_and_logprobs(server):
             prompt=token_ids,
             max_tokens=20,
             temperature=0,
-            echo=False,
+            echo=True,
             extra_body={
                 "return_token_ids": True,
             },
diff --git a/vllm/entrypoints/openai/serving_completion.py b/vllm/entrypoints/openai/serving_completion.py
@@ -691,5 +691,6 @@ def _build_render_config(
             truncate_prompt_tokens=request.truncate_prompt_tokens,
             add_special_tokens=request.add_special_tokens,
             cache_salt=request.cache_salt,
-            needs_detokenization=bool(request.echo),
+            needs_detokenization=bool(request.echo
+                                      and not request.return_token_ids),
         )

Original file line number	Diff line number	Diff line change
`@@ -691,5 +691,6 @@ def _build_render_config(`
`691`	`691`	`truncate_prompt_tokens=request.truncate_prompt_tokens,`
`692`	`692`	`add_special_tokens=request.add_special_tokens,`
`693`	`693`	`cache_salt=request.cache_salt,`
`694`		`- needs_detokenization=bool(request.echo),`
	`694`	`+ needs_detokenization=bool(request.echo`
	`695`	`+ and not request.return_token_ids),`
`695`	`696`	`)`