feat(api): update via SDK Studio

stainless-app[bot] · stainless-app[bot] · commit a201e22e2bad · 2025-07-29T18:29:21.000Z
diff --git a/.stats.yml b/.stats.yml
@@ -1,4 +1,4 @@
 configured_endpoints: 105
 openapi_spec_url: https://storage.googleapis.com/stainless-sdk-openapi-specs/llamastack%2Fllama-stack-client-df7a19394e9124c18ec4e888e2856d22b5ebfd6fe6fe6e929ff6cfadb2ae7e2a.yml
 openapi_spec_hash: 9428682672fdd7e2afee7af9ef849dc9
-config_hash: a2760f6aac3d1577995504a4d154a5a2
+config_hash: da8da64a2803645fa2115ed0b2d44784
diff --git a/src/llama_stack_client/resources/inference.py b/src/llama_stack_client/resources/inference.py
@@ -2,6 +2,7 @@
 
 from __future__ import annotations
 
+import typing_extensions
 from typing import List, Union, Iterable
 from typing_extensions import Literal, overload
 
@@ -183,6 +184,7 @@ def batch_completion(
             cast_to=BatchCompletion,
         )
 
+    @typing_extensions.deprecated("chat_completion is deprecated. Please use /v1/openai/v1/chat/completions.")
     @overload
     def chat_completion(
         self,
@@ -251,6 +253,7 @@ def chat_completion(
         """
         ...
 
+    @typing_extensions.deprecated("chat_completion is deprecated. Please use /v1/openai/v1/chat/completions.")
     @overload
     def chat_completion(
         self,
@@ -319,6 +322,7 @@ def chat_completion(
         """
         ...
 
+    @typing_extensions.deprecated("chat_completion is deprecated. Please use /v1/openai/v1/chat/completions.")
     @overload
     def chat_completion(
         self,
@@ -387,6 +391,7 @@ def chat_completion(
         """
         ...
 
+    @typing_extensions.deprecated("chat_completion is deprecated. Please use /v1/openai/v1/chat/completions.")
     @required_args(["messages", "model_id"], ["messages", "model_id", "stream"])
     def chat_completion(
         self,
@@ -437,6 +442,7 @@ def chat_completion(
             stream_cls=Stream[ChatCompletionResponseStreamChunk],
         )
 
+    @typing_extensions.deprecated("/v1/inference/completion is deprecated. Please use /v1/openai/v1/completions.")
     @overload
     def completion(
         self,
@@ -483,6 +489,7 @@ def completion(
         """
         ...
 
+    @typing_extensions.deprecated("/v1/inference/completion is deprecated. Please use /v1/openai/v1/completions.")
     @overload
     def completion(
         self,
@@ -529,6 +536,7 @@ def completion(
         """
         ...
 
+    @typing_extensions.deprecated("/v1/inference/completion is deprecated. Please use /v1/openai/v1/completions.")
     @overload
     def completion(
         self,
@@ -575,6 +583,7 @@ def completion(
         """
         ...
 
+    @typing_extensions.deprecated("/v1/inference/completion is deprecated. Please use /v1/openai/v1/completions.")
     @required_args(["content", "model_id"], ["content", "model_id", "stream"])
     def completion(
         self,
@@ -617,6 +626,7 @@ def completion(
             stream_cls=Stream[CompletionResponse],
         )
 
+    @typing_extensions.deprecated("/v1/inference/embeddings is deprecated. Please use /v1/openai/v1/embeddings.")
     def embeddings(
         self,
         *,
@@ -821,6 +831,7 @@ async def batch_completion(
             cast_to=BatchCompletion,
         )
 
+    @typing_extensions.deprecated("chat_completion is deprecated. Please use /v1/openai/v1/chat/completions.")
     @overload
     async def chat_completion(
         self,
@@ -889,6 +900,7 @@ async def chat_completion(
         """
         ...
 
+    @typing_extensions.deprecated("chat_completion is deprecated. Please use /v1/openai/v1/chat/completions.")
     @overload
     async def chat_completion(
         self,
@@ -957,6 +969,7 @@ async def chat_completion(
         """
         ...
 
+    @typing_extensions.deprecated("chat_completion is deprecated. Please use /v1/openai/v1/chat/completions.")
     @overload
     async def chat_completion(
         self,
@@ -1025,6 +1038,7 @@ async def chat_completion(
         """
         ...
 
+    @typing_extensions.deprecated("chat_completion is deprecated. Please use /v1/openai/v1/chat/completions.")
     @required_args(["messages", "model_id"], ["messages", "model_id", "stream"])
     async def chat_completion(
         self,
@@ -1075,6 +1089,7 @@ async def chat_completion(
             stream_cls=AsyncStream[ChatCompletionResponseStreamChunk],
         )
 
+    @typing_extensions.deprecated("/v1/inference/completion is deprecated. Please use /v1/openai/v1/completions.")
     @overload
     async def completion(
         self,
@@ -1121,6 +1136,7 @@ async def completion(
         """
         ...
 
+    @typing_extensions.deprecated("/v1/inference/completion is deprecated. Please use /v1/openai/v1/completions.")
     @overload
     async def completion(
         self,
@@ -1167,6 +1183,7 @@ async def completion(
         """
         ...
 
+    @typing_extensions.deprecated("/v1/inference/completion is deprecated. Please use /v1/openai/v1/completions.")
     @overload
     async def completion(
         self,
@@ -1213,6 +1230,7 @@ async def completion(
         """
         ...
 
+    @typing_extensions.deprecated("/v1/inference/completion is deprecated. Please use /v1/openai/v1/completions.")
     @required_args(["content", "model_id"], ["content", "model_id", "stream"])
     async def completion(
         self,
@@ -1255,6 +1273,7 @@ async def completion(
             stream_cls=AsyncStream[CompletionResponse],
         )
 
+    @typing_extensions.deprecated("/v1/inference/embeddings is deprecated. Please use /v1/openai/v1/embeddings.")
     async def embeddings(
         self,
         *,
@@ -1327,14 +1346,20 @@ def __init__(self, inference: InferenceResource) -> None:
         self.batch_completion = to_raw_response_wrapper(
             inference.batch_completion,
         )
-        self.chat_completion = to_raw_response_wrapper(
-            inference.chat_completion,
+        self.chat_completion = (  # pyright: ignore[reportDeprecated]
+            to_raw_response_wrapper(
+                inference.chat_completion  # pyright: ignore[reportDeprecated],
+            )
         )
-        self.completion = to_raw_response_wrapper(
-            inference.completion,
+        self.completion = (  # pyright: ignore[reportDeprecated]
+            to_raw_response_wrapper(
+                inference.completion  # pyright: ignore[reportDeprecated],
+            )
         )
-        self.embeddings = to_raw_response_wrapper(
-            inference.embeddings,
+        self.embeddings = (  # pyright: ignore[reportDeprecated]
+            to_raw_response_wrapper(
+                inference.embeddings  # pyright: ignore[reportDeprecated],
+            )
         )
 
 
@@ -1348,14 +1373,20 @@ def __init__(self, inference: AsyncInferenceResource) -> None:
         self.batch_completion = async_to_raw_response_wrapper(
             inference.batch_completion,
         )
-        self.chat_completion = async_to_raw_response_wrapper(
-            inference.chat_completion,
+        self.chat_completion = (  # pyright: ignore[reportDeprecated]
+            async_to_raw_response_wrapper(
+                inference.chat_completion  # pyright: ignore[reportDeprecated],
+            )
         )
-        self.completion = async_to_raw_response_wrapper(
-            inference.completion,
+        self.completion = (  # pyright: ignore[reportDeprecated]
+            async_to_raw_response_wrapper(
+                inference.completion  # pyright: ignore[reportDeprecated],
+            )
         )
-        self.embeddings = async_to_raw_response_wrapper(
-            inference.embeddings,
+        self.embeddings = (  # pyright: ignore[reportDeprecated]
+            async_to_raw_response_wrapper(
+                inference.embeddings  # pyright: ignore[reportDeprecated],
+            )
         )
 
 
@@ -1369,14 +1400,20 @@ def __init__(self, inference: InferenceResource) -> None:
         self.batch_completion = to_streamed_response_wrapper(
             inference.batch_completion,
         )
-        self.chat_completion = to_streamed_response_wrapper(
-            inference.chat_completion,
+        self.chat_completion = (  # pyright: ignore[reportDeprecated]
+            to_streamed_response_wrapper(
+                inference.chat_completion  # pyright: ignore[reportDeprecated],
+            )
         )
-        self.completion = to_streamed_response_wrapper(
-            inference.completion,
+        self.completion = (  # pyright: ignore[reportDeprecated]
+            to_streamed_response_wrapper(
+                inference.completion  # pyright: ignore[reportDeprecated],
+            )
         )
-        self.embeddings = to_streamed_response_wrapper(
-            inference.embeddings,
+        self.embeddings = (  # pyright: ignore[reportDeprecated]
+            to_streamed_response_wrapper(
+                inference.embeddings  # pyright: ignore[reportDeprecated],
+            )
         )
 
 
@@ -1390,12 +1427,18 @@ def __init__(self, inference: AsyncInferenceResource) -> None:
         self.batch_completion = async_to_streamed_response_wrapper(
             inference.batch_completion,
         )
-        self.chat_completion = async_to_streamed_response_wrapper(
-            inference.chat_completion,
+        self.chat_completion = (  # pyright: ignore[reportDeprecated]
+            async_to_streamed_response_wrapper(
+                inference.chat_completion  # pyright: ignore[reportDeprecated],
+            )
         )
-        self.completion = async_to_streamed_response_wrapper(
-            inference.completion,
+        self.completion = (  # pyright: ignore[reportDeprecated]
+            async_to_streamed_response_wrapper(
+                inference.completion  # pyright: ignore[reportDeprecated],
+            )
         )
-        self.embeddings = async_to_streamed_response_wrapper(
-            inference.embeddings,
+        self.embeddings = (  # pyright: ignore[reportDeprecated]
+            async_to_streamed_response_wrapper(
+                inference.embeddings  # pyright: ignore[reportDeprecated],
+            )
         )
diff --git a/tests/api_resources/test_inference.py b/tests/api_resources/test_inference.py