1Panel-dev · shaohuzhang1 · Feb 19, 2025 · Feb 19, 2025 · shaohuzhang1 · Feb 19, 2025
diff --git a/apps/setting/models_provider/impl/base_chat_open_ai.py b/apps/setting/models_provider/impl/base_chat_open_ai.py
@@ -52,7 +52,8 @@ def _stream(
             run_manager: Optional[CallbackManagerForLLMRun] = None,
             **kwargs: Any,
     ) -> Iterator[ChatGenerationChunk]:
-
+        kwargs["stream"] = True
+        kwargs["stream_options"] = {"include_usage": True}
         """Set default stream_options."""
         stream_usage = self._should_stream_usage(kwargs.get('stream_usage'), **kwargs)
         # Note: stream_options is not a valid parameter for Azure OpenAI.
@@ -63,7 +64,6 @@ def _stream(
         if stream_usage:
             kwargs["stream_options"] = {"include_usage": stream_usage}
 
-        kwargs["stream"] = True
         payload = self._get_request_payload(messages, stop=stop, **kwargs)
         default_chunk_class: Type[BaseMessageChunk] = AIMessageChunk
         base_generation_info = {}
@@ -107,9 +107,6 @@ def _stream(
                     continue
 
                 # custom code
-                if generation_chunk.message.usage_metadata is not None:
-                    self.usage_metadata = generation_chunk.message.usage_metadata
-                # custom code
                 if len(chunk['choices']) > 0 and 'reasoning_content' in chunk['choices'][0]['delta']:
                     generation_chunk.message.additional_kwargs["reasoning_content"] = chunk['choices'][0]['delta'][
                         'reasoning_content']
@@ -121,6 +118,9 @@ def _stream(
                         generation_chunk.text, chunk=generation_chunk, logprobs=logprobs
                     )
                 is_first_chunk = False
+                # custom code
+                if generation_chunk.message.usage_metadata is not None:
+                    self.usage_metadata = generation_chunk.message.usage_metadata
                 yield generation_chunk
 
     def _create_chat_result(self,