livekit · chenghao-mou · Jan 30, 2026 · Jan 26, 2026 · Jan 26, 2026 · Jan 27, 2026
diff --git a/livekit-agents/livekit/agents/llm/realtime.py b/livekit-agents/livekit/agents/llm/realtime.py
@@ -182,6 +182,10 @@ def generate_reply(
     @abstractmethod
     def commit_audio(self) -> None: ...
 
+    # commit the user turn to the server
+    @abstractmethod
+    def commit_user_turn(self) -> None: ...
+
     # clear the input audio buffer to the server
     @abstractmethod
     def clear_audio(self) -> None: ...

diff --git a/livekit-agents/livekit/agents/voice/agent_activity.py b/livekit-agents/livekit/agents/voice/agent_activity.py
@@ -976,6 +976,9 @@ def clear_user_turn(self) -> None:
             self._rt_session.clear_audio()
 
     def commit_user_turn(self, *, transcript_timeout: float, stt_flush_duration: float) -> None:
+        if self._rt_session is not None:
+            self._rt_session.commit_user_turn()
-            self._rt_session.commit_user_turn()
+            self._rt_session.commit_audio()
+            self._rt_session.generate_reply()
-            self._rt_session.commit_user_turn()
+            self._rt_session.commit_audio()
+            self._rt_session.generate_reply()
+
-    def commit_user_turn(self, *, transcript_timeout: float, stt_flush_duration: float) -> None:
-        if self._rt_session is not None:
-            self._rt_session.commit_user_turn()
+    def commit_user_turn(self, *, transcript_timeout: float, stt_flush_duration: float) -> None:
+        if self._rt_session is not None:
+            try:
+                self._rt_session.commit_user_turn()
+            except llm.RealtimeError:
+                logger.exception("failed to commit user turn on realtime session")
+
-    def commit_user_turn(self, *, transcript_timeout: float, stt_flush_duration: float) -> None:
-        if self._rt_session is not None:
-            self._rt_session.commit_user_turn()
+    def commit_user_turn(self, *, transcript_timeout: float, stt_flush_duration: float) -> None:
+        if self._rt_session is not None:
+            try:
+                self._rt_session.commit_user_turn()
+            except llm.RealtimeError:
+                logger.exception("failed to commit user turn on realtime session")
+
         assert self._audio_recognition is not None
         self._audio_recognition.commit_user_turn(
             audio_detached=not self._session.input.audio_enabled,

diff --git a/...t-plugins/livekit-plugins-aws/livekit/plugins/aws/experimental/realtime/realtime_model.py b/...t-plugins/livekit-plugins-aws/livekit/plugins/aws/experimental/realtime/realtime_model.py
@@ -2005,6 +2005,9 @@ def commit_audio(self) -> None:
     def clear_audio(self) -> None:
         logger.warning("clear_audio is not supported by Nova Sonic's Realtime API")
 
+    def commit_user_turn(self) -> None:
+        logger.warning("commit_user_turn is not supported by Nova Sonic's Realtime API")
+
     def push_video(self, frame: rtc.VideoFrame) -> None:
         logger.warning("video is not supported by Nova Sonic's Realtime API")
 

diff --git a/livekit-plugins/livekit-plugins-google/livekit/plugins/google/realtime/realtime_api.py b/livekit-plugins/livekit-plugins-google/livekit/plugins/google/realtime/realtime_api.py
@@ -1225,10 +1225,13 @@ def _handle_go_away(self, go_away: types.LiveServerGoAway) -> None:
         self._session_should_close.set()
 
     def commit_audio(self) -> None:
-        pass
+        logger.warning("commit_audio is not supported by Gemini Realtime API.")
 
     def clear_audio(self) -> None:
-        pass
+        logger.warning("clear_audio is not supported by Gemini Realtime API.")
+
+    def commit_user_turn(self) -> None:
+        logger.warning("commit_user_turn is not supported by Gemini Realtime API.")
 
     def _resample_audio(self, frame: rtc.AudioFrame) -> Iterator[rtc.AudioFrame]:
         if self._input_resampler:

diff --git a/livekit-plugins/livekit-plugins-openai/livekit/plugins/openai/realtime/realtime_model.py b/livekit-plugins/livekit-plugins-openai/livekit/plugins/openai/realtime/realtime_model.py
@@ -1292,6 +1292,23 @@ def clear_audio(self) -> None:
         self.send_event(InputAudioBufferClearEvent(type="input_audio_buffer.clear"))
         self._pushed_duration_s = 0
 
+    def commit_user_turn(self) -> None:
+        if self._realtime_model._opts.turn_detection is not None and (
+            self._realtime_model._opts.turn_detection.interrupt_response
+            or self._realtime_model._opts.turn_detection.create_response
+        ):
+            logger.warning(
+                "commit_user_turn is triggered when auto response is enabled. Model behavior may be unexpected."
+            )
+
+        self.commit_audio()
+        self.send_event(
+            ResponseCreateEvent(
+                type="response.create",
+                response=RealtimeResponseCreateParams(),
+            )
+        )
+
     def generate_reply(
         self, *, instructions: NotGivenOr[str] = NOT_GIVEN
     ) -> asyncio.Future[llm.GenerationCreatedEvent]:

diff --git a/...kit-plugins/livekit-plugins-openai/livekit/plugins/openai/realtime/realtime_model_beta.py b/...kit-plugins/livekit-plugins-openai/livekit/plugins/openai/realtime/realtime_model_beta.py
@@ -1120,6 +1120,23 @@ def clear_audio(self) -> None:
         self.send_event(InputAudioBufferClearEvent(type="input_audio_buffer.clear"))
         self._pushed_duration_s = 0
 
+    def commit_user_turn(self) -> None:
+        if self._realtime_model._opts.turn_detection is not None and (
+            self._realtime_model._opts.turn_detection.interrupt_response
+            or self._realtime_model._opts.turn_detection.create_response
+        ):
+            logger.warning(
+                "commit_user_turn is triggered when auto response is enabled. Model behavior may be unexpected."
+            )
+
+        self.commit_audio()
+        self.send_event(
+            ResponseCreateEvent(
+                type="response.create",
+                response=Response(),
+            )
+        )
+
     def generate_reply(
         self, *, instructions: NotGivenOr[str] = NOT_GIVEN
     ) -> asyncio.Future[llm.GenerationCreatedEvent]:

diff --git a/livekit-plugins/livekit-plugins-ultravox/livekit/plugins/ultravox/realtime/realtime_model.py b/livekit-plugins/livekit-plugins-ultravox/livekit/plugins/ultravox/realtime/realtime_model.py
@@ -466,7 +466,7 @@ def push_audio(self, frame: rtc.AudioFrame) -> None:
 
     def push_video(self, frame: rtc.VideoFrame) -> None:
         """Push video frames (not supported by Ultravox)."""
-        pass
+        logger.warning("push_video is not supported by Ultravox.")
 
     def _send_client_event(self, event: UltravoxEvent | dict[str, Any]) -> None:
         """Send an event to the Ultravox WebSocket."""
@@ -1138,6 +1138,9 @@ def commit_audio(self) -> None:
     def clear_audio(self) -> None:
         logger.warning("clear audio is not supported by Ultravox.")
 
+    def commit_user_turn(self) -> None:
+        logger.warning("commit_user_turn is not supported by Ultravox.")
+
     def _resample_audio(self, frame: rtc.AudioFrame) -> Iterator[rtc.AudioFrame]:
         """Resample audio frame to the required sample rate."""
         if self._input_resampler: