Arize-ai · axiomofjoy · Oct 14, 2024 · Oct 14, 2024 · Oct 14, 2024 · RogerHYang
diff --git a/src/phoenix/server/api/subscriptions.py b/src/phoenix/server/api/subscriptions.py
@@ -1,20 +1,40 @@
+import json
+from dataclasses import asdict
 from datetime import datetime
-from typing import TYPE_CHECKING, AsyncIterator, List
+from enum import Enum
+from itertools import chain
+from json import JSONEncoder
+from typing import TYPE_CHECKING, Any, AsyncIterator, Iterator, List, Optional, Tuple
 
 import strawberry
+from openinference.semconv.trace import (
+    MessageAttributes,
+    OpenInferenceMimeTypeValues,
+    OpenInferenceSpanKindValues,
+    SpanAttributes,
+)
+from opentelemetry.sdk.trace import TracerProvider
+from opentelemetry.sdk.trace.export import SimpleSpanProcessor
+from opentelemetry.sdk.trace.export.in_memory_span_exporter import InMemorySpanExporter
+from opentelemetry.trace import StatusCode
+from pydantic import BaseModel
 from sqlalchemy import insert, select
 from strawberry.types import Info
+from typing_extensions import assert_never
 
 from phoenix.db import models
 from phoenix.server.api.context import Context
 from phoenix.server.api.input_types.ChatCompletionMessageInput import ChatCompletionMessageInput
 from phoenix.server.api.types.ChatCompletionMessageRole import ChatCompletionMessageRole
+from phoenix.trace.attributes import unflatten
 
 if TYPE_CHECKING:
     from openai.types.chat import (
         ChatCompletionMessageParam,
     )
 
+PLAYGROUND_PROJECT_NAME = "playground"
+
 
 @strawberry.input
 class ChatCompletionInput:
@@ -51,7 +71,9 @@ def to_openai_chat_completion_param(
                 "role": "assistant",
             }
         )
-    raise ValueError(f"Unsupported role: {message.role}")
+    if message.role is ChatCompletionMessageRole.TOOL:
+        raise NotImplementedError
+    assert_never(message.role)
 
 
 @strawberry.type
@@ -64,36 +86,79 @@ async def chat_completion(
 
         client = AsyncOpenAI()
 
-        # Loop over the input messages and map them to the OpenAI format
-
-        messages: List[ChatCompletionMessageParam] = [
-            to_openai_chat_completion_param(message) for message in input.messages
-        ]
-        chunk_contents = []
-        start_time = datetime.now()
-        async for chunk in await client.chat.completions.create(
-            messages=messages,
-            model="gpt-4",
-            stream=True,
-        ):
-            choice = chunk.choices[0]
-            if choice.finish_reason is None:
-                assert isinstance(chunk_content := chunk.choices[0].delta.content, str)
-                yield chunk_content
-                chunk_contents.append(chunk_content)
-        end_time = datetime.now()
-        async with info.context.db() as session:
-            # insert dummy data
-            trace_id = str(start_time)
-            span_id = str(end_time)
-            default_project_id = await session.scalar(
-                select(models.Project.id).where(models.Project.name == "default")
+        in_memory_span_exporter = InMemorySpanExporter()
+        tracer_provider = TracerProvider()
+        tracer_provider.add_span_processor(
+            span_processor=SimpleSpanProcessor(span_exporter=in_memory_span_exporter)
+        )
+        tracer = tracer_provider.get_tracer(__name__)
+        span_name = "ChatCompletion"
+        with tracer.start_span(
+            span_name,
+            attributes=dict(
+                chain(
+                    _llm_span_kind(),
+                    _input_value_and_mime_type(input),
+                    _llm_input_messages(input.messages),
+                )
+            ),
+        ) as span:
+            chunks = []
+            chunk_contents = []
+            role: Optional[str] = None
+            async for chunk in await client.chat.completions.create(
+                messages=(to_openai_chat_completion_param(message) for message in input.messages),
+                model="gpt-4",
+                stream=True,
+            ):
+                chunks.append(chunk)
+                choice = chunk.choices[0]
+                delta = choice.delta
+                if role is None:
+                    role = delta.role
+                if choice.finish_reason is None:
+                    assert isinstance(chunk_content := delta.content, str)
+                    yield chunk_content
+                    chunk_contents.append(chunk_content)
+            span.set_status(StatusCode.OK)
+            assert role is not None
+            span.set_attributes(
+                dict(
+                    chain(
+                        _output_value_and_mime_type(chunks),
+                        _llm_output_messages(content="".join(chunk_contents), role=role),
+                    )
+                )
             )
+        assert len(spans := in_memory_span_exporter.get_finished_spans()) == 1
+        finished_span = spans[0]
+        assert finished_span.start_time is not None
+        assert finished_span.end_time is not None
+        assert (attributes := finished_span.attributes) is not None
+        start_time = _datetime(epoch_nanoseconds=finished_span.start_time)
+        end_time = _datetime(epoch_nanoseconds=finished_span.end_time)
+        trace_id = _hex(finished_span.context.trace_id)
+        span_id = _hex(finished_span.context.span_id)
+        status = finished_span.status
+        async with info.context.db() as session:
+            if (
+                playground_project_id := await session.scalar(
+                    select(models.Project.id).where(models.Project.name == PLAYGROUND_PROJECT_NAME)
+                )
+            ) is None:
+                playground_project_id = await session.scalar(
+                    insert(models.Project)
+                    .returning(models.Project.id)
+                    .values(
+                        name=PLAYGROUND_PROJECT_NAME,
+                        description="Traces from prompt playground",
+                    )
+                )
             trace_rowid = await session.scalar(
                 insert(models.Trace)
                 .returning(models.Trace.id)
                 .values(
-                    project_rowid=default_project_id,
+                    project_rowid=playground_project_id,
                     trace_id=trace_id,
                     start_time=start_time,
                     end_time=end_time,
@@ -104,18 +169,88 @@ async def chat_completion(
                     trace_rowid=trace_rowid,
                     span_id=span_id,
                     parent_id=None,
-                    name="AsyncOpenAI.chat.completion.create",
-                    span_kind="LLM",
+                    name=span_name,
+                    span_kind=LLM,
                     start_time=start_time,
                     end_time=end_time,
-                    attributes={},
-                    events=[],
-                    status_code="OK",
-                    status_message="",
-                    cumulative_error_count=0,
+                    attributes=unflatten(attributes.items()),
+                    events=finished_span.events,
+                    status_code=status.status_code.name,
+                    status_message=status.description or "",
+                    cumulative_error_count=int(not status.is_ok),
                     cumulative_llm_token_count_prompt=0,
                     cumulative_llm_token_count_completion=0,
                     llm_token_count_prompt=0,
                     llm_token_count_completion=0,
                 )
             )
+
+
+def _llm_span_kind() -> Iterator[Tuple[str, Any]]:
+    yield OPENINFERENCE_SPAN_KIND, LLM
+
+
+def _input_value_and_mime_type(input: ChatCompletionInput) -> Iterator[Tuple[str, Any]]:
+    yield INPUT_MIME_TYPE, JSON
+    yield INPUT_VALUE, json.dumps(asdict(input), cls=GraphQLInputJSONEncoder)
+
+
+def _output_value_and_mime_type(output: Any) -> Iterator[Tuple[str, Any]]:
+    yield OUTPUT_MIME_TYPE, JSON
+    yield OUTPUT_VALUE, json.dumps(output, cls=ChatCompletionOutputJSONEncoder)
+
+
+def _llm_input_messages(messages: List[ChatCompletionMessageInput]) -> Iterator[Tuple[str, Any]]:
+    for i, message in enumerate(messages):
+        yield f"{LLM_INPUT_MESSAGES}.{i}.{MESSAGE_ROLE}", message.role.value.lower()
+        yield f"{LLM_INPUT_MESSAGES}.{i}.{MESSAGE_CONTENT}", message.content
+
+
+def _llm_output_messages(content: str, role: str) -> Iterator[Tuple[str, Any]]:
+    yield f"{LLM_OUTPUT_MESSAGES}.0.{MESSAGE_ROLE}", role
+    yield f"{LLM_OUTPUT_MESSAGES}.0.{MESSAGE_CONTENT}", content
+
+
+def _hex(number: int) -> str:
+    """
+    Converts an integer to a hexadecimal string.
+    """
+    return hex(number)[2:]
+
+
+def _datetime(*, epoch_nanoseconds: float) -> datetime:
+    """
+    Converts a Unix epoch timestamp in nanoseconds to a datetime.
+    """
+    epoch_seconds = epoch_nanoseconds / 1e9
+    return datetime.fromtimestamp(epoch_seconds)
+
+
+class GraphQLInputJSONEncoder(JSONEncoder):
+    def default(self, obj: Any) -> Any:
+        if isinstance(obj, Enum):
+            return obj.value
+        return super().default(obj)
+
+
+class ChatCompletionOutputJSONEncoder(JSONEncoder):
+    def default(self, obj: Any) -> Any:
+        if isinstance(obj, BaseModel):
+            return obj.model_dump()
+        return super().default(obj)
+
+
+JSON = OpenInferenceMimeTypeValues.JSON.value
+
+LLM = OpenInferenceSpanKindValues.LLM.value
+
+OPENINFERENCE_SPAN_KIND = SpanAttributes.OPENINFERENCE_SPAN_KIND
+INPUT_MIME_TYPE = SpanAttributes.INPUT_MIME_TYPE
+INPUT_VALUE = SpanAttributes.INPUT_VALUE
+OUTPUT_MIME_TYPE = SpanAttributes.OUTPUT_MIME_TYPE
+OUTPUT_VALUE = SpanAttributes.OUTPUT_VALUE
+LLM_INPUT_MESSAGES = SpanAttributes.LLM_INPUT_MESSAGES
+LLM_OUTPUT_MESSAGES = SpanAttributes.LLM_OUTPUT_MESSAGES
+
+MESSAGE_CONTENT = MessageAttributes.MESSAGE_CONTENT
+MESSAGE_ROLE = MessageAttributes.MESSAGE_ROLE