timescale · Tostino · Nov 13, 2024 · Nov 14, 2024 · Nov 14, 2024 · Nov 14, 2024
@@ -1,6 +1,7 @@
+import json
+import asyncio
 import openai
-from datetime import datetime
-from typing import Optional, Generator, Union
+from typing import Optional, Any, Dict, Callable, Awaitable
 from .secrets import reveal_secret
 
 
@@ -17,58 +18,95 @@ def get_openai_api_key(plpy, api_key_name: Optional[str] = None) -> str:
 
 def get_openai_base_url(plpy) -> Optional[str]:
     r = plpy.execute(
-        "select pg_catalog.current_setting('ai.openai_base_url', true) as base_url"
+        "SELECT pg_catalog.current_setting('ai.openai_base_url', true) AS base_url"
     )
     if len(r) == 0:
         return None
     return r[0]["base_url"]
 
 
-def make_client(
-    plpy,
-    api_key: Optional[str] = None,
-    api_key_name: Optional[str] = None,
-    base_url: Optional[str] = None,
-) -> openai.Client:
+def make_async_client(
+        plpy,
+        api_key: Optional[str] = None,
+        api_key_name: Optional[str] = None,
+        organization: Optional[str] = None,
+        base_url: Optional[str] = None,
+        timeout: Optional[float] = None,
+        max_retries: Optional[int] = None,
+        default_headers: Optional[Dict[str, str]] = None,
+        default_query: Optional[Dict[str, Any]] = None,
+        http_client: Optional[Any] = None,
+        _strict_response_validation: Optional[bool] = None
+) -> openai.AsyncOpenAI:
     if api_key is None:
         api_key = get_openai_api_key(plpy, api_key_name)
     if base_url is None:
         base_url = get_openai_base_url(plpy)
-    return openai.Client(api_key=api_key, base_url=base_url)
-
-
-def list_models(
-    plpy,
-    api_key: Optional[str] = None,
-    api_key_name: Optional[str] = None,
-    base_url: Optional[str] = None,
-) -> Generator[tuple[str, datetime, str], None, None]:
-    client = make_client(plpy, api_key, api_key_name, base_url)
-    from datetime import datetime, timezone
-
-    for model in client.models.list():
-        created = datetime.fromtimestamp(model.created, timezone.utc)
-        yield model.id, created, model.owned_by
-
-
-def embed(
-    plpy,
-    model: str,
-    input: Union[str, list[str], list[int]],
-    api_key: Optional[str] = None,
-    api_key_name: Optional[str] = None,
-    base_url: Optional[str] = None,
-    dimensions: Optional[int] = None,
-    user: Optional[str] = None,
-) -> Generator[tuple[int, list[float]], None, None]:
-    client = make_client(plpy, api_key, api_key_name, base_url)
-    args = {}
-    if dimensions is not None:
-        args["dimensions"] = dimensions
-    if user is not None:
-        args["user"] = user
-    response = client.embeddings.create(input=input, model=model, **args)
-    if not hasattr(response, "data"):
-        return None
-    for obj in response.data:
-        yield obj.index, obj.embedding
+
+    client_kwargs = prepare_kwargs({
+        "api_key": api_key,
+        "organization": organization,
+        "base_url": base_url,
+        "timeout": timeout,
+        "max_retries": max_retries,
+        "default_headers": default_headers,
+        "default_query": default_query,
+        "http_client": http_client,
+        "_strict_response_validation": _strict_response_validation
+    })
+
+    return openai.AsyncOpenAI(**client_kwargs)
+
+def get_or_create_client(plpy, GD: Dict[str, Any], api_key: str = None, api_key_name: str = None, base_url: str = None) -> Any:
+    new_config = prepare_kwargs({'api_key': api_key, 'api_key_name': api_key_name, 'base_url': base_url})
+    old_config = GD.get('openai_client', {}).get('config', {})
+    merged_config = {**old_config, **new_config}
+
+    client_needs_update = (
+            'openai_client' not in GD or
+            'client' not in GD.get('openai_client', {}) or
+            client_config_changed(old_config, merged_config)
+    )
+
+    if client_needs_update:
+        client = make_async_client(plpy, **merged_config)
+        GD['openai_client'] = {'client': client, 'config': merged_config}
+    else:
+        client = GD['openai_client']['client']
+
+    return client
+
+
+def process_json_input(input_value):
+    return json.loads(input_value) if input_value is not None else None
+
+
+def is_query_cancelled(plpy):
+    try:
+        plpy.execute("SELECT 1")
+        return False
+    except plpy.SPIError:
+        return True
+
+
+def execute_with_cancellation(plpy, client: openai.AsyncOpenAI, async_func: Callable[[openai.AsyncOpenAI, Dict[str, Any]], Awaitable[Dict[str, Any]]], **kwargs) -> Dict[str, Any]:
+    async def main():
+        task = asyncio.create_task(async_func(client, kwargs))
+        while not task.done():
+            if is_query_cancelled(plpy):
+                task.cancel()
+                raise plpy.SPIError("Query cancelled by user")
+            await asyncio.sleep(0.1)  # 100ms
+        return await task
+
+    loop = asyncio.get_event_loop()
+    result = loop.run_until_complete(main())
+    return result
+
+
+def prepare_kwargs(params: Dict[str, Any]) -> Dict[str, Any]:
+    return {k: v for k, v in params.items() if v is not None}
+
+
+def client_config_changed(old_config: Dict[str, Any], new_config: Dict[str, Any]) -> bool:
+    return any(old_config.get(k) != new_config.get(k) for k in new_config)
@@ -1,5 +1,5 @@
-openai==1.44.0
-tiktoken==0.7.0
+openai==1.51.2
+tiktoken==0.8.0
 ollama==0.2.1
 anthropic==0.29.0
 cohere==5.5.8

@@ -7,8 +7,8 @@ python_requires = >=3.10
 packages = ai
 # unfortunately, we cannot refer to the requirements.txt file with python 3.10
 install_requires =
-    openai==1.44.0
-    tiktoken==0.7.0
+    openai==1.51.2
+    tiktoken==0.8.0
     ollama==0.2.1
     anthropic==0.29.0
     cohere==5.5.8