From 53274575ea77be81191a1f55c301182ae4e03f80 Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Tue, 7 May 2024 21:10:09 -0400
Subject: [PATCH 01/12] Add browser interface + experimental studio

---
 .gitignore                    |   1 +
 package.json                  |   3 +
 src/CompletionService.js      |   8 +-
 src/service/browser.js        | 153 ++++++++
 src/service/server.js         |  76 ++++
 src/service/studio/index.html | 692 ++++++++++++++++++++++++++++++++++
 src/tools.js                  |  61 +--
 src/tools/misc.js             |  61 +++
 src/tools/tokens.js           |  13 +
 src/util.js                   |  67 +++-
 10 files changed, 1070 insertions(+), 65 deletions(-)
 create mode 100644 src/service/browser.js
 create mode 100644 src/service/server.js
 create mode 100644 src/service/studio/index.html
 create mode 100644 src/tools/misc.js
 create mode 100644 src/tools/tokens.js

diff --git a/.gitignore b/.gitignore
index 5e15658..efe9c36 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,6 +1,7 @@
 node_modules
 package-lock.json
 playground
+dist
 test/*.html
 src/tools/repos
 __*
diff --git a/package.json b/package.json
index 0296f56..5ead975 100644
--- a/package.json
+++ b/package.json
@@ -11,6 +11,7 @@
     "test": "npm run mocha",
     "pretest": "npm run lint",
     "mocha": "mocha --bail test/*.test.js",
+    "buildWeb": "browserify src/service/browser.js -o dist/langxlang.js",
     "lint": "standard",
     "fix": "standard --fix"
   },
@@ -34,6 +35,8 @@
   },
   "homepage": "https://github.com/extremeheat/LXL#readme",
   "devDependencies": {
+    "basic-ipc": "^0.1.1",
+    "browserify": "^17.0.0",
     "langxlang": "file:.",
     "mocha": "^10.0.0",
     "standard": "^17.0.0"
diff --git a/src/CompletionService.js b/src/CompletionService.js
index 4dbbbbc..89151a0 100644
--- a/src/CompletionService.js
+++ b/src/CompletionService.js
@@ -41,7 +41,9 @@ class CompletionService {
     }
     if (this.geminiApiKey) {
       const geminiList = await gemini.listModels(this.geminiApiKey)
-      Object.assign(geminiModels, Object.fromEntries(geminiList.map((e) => ([e.name, e]))))
+      Object.assign(geminiModels, Object.fromEntries(geminiList
+        .filter((e) => e.name.startsWith('models/'))
+        .map((e) => ([e.name.replace('models/', ''), e]))))
     }
     return { openai: openaiModels, google: geminiModels }
   }
@@ -107,6 +109,10 @@ class CompletionService {
         const msg = structuredClone(entry)
         if (msg.role === 'model') msg.role = 'assistant'
         if (msg.role === 'guidance') msg.role = 'assistant'
+        if (msg.text != null) {
+          delete msg.text
+          msg.content = entry.text
+        }
         return msg
       }).filter((msg) => msg.content),
       {
diff --git a/src/service/browser.js b/src/service/browser.js
new file mode 100644
index 0000000..1344269
--- /dev/null
+++ b/src/service/browser.js
@@ -0,0 +1,153 @@
+// Exports for the browser bundle
+const { EventEmitter } = require('events')
+const { getModelInfo } = require('../util')
+const ipc = require('basic-ipc/browser')
+
+const mdp = require('../tools/mdp')
+const stripping = require('../tools/stripping')
+const tokenizer = require('../tools/tokens')
+const misc = require('../tools/misc')
+
+function setValue (id, to) {
+  const el = document.getElementById(id)
+  if (el) el.value = to
+}
+function getValue (id, parser) {
+  const el = document.getElementById(id)
+  return el ? (parser ? parser(el.value) : el.value) : null
+}
+function setRangeBounds (id, min, max) {
+  const el = document.getElementById(id)
+  if (el) {
+    el.min = min
+    el.max = max
+  }
+}
+
+class Session extends EventEmitter {
+  /** @type {import('basic-ipc').ClientEx} */
+  client
+
+  constructor (options) {
+    super()
+    this.serverAddress = options.serverAddress
+  }
+
+  async connect () {
+    this.client = ipc.createClient({ ws: { url: this.serverAddress } })
+    console.log('Client', this.client)
+    window.ipcClient = this.client
+    this.ready = this.client.waitForReady()
+    await this.ready
+    const response = await this.client.request('hello', {})
+    this.setModelsList(response.models)
+    this.emit('ready')
+  }
+
+  updateForModel (model) {
+    const info = getModelInfo(model)
+    this.setGenerationOptionToDefaults(info)
+    if (this.bindings?.generationOptions?.model) {
+      setValue(this.bindings.generationOptions.model, model)
+    }
+  }
+
+  setModelsList (models) {
+    this.models = models
+    this.emit('modelsListUpdate', models)
+    // if (this.bindings.generationOptions.model) {
+    //   const el = document.getElementById(this.bindings.generationOptions.model)
+    //   const currentlySelected = el.value
+    //   el.innerHTML = '<option value="" disabled selected>Select Model</option>'
+    //   for (const model of models) {
+    //     const option = document.createElement('option')
+    //     option.value = JSON.stringify({ service: model.service, model: model.model })
+    //     option.textContent = model.displayName
+    //     el.appendChild(option)
+    //   }
+    //   // re-select the previously selected model
+    //   if (currentlySelected) {
+    //     setValue(this.bindings.generationOptions.model, currentlySelected)
+    //   } else {
+    //     console.log('No model selected, setting to default', el.selectedIndex)
+    //     el.selectedIndex = 0
+    //     window.el = el
+    //   }
+    // }
+  }
+
+  setGenerationOptionToDefaults (opts) {
+    if (opts.outputTokens != null) {
+      setRangeBounds('maxTokens', 1, opts.outputTokens)
+      setValue('maxTokens', opts.outputTokens)
+    }
+  }
+
+  setGenerationOpt (key, value) {
+    if (key === 'model') {
+      // nop
+    } else if (this.bindings.generationOptions[key]) {
+      setValue(this.bindings.generationOptions[key], value)
+      setValue('text-' + this.bindings.generationOptions[key], value)
+    }
+  }
+
+  _listenRadio (radioId, textId) {
+    const el = document.getElementById(radioId)
+    el.addEventListener('change', () => {
+      // update the accompanying text adjacent to the radio slider
+      setValue(textId, el.value)
+    })
+  }
+
+  bindForm (options) {
+    this.bindings = options
+    if (options.generationOptions) {
+      const opts = options.generationOptions
+      if (opts.temperature) this._listenRadio(opts.temperature, 'text-' + opts.temperature)
+      if (opts.maxTokens) this._listenRadio(opts.maxTokens, 'text-' + opts.maxTokens)
+      if (opts.topP) this._listenRadio(opts.topP, 'text-' + opts.topP)
+      if (opts.topK) this._listenRadio(opts.topK, 'text-' + opts.topK)
+    }
+  }
+
+  getBoundedGenerationOptions () {
+    if (!this.bindings?.generationOptions) return {}
+    const opts = this.bindings.generationOptions
+    return {
+      maxTokens: getValue(opts.maxTokens, parseInt),
+      temperature: getValue(opts.temperature, parseFloat),
+      topP: getValue(opts.topP, parseFloat),
+      topK: getValue(opts.topK, parseFloat),
+      model: getValue(opts.model, JSON.parse)
+    }
+  }
+
+  async sendChatCompletionRequest (messages, genOpts, chunkCb) {
+    await this.ready
+    const opts = { ...this.getBoundedGenerationOptions(), ...genOpts }
+    const response = await this.client.request('chatCompletion', {
+      service: opts.model.service,
+      model: opts.model.model,
+      messages,
+      generationOptions: opts
+    }, chunkCb, 1000 * 60 * 2)
+    return response
+  }
+}
+
+function createSession (options) {
+  const session = new Session(options)
+  session.connect()
+  return session
+}
+
+window.lxl = {
+  createSession,
+  tools: {
+    stripping,
+    tokenizer,
+    _segmentPromptByRoles: mdp.segmentByRoles,
+    ...misc
+  }
+}
diff --git a/src/service/server.js b/src/service/server.js
new file mode 100644
index 0000000..793ab66
--- /dev/null
+++ b/src/service/server.js
@@ -0,0 +1,76 @@
+// @ts-check
+const ipc = require('basic-ipc')
+const { toTitleCase, getModelInfo } = require('../util')
+
+async function main (port, services) {
+  /** @type {import('basic-ipc').ServerEx} */
+  const server = ipc.createServer({
+    ws: { port }
+  })
+
+  server.on('listening', () => {
+    console.log('Listening on port', port)
+  })
+
+  const servingModels = []
+  for (const serviceName in services) {
+    const service = services[serviceName]
+    const models = await service.listModels()
+    for (const author in models) {
+      for (const modelName in models[author]) {
+        try {
+          var modelInfo = getModelInfo(modelName) // eslint-disable-line no-var
+        } catch {
+          console.log('Skip', modelName, 'due to error')
+          continue
+        }
+        servingModels.push({
+          service: serviceName,
+          author,
+          model: modelName,
+          displayName: [serviceName, toTitleCase(author), modelName].filter(e => !!e).join(': '),
+          details: modelInfo
+            ? {
+                maxOutputTokens: modelInfo.outputTokens || modelInfo.contextWindow,
+                maxInputTokens: modelInfo.inputTokens
+              }
+            : null
+        })
+      }
+    }
+    // console.log('Service', serviceName, 'has models', models)
+  }
+
+  server.on('join', function (client) {
+    client.receive('hello', (/** @type {Record<String, any>} */ message, /** @type {import('basic-ipc').MessageCreator} */ resp) => {
+      resp.sendResponse({
+        models: servingModels
+      })
+    })
+
+    client.receive('chatCompletion', (req, resp) => {
+      const { service, model, messages } = req
+      const completionService = services[service || '']
+      if (!completionService) {
+        resp.sendResponse({ error: `No service for ${service}` })
+        return
+      }
+      completionService.requestChatCompletion(model, { messages }, (chunk) => {
+        resp.sendChunk(chunk)
+      })
+        .then((result) => {
+          resp.sendResponse({ result })
+        })
+        .catch((err) => {
+          console.error('Error in chatCompletion', err)
+          resp.sendResponse({ error: err.message })
+        })
+    })
+  })
+}
+
+const { CompletionService } = require('../CompletionService')
+
+const services = {}
+services[''] = new CompletionService()
+main(8091, services)
diff --git a/src/service/studio/index.html b/src/service/studio/index.html
new file mode 100644
index 0000000..b5d8292
--- /dev/null
+++ b/src/service/studio/index.html
@@ -0,0 +1,692 @@
+<!DOCTYPE html>
+<html lang="en">
+
+<head>
+  <meta charset="UTF-8">
+  <meta name="viewport" content="width=device-width, initial-scale=1.0">
+  <title>LXL Studio v1</title>
+  <link
+    href="https://fonts.googleapis.com/css2?family=Noto+Sans:ital,wght@0,100..900;1,100..900&family=Noto+Serif:ital,wght@0,100..900;1,100..900&family=Poppins:ital,wght@0,100;0,200;0,300;0,400;0,500;0,600;0,700;0,800;0,900;1,100;1,200;1,300;1,400;1,500;1,600;1,700;1,800;1,900&display=swap"
+    rel="stylesheet">
+</head>
+<style>
+  /* light mode */
+  /* :root {
+    --pageBg: #fff;
+    --panelBg: #f0f0f0;
+    --fg: #000;
+    --chatBg: #f8f8f8;
+    --borders: #ccc;
+  } */
+  /* dark mode */
+  :root {
+    --pageBg: #111;
+    --panelBg: #333;
+    --fg: #fff;
+    --chatBg: #222;
+    --borders: #444;
+
+    --btnSuggest: #825F07;
+    --btnSuggestBorder: #7B5B08;
+    /* --btnSuggest: rgb(136, 115, 0); */
+  }
+
+  body {
+    margin: 0;
+    font-family: "Noto Sans", sans-serif;
+    background-color: var(--pageBg);
+    color: var(--fg);
+  }
+
+  a {
+    color: lightblue;
+    text-decoration: none;
+  }
+
+  button {
+    font-family: "Noto Sans", sans-serif;
+  }
+
+  .container {
+    /* margin-top: 10px; */
+    margin-left: 1vw;
+    margin-right: 1vw;
+  }
+
+  .bar {
+    display: grid;
+    grid-template-columns: minmax(max-content, 1fr) auto minmax(max-content, 1fr);
+    margin: 8px;
+
+    >div {
+      display: flex;
+      align-items: center;
+    }
+
+    .buttons {
+      justify-content: flex-end;
+    }
+  }
+
+  .content {
+    display: grid;
+    grid-template-columns: 212px calc(98vw - 212px);
+
+    .panel {
+      color: var(--fg);
+
+      .panel-box {
+        padding-top: 0;
+        padding: 8px;
+        /* padding-right: 10px; */
+        border-radius: 5px;
+        background-color: var(--panelBg);
+        margin-bottom: 1vh;
+
+        .panel-title {
+          font-weight: bold;
+        }
+      }
+
+      .options {
+        padding-top: 5px;
+        padding-bottom: 5px;
+
+        .name {
+          font-weight: bold;
+          color: #E0E0E0;
+          font-family: monospace;
+        }
+
+        .ovalue {
+          /* text-align: center; */
+          margin-left: -4px;
+          display: flex;
+          vertical-align: middle;
+          justify-content: space-between;
+          align-items: center;
+        }
+
+        .auxinput {
+          width: 66px;
+          margin-left: 2px;
+          border: none;
+          color: var(--fg);
+          text-align: center;
+          border-radius: 5px;
+          vertical-align: middle;
+          background-color: var(--panelBg);
+        }
+
+        .oinput {
+          margin-top: 5px;
+          border: 0.5px solid var(--borders);
+          border-radius: 5px;
+          vertical-align: middle;
+          background-color: blue;
+          accent-color: darkgray;
+        }
+
+        .option {
+          padding-top: 5px;
+          padding-bottom: 5px;
+
+          >div {
+            vertical-align: middle;
+            /* text-align: right; */
+          }
+        }
+
+        .oinput:focus {
+          outline: 1.5px solid blue;
+        }
+      }
+    }
+
+    .conversation {
+      background-color: var(--chatBg);
+      color: var(--fg);
+      border-radius: 5px;
+      padding: 1rem;
+      margin-left: 1%;
+    }
+  }
+
+  progress {
+    /* width: 100%; */
+    /* height: 10px; */
+    /* border-radius: 10px; */
+    /* background-color: #1A1A1A; */
+    accent-color: darkgray;
+  }
+</style>
+
+<style>
+  .message {
+    display: flex;
+    margin-top: 4px;
+    padding-top: 2px;
+    padding-bottom: 2px;
+
+    /* spacing between */
+    .user {
+      margin-right: 5px;
+      margin-top: 6px;
+      width: 80px;
+      max-width: 80px;
+
+      .modelName {
+        font-weight: bold;
+        text-align: center;
+        border-radius: 6px;
+        padding: 6px;
+        background-color: #1A1A1A;
+
+        &:hover {
+          cursor: pointer;
+          background-color: #0A0A0A;
+          transition: 0.5s background-color;
+        }
+      }
+
+      .small {
+        margin-left: -10px;
+        padding-top: 2px;
+        font-size: 0.75rem;
+        color: #888;
+        text-align: right;
+      }
+    }
+
+    .text {
+      margin-left: 5px;
+      margin-top: 8px;
+      padding-bottom: 6px;
+      width: 100%;
+
+      & pre {
+        white-space: pre-wrap;
+        margin-top: 0;
+        margin-bottom: 0;
+      }
+    }
+
+    .edittext {
+      margin-top: -4px;
+      background-color: var(--panelBg);
+      color: var(--fg);
+      width: calc(100% - 1rem);
+      padding: 10px;
+      border-radius: 5px;
+      border: 1px solid var(--borders);
+    }
+  }
+
+  .messagebar {
+    width: 100%;
+    padding-top: 20px;
+
+    .message-text textarea {
+      background-color: var(--panelBg);
+      color: var(--fg);
+      width: calc(100% - 1rem);
+      padding: 10px;
+      border-radius: 5px;
+      border: 1px solid var(--borders);
+    }
+
+    .bottomrow {
+      margin-top: 10px;
+
+      .left {
+        display: inline-block;
+
+        >div {
+          display: inline-block;
+          font-size: 0.75rem;
+          vertical-align: middle;
+          text-emphasis: center;
+        }
+      }
+    }
+
+    .right {
+      /* display: inline-block; */
+      float: right;
+    }
+  }
+
+  .textarea {
+    background-color: var(--panelBg);
+    color: var(--fg);
+    width: calc(100% - 1rem);
+    padding: 10px;
+    border-radius: 5px;
+    border: 1px solid var(--borders);
+  }
+
+  .select {
+    /* margin-top: 10px; */
+    margin-left: 5px;
+    padding: 10px;
+    border-radius: 5px;
+    background-color: #1A1A1A;
+    color: var(--fg);
+    border: 1px solid var(--borders);
+
+    &:hover {
+      cursor: pointer;
+      background-color: #0A0A0A;
+      transition: 0.5s background-color;
+    }
+
+    &:disabled {
+      background-color: #505050;
+      color: #808080;
+      border: none;
+      cursor: not-allowed;
+    }
+  }
+
+  .btn {
+    margin-left: 5px;
+    padding: 10px;
+    border-radius: 5px;
+    background-color: #1A1A1A;
+    color: var(--fg);
+    border: 1px solid var(--borders);
+
+    &:hover {
+      cursor: pointer;
+      background-color: #0A0A0A;
+      transition: 0.5s background-color;
+    }
+
+    &:disabled {
+      background-color: #505050;
+      color: #808080;
+      border: none;
+      cursor: not-allowed;
+    }
+  }
+
+  .btn-suggest {
+    font-weight: bold;
+    background-color: var(--btnSuggest);
+    background-color: gainsboro;
+    color: black;
+    /* border: 1px solid var(--btnSuggestBorder); */
+
+    &:hover {
+      /* background-color: var(--btnSuggestBorder); */
+      background-color: darkgray;
+    }
+  }
+
+  #submission-text {
+    height: 80px;
+  }
+
+  .rendertext {
+
+    & ul,
+    ol,
+    p {
+      margin-top: 0;
+      margin-bottom: 6px;
+    }
+
+    & ul,
+    ol {
+      padding-left: 20px;
+      padding-bottom: 10px;
+    }
+  }
+</style>
+
+<body>
+  <dialog id="loading-modal" open>
+    <style>
+      /* add a backdrop to .container */
+      .container {
+        /* background-color: rgba(0, 0, 0, 0.5); */
+        filter: blur(2px);
+      }
+    </style>
+    <p>Please wait while the connection to the LXL server is established...</p>
+  </dialog>
+</body>
+
+<script>
+  window.debugging = true
+</script>
+<!-- <script src="d:\Development\Projects\Nodejs\node-basic-ipc\dist\basic-ipc.js"></script> -->
+<script src="https://cdnjs.cloudflare.com/ajax/libs/showdown/2.1.0/showdown.min.js"
+  integrity="sha512-LhccdVNGe2QMEfI3x4DVV3ckMRe36TfydKss6mJpdHjNFiV07dFpS2xzeZedptKZrwxfICJpez09iNioiSZ3hA=="
+  crossorigin="anonymous" referrerpolicy="no-referrer"></script>
+<script src="C:\Users\extre\Development\Projects\ML\LXL\dist\langxlang.js"></script>
+<script type="module">
+  import { h, render } from 'https://esm.sh/preact';
+  import { useState, useEffect } from 'https://esm.sh/preact/hooks';
+  import htm from 'https://esm.sh/htm';
+  // Initialize htm with Preact
+  const html = htm.bind(h);
+
+  const playground = window.lxl.createSession({
+    serverAddress: 'ws://localhost:8091'
+  })
+  playground.bindForm({
+    generationOptions: {
+      model: 'model'
+    }
+  })
+  let isReady
+  playground.on('ready', () => {
+    document.getElementById('loading-modal').remove()
+    console.log('Models', playground.models)
+    playground.setModelsList(playground.models)
+    playground.updateForModel(playground.models[0].model)
+    playground.messages = []
+    isReady = true
+  })
+  setTimeout(() => {
+    if (!isReady) {
+      // reload the page
+      window.location.reload()
+    }
+  }, 5000)
+  window.playground = playground
+
+  const nextId = () => (Date.now() << 8) | (Math.random() * 0xff)
+  function setMessageContent(id, to) {
+    to = to || ''
+    document.getElementById(id + '-edit').textContent = to
+    document.getElementById(id + '-render').textContent = to
+  }
+  function appendMessageContent(id, to) {
+    to = to || ''
+    document.getElementById(id + '-edit').textContent += to
+    document.getElementById(id + '-render').textContent += to
+  }
+
+  function md2html(text) {
+    const converter = new showdown.Converter()
+    return converter.makeHtml(text)
+  }
+
+  function countTokens(text) {
+    return window.lxl.tools.tokenizer.tokenize('gpt-4', text).length
+  }
+
+  class ChatSession {
+    constructor() {
+      this.messages = []
+    }
+
+    // Update our messages with the messages in DOM's textareas
+    updateMessagesFromDOM(containerId) {
+      const elements = document.querySelectorAll(`#${containerId} .edittext`)
+      elements.forEach((element) => {
+        const messageId = element.id.split('-')[1]
+        const message = this.messages.find(msg => msg.id === messageId)
+        if (message) {
+          message.text.raw = element.value
+          message.text.html = md2html(element.value)
+        }
+      })
+    }
+
+    async sendMessage(msg, model) {
+      // role: { name: 'User' }, text: { html: 'Hello, how are you?', raw: 'Hello, how are you?' }
+      this.messages.push({ role: { id: 'user' }, id: nextId(), text: { html: msg, raw: msg } })
+      const newModelMsg = { role: { id: 'model' }, id: nextId(), pending: true, text: { html: '', raw: '' } }
+
+      const effect = window.lxl.tools.createTypeWriterEffectStream({
+        write(chunk) {
+          appendMessageContent('message-' + newModelMsg.id, chunk)
+        }
+      })
+
+      const request = playground.sendChatCompletionRequest(this.messages.map(msg => {
+        return { role: msg.role.id, content: msg.text.raw }
+      }), { model }, (chunk) => {
+        effect(chunk)
+        newModelMsg.text.raw += (chunk.content || '')
+      })
+      playground.emit('updateError', null)
+      this.messages.push(newModelMsg)
+      playground.emit('conversationUpdate')
+      const response = await request
+      console.log('Complete Response', response)
+      if (response.error) {
+        playground.emit('updateError', response.error)
+      }
+      newModelMsg.pending = false
+      const [result] = response.result
+      newModelMsg.text.raw = result.content
+      playground.emit('conversationUpdate')
+      return response
+    }
+
+    countTokens() {
+      return this.messages.reduce((acc, msg) => acc + countTokens(msg.text.raw), 0)
+    }
+  }
+  const chatSession = new ChatSession()
+  window.chatSession = chatSession
+
+  function Bar() {
+    return html`<div class="bar">
+      <div></div>
+      <div class="title"><strong>LXL Studio</strong></div>
+      <div class="buttons">
+        <button class="btn" stylez="color:gold;font-weight: bold;">Export / Share 📤</button>
+        <button class="btn">Accounts</button>
+      </div>
+    </div>`
+  }
+
+  function PanelOptions() {
+    const options = {
+      temperature: { name: 'Temperature', range: [0, 2], default: 1 },
+      maxOutputTokens: { name: 'Output Tokens', range: [0, 1_000_000], default: 1_000_000 },
+      top_k: { name: 'Top K', range: [0, 100], default: 0 },
+      top_p: { name: 'Top P', range: [0, 1], default: 0 },
+    }
+    const optionsHtml = Object.entries(options).map(([key, opts]) => {
+      return html`<div class="option">
+        <div class="name">${opts.name}</div>
+        <div class="ovalue">
+          <input class="oinput" type="range" min="${opts.range[0]}" max="${opts.range[1]}" value="${opts.default}" />
+          <input class="auxinput" type="text" value="${opts.default}" />
+        </div>
+      </div>`
+    })
+    return html`<div class="panel-box">
+      <div class="panel-title">Options</div>
+      <div class="options">
+        ${optionsHtml}
+      </div>
+    </div>`
+  }
+
+  function Panel() {
+    return html`<div class="panel">
+      <${PanelOptions} />
+    </div>`
+  }
+
+  function pushMessageAndSubmit(userText, model) {
+    if (!model) {
+      return
+    }
+    chatSession.updateMessagesFromDOM()
+    chatSession.sendMessage(userText, typeof model === 'string' ? JSON.parse(model) : model)
+  }
+
+  // Handle tabs
+  function _onKeyDown(event) {
+    // console.log('Key down', event)
+    if (event.key === 'Tab') {
+      event.target.setRangeText('  ', event.target.selectionStart, event.target.selectionEnd, 'end');
+      event.preventDefault();
+    }
+  }
+
+  function ConversationMessage({ message: { id, role, text, pending } }) {
+    function onKeyDown(event) {
+      _onKeyDown(event)
+    }
+    const roleName = { user: 'User', model: 'Model' }[role.id]
+    const rendered = { __html: md2html(text.raw || '') }
+    // console.log('Rendering message', [text.raw, rendered])
+    return html`<div class="message" id="message-${id}">
+      <div class="user">
+        <div class="modelName">${roleName}</div>
+      </div>
+      <div class="text">
+        ${pending
+        ? html`<pre class="rendertext" id="message-${id}-render">${text.raw || ''}</pre>`
+        : html`<div class="rendertext" id="message-${id}-render" dangerouslySetInnerHTML=${rendered}></div>`
+      }
+        <textarea class="edittext" id="message-${id}-edit" style="display:none" onkeydown=${onKeyDown}>${text.raw}</textarea>
+      </div>
+    </div>`
+  }
+
+  function ConversationSubmissionBar({ updateMessages }) {
+    const [activeError, setActiveError] = useState(false)
+    const [tokenCount, setTokenCount] = useState(0)
+    const [aggregateTokenCount, setAggregateTokenCount] = useState(0)
+    const [models, setModels] = useState(playground.models || [])
+    const [activeModel, setActiveModel] = useState('')
+
+    useEffect(() => {
+      playground.on('modelsListUpdate', () => {
+        setModels(playground.models)
+        // set active to gpt-3.5-turbo
+        // const DEFAULT_MODEL = 'gpt-3.5-turbo'
+        const DEFAULT_MODEL = 'gemini-1.0-pro'
+        const model = playground.models.find(model => model.model === DEFAULT_MODEL)
+        console.log('Setting active model', model)
+        const modelValue = JSON.stringify({ service: model.service, model: model.model })
+        document.getElementById('model').value = modelValue
+        setActiveModel(modelValue)
+      })
+      playground.on('conversationUpdate', () => {
+        setAggregateTokenCount(chatSession.countTokens())
+      })
+      playground.on('updateError', (error) => {
+        setActiveError(error)
+      })
+    }, [])
+
+    function onModelChange(event) {
+      const model = event.target.value
+      setActiveModel(model)
+    }
+    function onKeyDown(event) {
+      _onKeyDown(event)
+      // if we get a control + enter, submit the message
+      if (event.key === 'Enter' && (event.ctrlKey || event.metaKey)) {
+        if (!activeModel) {
+          return
+        }
+        event.preventDefault()
+        const text = event.target.value
+        pushMessageAndSubmit(text, activeModel)
+        event.target.value = ''
+        setTokenCount(0)
+      } else {
+        setTokenCount(countTokens(event.target.value))
+      }
+    }
+    function addMessage(roleId) {
+      const el = document.getElementById('submission-text')
+      const currentText = el.value
+      console.log('Adding message', roleId, currentText)
+      chatSession.messages.push({
+        role: { id: roleId },
+        text: { raw: currentText }
+      })
+      updateMessages()
+      el.value = ''
+      setTokenCount(0)
+    }
+    function onSubmitClick() {
+      const text = document.getElementById('submission-text').value
+      pushMessageAndSubmit(text, activeModel)
+      updateMessages()
+    }
+
+    // - <a href="javascript:void">Show tokens</a>
+    return html`<div class="messagebar">
+      <div class="message-text">
+        <textarea id="submission-text" placeholder="Type a message" onkeydown=${onKeyDown}><mark>Hello world!</mark></textarea>
+      </div>
+      <div class="bottomrow">
+        <div class="left">
+          <button class="btn" onClick=${() => addMessage('user')}>Add User</button>
+          <button class="btn" onClick=${() => addMessage('model')}>Add Model</button>
+          <div style="padding-left:8px;text-align:center;width:fit-content;line-height: 1.5;">
+            <div>GPT-4 Tokens</div>
+            <div>${aggregateTokenCount} ${tokenCount ? html`+ ${tokenCount} pending` : null}</div>
+          </div>
+        </div>
+        <div class="right">
+          <progress value="50" max="100"></progress>
+          <select class="select" name="model" id="model" onChange=${onModelChange} disabled=${models.length === 0} value=${activeModel}>
+            ${models.length === 0 ? html`<option value="" disabled>Please wait...</option>` : null}
+            ${models.map(model => html`<option value=${JSON.stringify({ service: model.service, model: model.model })}>${model.displayName}</option>`)}
+          </select>
+          <button class="btn btn-suggest" onClick=${onSubmitClick} disabled=${!activeModel}>Run</button>
+        </div>
+      </div>
+      <div>
+        ${activeError ? html`<p style="color: red; text-align: center;">${activeError}</p>` : null}
+      </div>
+    </div>`
+  }
+  function ConversationMessages({ messages }) {
+    return html`<div class="messages">
+      ${messages.map(msg => html`<${ConversationMessage} message=${msg} />`)}
+    </div>`
+  }
+  function Conversation() {
+    const testMessages = [
+      { role: { name: 'User' }, text: { html: 'Hello, how are you?', raw: 'Hello, how are you?' } },
+      { role: { name: 'Model' }, text: { html: 'I am fine, thank you.', raw: 'I am fine, thank you.' } },
+    ]
+    const [messages, setMessages] = useState([...chatSession.messages])
+    function updateMessages() {
+      setMessages([...chatSession.messages])
+    }
+    useEffect(() => {
+      playground.on('conversationUpdate', updateMessages)
+    }, [])
+
+    return html`<div class="conversation">
+      <div style="font-weight: bold;">Conversation</div>
+      <${ConversationMessages} updateMessages=${updateMessages} messages=${messages} id="convo-messages" />
+      <${ConversationSubmissionBar} updateMessages=${updateMessages} />
+    </div>`
+  }
+
+  function Content() {
+    return html`<div class="content">
+      <${Panel} />
+      <${Conversation} />
+    </div>`
+  }
+
+  function App() {
+    return html`<div class="container">
+      <${Bar} />
+      <${Content} />
+    </div>`
+  }
+
+  render(html`<${App} />`, document.body);
+</script>
+
+</html>
\ No newline at end of file
diff --git a/src/tools.js b/src/tools.js
index 71cf6a1..d94f7fb 100644
--- a/src/tools.js
+++ b/src/tools.js
@@ -5,70 +5,17 @@ const yaml = require('./tools/yaml')
 const stripping = require('./tools/stripping')
 const mdp = require('./tools/mdp')
 const md = require('./tools/md')
-
-function createTypeWriterEffectStream (to = process.stdout) {
-  // Instead of writing everything at once, we want a typewriter effect
-  // so we'll write one character at a time
-  let remainingToWrite = ''
-  const interval = setInterval(() => {
-    if (remainingToWrite.length > 0) {
-      process.stdout.write(remainingToWrite.slice(0, 2))
-      remainingToWrite = remainingToWrite.slice(2)
-    }
-  }, 10)
-
-  return function (chunk) {
-    if (chunk.done) {
-      // Immediately flush whatever is left
-      to.write(remainingToWrite)
-      to.write('\n')
-      clearInterval(interval)
-    }
-    remainingToWrite += chunk.content || chunk.delta
-  }
-}
-
-function extractCodeblockFromMarkdown (md) {
-  const tokens = stripping.tokenizeMarkdown(stripping.normalizeLineEndings(md), {})
-  return tokens.reduce((acc, token) => {
-    if (token[1] === 'code') {
-      acc.push({
-        raw: token[0],
-        lang: token[2],
-        code: token[3]
-      })
-    }
-    return acc
-  }, [])
-}
-
-function extractJSFunctionCall (text, enclosing = '<FUNCTION_CALL>', closing) {
-  if (text.includes(enclosing)) {
-    let slice
-    const start = text.indexOf(enclosing)
-    if (closing) {
-      const end = text.indexOf(closing)
-      slice = text.slice(start, end + closing.length)
-    } else {
-      slice = text.slice(start)
-    }
-    const fnName = slice.slice(enclosing.length, slice.indexOf('('))
-    const args = slice.slice(slice.indexOf('(') + 1, slice.lastIndexOf(')'))
-    const argsEncapsulated = '[' + args + ']'
-    const argsArray = JSON.parse(argsEncapsulated)
-    return { name: fnName, args: argsArray }
-  }
-}
+const tokenizer = require('./tools/tokens')
+const misc = require('./tools/misc')
 
 module.exports = {
   makeVizForPrompt: viz.makeVizForPrompt,
   stripping,
+  tokenizer,
   collectFolderFiles: codebase.collectFolderFiles,
   collectGithubRepoFiles: codebase.collectGithubRepoFiles,
   concatFilesToMarkdown: codebase.concatFilesToMarkdown,
-  createTypeWriterEffectStream,
-  extractCodeblockFromMarkdown,
-  extractJSFunctionCall,
+  ...misc,
   wrapContent: mdp.wrapContentWithSufficientTokens,
   preMarkdown: mdp.preMarkdown,
   loadPrompt: mdp.loadPrompt,
diff --git a/src/tools/misc.js b/src/tools/misc.js
new file mode 100644
index 0000000..5210c3c
--- /dev/null
+++ b/src/tools/misc.js
@@ -0,0 +1,61 @@
+const stripping = require('./stripping')
+
+function createTypeWriterEffectStream (to = process.stdout) {
+  // Instead of writing everything at once, we want a typewriter effect
+  // so we'll write one character at a time
+  let remainingToWrite = ''
+  const interval = setInterval(() => {
+    if (remainingToWrite.length > 0) {
+      to.write(remainingToWrite.slice(0, 2))
+      remainingToWrite = remainingToWrite.slice(2)
+    }
+  }, 10)
+
+  return function (chunk) {
+    if (chunk.done) {
+      // Immediately flush whatever is left
+      to.write(remainingToWrite)
+      to.write('\n')
+      clearInterval(interval)
+    }
+    remainingToWrite += chunk.content || chunk.delta
+  }
+}
+
+function extractCodeblockFromMarkdown (md) {
+  const tokens = stripping.tokenizeMarkdown(stripping.normalizeLineEndings(md), {})
+  return tokens.reduce((acc, token) => {
+    if (token[1] === 'code') {
+      acc.push({
+        raw: token[0],
+        lang: token[2],
+        code: token[3]
+      })
+    }
+    return acc
+  }, [])
+}
+
+function extractJSFunctionCall (text, enclosing = '<FUNCTION_CALL>', closing) {
+  if (text.includes(enclosing)) {
+    let slice
+    const start = text.indexOf(enclosing)
+    if (closing) {
+      const end = text.indexOf(closing)
+      slice = text.slice(start, end + closing.length)
+    } else {
+      slice = text.slice(start)
+    }
+    const fnName = slice.slice(enclosing.length, slice.indexOf('('))
+    const args = slice.slice(slice.indexOf('(') + 1, slice.lastIndexOf(')'))
+    const argsEncapsulated = '[' + args + ']'
+    const argsArray = JSON.parse(argsEncapsulated)
+    return { name: fnName, args: argsArray }
+  }
+}
+
+module.exports = {
+  createTypeWriterEffectStream,
+  extractCodeblockFromMarkdown,
+  extractJSFunctionCall
+}
diff --git a/src/tools/tokens.js b/src/tools/tokens.js
new file mode 100644
index 0000000..c8fb935
--- /dev/null
+++ b/src/tools/tokens.js
@@ -0,0 +1,13 @@
+const gpt4 = require('gpt-tokenizer/cjs/model/gpt-4')
+
+function tokenize (tokenizer, data) {
+  if (tokenizer === 'gpt-4') {
+    const encoded = gpt4.encode(data)
+    return {
+      length: encoded.length
+    }
+  }
+  throw new Error('Unknown tokenizer')
+}
+
+module.exports = { tokenize }
diff --git a/src/util.js b/src/util.js
index fc109cb..b2e4faa 100644
--- a/src/util.js
+++ b/src/util.js
@@ -5,15 +5,68 @@ function cleanMessage (msg) {
   return msg.replace(/\r\n/g, '\n')
 }
 
+function toTitleCase (str) {
+  return str.charAt(0).toUpperCase() + str.slice(1)
+}
+
 const knownModelInfo = {
-  'gpt-3.5-turbo-16k': { author: 'openai', family: 'openai', displayName: 'GPT-3.5 Turbo 16k', safeId: 'gpt3_5turbo16k' },
-  'gpt-3.5-turbo': { author: 'openai', family: 'openai', displayName: 'GPT-3.5 Turbo', safeId: 'gpt3_5turbo' },
-  'gpt-4': { author: 'openai', family: 'openai', displayName: 'GPT-4', safeId: 'gpt4' },
-  'gpt-4-turbo-preview': { author: 'openai', family: 'openai', displayName: 'GPT-4 Turbo Preview', safeId: 'gpt4turbo' },
-  'gemini-1.0-pro': { author: 'google', family: 'gemini', displayName: 'Gemini 1.0 Pro', safeId: 'gemini1_0pro' },
+  // OpenAI
+  'gpt-3.5-turbo-16k': {
+    author: 'openai',
+    family: 'openai',
+    displayName: 'GPT-3.5 Turbo 16k',
+    safeId: 'gpt3_5turbo16k',
+    contextWindow: 16_000
+  },
+  'gpt-3.5-turbo': {
+    author: 'openai',
+    family: 'openai',
+    displayName: 'GPT-3.5 Turbo',
+    safeId: 'gpt3_5turbo',
+    contextWindow: 16_000
+  },
+  'gpt-4': {
+    author: 'openai',
+    family: 'openai',
+    displayName: 'GPT-4',
+    safeId: 'gpt4',
+    outputTokens: 4096
+  },
+  'gpt-4-32k': {
+    author: 'openai',
+    family: 'openai',
+    displayName: 'GPT-4 32k',
+    safeId: 'gpt4_32k',
+    outputTokens: 32_000
+  },
+  'gpt-4-turbo-preview': {
+    author: 'openai',
+    family: 'openai',
+    displayName: 'GPT-4 Turbo Preview',
+    safeId: 'gpt4turbo',
+    outputTokens: 4096
+  },
+  // Google / Gemini
+  'gemini-1.0-pro': {
+    author: 'google',
+    family: 'gemini',
+    displayName: 'Gemini 1.0 Pro',
+    safeId: 'gemini1_0pro',
+    inputTokens: 30720,
+    outputTokens: 2048
+  },
   // Gemini 1.5 Pro has 2 requests per minute
-  'gemini-1.5-pro': { author: 'google', family: 'gemini', displayName: 'Gemini 1.5 Pro', safeId: 'gemini1_5pro', rateLimit: 1000 * 30 }
+  'gemini-1.5-pro': {
+    author: 'google',
+    family: 'gemini',
+    displayName: 'Gemini 1.5 Pro',
+    safeId: 'gemini1_5pro',
+    rateLimit: 1000 * 30,
+    inputTokens: 1_048_576,
+    outputTokens: 8192
+  }
 }
+
 knownModelInfo['gemini-1.5-pro-latest'] = knownModelInfo['gemini-1.5-pro']
 const knownModels = Object.keys(knownModelInfo)
 
@@ -68,4 +121,4 @@ function checkGuidance (messages, chunkCb) {
   return ''
 }
 
-module.exports = { sleep, cleanMessage, getModelInfo, getRateLimit, checkDoesGoogleModelSupportInstructions, checkGuidance, knownModelInfo, knownModels }
+module.exports = { sleep, cleanMessage, toTitleCase, getModelInfo, getRateLimit, checkDoesGoogleModelSupportInstructions, checkGuidance, knownModelInfo, knownModels }

From 6a0a4b1683362958ef2fa4062f132bbed25d543f Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Fri, 10 May 2024 03:37:42 -0400
Subject: [PATCH 02/12] Support multimodal image input in CompleteService

---
 src/CompletionService.js | 89 ++++++++++++++++++++++++++++++++++++++--
 src/backends/gemini.js   |  2 +
 src/backends/openai.js   |  9 +++-
 src/index.d.ts           | 10 ++++-
 src/util.js              |  5 +++
 test/api.js              | 25 +++++++++++
 6 files changed, 132 insertions(+), 8 deletions(-)

diff --git a/src/CompletionService.js b/src/CompletionService.js
index 89151a0..eb18a9c 100644
--- a/src/CompletionService.js
+++ b/src/CompletionService.js
@@ -113,6 +113,27 @@ class CompletionService {
           delete msg.text
           msg.content = entry.text
         }
+        if (typeof msg.content === 'object') {
+          const updated = []
+          for (const key in msg.content) {
+            const value = msg.content[key]
+            if (value.text) {
+              updated.push({ type: 'text', text: value.text })
+            } else if (value.imageURL) {
+              updated.push({ type: 'image_url', image_url: { url: value.imageURL, detail: value.imageDetail } })
+            } else if (value.imageB64) {
+              let dataURL = value.imageB64
+              if (!dataURL.startsWith('data:')) {
+                if (!value.mimeType) throw new Error('Missing accompanying `mimeType` for imageB64 that is not a data URL')
+                dataURL = `data:${value.mimeType};base64,${dataURL}`
+              }
+              updated.push({ type: 'image_url', image_url: { url: dataURL, detail: value.imageDetail } })
+            } else if (value.image_url) {
+              updated.push({ type: 'image_url', image_url: value.image_url })
+            }
+          }
+          msg.content = updated
+        }
         return msg
       }).filter((msg) => msg.content),
       {
@@ -136,26 +157,80 @@ class CompletionService {
         tool_calls: 'function'
       }[choice.finishReason] ?? 'unknown'
       const content = guidance ? guidance + choice.content : choice.content
-      return { type: choiceType, isTruncated: choice.finishReason === 'length', ...choice, content, text: content }
+      return {
+        type: choiceType,
+        isTruncated: choice.finishReason === 'length',
+        // ...choice,
+        content,
+        text: content
+      }
     })
   }
 
   async _requestChatCompleteGemini (model, messages, { maxTokens, stopSequences, temperature, topP, topK }, functions, chunkCb) {
+    // Google Gemini doesn't support data URLs, or even remote ones, so we need to fetch them, extract data URLs then split
+    async function resolveImage (url) {
+      // fetch the URL contents to a data URL (node.js)
+      const req = await fetch(url)
+      const buffer = await req.arrayBuffer()
+      const dataURL = `data:${req.headers.get('content-type')};base64,${Buffer.from(buffer).toString('base64')}`
+      return dataURL
+    }
+
+    function splitDataURL (entry) {
+      // gemini doesn't support data URLs
+      const mimeType = entry.slice(5, entry.indexOf(';'))
+      const data = entry.slice(entry.indexOf(',') + 1)
+      return { inlineData: { mimeType, data } }
+    }
+
     if (!this.geminiApiKey) throw new Error('Gemini API key not set')
     // April 2024 - Only Gemini 1.5 supports instructions
     const supportsSystemInstruction = checkDoesGoogleModelSupportInstructions(model)
     const guidance = checkGuidance(messages, chunkCb)
+    const imagesForResolve = []
     const geminiMessages = messages.map((msg) => {
       const m = structuredClone(msg)
       if (msg.role === 'assistant') m.role = 'model'
       if (msg.role === 'system') m.role = supportsSystemInstruction ? 'system' : 'user'
       if (msg.role === 'guidance') m.role = 'model'
-      if (msg.content != null) {
+      if (typeof msg.content === 'object') {
+        const updated = []
+        for (const entry of msg.content) {
+          if (entry.text) {
+            updated.push({ text: entry.text })
+          } else if (entry.imageURL) {
+            const val = { imageURL: entry.imageURL }
+            imagesForResolve.push(val)
+            updated.push(val)
+          } else if (entry.imageB64) {
+            if (entry.imageB64.startsWith('data:')) {
+              updated.push(splitDataURL(entry.imageB64))
+            } else if (entry.mimeType) {
+              updated.push({
+                inlineData: {
+                  mimeType: entry.mimeType,
+                  data: entry.imageB64
+                }
+              })
+            }
+          }
+        }
+        delete m.content
+        m.parts = updated
+      } else if (msg.content != null) {
         delete m.content
         m.parts = [{ text: msg.content }]
       }
       return m
     }).filter((msg) => msg.parts && (msg.parts.length > 0))
+
+    for (const entry of imagesForResolve) {
+      const dataURL = await resolveImage(entry.imageURL)
+      Object.assign(entry, splitDataURL(dataURL))
+      delete entry.imageURL
+    }
+
     const response = await gemini.generateChatCompletionEx(model, geminiMessages, {
       apiKey: this.geminiApiKey,
       functions,
@@ -171,7 +246,13 @@ class CompletionService {
       const answer = response.text()
       chunkCb?.({ done: true, delta: '' })
       const content = guidance ? guidance + answer : answer
-      const result = { type: 'text', content, text: content }
+      const result = {
+        type: 'text',
+        isTruncated: response.finishReason === 'MAX_TOKENS',
+        content,
+        safetyRatings: response.safetyRatings,
+        text: content
+      }
       return [result]
     } else if (response.functionCalls()) {
       const calls = response.functionCalls()
@@ -184,7 +265,7 @@ class CompletionService {
           args: call.args
         }
       }
-      const result = { type: 'function', fnCalls }
+      const result = { type: 'function', fnCalls, safetyRatings: response.safetyRatings }
       return [result]
     } else {
       throw new Error('Unknown response from Gemini')
diff --git a/src/backends/gemini.js b/src/backends/gemini.js
index 43da004..be8caf4 100644
--- a/src/backends/gemini.js
+++ b/src/backends/gemini.js
@@ -89,6 +89,7 @@ async function generateChatCompletionIn (model, messages, options, chunkCb) {
         // Function response
         resultCandidates.push({
           type: 'function',
+          finishReason: candidate.finishReason,
           fnCalls: candidate.content.functionCalls,
           raw: data,
           safetyRatings: candidate.safetyRatings
@@ -97,6 +98,7 @@ async function generateChatCompletionIn (model, messages, options, chunkCb) {
         // Text response
         resultCandidates.push({
           type: 'text',
+          finishReason: candidate.finishReason,
           text: () => candidate.content.parts.reduce((acc, part) => acc + part.text, ''),
           raw: data,
           safetyRatings: candidate.safetyRatings
diff --git a/src/backends/openai.js b/src/backends/openai.js
index 135fcfd..53e06d8 100644
--- a/src/backends/openai.js
+++ b/src/backends/openai.js
@@ -26,7 +26,12 @@ function createChunkProcessor (chunkCb, resultChoices) {
     }
     for (const choiceId in chunk.choices) {
       const choice = chunk.choices[choiceId]
-      const resultChoice = resultChoices[choiceId] ??= { content: '', fnCalls: [], finishReason: '', safetyRatings: {} }
+      const resultChoice = resultChoices[choiceId] ??= {
+        content: '',
+        fnCalls: [],
+        finishReason: '',
+        safetyRatings: {}
+      }
       if (choice.finish_reason) {
         resultChoice.finishReason = choice.finish_reason
       }
@@ -93,7 +98,7 @@ function _sendApiRequest (apiKey, payload, chunkCb) {
       Authorization: 'Bearer ' + apiKey
     }
   }
-  debug('[OpenAI] /completions Payload', JSON.stringify(payload))
+  console.debug('[OpenAI] /completions Payload', JSON.stringify(payload))
   return new Promise((resolve, reject) => {
     const req = https.request(options, (res) => {
       if (res.statusCode !== 200) {
diff --git a/src/index.d.ts b/src/index.d.ts
index bff8280..f46a1e7 100644
--- a/src/index.d.ts
+++ b/src/index.d.ts
@@ -3,7 +3,13 @@ type CompletionResponse = { content: string, text: string }
 declare module 'langxlang' {
   type Model = 'gpt-3.5-turbo-16k' | 'gpt-3.5-turbo' | 'gpt-4' | 'gpt-4-turbo-preview' | 'gemini-1.0-pro' | 'gemini-1.5-pro-latest'
   type Role = 'system' | 'user' | 'assistant' | 'guidance'
-  type Message = { role: Role, content: string }
+  type MessagePart = 
+    | { text: string }
+    | { imageURL: string, imageDetail? }
+    | { imageB64: string, mimeType?: string, imageDetail? }
+  type Message = 
+    | { role: Role, content: string }
+    | { role: Role, content: MessagePart }
   type ChunkCb = ({ content: string }) => void
 
   type CompletionOptions = {
@@ -34,7 +40,7 @@ declare module 'langxlang' {
     listModels(): Promise<{ openai: Record<string, object>, google: Record<string, object> }>
 
     // Request a completion from the model with a system prompt and a single user prompt.
-    requestCompletion(model: Model, systemPrompt: string, userPrompt: string, _chunkCb?: ChunkCb, options?: CompletionOptions & {
+    requestCompletion(model: Model, systemPrompt: string, userPrompt: string | MessagePart[], _chunkCb?: ChunkCb, options?: CompletionOptions & {
       // If true, the response will be cached and returned from the cache if the same request is made again.
       enableCaching?: boolean
     }): Promise<CompletionResponse[]>
diff --git a/src/util.js b/src/util.js
index b2e4faa..375e6e9 100644
--- a/src/util.js
+++ b/src/util.js
@@ -1,4 +1,9 @@
 function cleanMessage (msg) {
+  if (Array.isArray(msg)) {
+    return msg.map(m => {
+      if (m.text) { m.text = cleanMessage(m.text); return m } else return m
+    })
+  }
   if (!msg) return msg
   if (msg.constructor.name === 'PromptString') return msg
   // fix systemMessage \r\n to \n
diff --git a/test/api.js b/test/api.js
index be4bdad..4da343a 100644
--- a/test/api.js
+++ b/test/api.js
@@ -170,6 +170,27 @@ async function testOptions () {
   console.log('Gemini 1.0 Pro with maxTokens=100, temp=2', resultGemini)
 }
 
+const appleIcon64 = 'data:image/webp;base64,UklGRuwNAABXRUJQVlA4TOANAAAv/8A/EOJQ27aNJO0/9r3CdVdFxATwoNnrZrFiAwqOwbrz0t+r1WXb8v+btuU8Sq9/V+7S47tO9BZ5hFzmQXKXt+A1z3/3G+bsNfdaY4z/uOqqf9s2rnZsW2vHatvu2LYOYszYTk5cZYy2Vsdo27aZVZJi23ZtRSz1FrlH3fVTDxNZBR7QkN5YLyih2EiSI0lWpUPFESlOh78p6+f8xxcvAZIk07Zicfhs27Zt27Zt237v27Zt27Zt/2fcMwFwa9tWrbTy933jfvePQwSRu5O5u7unWoC7Q4//nftgnAKwyHp6NVAEbVADIbXcFHphkNGBA0mSTOu2875t27Zt27Zt3MVhAABGLGiHTtm2+TZzbCLJlqLiq7hU/PomLpCCF0wQkZNhBQFUT4AvAalkApJZSObUyVFf5DRUcM+RbJNkY5Jxw6FkLyUr7uQQpSaZDwB8dnzJTkomXGaSeZ9mm0t2oMgkx+G0IVWy0AKTHAPJfgx7luxweXUyWcleDXuX7KvkUKUlOYxkl4YNT5NMsLDkzQGSLR82leyLZFRhdbKMYWPJ9ntZdzIDyUabSeZfVp3TWMnuDBtLtsPLWrK+YWPJzkiOQFlJjq1k040kuyo5Ql7U8nqUZA+GTSV7LJmkl7VkNcOmkn2TTMvLupOpSPavyWclx80LW7LNw6aSVXphS461ZHNNHtQ5HVRYkgMlOzVsKNnnTo6UF7bkeAwbSsZb4IM5u0HtG2sjtVHaD/o9BxygDU80aL5FMiDZhSaSbfF+60NC2ky0xWpr1LZK2zFtd7S90/Zb26Q2njau1TarbVzbD21vtd3VdkrbRm092vK0eU80DX14k2aTHNePNpDsp+TI9WN2w9q0tWVoW67twaXtFGub0/ZH21VtS7SlaNPSI8Jikh0eNvylT7k2fm0h2lZre62N1/Zd23ttmy7RI2lrSY7BRxtI9mjRHGKKHqktQtueS9tB3VnbBW3F2hRNJdmyYUPJQn0qtYH3aVv0yXawX6ntiLZIPaLM1MnE/xQku9Q5DU3BxBGxhraLbYzaPmpr0iZtJMnybcWzvPHsxmjL1Pa8jVXbf23z3m4iyW4rSHZj0dNgE22EtrSr2pi1jWob0L5F7SM5xh9VkCzKe1/84QNoC9T2qI1d23dt2doI60jWN6RL9qaTQ/WmTVfbYW28NoG/02Zkm04OcXYDyanzXrXxaWt5ZZvGV2qr14c3toxkNsPeJZvoZPK9aLPV9rBNp7aT2uQMI1lPA8n2+uTaN6WtS9t0m9LztFmY5VbvDvhTA8nCJtOmqe16m1htt19kFcnRkGy2N8n+dDJmEm3Rh7ZpPVbben1IxK0qObnD3iVb73OcaOSrjm3Tqu3bP92ukrOzwYI5aBP/XpvWY7Xtmmhybld5ffBBvUn2XzKRB9Cmoe1Jm1ZtXw+Z/fAfcMNKjv6wd8mOu7trs92mTaq2OW1rtEm4aSUnq4HkVLi7Nh9t/9qkjrR5uHElW9Wgk5m5r/HKNqU3aqvTh2i3rmT3e5Pst2Skr/HKNqEbaNumTcXNK5mwZKO9SXbMtYVqm2oTqu2KNic3sGTmw94la3untok2ndpeaktY/OEDuoUlS2pwp4/fOm9sk6nti7Z87Zt1G0vW25sA4G6ffp9sU/kVbVV6xO+5BwJo4McVZITZI8YeURBiBBg2QALoj2S7e/MhxP365hJxnrbyiSbk+QaK0QI/KIIB2Abn4BF8hF8wATzgaq0wDf/gCzyDS7Ad+iATHEB0qg7vzQnoPVFbv7ZLP4vvc9/SfrCeaXYZMIIcWAE3YGxcpxpm4DGshDiQs0BefQWS/esNAE53n+ib1WatrUDbBm1PHxTPmdoOafPV4z/kWZ51fQBoQiHshe+1/zAFV6EOdJ7cAAACAPw0ADh8zvfv/2CiSWtz1Vahbbu2Z7Mf4kWg7YO2rl09y1weGDCD7nfUwYX70AQG3f0IegFQxaYDwD6Ju4MalMHlO/x5eHf8/TN351+/cRPh3pppsi9aXLE2N0fbD23r3nn/hj3LjAxUPRfm6mDPwJP1GVeGbxIAaAoAqs4JaLCGFrg5qnOOfG8yrg9F05fG6tdYpLdkHW3JFmfc1eM1LXOvz/9xd/n55+hdv/xVfO+XN5/nGexgM4zXKOEvnIEOCN48gP0WALqCA0D0xS4PxFUCH2iAQ9fXKUx83WXtn0rHb/W1r/7k34Jn8LOhmJ3wVlZcsjfritmcb/C5ZPeMA24EB3ed9e/C/IRBu8KFcY14BkbhUfB/u5w+51Hwnw433Jueqf0N/W9ekx93mYeH/PlLVf+trv7RWvrqyfwMx/8mQ71Zf2/eO1j0DL6mA7339sJPbecje/X09K9NPwIxDJkZcIKL4xq9K+KhAYsEXmc1ergPIcEFGQEN2F1T6PQ6aIJEBD4X8dX6G7DIRXBpqIPRmkSnw0QTNEbwd5WCCtMwElyhLIAx3KqJdFoMNMFiaSbhFa5b+rogKFmvplIaNTSDy+Giwiz0MlTiAoKwo6ZT6jU0g8djo1Y4z8gmbT48qAmVBg3NEAoYqfAhjHXCAjbwtabU6bLQpEbBSYX/EJwsxmu6JtXTyNHcyRArdSVISRT4rVfTGvhcCDqDAjwSuB7xUudCZpIYVxirqfV2S0BBZkAAdyGmuZ0LCQkC831rej3VzHc8oKEPzS9MgX9yAgr/qCn2b3ecVoMgYkABv8BjUq/xzVua433BJDG4LFytiQ58r/zHA//h4E0zvRtIpgWWVYNvES4XpwSigWexunVCAvLwq5p8U8Y0GWEv8OBqdLgJVCogcmy1ChWJAH54W80+fVkaoLEaHlYlAVca/lhuBIYp2KmaHrYnIIzEQtuNQC8+qK/G/2F0i+1F/sN6O4JEbBBezQ/lscFh+90SBsXFKMCk/cZgFRdTWAsQBuP6TQl8qXv5CcQURnJUAnWlmCCuFuGLY4K1ZQBnIwqDdyuD08MIxgMq4zKoN8fzplqIUB0P9JcC7IwHTpYCvIymu+/w/aXwOUYsFpCB6VKop8QCtrUYITYWiC+HZWJ5cTn8MBZYVA5fiAV2lwPcjgUulgO8C8A4nvyOcpgOLhEHLoL35QBzXNBxnPaYcqggFgcuuV5BgHwcP5hbEIx6HGGoWpCgFQfDlAToxgF0SRwQxw/GBTE/krkFAepxALlpQYByHGGI0wsijGwcuPgxBfHBOBh0cEF0hz+OMBBel8PovDgcHpbDdICIZJ1yODiAIoFT5fA99sBIfl4OL/dIYU05XBsLDJfDg2M5pBxgZSyQWw47xXJdOWwdCziXAyTHckA5gE8sILVpMfwolrBLTJfC6EGxOLwohW/i0tE8rRTgjUcLG0rhUfFAeynAxnggvRR+Gg+4lwJkxAOqpQCu8TB804UAivFw/g7gSRnAb2DjcdhfBnDfI4a+MnhbTExaGUBbTC8rg4tiYld4bhG8ISb/UglsGqCjggMlcItHfUkJfCqu95UAlMf113EBgFtc7JIH2+9zb43L4bj9XtO9PCAy6LQfbPLIIch+UBQbu1Jj84FlbADhufV2DHuY2BzWWe83Hv2K1tsvPkZvxni7xtcdBB9td3TYFY3PYYvtTvUEQrbtzkjB/LHpwCMFgM6x3DQjmAKHZZaDY55ECLPcJmkICG9qtzHopcGfZjd4c9vbDyARJ9rtKZ7IgO6M2cArFeyB8Nhqjwnwp8J3shps82T+x2oQnQ72oNVtdjQjnA6fZ7MHe0LB3mYQn5Lg4hMsBv9BJCW+vsX+6EkFU4sxoWn5/EfsdT3wpcW3thcs8cSGURiZC2xS41tY64ncH5AciLAWVHpyT4JPtoLxgFx6fH1bvc0TPH/GVL9Ikf/NUvBk1uVBSQoEWwqKPcnBQ5xjp4WHpslPtBMs9EQHV2yhlUagnSqHeVaCfZ7sMGorGYlxSpcfZqO9PeGMOcya6IUp810sBHcDOGnLW4iJ87QvsM8VYQ9OHDjOmCdMvCe+e34BOGodeBCGTJ2vPWOcp3v6Yadt4Hrw4AwwuitZZny25xCWWuZvnsXLFtplJTDLg7/YLj/0TAbY3ayykJHJhb9vbJRNPJu39iNY1Sa3dKHz4e852iIzl3tOodUisM6zyjBPtMf1Aam8+OVzzQHJnltYZI1dcGF2QGhjWywMo+T5ZdxGlhhDiucYhiwBu2adwSyd9HI7/CMg6XkG/W9aYcR4eK5XtMJ+nm12Aay1wYFdyHx52OWHuxb4OK6M5/z58CN/RwccPO+7rpS7MWR67s/N3VEHZc9hft4efJrn/+GX5WxvdgXcgmHY3+TrCpB0GwZXZJ1cbRxQdiv+4SN5+sfz3Y5hpOBOjuBdQMstyUjCtfycw2i6LT95YG5ueZBbExjYkJclP+j2DC76/Tgje+7hJn3fxbk4GgrdqmF0PjNYcy9+7pKXHXbY4/+2wu9Gg/W9l7ldg8usPxoYeHTUC0Gpe34hn3TWHhhGbtf9tp8ZlPG2y7ppX7bCQJyw33sY6I1xQRgVqHrHQMArCHTr7vEr+NWvuXDw7wHKp/jX4HLYpv1aD9o+6QZe9rG/6wc8/cDO3tcbH7bOTB++CQte6UZeFgo+MmPJ59Z5Sxhzzhd738Me8B6o+M2OUzL+3jIBGbd0wOQDvzm9lzF8+8xhUHs2iPvA4grcDOVrnQqf5/ZyNFyDruW7XtDNHYZmtMH7IkiFpEAchJ79H0YdVzAM4REymOFnVBiLV7/wIkj63z6MH2OAy+dLYAk='
+const bingImage = 'https://www.bing.com/th?id=OHR.CratersOfTheMoon_EN-US6516727783_1920x1080.jpg&w=1000'
+
+async function testRemoteImage (model = 'gpt-4-turbo') {
+  console.log('Image complete with model', model)
+  const [result] = await completionService.requestCompletion(model, '', [
+    { text: "What's in this picture?" },
+    { imageURL: bingImage }
+  ], toTerminal)
+  console.log('Image result', result)
+}
+
+async function testImage (model = 'gemini-1.0-pro') {
+  console.log('Image complete with model', model)
+  const [result] = await completionService.requestCompletion(model, '', [
+    { text: "What's in this image?" },
+    { imageB64: appleIcon64 }
+  ], toTerminal)
+  console.log('Image result', result)
+}
+
 async function testBasic () {
   completionService.startLogging()
   await testListing()
@@ -184,6 +205,10 @@ async function testBasic () {
   await testGeminiSessionWithFuncs('gemini-1.5-pro-latest')
   await testOpenAICaching()
   await testOptions()
+  await testImage('gemini-pro-vision')
+  await testImage('gpt-4-turbo')
+  await testRemoteImage('gemini-pro-vision')
+  await testRemoteImage('gpt-4-turbo')
   const log = completionService.stopLogging()
   const html = log.exportHTML()
   fs.writeFileSync('log.html', html)

From 97399e841e22efa250c31c0b3aa6173527a3d2ed Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Fri, 10 May 2024 23:17:01 -0400
Subject: [PATCH 03/12] Update logging to support images, add chat+img test

---
 src/index.d.ts                 |  2 +-
 src/tools/logging.js           |  7 ++-
 src/tools/loggingTemplate.html | 83 ++++++++++++++++++++++++++++------
 test/api.js                    | 13 ++++++
 4 files changed, 90 insertions(+), 15 deletions(-)

diff --git a/src/index.d.ts b/src/index.d.ts
index f46a1e7..bf25f59 100644
--- a/src/index.d.ts
+++ b/src/index.d.ts
@@ -100,7 +100,7 @@ declare module 'langxlang' {
     constructor(completionService: SomeCompletionService, model: Model, systemPrompt?: string, options?: { functions?: Functions<T>, generationOptions?: CompletionOptions })
     // Send a message to the LLM and receive a response as return value. The chunkCallback
     // can be defined to listen to bits of the message stream as it's being written by the LLM.
-    sendMessage(userMessage: string, chunkCallback?: ChunkCb, generationOptions?: CompletionOptions): Promise<string>
+    sendMessage(userMessage: string | MessagePart[], chunkCallback?: ChunkCb, generationOptions?: CompletionOptions): Promise<string>
   }
 
   type StripOptions = {
diff --git a/src/tools/logging.js b/src/tools/logging.js
index 3a3f0ae..266335c 100644
--- a/src/tools/logging.js
+++ b/src/tools/logging.js
@@ -12,7 +12,12 @@ function createHTML (log) {
       on: new Date(entry.date).toISOString(),
       role: 'user',
       model: entry.model,
-      content: entry.messages ? null : [entry.system, entry.user].join('\n'),
+      content: entry.messages
+        ? null
+        : [
+            { text: entry.system || '' },
+            { text: entry.user || '' }
+          ],
       messages: entry.messages,
       generationOptions: entry.generationOptions
     })
diff --git a/src/tools/loggingTemplate.html b/src/tools/loggingTemplate.html
index d61e3d7..5ded96a 100644
--- a/src/tools/loggingTemplate.html
+++ b/src/tools/loggingTemplate.html
@@ -38,8 +38,10 @@ <h3>LXL Session Log &mdash; <span id="session-date"></span></h3>
 <script>
   document.getElementById('session-date').innerText = window.$DATE || new Date().toDateString()
   const messages = window.$ENTRIES || [
+    { role: 'user', model: 'gemini-1.5-pro-latest', on: new Date(), messages: [{ role: 'user', contents: [{ text: 'Image test' }, { imageURL: 'https://imgs.xkcd.com/comics/standards.png' }] }] },
     { role: 'user', model: 'gemini-1.5-pro-latest', on: new Date(), messages: [{ role: 'user', contents: 'Hello!' }] },
-    { role: 'model', content: 'This\nworks', model: 'gemini-1.5-pro-latest', on: new Date().toLocaleString() }
+    { role: 'model', content: 'This\nworks', model: 'gemini-1.5-pro-latest', on: new Date().toLocaleString() },
+    { role: 'model', content: [{ text: 'ok' }, { text: '!' }], model: 'gemini-1.5-pro-latest', on: new Date().toLocaleString() }
   ]
   function addMessage({ role, model, on, content, messages, generationOptions = {} }, i) {
     // const html = `
@@ -48,23 +50,80 @@ <h3>LXL Session Log &mdash; <span id="session-date"></span></h3>
     //       <strong>Model</strong><br/>
     //       <small>${model}<br/>
     //         ${on}<br/>
-    //         <a href="javascript:void">Copy Response</a>
+    //         <a href="javascript:undefined">Copy Response</a>
     //       </small>
     //     </div>
     //     <div class="contents"><pre id="contents1">${str}</pre></div>
     //   </div>
     // `
+    let contentHTML
+    function contentToHTML(content) {
+      let html = document.createElement('div')
+      if (typeof content === 'string') {
+        const pre = document.createElement('pre')
+        pre.innerText = content
+        html.appendChild(pre)
+      } else if (Array.isArray(content)) {
+        for (const part of content) {
+          if (part.imageURL || part.imageB64) {
+            if (part.imageB64) {
+              if (part.imageB64.startsWith('data:')) {
+                const img = document.createElement('img')
+                img.src = part.imageB64
+                html.appendChild(img)
+                continue
+              } else {
+                const mimeType = part.mimeType
+                const dataUrl = `data:${mimeType};base64,${part.imageB64}`
+                const img = document.createElement('img')
+                img.src = dataUrl
+                html.appendChild(img)
+              }
+            } else {
+              const img = document.createElement('img')
+              img.src = part.imageURL || part.imageB64
+              html.appendChild(img)
+            }
+          } else {
+            const pre = document.createElement('pre')
+            pre.innerText = part.text
+            html.appendChild(pre)
+          }
+        }
+      }
+      return html
+    }
     if (role === 'user' && !content) {
-      content = messages.map((entry) => `<|${entry.role.toUpperCase()}|>\n${entry.content || JSON.stringify(entry.parts)}`).join('\n')
+      contentHTML = document.createElement('div')
+      for (const message of messages) {
+        const messageDiv = document.createElement('div')
+        const roleEl = document.createElement('pre')
+        roleEl.innerText = `<|${message.role.toUpperCase()}|>`
+        messageDiv.appendChild(roleEl)
+        const contentEl = contentToHTML(message.content)
+        messageDiv.appendChild(contentEl)
+        contentHTML.appendChild(messageDiv)
+      }
+    } else {
+      contentHTML = contentToHTML(content)
     }
     function onCopyContent() {
-      navigator.clipboard.writeText(content)
+      if (messages) {
+        const textContent = messages.map(message => typeof message.content === 'string'
+          ? message.content
+          : message.content.map(part => part.text).join('\n')).join('\n')
+        navigator.clipboard.writeText(textContent)
+      } else {
+        const textContent = typeof content === 'string' ? content : content.map(part => part.text).join('\n')
+        navigator.clipboard.writeText(textContent)
+      }
     }
     function onCopyCode() {
       function stringify(content, withPadding = '') {
         return JSON.stringify(content, null, 2).split('\n').map((line, i) => i === 0 ? line : withPadding + line).join('\n')
       }
-      const data = messages ? `
+      const data = messages
+        ? `
 const { CompletionService } = require('langxlang')
 async function main () {
   const service = new CompletionService()
@@ -74,8 +133,8 @@ <h3>LXL Session Log &mdash; <span id="session-date"></span></h3>
   })
   console.log(response)
 }
-`.trim() :
-        `
+`.trim()
+        : `
 const { CompletionService } = require('langxlang')
 async function main () {
   const service = new CompletionService()
@@ -93,7 +152,7 @@ <h3>LXL Session Log &mdash; <span id="session-date"></span></h3>
     }
     const buttons = role === 'user'
       ? [
-        ['Copy Request JSON', () => navigator.clipboard.writeText(JSON.stringify(messages))],
+        ['Copy Request JSON', () => navigator.clipboard.writeText(JSON.stringify(messages || content))],
         ['Copy Request MD', onCopyContent],
         ['Copy Replay Code', onCopyCode]
       ]
@@ -126,7 +185,7 @@ <h3>LXL Session Log &mdash; <span id="session-date"></span></h3>
       for (const [name, action] of buttons) {
         const copy = document.createElement('a')
         copy.onclick = action
-        copy.href = 'javascript:void'
+        copy.href = 'javascript:undefined'
         copy.innerText = name
         small.appendChild(copy)
         small.appendChild(document.createElement('br'))
@@ -137,10 +196,8 @@ <h3>LXL Session Log &mdash; <span id="session-date"></span></h3>
     roleEl.appendChild(small)
     const contents = document.createElement('div')
     contents.className = 'contents'
-    const pre = document.createElement('pre')
-    pre.id = 'contents-' + i
-    pre.innerText = content
-    contents.appendChild(pre)
+    contentHTML.id = 'contents-' + i
+    contents.appendChild(contentHTML)
     div.appendChild(roleEl)
     div.appendChild(contents)
     document.getElementById('messages').appendChild(div)
diff --git a/test/api.js b/test/api.js
index 4da343a..89ed686 100644
--- a/test/api.js
+++ b/test/api.js
@@ -191,6 +191,18 @@ async function testImage (model = 'gemini-1.0-pro') {
   console.log('Image result', result)
 }
 
+async function testSessionImage (model) {
+  const session = new ChatSession(completionService, model, '')
+  const q = "What's in this image?"
+  console.log('> ', q)
+  const message = await session.sendMessage([
+    { text: "What's in this image?" },
+    { imageB64: appleIcon64 }
+  ], toTerminal)
+  process.stdout.write('\n')
+  console.log('Done', message)
+}
+
 async function testBasic () {
   completionService.startLogging()
   await testListing()
@@ -209,6 +221,7 @@ async function testBasic () {
   await testImage('gpt-4-turbo')
   await testRemoteImage('gemini-pro-vision')
   await testRemoteImage('gpt-4-turbo')
+  await testSessionImage('gemini-pro-vision')
   const log = completionService.stopLogging()
   const html = log.exportHTML()
   fs.writeFileSync('log.html', html)

From 5a8dfa2318fb1394264bc5cf37b7d101ad38c591 Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Sat, 11 May 2024 02:34:20 -0400
Subject: [PATCH 04/12] update browser exports

---
 src/browser.js         |  14 ++++
 src/service/browser.js | 153 -----------------------------------------
 2 files changed, 14 insertions(+), 153 deletions(-)
 create mode 100644 src/browser.js
 delete mode 100644 src/service/browser.js

diff --git a/src/browser.js b/src/browser.js
new file mode 100644
index 0000000..be2df76
--- /dev/null
+++ b/src/browser.js
@@ -0,0 +1,14 @@
+// Exports for browser bundles
+const mdp = require('./tools/mdp')
+const stripping = require('./tools/stripping')
+const tokenizer = require('./tools/tokens')
+const misc = require('./tools/misc')
+
+window.lxl = {
+  tools: {
+    stripping,
+    tokenizer,
+    _segmentPromptByRoles: mdp.segmentByRoles,
+    ...misc
+  }
+}
diff --git a/src/service/browser.js b/src/service/browser.js
deleted file mode 100644
index 1344269..0000000
--- a/src/service/browser.js
+++ /dev/null
@@ -1,153 +0,0 @@
-// Exports for the browser bundle
-const { EventEmitter } = require('events')
-const { getModelInfo } = require('../util')
-const ipc = require('basic-ipc/browser')
-
-const mdp = require('../tools/mdp')
-const stripping = require('../tools/stripping')
-const tokenizer = require('../tools/tokens')
-const misc = require('../tools/misc')
-
-function setValue (id, to) {
-  const el = document.getElementById(id)
-  if (el) el.value = to
-}
-function getValue (id, parser) {
-  const el = document.getElementById(id)
-  return el ? (parser ? parser(el.value) : el.value) : null
-}
-function setRangeBounds (id, min, max) {
-  const el = document.getElementById(id)
-  if (el) {
-    el.min = min
-    el.max = max
-  }
-}
-
-class Session extends EventEmitter {
-  /** @type {import('basic-ipc').ClientEx} */
-  client
-
-  constructor (options) {
-    super()
-    this.serverAddress = options.serverAddress
-  }
-
-  async connect () {
-    this.client = ipc.createClient({ ws: { url: this.serverAddress } })
-    console.log('Client', this.client)
-    window.ipcClient = this.client
-    this.ready = this.client.waitForReady()
-    await this.ready
-    const response = await this.client.request('hello', {})
-    this.setModelsList(response.models)
-    this.emit('ready')
-  }
-
-  updateForModel (model) {
-    const info = getModelInfo(model)
-    this.setGenerationOptionToDefaults(info)
-    if (this.bindings?.generationOptions?.model) {
-      setValue(this.bindings.generationOptions.model, model)
-    }
-  }
-
-  setModelsList (models) {
-    this.models = models
-    this.emit('modelsListUpdate', models)
-    // if (this.bindings.generationOptions.model) {
-    //   const el = document.getElementById(this.bindings.generationOptions.model)
-    //   const currentlySelected = el.value
-    //   el.innerHTML = '<option value="" disabled selected>Select Model</option>'
-    //   for (const model of models) {
-    //     const option = document.createElement('option')
-    //     option.value = JSON.stringify({ service: model.service, model: model.model })
-    //     option.textContent = model.displayName
-    //     el.appendChild(option)
-    //   }
-    //   // re-select the previously selected model
-    //   if (currentlySelected) {
-    //     setValue(this.bindings.generationOptions.model, currentlySelected)
-    //   } else {
-    //     console.log('No model selected, setting to default', el.selectedIndex)
-    //     el.selectedIndex = 0
-    //     window.el = el
-    //   }
-    // }
-  }
-
-  setGenerationOptionToDefaults (opts) {
-    if (opts.outputTokens != null) {
-      setRangeBounds('maxTokens', 1, opts.outputTokens)
-      setValue('maxTokens', opts.outputTokens)
-    }
-  }
-
-  setGenerationOpt (key, value) {
-    if (key === 'model') {
-      // nop
-    } else if (this.bindings.generationOptions[key]) {
-      setValue(this.bindings.generationOptions[key], value)
-      setValue('text-' + this.bindings.generationOptions[key], value)
-    }
-  }
-
-  _listenRadio (radioId, textId) {
-    const el = document.getElementById(radioId)
-    el.addEventListener('change', () => {
-      // update the accompanying text adjacent to the radio slider
-      setValue(textId, el.value)
-    })
-  }
-
-  bindForm (options) {
-    this.bindings = options
-    if (options.generationOptions) {
-      const opts = options.generationOptions
-      if (opts.temperature) this._listenRadio(opts.temperature, 'text-' + opts.temperature)
-      if (opts.maxTokens) this._listenRadio(opts.maxTokens, 'text-' + opts.maxTokens)
-      if (opts.topP) this._listenRadio(opts.topP, 'text-' + opts.topP)
-      if (opts.topK) this._listenRadio(opts.topK, 'text-' + opts.topK)
-    }
-  }
-
-  getBoundedGenerationOptions () {
-    if (!this.bindings?.generationOptions) return {}
-    const opts = this.bindings.generationOptions
-    return {
-      maxTokens: getValue(opts.maxTokens, parseInt),
-      temperature: getValue(opts.temperature, parseFloat),
-      topP: getValue(opts.topP, parseFloat),
-      topK: getValue(opts.topK, parseFloat),
-      model: getValue(opts.model, JSON.parse)
-    }
-  }
-
-  async sendChatCompletionRequest (messages, genOpts, chunkCb) {
-    await this.ready
-    const opts = { ...this.getBoundedGenerationOptions(), ...genOpts }
-    const response = await this.client.request('chatCompletion', {
-      service: opts.model.service,
-      model: opts.model.model,
-      messages,
-      generationOptions: opts
-    }, chunkCb, 1000 * 60 * 2)
-    return response
-  }
-}
-
-function createSession (options) {
-  const session = new Session(options)
-  session.connect()
-  return session
-}
-
-window.lxl = {
-  createSession,
-  tools: {
-    stripping,
-    tokenizer,
-    _segmentPromptByRoles: mdp.segmentByRoles,
-    ...misc
-  }
-}

From f8dd5e9d755530867ccda2aa3e31c9650739d3ff Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Sun, 12 May 2024 03:23:40 -0400
Subject: [PATCH 05/12] Support images/rich vars in MDP

---
 src/tools/mdp.js     | 114 +++++++++++++++++++++++++++++++++----------
 test/tooling.test.js |  19 ++++++++
 2 files changed, 106 insertions(+), 27 deletions(-)

diff --git a/src/tools/mdp.js b/src/tools/mdp.js
index 6e3cdc8..dd868f0 100644
--- a/src/tools/mdp.js
+++ b/src/tools/mdp.js
@@ -5,18 +5,15 @@ const { stripMdpComments, normalizeLineEndings } = require('./stripping')
 
 // See doc/MarkdownPreprocessing.md for more information
 
-class PromptString extends String {
+const TOKEN_VAR_START = '%%%('
+const TOKEN_VAR_END = ')%%%'
 
-}
-
-function preMarkdown (text, vars = {}) {
+function tokenizeMarkdown (text, vars = {}) {
   // Notes:
   // %%%()%%% refers to variable insertion
   // %%%[...] if CONDITION%%% refers to conditional insertion
   // %%%[...] if CONDITION else [...]%%% refers to conditional insertion with an else clause
   // %%%IF CONDITION\n...\n%%%ELSE\n...\n%%%ENDIF refers to conditional insertion with an else clause
-  const TOKEN_VAR_START = '%%%('
-  const TOKEN_VAR_END = ')%%%'
   let tokens = []
   let temp = ''
   let result = text
@@ -204,20 +201,93 @@ function preMarkdown (text, vars = {}) {
     }
   }
   tokens.push([temp, 'text'])
+  return tokens
+}
+
+function preMarkdown (text, vars = {}, roles) {
+  const tokens = tokenizeMarkdown(text, vars)
+  const hasRoles = roles && Object.keys(roles).length > 0
   // Now, for each of the var tokens, we replace them with the appropriate value
   for (let i = 0; i < tokens.length; i++) {
     if (tokens[i][1] === 'var') {
       const varName = tokens[i][0].slice(TOKEN_VAR_START.length, -TOKEN_VAR_END.length)
-      const replacement = vars[varName] || ''
-      tokens[i] = [replacement, 'text']
+      if (typeof vars[varName] === 'object') {
+        tokens[i] = [vars[varName], 'part']
+      } else {
+        const replacement = vars[varName] || ''
+        tokens[i] = [replacement, 'text']
+      }
+    } else if (tokens[i][1] === 'text' && hasRoles) {
+      // check if it contains any of the roles, if so split the text into [['', text], ['', role], ['', text]]
+      const newTokens = []
+      const text = tokens[i][0]
+      let k = 0
+      for (let j = 0; j < text.length; j++) {
+        for (const role in roles) {
+          if (text.slice(j, j + role.length) === role) {
+            newTokens.push([text.slice(k, j), 'text'])
+            newTokens.push([role, 'role', roles[role]])
+            k = j + role.length
+          }
+        }
+      }
+      newTokens.push([text.slice(k), 'text'])
+      if (newTokens.length) {
+        // splice the new tokens into the tokens array
+        tokens.splice(i, 1, ...newTokens)
+      }
     }
   }
-  // Now recombine the tokens
-  result = ''
-  for (let i = 0; i < tokens.length; i++) {
-    result += tokens[i][0]
+
+  function splitParts (tokens) {
+    const parts = []
+    // Now recombine the tokens (and segment the tokens into the parts if there are rich variables)
+    let currentPart = ''
+    for (let i = 0; i < tokens.length; i++) {
+      const token = tokens[i]
+      if (token[1] === 'part') {
+        parts.push(currentPart)
+        parts.push(token[0])
+        currentPart = ''
+      } else {
+        currentPart += token[0]
+      }
+    }
+    parts.push(currentPart)
+    if (parts.length === 1) {
+      return parts[0]
+    } else {
+      return parts.map(part => typeof part === 'string' ? ({ text: part }) : part)
+    }
   }
-  return result
+
+  if (hasRoles) {
+    const tokensSegmentedByRole = []
+    let currentSegment = [['unknown', 'role']]
+    for (let i = 0; i < tokens.length; i++) {
+      if (tokens[i][1] === 'role') {
+        tokensSegmentedByRole.push(currentSegment)
+        currentSegment = [tokens[i]]
+      } else {
+        currentSegment.push(tokens[i])
+      }
+    }
+    tokensSegmentedByRole.push(currentSegment)
+    // now map each segment to its role
+    const result = []
+    for (let i = 0; i < tokensSegmentedByRole.length; i++) {
+      const segment = tokensSegmentedByRole[i]
+      const role = segment[0][2] || segment[0][0]
+      const content = splitParts(segment.slice(1).map(e => {
+        e[0] = e[0].trim ? e[0].trim() : e[0]
+        return e
+      }))
+      result.push({ role, content })
+    }
+    return result.filter(x => x.content.trim ? (x.content.trim() !== '') : true)
+  }
+
+  return splitParts(tokens)
 }
 
 const DEFAULT_ROLES = {
@@ -265,22 +335,12 @@ function wrapContentWithSufficientTokens (content, token = '`', initialTokenSuff
 }
 
 function loadPrompt (text, vars, options = {}) {
-  const newRoles = {}
-  if (options.roles) {
-    // Prevent user data from affecting this
-    const roles = options.roles === true ? DEFAULT_ROLES : options.roles
-    for (const role in roles) {
-      const newRole = role + Math.random()
-      newRoles[newRole] = roles[role]
-      text = text.replaceAll(role, newRole)
-    }
-  }
-  const str = preMarkdown(text.replaceAll('\r\n', '\n'), vars)
+  let newRoles
   if (options.roles) {
-    return segmentByRoles(str, newRoles)
-  } else {
-    return new PromptString(str)
+    newRoles = options.roles === true ? DEFAULT_ROLES : options.roles
   }
+  const result = preMarkdown(text.replaceAll('\r\n', '\n'), vars, newRoles)
+  return result
 }
 
 function readSync (path, caller) {
diff --git a/test/tooling.test.js b/test/tooling.test.js
index 163beff..1d99e55 100644
--- a/test/tooling.test.js
+++ b/test/tooling.test.js
@@ -47,6 +47,24 @@ describe('Basic tests', () => {
     console.log('Messages', JSON.stringify(messages))
     assert.strictEqual(JSON.stringify(messages), '[{"role":"system","content":"Respond to the user like a pirate."},{"role":"user","content":"How are you today?"},{"role":"assistant","content":"Arrr, I be doin\' well, matey! How can I help ye today?"},{"role":"user","content":"What is the weather like?"},{"role":"assistant","content":"Arrr, the weather be fair and mild, matey. Ye be safe to set sail!"}]')
   })
+
+  it('mdp rich vars', function () {
+    const prompt = `Hello! What's in this below image?\n%%%(IMAGE)%%%\nPlease tell me what you see.` // eslint-disable-line
+    const parsed = tools.loadPrompt(prompt, {
+      IMAGE: { imageURL: testImage }
+    })
+    assert.strictEqual(JSON.stringify(parsed), JSON.stringify([{ text: "Hello! What's in this below image?\n" }, { imageURL: 'https://www.bing.com/th?id=OHR.CratersOfTheMoon_EN-US6516727783_1920x1080.jpg&w=1000' }, { text: '\nPlease tell me what you see.' }]))
+  })
+
+  it('mdp role processing with rich vars', function () {
+    const prompt = `<|SYSTEM|>\nYou're a helpful AI<|USER|>\nHello! What's in this below image?\n%%%(IMAGE)%%%\nPlease tell me what you see.` // eslint-disable-line
+    const parsed = tools.loadPrompt(prompt, {
+      IMAGE: { imageURL: testImage }
+    }, {
+      roles: true
+    })
+    assert.strictEqual(JSON.stringify(parsed), `[{"role":"system","content":"You're a helpful AI"},{"role":"user","content":[{"text":"Hello! What's in this below image?"},{"imageURL":"https://www.bing.com/th?id=OHR.CratersOfTheMoon_EN-US6516727783_1920x1080.jpg&w=1000"},{"text":"Please tell me what you see."}]}]`) // eslint-disable-line
+  })
 })
 
 describe('stripping', function () {
@@ -76,6 +94,7 @@ public static final EntityType<Boat> BOAT = register(
   })
 })
 
+const testImage = 'https://www.bing.com/th?id=OHR.CratersOfTheMoon_EN-US6516727783_1920x1080.jpg&w=1000'
 const testObject = {
   event_data: [
     {

From 3b28a521479d05939e1b3e78d43fcf20868dce1c Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Fri, 31 May 2024 12:14:25 -0400
Subject: [PATCH 06/12] Add token counting for G1.5Pro

---
 bin/cli.js               |  9 ++++++++-
 src/CompletionService.js | 40 +++++++++++++++++++++++++++++++++++++---
 src/backends/gemini.js   |  9 ++++++++-
 src/backends/openai.js   |  2 +-
 src/index.d.ts           |  3 +++
 src/tools/tokens.js      | 28 ++++++++++++++++++++++++----
 test/api.js              | 22 ++++++++++++++++++++++
 7 files changed, 103 insertions(+), 10 deletions(-)

diff --git a/bin/cli.js b/bin/cli.js
index c52edd7..61f7850 100644
--- a/bin/cli.js
+++ b/bin/cli.js
@@ -1,5 +1,6 @@
 #!/usr/bin/env node
 const gpt4 = require('gpt-tokenizer/cjs/model/gpt-4')
+const { CompletionService } = require('langxlang')
 
 function countTokens (text) {
   return gpt4.encode(text).length
@@ -10,6 +11,7 @@ function raise (msg) {
   console.error('Usage: langxlang <command> ...args')
   console.error('Usage: langxlang count <tokenizer> <file>')
   console.error('Example: langxlang count gpt4 myfile.js')
+  console.error('Example: langxlang count gemini1.5pro myfile.txt')
 }
 
 if (process.argv.length < 3) {
@@ -24,9 +26,14 @@ const commands = {
       process.exit(1)
     }
     console.log('Counting tokens in', file, 'using', tokenizer)
+    const text = require('fs').readFileSync(file, 'utf8')
     if (tokenizer === 'gpt4') {
-      const text = require('fs').readFileSync(file, 'utf8')
       console.log('Tokens:', countTokens(text).toLocaleString())
+    } else if (tokenizer === 'gemini1.5pro' || tokenizer === 'g15pro') {
+      const service = new CompletionService()
+      service.countTokens('gemini-1.5-pro-latest', text).then((tokens) => {
+        console.log('Tokens:', tokens.toLocaleString())
+      })
     } else {
       console.error('Unknown tokenizer', tokenizer)
       process.exit(1)
diff --git a/src/CompletionService.js b/src/CompletionService.js
index eb18a9c..81ffab5 100644
--- a/src/CompletionService.js
+++ b/src/CompletionService.js
@@ -167,7 +167,7 @@ class CompletionService {
     })
   }
 
-  async _requestChatCompleteGemini (model, messages, { maxTokens, stopSequences, temperature, topP, topK }, functions, chunkCb) {
+  async _processGeminiMessages (model, messages) {
     // Google Gemini doesn't support data URLs, or even remote ones, so we need to fetch them, extract data URLs then split
     async function resolveImage (url) {
       // fetch the URL contents to a data URL (node.js)
@@ -184,10 +184,8 @@ class CompletionService {
       return { inlineData: { mimeType, data } }
     }
 
-    if (!this.geminiApiKey) throw new Error('Gemini API key not set')
     // April 2024 - Only Gemini 1.5 supports instructions
     const supportsSystemInstruction = checkDoesGoogleModelSupportInstructions(model)
-    const guidance = checkGuidance(messages, chunkCb)
     const imagesForResolve = []
     const geminiMessages = messages.map((msg) => {
       const m = structuredClone(msg)
@@ -231,6 +229,14 @@ class CompletionService {
       delete entry.imageURL
     }
 
+    return geminiMessages
+  }
+
+  async _requestChatCompleteGemini (model, messages, { maxTokens, stopSequences, temperature, topP, topK }, functions, chunkCb) {
+    if (!this.geminiApiKey) throw new Error('Gemini API key not set')
+    const guidance = checkGuidance(messages, chunkCb)
+    const geminiMessages = await this._processGeminiMessages(model, messages)
+
     const response = await gemini.generateChatCompletionEx(model, geminiMessages, {
       apiKey: this.geminiApiKey,
       functions,
@@ -301,6 +307,34 @@ class CompletionService {
     }
   }
 
+  async countTokens (model, content) {
+    const { family } = getModelInfo(model)
+    switch (family) {
+      case 'openai':
+        return require('./tools/tokens').countTokens('gpt-4', content)
+      case 'gemini':
+        return gemini.countTokens(this.geminiApiKey, model, Array.isArray(content)
+          ? (await this._processGeminiMessages(model, [{ role: 'user', content }]))[0].parts
+          : content)
+      default:
+        throw new Error(`Model '${model}' not supported for token counting, available models: ${knownModels.join(', ')}`)
+    }
+  }
+
+  async countTokensInMessages (model, messages) {
+    const { family } = getModelInfo(model)
+    switch (family) {
+      case 'openai':
+        return messages.reduce((cumLen, entry) => {
+          return cumLen + this.countTokens(model, entry.content)
+        }, 0)
+      case 'gemini':
+        return gemini.countTokens(this.geminiApiKey, model, this._processGeminiMessages(model, messages))
+      default:
+        throw new Error(`Model '${model}' not supported for token counting, available models: ${knownModels.join(', ')}`)
+    }
+  }
+
   stop () {}
   close () {}
 }
diff --git a/src/backends/gemini.js b/src/backends/gemini.js
index be8caf4..dc4c941 100644
--- a/src/backends/gemini.js
+++ b/src/backends/gemini.js
@@ -133,6 +133,13 @@ async function listModels (apiKey) {
   return response.models
 }
 
+async function countTokens (apiKey, model, content) {
+  const google = new GoogleGenerativeAI(apiKey)
+  const generator = google.getGenerativeModel({ model }, { apiVersion: 'v1beta' })
+  const results = await generator.countTokens(content)
+  return results.totalTokens
+}
+
 function mergeDuplicatedRoleMessages (messages) {
   // if there are 2 messages with the same role, merge them with a newline.
   // Not doing this can return `GoogleGenerativeAIError: [400 Bad Request] Please ensure that multiturn requests ends with a user role or a function response.`
@@ -148,7 +155,7 @@ function mergeDuplicatedRoleMessages (messages) {
   return mergedMessages
 }
 
-module.exports = { generateChatCompletionEx, generateChatCompletionIn, generateCompletion, listModels }
+module.exports = { generateChatCompletionEx, generateChatCompletionIn, generateCompletion, listModels, countTokens }
 
 /*
 {
diff --git a/src/backends/openai.js b/src/backends/openai.js
index 53e06d8..76a4a30 100644
--- a/src/backends/openai.js
+++ b/src/backends/openai.js
@@ -98,7 +98,7 @@ function _sendApiRequest (apiKey, payload, chunkCb) {
       Authorization: 'Bearer ' + apiKey
     }
   }
-  console.debug('[OpenAI] /completions Payload', JSON.stringify(payload))
+  debug('[OpenAI] /completions Payload', JSON.stringify(payload))
   return new Promise((resolve, reject) => {
     const req = https.request(options, (res) => {
       if (res.statusCode !== 200) {
diff --git a/src/index.d.ts b/src/index.d.ts
index bf25f59..933ccfd 100644
--- a/src/index.d.ts
+++ b/src/index.d.ts
@@ -39,6 +39,9 @@ declare module 'langxlang' {
 
     listModels(): Promise<{ openai: Record<string, object>, google: Record<string, object> }>
 
+    countTokens(model: Model, text: string | MessagePart[]): Promise<number>
+    countTokensInMessages(model: Model, text: string | MessagePart[]): Promise<number>
+
     // Request a completion from the model with a system prompt and a single user prompt.
     requestCompletion(model: Model, systemPrompt: string, userPrompt: string | MessagePart[], _chunkCb?: ChunkCb, options?: CompletionOptions & {
       // If true, the response will be cached and returned from the cache if the same request is made again.
diff --git a/src/tools/tokens.js b/src/tools/tokens.js
index c8fb935..8345ebe 100644
--- a/src/tools/tokens.js
+++ b/src/tools/tokens.js
@@ -2,12 +2,32 @@ const gpt4 = require('gpt-tokenizer/cjs/model/gpt-4')
 
 function tokenize (tokenizer, data) {
   if (tokenizer === 'gpt-4') {
-    const encoded = gpt4.encode(data)
-    return {
-      length: encoded.length
+    if (typeof data === 'string') {
+      const encoded = gpt4.encode(data)
+      return { length: encoded.length }
     }
   }
   throw new Error('Unknown tokenizer')
 }
 
-module.exports = { tokenize }
+function countTokens (tokenizer, data) {
+  if (tokenizer === 'gpt-4') {
+    if (typeof data === 'string') {
+      const encoded = gpt4.encode(data)
+      return encoded.length
+    }
+    let cumLen = 0
+    for (const entry of data) {
+      if (typeof entry.content === 'string') {
+        cumLen += gpt4.encode(entry.content).length
+      } else if (typeof entry.text === 'string') {
+        cumLen += gpt4.encode(entry.text).length
+      } else if (entry.imageURL) {
+        // todo
+      }
+    }
+    return cumLen
+  }
+}
+
+module.exports = { countTokens, tokenize }
diff --git a/test/api.js b/test/api.js
index 89ed686..f2eff56 100644
--- a/test/api.js
+++ b/test/api.js
@@ -203,6 +203,27 @@ async function testSessionImage (model) {
   console.log('Done', message)
 }
 
+async function testTokenCounting () {
+  const text = 'Hello, World!'
+  const content = [{ text }]
+  {
+    const tokens = await completionService.countTokens('gpt-3.5-turbo', text)
+    console.log('GPT-3.5/4 Tokens in', text, 'is', tokens)
+    assert.strictEqual(tokens, 4)
+    const tokensGemini = await completionService.countTokens('gemini-1.0-pro', text)
+    console.log('Gemini 1.0 Tokens in', text, 'is', tokensGemini)
+    assert.strictEqual(tokensGemini, 5)
+  }
+  {
+    const tokens = await completionService.countTokens('gpt-3.5-turbo', content)
+    console.log('GPT-3.5/4 Tokens in', text, 'is', tokens)
+    assert.strictEqual(tokens, 4)
+    const tokensGemini = await completionService.countTokens('gemini-1.0-pro', content)
+    console.log('Gemini 1.0 Tokens in', text, 'is', tokensGemini)
+    assert.strictEqual(tokensGemini, 5)
+  }
+}
+
 async function testBasic () {
   completionService.startLogging()
   await testListing()
@@ -222,6 +243,7 @@ async function testBasic () {
   await testRemoteImage('gemini-pro-vision')
   await testRemoteImage('gpt-4-turbo')
   await testSessionImage('gemini-pro-vision')
+  await testTokenCounting()
   const log = completionService.stopLogging()
   const html = log.exportHTML()
   fs.writeFileSync('log.html', html)

From 8359380afa2856ed26d62cdd22d55076290b4e3a Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Fri, 31 May 2024 12:15:35 -0400
Subject: [PATCH 07/12] Update mdp to support inline images/rich data

---
 src/browser.js   |  1 +
 src/tools/mdp.js | 15 +++++++++++++--
 2 files changed, 14 insertions(+), 2 deletions(-)

diff --git a/src/browser.js b/src/browser.js
index be2df76..7771b09 100644
--- a/src/browser.js
+++ b/src/browser.js
@@ -8,6 +8,7 @@ window.lxl = {
   tools: {
     stripping,
     tokenizer,
+    loadPrompt: mdp.loadPrompt,
     _segmentPromptByRoles: mdp.segmentByRoles,
     ...misc
   }
diff --git a/src/tools/mdp.js b/src/tools/mdp.js
index dd868f0..946112e 100644
--- a/src/tools/mdp.js
+++ b/src/tools/mdp.js
@@ -211,7 +211,16 @@ function preMarkdown (text, vars = {}, roles) {
   for (let i = 0; i < tokens.length; i++) {
     if (tokens[i][1] === 'var') {
       const varName = tokens[i][0].slice(TOKEN_VAR_START.length, -TOKEN_VAR_END.length)
-      if (typeof vars[varName] === 'object') {
+      if (varName.startsWith('{') && varName.endsWith('}')) {
+        // inline JSON object var
+        const json = varName.slice(1, -1)
+        try {
+          const replacement = JSON.parse(json)
+          tokens[i] = [replacement, 'part']
+        } catch (e) {
+          throw new Error(`Failed to parse JSON object in variable insertion token: ${varName}`)
+        }
+      } else if (typeof vars[varName] === 'object') {
         tokens[i] = [vars[varName], 'part']
       } else {
         const replacement = vars[varName] || ''
@@ -257,7 +266,9 @@ function preMarkdown (text, vars = {}, roles) {
     if (parts.length === 1) {
       return parts[0]
     } else {
-      return parts.map(part => typeof part === 'string' ? ({ text: part }) : part)
+      return parts
+        .map(part => typeof part === 'string' ? ({ text: part }) : part)
+        .filter(x => x.trim ? (x.trim() !== '') : true)
     }
   }
 

From 81b22948d5272454d264fbd3088ec0b654852f37 Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Fri, 2 Aug 2024 01:23:35 -0400
Subject: [PATCH 08/12] Add github repo to markdown command to CLI tool

---
 bin/cli.js | 16 +++++++++++++++-
 1 file changed, 15 insertions(+), 1 deletion(-)

diff --git a/bin/cli.js b/bin/cli.js
index 61f7850..3c557dc 100644
--- a/bin/cli.js
+++ b/bin/cli.js
@@ -1,6 +1,7 @@
 #!/usr/bin/env node
+const fs = require('fs')
 const gpt4 = require('gpt-tokenizer/cjs/model/gpt-4')
-const { CompletionService } = require('langxlang')
+const { CompletionService, tools } = require('langxlang')
 
 function countTokens (text) {
   return gpt4.encode(text).length
@@ -10,8 +11,11 @@ function raise (msg) {
   if (msg) console.error(msg)
   console.error('Usage: langxlang <command> ...args')
   console.error('Usage: langxlang count <tokenizer> <file>')
+  console.error('Usage: langxlang githubRepoToMarkdown <repo> <branch or ref> [output file]')
+  console.error('Usage (alias): langxlang repo2md <repo> <branch or ref> [output file]')
   console.error('Example: langxlang count gpt4 myfile.js')
   console.error('Example: langxlang count gemini1.5pro myfile.txt')
+  console.error('Example: langxlang githubRepoToMarkdown PrismarineJS/vec3 master vec3.md')
 }
 
 if (process.argv.length < 3) {
@@ -38,9 +42,19 @@ const commands = {
       console.error('Unknown tokenizer', tokenizer)
       process.exit(1)
     }
+  },
+  githubRepoToMarkdown (repo, branch, outFile = 'repo.md') {
+    const files = tools.collectGithubRepoFiles(repo, {
+      branch,
+      truncateLargeFiles: 16_000 // 16k
+    })
+    const md = tools.concatFilesToMarkdown(files)
+    fs.writeFileSync(outFile, md)
   }
 }
 
+commands.repo2md = commands.githubRepoToMarkdown
+
 const [, , command, ...args] = process.argv
 console.error(`command: ${command}`, args)
 commands[command](...args)

From 3e95b9e388a9871a683569a8467278b612a9aa7b Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Sun, 4 Aug 2024 01:36:33 -0400
Subject: [PATCH 09/12] Add CLI command to convert folder to markdown

---
 bin/cli.js            | 21 +++++++++++++++++----
 src/tools/codebase.js | 10 ++++++----
 2 files changed, 23 insertions(+), 8 deletions(-)

diff --git a/bin/cli.js b/bin/cli.js
index 3c557dc..a3fe407 100644
--- a/bin/cli.js
+++ b/bin/cli.js
@@ -4,18 +4,21 @@ const gpt4 = require('gpt-tokenizer/cjs/model/gpt-4')
 const { CompletionService, tools } = require('langxlang')
 
 function countTokens (text) {
-  return gpt4.encode(text).length
+  return gpt4.encode(text.replaceAll('<|endoftext|>', '<|EndOfText|>')).length
 }
 
 function raise (msg) {
   if (msg) console.error(msg)
   console.error('Usage: langxlang <command> ...args')
   console.error('Usage: langxlang count <tokenizer> <file>')
-  console.error('Usage: langxlang githubRepoToMarkdown <repo> <branch or ref> [output file]')
-  console.error('Usage (alias): langxlang repo2md <repo> <branch or ref> [output file]')
+  console.error('Usage: langxlang githubRepoToMarkdown <repo> <branch or ref> [output file] [comma separated extensions]')
+  console.error('Usage: langxlang folderToMarkdown <path> [output file] [comma separated extensions]')
+  console.error('Usage (alias): langxlang repo2md <repo> <branch or ref> [output file] [comma seperated extensions]')
+  console.error('Usage (alias): langxlang folder2md <path> [output file] [comma separated extensions]')
   console.error('Example: langxlang count gpt4 myfile.js')
   console.error('Example: langxlang count gemini1.5pro myfile.txt')
   console.error('Example: langxlang githubRepoToMarkdown PrismarineJS/vec3 master vec3.md')
+  console.error('Example: langxlang folderToMarkdown ./src output.md .js,.ts')
 }
 
 if (process.argv.length < 3) {
@@ -43,9 +46,18 @@ const commands = {
       process.exit(1)
     }
   },
-  githubRepoToMarkdown (repo, branch, outFile = 'repo.md') {
+  githubRepoToMarkdown (repo, branch, outFile = 'repo.md', extensions) {
     const files = tools.collectGithubRepoFiles(repo, {
       branch,
+      extension: extensions ? extensions.split(',') : undefined,
+      truncateLargeFiles: 16_000 // 16k
+    })
+    const md = tools.concatFilesToMarkdown(files)
+    fs.writeFileSync(outFile, md)
+  },
+  folderToMarkdown (path, outFile = 'folder.md', extensions) {
+    const files = tools.collectFolderFiles(path, {
+      extension: extensions ? extensions.split(',') : undefined,
       truncateLargeFiles: 16_000 // 16k
     })
     const md = tools.concatFilesToMarkdown(files)
@@ -54,6 +66,7 @@ const commands = {
 }
 
 commands.repo2md = commands.githubRepoToMarkdown
+commands.folder2md = commands.folderToMarkdown
 
 const [, , command, ...args] = process.argv
 console.error(`command: ${command}`, args)
diff --git a/src/tools/codebase.js b/src/tools/codebase.js
index 62b7281..18d2959 100644
--- a/src/tools/codebase.js
+++ b/src/tools/codebase.js
@@ -35,8 +35,10 @@ function collectFolderFiles (folder, options) {
   // Now figure out the relevant files
   const relevantFiles = []
   for (const [file, relFile] of allFiles) {
-    if (Array.isArray(extension) && !extension.some(ext => file.endsWith(ext))) {
-      continue
+    if (Array.isArray(extension)) {
+      if (!extension.some(ext => file.endsWith(ext))) {
+        continue
+      }
     } else if (extension && !file.endsWith(extension)) {
       continue
     }
@@ -80,8 +82,8 @@ function collectFolderFiles (folder, options) {
     }
     if (options.truncateLargeFiles) {
       const maxTokens = options.truncateLargeFiles
-      if (!gpt4.isWithinTokenLimit(contents, maxTokens)) {
-        contents = gpt4.decode(gpt4.encode(contents).slice(0, maxTokens))
+      if (!gpt4.isWithinTokenLimit(contents.replaceAll('<|endoftext|>', '<|EndOfText|>'), maxTokens)) {
+        contents = gpt4.decode(gpt4.encode(contents.replaceAll('<|endoftext|>', '<|EndOfText|>')).slice(0, maxTokens))
         truncated = true
       }
     }

From 6f49a1066ccaab5e8266edec2e9f55d869653ffd Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Sun, 4 Aug 2024 01:38:59 -0400
Subject: [PATCH 10/12] update package.json

---
 package.json | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/package.json b/package.json
index 5ead975..566202a 100644
--- a/package.json
+++ b/package.json
@@ -11,8 +11,8 @@
     "test": "npm run mocha",
     "pretest": "npm run lint",
     "mocha": "mocha --bail test/*.test.js",
-    "buildWeb": "browserify src/service/browser.js -o dist/langxlang.js",
     "lint": "standard",
+    "buildWeb": "browserify src/browser.js -o dist/langxlang.js",
     "fix": "standard --fix"
   },
   "repository": {
@@ -48,6 +48,7 @@
     "debug": "^4.3.4",
     "fast-xml-parser": "^4.3.6",
     "gpt-tokenizer": "^2.1.2",
+    "js-yaml": "^4.1.0",
     "openai": "^4.28.0",
     "ws": "^8.16.0"
   }

From 3ce6eee42af33930831d84e9f9a423ae9b0b90f0 Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Sun, 4 Aug 2024 01:40:14 -0400
Subject: [PATCH 11/12] cli: help screen on unknown

---
 bin/cli.js | 8 +++++++-
 1 file changed, 7 insertions(+), 1 deletion(-)

diff --git a/bin/cli.js b/bin/cli.js
index a3fe407..405140d 100644
--- a/bin/cli.js
+++ b/bin/cli.js
@@ -70,4 +70,10 @@ commands.folder2md = commands.folderToMarkdown
 
 const [, , command, ...args] = process.argv
 console.error(`command: ${command}`, args)
-commands[command](...args)
+const handler = commands[command]
+if (handler) {
+  handler(...args)
+} else {
+  raise('Unknown command')
+  process.exit(1)
+}
\ No newline at end of file

From 28e888874e87ac1d89726bc13ff7000cd7965036 Mon Sep 17 00:00:00 2001
From: extremeheat <extreme@protonmail.ch>
Date: Fri, 22 Nov 2024 03:01:22 -0500
Subject: [PATCH 12/12] Update cli.js

---
 bin/cli.js | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/bin/cli.js b/bin/cli.js
index 405140d..d99c602 100644
--- a/bin/cli.js
+++ b/bin/cli.js
@@ -76,4 +76,4 @@ if (handler) {
 } else {
   raise('Unknown command')
   process.exit(1)
-}
\ No newline at end of file
+}