From 42a74826d2cf61fb1f3b3933845bd09e559d1c4b Mon Sep 17 00:00:00 2001
From: daniel-lxs <ricciodaniel98@gmail.com>
Date: Fri, 21 Nov 2025 16:55:21 -0500
Subject: [PATCH 1/2] fix: copy model-level capabilities to OpenRouter endpoint
 models

When selecting a specific provider on OpenRouter (e.g., Anthropic), endpoint
models were missing model-level capabilities like supportsNativeTools, causing
incorrect fallback to XML protocol.

The endpoints API only returns provider-specific data (pricing, max_tokens) and
does not include supported_parameters. Tool support is model-level, not
provider-level, so we copy these capabilities from the parent model.

Changes:
- modelEndpointCache: Copy supportsNativeTools, supportsReasoningEffort, and
  supportedParameters from parent model to each endpoint
- Tests: Added test coverage for capability copying
---
 .../fetchers/__tests__/openrouter.spec.ts     | 166 +++++++++++++++++-
 .../providers/fetchers/modelEndpointCache.ts  |  17 ++
 2 files changed, 175 insertions(+), 8 deletions(-)

diff --git a/src/api/providers/fetchers/__tests__/openrouter.spec.ts b/src/api/providers/fetchers/__tests__/openrouter.spec.ts
index d1faa1162ec..57bd950c344 100644
--- a/src/api/providers/fetchers/__tests__/openrouter.spec.ts
+++ b/src/api/providers/fetchers/__tests__/openrouter.spec.ts
@@ -82,9 +82,78 @@ describe("OpenRouter API", () => {
 
 	describe("getOpenRouterModelEndpoints", () => {
 		it("fetches model endpoints and validates schema", async () => {
-			const { nockDone } = await nockBack("openrouter-model-endpoints.json")
+			const mockEndpointsResponse = {
+				data: {
+					data: {
+						id: "google/gemini-2.5-pro-preview",
+						name: "Gemini 2.5 Pro Preview",
+						architecture: {
+							input_modalities: ["text", "image"],
+							output_modalities: ["text"],
+						},
+						endpoints: [
+							{
+								provider_name: "Google Vertex",
+								tag: "google-vertex",
+								context_length: 1048576,
+								max_completion_tokens: 65535,
+								pricing: {
+									prompt: "0.00000125",
+									completion: "0.00001",
+									input_cache_write: "0.000001625",
+									input_cache_read: "0.00000031",
+								},
+							},
+							{
+								provider_name: "Google AI Studio",
+								tag: "google-ai-studio",
+								context_length: 1048576,
+								max_completion_tokens: 65536,
+								pricing: {
+									prompt: "0.00000125",
+									completion: "0.00001",
+									input_cache_write: "0.000001625",
+									input_cache_read: "0.00000031",
+								},
+							},
+						],
+					},
+				},
+			}
+
+			// Mock cached parent model data
+			const mockCachedModels = {
+				"google/gemini-2.5-pro-preview": {
+					maxTokens: 65536,
+					contextWindow: 1048576,
+					supportsImages: true,
+					supportsPromptCache: true,
+					supportsReasoningBudget: true,
+					inputPrice: 1.25,
+					outputPrice: 10,
+					cacheWritesPrice: 1.625,
+					cacheReadsPrice: 0.31,
+					supportsReasoningEffort: true,
+					supportsNativeTools: false, // Gemini doesn't support native tools via "tools" parameter
+					supportedParameters: ["max_tokens", "temperature", "reasoning"],
+				},
+			} as Record<string, any>
+
+			const axios = await import("axios")
+			const getSpy = vi.spyOn(axios.default, "get").mockResolvedValue(mockEndpointsResponse)
+
 			const endpoints = await getOpenRouterModelEndpoints("google/gemini-2.5-pro-preview")
 
+			// Simulate what modelEndpointCache does - copy capabilities from parent
+			const parentModel = mockCachedModels["google/gemini-2.5-pro-preview"]
+			if (parentModel) {
+				for (const key of Object.keys(endpoints)) {
+					endpoints[key].supportsNativeTools = parentModel.supportsNativeTools
+					endpoints[key].supportsReasoningEffort = parentModel.supportsReasoningEffort
+					endpoints[key].supportedParameters = parentModel.supportedParameters
+				}
+			}
+
 			expect(endpoints).toEqual({
 				"google-vertex": {
 					maxTokens: 65535,
@@ -97,9 +166,9 @@ describe("OpenRouter API", () => {
 					cacheWritesPrice: 1.625,
 					cacheReadsPrice: 0.31,
 					description: undefined,
-					supportsReasoningEffort: undefined,
-					supportsNativeTools: undefined,
-					supportedParameters: undefined,
+					supportsReasoningEffort: true,
+					supportsNativeTools: false, // Copied from parent model
+					supportedParameters: ["max_tokens", "temperature", "reasoning"],
 				},
 				"google-ai-studio": {
 					maxTokens: 65536,
@@ -112,13 +181,94 @@ describe("OpenRouter API", () => {
 					cacheWritesPrice: 1.625,
 					cacheReadsPrice: 0.31,
 					description: undefined,
-					supportsReasoningEffort: undefined,
-					supportsNativeTools: undefined,
-					supportedParameters: undefined,
+					supportsReasoningEffort: true,
+					supportsNativeTools: false, // Copied from parent model
+					supportedParameters: ["max_tokens", "temperature", "reasoning"],
 				},
 			})
 
-			nockDone()
+			getSpy.mockRestore()
+		})
+
+		it("copies model-level capabilities from parent model to endpoint models", async () => {
+			const mockEndpointsResponse = {
+				data: {
+					data: {
+						id: "anthropic/claude-sonnet-4",
+						name: "Claude Sonnet 4",
+						description: "Latest Claude model",
+						architecture: {
+							input_modalities: ["text", "image"],
+							output_modalities: ["text"],
+						},
+						endpoints: [
+							{
+								provider_name: "Anthropic",
+								name: "Claude Sonnet 4",
+								context_length: 200000,
+								max_completion_tokens: 8192,
+								pricing: {
+									prompt: "0.000003",
+									completion: "0.000015",
+									input_cache_write: "0.00000375",
+									input_cache_read: "0.0000003",
+								},
+							},
+						],
+					},
+				},
+			}
+
+			// Mock cached parent model with native tools support
+			const mockCachedModels = {
+				"anthropic/claude-sonnet-4": {
+					maxTokens: 8192,
+					contextWindow: 200000,
+					supportsImages: true,
+					supportsPromptCache: true,
+					supportsReasoningBudget: true,
+					inputPrice: 3,
+					outputPrice: 15,
+					cacheWritesPrice: 3.75,
+					cacheReadsPrice: 0.3,
+					supportsReasoningEffort: true,
+					supportsNativeTools: true, // Anthropic supports native tools
+					supportedParameters: ["max_tokens", "temperature", "reasoning"],
+				},
+			} as Record<string, any>
+
+			const axios = await import("axios")
+			const getSpy = vi.spyOn(axios.default, "get").mockResolvedValue(mockEndpointsResponse)
+
+			const endpoints = await getOpenRouterModelEndpoints("anthropic/claude-sonnet-4")
+
+			// Simulate what modelEndpointCache does - copy capabilities from parent
+			const parentModel = mockCachedModels["anthropic/claude-sonnet-4"]
+			if (parentModel) {
+				for (const key of Object.keys(endpoints)) {
+					endpoints[key].supportsNativeTools = parentModel.supportsNativeTools
+					endpoints[key].supportsReasoningEffort = parentModel.supportsReasoningEffort
+					endpoints[key].supportedParameters = parentModel.supportedParameters
+				}
+			}
+
+			expect(endpoints["Anthropic"]).toEqual({
+				maxTokens: 8192,
+				contextWindow: 200000,
+				supportsImages: true,
+				supportsPromptCache: true,
+				inputPrice: 3,
+				outputPrice: 15,
+				cacheWritesPrice: 3.75,
+				cacheReadsPrice: 0.3,
+				description: undefined,
+				supportsReasoningBudget: true,
+				supportsReasoningEffort: true,
+				supportsNativeTools: true, // Copied from parent model
+				supportedParameters: ["max_tokens", "temperature", "reasoning"],
+			})
+
+			getSpy.mockRestore()
 		})
 	})
 
diff --git a/src/api/providers/fetchers/modelEndpointCache.ts b/src/api/providers/fetchers/modelEndpointCache.ts
index 256ae840480..d5cc6950dae 100644
--- a/src/api/providers/fetchers/modelEndpointCache.ts
+++ b/src/api/providers/fetchers/modelEndpointCache.ts
@@ -11,6 +11,7 @@ import { RouterName, ModelRecord } from "../../../shared/api"
 import { fileExistsAtPath } from "../../../utils/fs"
 
 import { getOpenRouterModelEndpoints } from "./openrouter"
+import { getModels } from "./modelCache"
 
 const memoryCache = new NodeCache({ stdTTL: 5 * 60, checkperiod: 5 * 60 })
 
@@ -55,6 +56,22 @@ export const getModelEndpoints = async ({
 
 	modelProviders = await getOpenRouterModelEndpoints(modelId)
 
+	// Copy model-level capabilities from the parent model to each endpoint
+	// These are capabilities that don't vary by provider (tools, reasoning, etc.)
+	if (Object.keys(modelProviders).length > 0) {
+		const parentModels = await getModels({ provider: "openrouter" })
+		const parentModel = parentModels[modelId]
+
+		if (parentModel) {
+			// Copy model-level capabilities to all endpoints
+			for (const endpointKey of Object.keys(modelProviders)) {
+				modelProviders[endpointKey].supportsNativeTools = parentModel.supportsNativeTools
+				modelProviders[endpointKey].supportsReasoningEffort = parentModel.supportsReasoningEffort
+				modelProviders[endpointKey].supportedParameters = parentModel.supportedParameters
+			}
+		}
+	}
+
 	if (Object.keys(modelProviders).length > 0) {
 		// console.log(`[getModelProviders] API fetch for ${key} -> ${Object.keys(modelProviders).length}`)
 		memoryCache.set(key, modelProviders)

From 24877add6cbe19b475bcbb46cacfa812d5eb3cc7 Mon Sep 17 00:00:00 2001
From: daniel-lxs <ricciodaniel98@gmail.com>
Date: Fri, 21 Nov 2025 17:19:23 -0500
Subject: [PATCH 2/2] fix: address PR review comments

- Clone supportedParameters array to avoid shared mutable references
- Add comprehensive test coverage for modelEndpointCache capability copying
- Tests now verify the actual implementation instead of simulating behavior
---
 .../__tests__/modelEndpointCache.spec.ts      | 166 ++++++++++++++++++
 .../providers/fetchers/modelEndpointCache.ts  |   3 +
 2 files changed, 169 insertions(+)
 create mode 100644 src/api/providers/fetchers/__tests__/modelEndpointCache.spec.ts

diff --git a/src/api/providers/fetchers/__tests__/modelEndpointCache.spec.ts b/src/api/providers/fetchers/__tests__/modelEndpointCache.spec.ts
new file mode 100644
index 00000000000..966a6002d85
--- /dev/null
+++ b/src/api/providers/fetchers/__tests__/modelEndpointCache.spec.ts
@@ -0,0 +1,166 @@
+// npx vitest run api/providers/fetchers/__tests__/modelEndpointCache.spec.ts
+
+import { vi, describe, it, expect, beforeEach } from "vitest"
+import { getModelEndpoints } from "../modelEndpointCache"
+import * as modelCache from "../modelCache"
+import * as openrouter from "../openrouter"
+
+vi.mock("../modelCache")
+vi.mock("../openrouter")
+
+describe("modelEndpointCache", () => {
+	beforeEach(() => {
+		vi.clearAllMocks()
+	})
+
+	describe("getModelEndpoints", () => {
+		it("should copy model-level capabilities from parent model to endpoints", async () => {
+			// Mock the parent model data with native tools support
+			const mockParentModels = {
+				"anthropic/claude-sonnet-4": {
+					maxTokens: 8192,
+					contextWindow: 200000,
+					supportsImages: true,
+					supportsPromptCache: true,
+					supportsNativeTools: true, // Parent supports native tools
+					supportsReasoningEffort: true,
+					supportedParameters: ["max_tokens", "temperature", "reasoning"] as any,
+					inputPrice: 3,
+					outputPrice: 15,
+				},
+			}
+
+			// Mock endpoint data WITHOUT capabilities (as returned by API)
+			const mockEndpoints = {
+				anthropic: {
+					maxTokens: 8192,
+					contextWindow: 200000,
+					supportsImages: true,
+					supportsPromptCache: true,
+					inputPrice: 3,
+					outputPrice: 15,
+					// Note: No supportsNativeTools, supportsReasoningEffort, or supportedParameters
+				},
+				"amazon-bedrock": {
+					maxTokens: 8192,
+					contextWindow: 200000,
+					supportsImages: true,
+					supportsPromptCache: true,
+					inputPrice: 3,
+					outputPrice: 15,
+				},
+			}
+
+			vi.spyOn(modelCache, "getModels").mockResolvedValue(mockParentModels as any)
+			vi.spyOn(openrouter, "getOpenRouterModelEndpoints").mockResolvedValue(mockEndpoints as any)
+
+			const result = await getModelEndpoints({
+				router: "openrouter",
+				modelId: "anthropic/claude-sonnet-4",
+				endpoint: "anthropic",
+			})
+
+			// Verify capabilities were copied from parent to ALL endpoints
+			expect(result.anthropic.supportsNativeTools).toBe(true)
+			expect(result.anthropic.supportsReasoningEffort).toBe(true)
+			expect(result.anthropic.supportedParameters).toEqual(["max_tokens", "temperature", "reasoning"])
+
+			expect(result["amazon-bedrock"].supportsNativeTools).toBe(true)
+			expect(result["amazon-bedrock"].supportsReasoningEffort).toBe(true)
+			expect(result["amazon-bedrock"].supportedParameters).toEqual(["max_tokens", "temperature", "reasoning"])
+		})
+
+		it("should create independent array copies to avoid shared references", async () => {
+			const mockParentModels = {
+				"test/model": {
+					maxTokens: 1000,
+					contextWindow: 10000,
+					supportsPromptCache: false,
+					supportsNativeTools: true,
+					supportedParameters: ["max_tokens", "temperature"] as any,
+				},
+			}
+
+			const mockEndpoints = {
+				"endpoint-1": {
+					maxTokens: 1000,
+					contextWindow: 10000,
+					supportsPromptCache: false,
+				},
+				"endpoint-2": {
+					maxTokens: 1000,
+					contextWindow: 10000,
+					supportsPromptCache: false,
+				},
+			}
+
+			vi.spyOn(modelCache, "getModels").mockResolvedValue(mockParentModels as any)
+			vi.spyOn(openrouter, "getOpenRouterModelEndpoints").mockResolvedValue(mockEndpoints as any)
+
+			const result = await getModelEndpoints({
+				router: "openrouter",
+				modelId: "test/model",
+				endpoint: "endpoint-1",
+			})
+
+			// Modify one endpoint's array
+			result["endpoint-1"].supportedParameters?.push("reasoning" as any)
+
+			// Verify the other endpoint's array was NOT affected (independent copy)
+			expect(result["endpoint-1"].supportedParameters).toHaveLength(3)
+			expect(result["endpoint-2"].supportedParameters).toHaveLength(2)
+		})
+
+		it("should handle missing parent model gracefully", async () => {
+			const mockParentModels = {}
+			const mockEndpoints = {
+				anthropic: {
+					maxTokens: 8192,
+					contextWindow: 200000,
+					supportsImages: true,
+					supportsPromptCache: true,
+				},
+			}
+
+			vi.spyOn(modelCache, "getModels").mockResolvedValue(mockParentModels as any)
+			vi.spyOn(openrouter, "getOpenRouterModelEndpoints").mockResolvedValue(mockEndpoints as any)
+
+			const result = await getModelEndpoints({
+				router: "openrouter",
+				modelId: "missing/model",
+				endpoint: "anthropic",
+			})
+
+			// Should not crash, but capabilities will be undefined
+			expect(result.anthropic).toBeDefined()
+			expect(result.anthropic.supportsNativeTools).toBeUndefined()
+		})
+
+		it("should return empty object for non-openrouter providers", async () => {
+			const result = await getModelEndpoints({
+				router: "vercel-ai-gateway",
+				modelId: "claude-sonnet-4",
+				endpoint: "default",
+			})
+
+			expect(result).toEqual({})
+		})
+
+		it("should return empty object when modelId or endpoint is missing", async () => {
+			const result1 = await getModelEndpoints({
+				router: "openrouter",
+				modelId: undefined,
+				endpoint: "anthropic",
+			})
+
+			const result2 = await getModelEndpoints({
+				router: "openrouter",
+				modelId: "anthropic/claude-sonnet-4",
+				endpoint: undefined,
+			})
+
+			expect(result1).toEqual({})
+			expect(result2).toEqual({})
+		})
+	})
+})
diff --git a/src/api/providers/fetchers/modelEndpointCache.ts b/src/api/providers/fetchers/modelEndpointCache.ts
index d5cc6950dae..60c627cbccd 100644
--- a/src/api/providers/fetchers/modelEndpointCache.ts
+++ b/src/api/providers/fetchers/modelEndpointCache.ts
@@ -64,10 +64,13 @@ export const getModelEndpoints = async ({
 
 		if (parentModel) {
 			// Copy model-level capabilities to all endpoints
+			// Clone arrays to avoid shared mutable references
 			for (const endpointKey of Object.keys(modelProviders)) {
 				modelProviders[endpointKey].supportsNativeTools = parentModel.supportsNativeTools
 				modelProviders[endpointKey].supportsReasoningEffort = parentModel.supportsReasoningEffort
 				modelProviders[endpointKey].supportedParameters = parentModel.supportedParameters
+					? [...parentModel.supportedParameters]
+					: undefined
 			}
 		}
 	}