Support for Ollama context window configuration

2025-04-20 01:37:10 -06:00 · 2025-04-20 01:37:10 -06:00 · c0705d1d9e
commit c0705d1d9e
parent 73b5e8832e
10 changed files with 170 additions and 54 deletions
--- a/src/app/api/chat/route.ts
+++ b/src/app/api/chat/route.ts
@ -20,6 +20,7 @@ import {
  getCustomOpenaiApiUrl,
  getCustomOpenaiModelName,
 } from '@/lib/config';
+import { ChatOllama } from '@langchain/ollama';
 import { searchHandlers } from '@/lib/search';

 export const runtime = 'nodejs';
@ -34,6 +35,7 @@ type Message = {
 type ChatModel = {
  provider: string;
  name: string;
+  ollamaContextWindow?: number;
 };

 type EmbeddingModel = {
@ -232,6 +234,11 @@ export const POST = async (req: Request) => {
      }) as unknown as BaseChatModel;
    } else if (chatModelProvider && chatModel) {
      llm = chatModel.model;
+      
+      // Set context window size for Ollama models
+      if (llm instanceof ChatOllama && body.chatModel?.provider === 'ollama') {
+        llm.numCtx = body.chatModel.ollamaContextWindow || 2048;
+      }
    }

    if (!llm) {
--- a/src/app/api/search/route.ts
+++ b/src/app/api/search/route.ts
@ -13,12 +13,14 @@ import {
  getCustomOpenaiModelName,
 } from '@/lib/config';
 import { searchHandlers } from '@/lib/search';
+import { ChatOllama } from '@langchain/ollama';

 interface chatModel {
  provider: string;
  name: string;
  customOpenAIKey?: string;
  customOpenAIBaseURL?: string;
+  ollamaContextWindow?: number;
 }

 interface embeddingModel {
@ -96,6 +98,10 @@ export const POST = async (req: Request) => {
      llm = chatModelProviders[chatModelProvider][chatModel]
        .model as unknown as BaseChatModel | undefined;
    }
+    
+    if (llm instanceof ChatOllama && body.chatModel?.provider === 'ollama') {
+      llm.numCtx = body.chatModel.ollamaContextWindow || 2048;
+    }

    if (
      embeddingModelProviders[embeddingModelProvider] &&
--- a/src/app/api/suggestions/route.ts
+++ b/src/app/api/suggestions/route.ts
@ -8,10 +8,12 @@ import { getAvailableChatModelProviders } from '@/lib/providers';
 import { BaseChatModel } from '@langchain/core/language_models/chat_models';
 import { AIMessage, BaseMessage, HumanMessage } from '@langchain/core/messages';
 import { ChatOpenAI } from '@langchain/openai';
+import { ChatOllama } from '@langchain/ollama';

 interface ChatModel {
  provider: string;
  model: string;
+  ollamaContextWindow?: number;
 }

 interface SuggestionsGenerationBody {
@ -57,6 +59,10 @@ export const POST = async (req: Request) => {
      }) as unknown as BaseChatModel;
    } else if (chatModelProvider && chatModel) {
      llm = chatModel.model;
+      // Set context window size for Ollama models
+      if (llm instanceof ChatOllama && body.chatModel?.provider === 'ollama') {
+        llm.numCtx = body.chatModel.ollamaContextWindow || 2048;
+      }
    }

    if (!llm) {