Langchain with Convex

Path: Computer Tech/AI/ML/Langchain/Langchain with Convex.mdUpdated: 2/3/2026

Langchain with Convex

Integration patterns for using Langchain.js with Convex database - enabling semantic search, RAG, and AI-powered features in your NNT Ecosystem.

Why Convex + Langchain

Convex strengths:

Real-time sync with React components
Type-safe queries
Serverless functions
Built-in authentication

Langchain strengths:

Semantic search via embeddings
LLM orchestration
RAG (Retrieval Augmented Generation)
Agent workflows

Together: Build AI-powered music analysis tools with real-time data sync.

Architecture Patterns

Pattern 1: Store Embeddings in Convex

Use case: Search song annotations semantically

Convex schema:

typescript
// convex/schema.ts
import { defineSchema, defineTable } from "convex/server";
import { v } from "convex/values";

export default defineSchema({
  songEmbeddings: defineTable({
    songId: v.string(),
    text: v.string(),
    embedding: v.array(v.float64()),  // 1536 dimensions
    metadata: v.object({
      title: v.string(),
      artist: v.string(),
      section: v.optional(v.string()),
      timestamp: v.optional(v.number())
    })
  }).index("by_song", ["songId"]),
  
  songs: defineTable({
    title: v.string(),
    artist: v.string(),
    appleMusicId: v.optional(v.string()),
    annotations: v.array(v.string())
  })
});

Generate and store embeddings:

typescript
// convex/embeddings.ts
import { mutation } from "./_generated/server";
import { v } from "convex/values";
import { OpenAIEmbeddings } from "@langchain/openai";

const embeddings = new OpenAIEmbeddings({
  modelName: "text-embedding-3-small"
});

export const addSongEmbedding = mutation({
  args: {
    songId: v.string(),
    text: v.string(),
    metadata: v.object({
      title: v.string(),
      artist: v.string(),
      section: v.optional(v.string())
    })
  },
  handler: async (ctx, args) => {
    // Generate embedding
    const vector = await embeddings.embedQuery(args.text);
    
    // Store in Convex
    await ctx.db.insert("songEmbeddings", {
      songId: args.songId,
      text: args.text,
      embedding: vector,
      metadata: args.metadata
    });
  }
});

Pattern 2: Similarity Search with Convex

Custom similarity search function:

typescript
// convex/search.ts
import { query } from "./_generated/server";
import { v } from "convex/values";

// Cosine similarity helper
function cosineSimilarity(vec1: number[], vec2: number[]): number {
  const dotProduct = vec1.reduce((sum, val, i) => sum + val * vec2[i], 0);
  const mag1 = Math.sqrt(vec1.reduce((sum, val) => sum + val * val, 0));
  const mag2 = Math.sqrt(vec2.reduce((sum, val) => sum + val * val, 0));
  return dotProduct / (mag1 * mag2);
}

export const similaritySearch = query({
  args: {
    queryEmbedding: v.array(v.float64()),
    limit: v.optional(v.number()),
    minSimilarity: v.optional(v.number())
  },
  handler: async (ctx, args) => {
    const limit = args.limit ?? 10;
    const minSimilarity = args.minSimilarity ?? 0.7;
    
    // Get all embeddings
    const allEmbeddings = await ctx.db.query("songEmbeddings").collect();
    
    // Calculate similarity for each
    const withScores = allEmbeddings.map(doc => ({
      ...doc,
      similarity: cosineSimilarity(args.queryEmbedding, doc.embedding)
    }));
    
    // Filter and sort
    return withScores
      .filter(doc => doc.similarity >= minSimilarity)
      .sort((a, b) => b.similarity - a.similarity)
      .slice(0, limit);
  }
});

Use from client:

typescript
import { useQuery, useMutation } from "convex/react";
import { api } from "../convex/_generated/api";
import { OpenAIEmbeddings } from "@langchain/openai";

function SongSearchComponent() {
  const [query, setQuery] = useState("");
  const [results, setResults] = useState([]);
  
  const embeddings = new OpenAIEmbeddings();
  
  const handleSearch = async () => {
    // Generate query embedding
    const queryVector = await embeddings.embedQuery(query);
    
    // Search Convex
    const similarDocs = await convex.query(api.search.similaritySearch, {
      queryEmbedding: queryVector,
      limit: 10
    });
    
    setResults(similarDocs);
  };
  
  return (
    <div>
      <input value={query} onChange={e => setQuery(e.target.value)} />
      <button onClick={handleSearch}>Search</button>
      
      {results.map(doc => (
        <div key={doc._id}>
          <h3>{doc.metadata.title} - {doc.metadata.artist}</h3>
          <p>Similarity: {(doc.similarity * 100).toFixed(1)}%</p>
          <p>{doc.text}</p>
        </div>
      ))}
    </div>
  );
}

Pattern 3: RAG with Convex Backend

Retrieve relevant context from Convex, send to LLM:

typescript
// convex/rag.ts
import { action } from "./_generated/server";
import { v } from "convex/values";
import { ChatOpenAI } from "@langchain/openai";
import { OpenAIEmbeddings } from "@langchain/openai";

export const askQuestion = action({
  args: {
    question: v.string()
  },
  handler: async (ctx, args) => {
    const embeddings = new OpenAIEmbeddings();
    const llm = new ChatOpenAI({ modelName: "gpt-4" });
    
    // 1. Embed the question
    const questionVector = await embeddings.embedQuery(args.question);
    
    // 2. Search Convex for relevant docs
    const relevantDocs = await ctx.runQuery(api.search.similaritySearch, {
      queryEmbedding: questionVector,
      limit: 5
    });
    
    // 3. Build context from retrieved docs
    const context = relevantDocs
      .map(doc => `Song: ${doc.metadata.title} - ${doc.metadata.artist}\n${doc.text}`)
      .join("\n\n---\n\n");
    
    // 4. Ask LLM with context
    const prompt = `Based on these song annotations:

${context}

Question: ${args.question}

Answer:`;
    
    const response = await llm.invoke(prompt);
    
    return {
      answer: response.content,
      sources: relevantDocs.map(d => ({
        title: d.metadata.title,
        artist: d.metadata.artist
      }))
    };
  }
});

Use from React:

typescript
function ResearchAssistant() {
  const askQuestion = useMutation(api.rag.askQuestion);
  const [answer, setAnswer] = useState(null);
  
  const handleAsk = async (question: string) => {
    const result = await askQuestion({ question });
    setAnswer(result);
  };
  
  return (
    <div>
      <input onSubmit={e => handleAsk(e.target.value)} />
      
      {answer && (
        <div>
          <h3>Answer:</h3>
          <p>{answer.answer}</p>
          
          <h4>Sources:</h4>
          <ul>
            {answer.sources.map(s => (
              <li>{s.title} - {s.artist}</li>
            ))}
          </ul>
        </div>
      )}
    </div>
  );
}

Optimizing Vector Storage in Convex

Challenge: Large Embeddings

Problem: 1536-dimensional vectors take space

Solutions:

1. Dimensionality Reduction (Advanced)

Reduce to 384 or 768 dimensions using PCA (loses some accuracy)

2. Lazy Loading

Store embeddings externally, cache in Convex on demand

typescript
// Store just the hash
songEmbeddings: defineTable({
  songId: v.string(),
  text: v.string(),
  embeddingHash: v.string(),  // Reference to external storage
  metadata: v.object({ ... })
})

3. Selective Embedding

Don't embed everything - prioritize:

User-created annotations
Important passages
Frequently queried content

Indexing Strategy

Convex doesn't have native vector indexes - implement approximate nearest neighbor (ANN) manually:

typescript
// Bucketing approach for faster search
export const bucketedSearch = query({
  args: {
    queryEmbedding: v.array(v.float64()),
    limit: v.number()
  },
  handler: async (ctx, args) => {
    // Pre-filter by metadata before similarity calculation
    const candidates = await ctx.db
      .query("songEmbeddings")
      .filter(q => 
        // Fast metadata filters first
        q.eq(q.field("metadata.genre"), "jazz")
      )
      .collect();
    
    // Then calculate similarity only on filtered set
    const withScores = candidates.map(doc => ({
      ...doc,
      similarity: cosineSimilarity(args.queryEmbedding, doc.embedding)
    }));
    
    return withScores
      .sort((a, b) => b.similarity - a.similarity)
      .slice(0, args.limit);
  }
});

Real-Time Sync: Embeddings + Live Data

Convex's killer feature: Real-time updates

Use Case: Collaborative Annotation

Multiple users annotating same song, embeddings update live:

typescript
// convex/annotations.ts
export const addAnnotation = mutation({
  args: {
    songId: v.string(),
    text: v.string(),
    timestamp: v.number()
  },
  handler: async (ctx, args) => {
    // 1. Store annotation
    const annotationId = await ctx.db.insert("annotations", args);
    
    // 2. Trigger embedding generation (async)
    await ctx.scheduler.runAfter(0, api.embeddings.addSongEmbedding, {
      songId: args.songId,
      text: args.text,
      metadata: {
        annotationId,
        timestamp: args.timestamp
      }
    });
    
    return annotationId;
  }
});

React component sees updates instantly:

typescript
function LiveAnnotations({ songId }: { songId: string }) {
  // Real-time query
  const annotations = useQuery(api.annotations.getBySong, { songId });
  
  return (
    <div>
      {annotations?.map(a => (
        <div key={a._id}>{a.text}</div>
      ))}
    </div>
  );
}

Convex Actions for LLM Calls

Use Convex actions (not mutations) for LLM calls:

Why:

Actions can make external API calls
Mutations are deterministic (can't call OpenAI)
Actions can be long-running

typescript
import { action } from "./_generated/server";
import { ChatOpenAI } from "@langchain/openai";

export const generateSummary = action({
  args: { songId: v.string() },
  handler: async (ctx, args) => {
    // 1. Query data (can call queries/mutations from actions)
    const song = await ctx.runQuery(api.songs.get, { id: args.songId });
    const annotations = await ctx.runQuery(api.annotations.getBySong, {
      songId: args.songId
    });
    
    // 2. Call LLM
    const llm = new ChatOpenAI();
    const summary = await llm.invoke(`Summarize these annotations: 
      ${annotations.map(a => a.text).join("\n")}`);
    
    // 3. Store result
    await ctx.runMutation(api.songs.updateSummary, {
      songId: args.songId,
      summary: summary.content
    });
    
    return summary.content;
  }
});

Multi-Tenant Embeddings

If you have multiple users/vaults, isolate embeddings:

typescript
songEmbeddings: defineTable({
  userId: v.string(),  // Ownership
  songId: v.string(),
  embedding: v.array(v.float64()),
  // ...
}).index("by_user_song", ["userId", "songId"])

// Search only user's embeddings
export const userSearch = query({
  args: {
    userId: v.string(),
    queryEmbedding: v.array(v.float64())
  },
  handler: async (ctx, args) => {
    const userDocs = await ctx.db
      .query("songEmbeddings")
      .withIndex("by_user_song", q => q.eq("userId", args.userId))
      .collect();
    
    // Calculate similarity only on user's docs
    // ...
  }
});

Cost and Performance

Embedding Generation Cost

Typical workflow:

User adds annotation (500 tokens)
Generate embedding: $0.00001 (text-embedding-3-small)
Store in Convex: free (within limits)

For 1000 annotations: ~$0.01

Query Performance

Current approach (scan all):

1000 embeddings: ~200ms
10,000 embeddings: ~2s (too slow)

Optimization needed at scale:

Pre-filter with metadata indexes
Implement ANN (approximate nearest neighbor)
Cache popular queries
Consider dedicated vector database for huge datasets (Pinecone + Convex hybrid)

Example: NNT Ecosystem Integration

Scenario: Search Song Annotations

Goal: User types "modal interchange examples" → finds relevant songs

Implementation:

1. Embed song annotations (one-time):

typescript
// Script to embed existing songs
import { convex } from "./convex";
import { api } from "./convex/_generated/api";
import { OpenAIEmbeddings } from "@langchain/openai";

async function embedAllSongs() {
  const songs = await convex.query(api.songs.list);
  const embeddings = new OpenAIEmbeddings();
  
  for (const song of songs) {
    for (const annotation of song.annotations) {
      const vector = await embeddings.embedQuery(annotation.text);
      
      await convex.mutation(api.embeddings.addSongEmbedding, {
        songId: song._id,
        text: annotation.text,
        embedding: vector,
        metadata: {
          title: song.title,
          artist: song.artist,
          section: annotation.section
        }
      });
    }
  }
}

2. Search interface:

typescript
function SemanticSearch() {
  const [query, setQuery] = useState("");
  const askQuestion = useMutation(api.rag.askQuestion);
  const [result, setResult] = useState(null);
  
  const handleSearch = async () => {
    const answer = await askQuestion({ question: query });
    setResult(answer);
  };
  
  return (
    <div>
      <input 
        placeholder="Ask about song annotations..." 
        value={query}
        onChange={e => setQuery(e.target.value)}
      />
      <button onClick={handleSearch}>Search</button>
      
      {result && (
        <div>
          <p>{result.answer}</p>
          <h4>From these songs:</h4>
          {result.sources.map(s => (
            <a href={`/songs/${s.songId}`}>{s.title}</a>
          ))}
        </div>
      )}
    </div>
  );
}

3. Voice annotation with auto-embedding:

typescript
export const addVoiceAnnotation = mutation({
  args: {
    songId: v.string(),
    transcript: v.string(),
    timestamp: v.number()
  },
  handler: async (ctx, args) => {
    // Store annotation
    const annotationId = await ctx.db.insert("annotations", args);
    
    // Schedule embedding (async, doesn't block)
    await ctx.scheduler.runAfter(0, api.embeddings.addSongEmbedding, {
      songId: args.songId,
      text: args.transcript,
      metadata: {
        timestamp: args.timestamp,
        type: "voice"
      }
    });
  }
});

Migration Path

If starting fresh:

Store song metadata in Convex
Add embeddings table
Embed on creation
Implement similarity search

If existing data:

Export annotations from vault
Bulk embed with script
Import to Convex
Set up incremental updates

Langchain with Convex

Langchain with Convex

Why Convex + Langchain

Architecture Patterns

Pattern 1: Store Embeddings in Convex

Pattern 2: Similarity Search with Convex

Pattern 3: RAG with Convex Backend

Optimizing Vector Storage in Convex

Challenge: Large Embeddings

1. Dimensionality Reduction (Advanced)

2. Lazy Loading

3. Selective Embedding

Indexing Strategy

Real-Time Sync: Embeddings + Live Data

Use Case: Collaborative Annotation

Convex Actions for LLM Calls

Multi-Tenant Embeddings

Cost and Performance

Embedding Generation Cost

Query Performance

Example: NNT Ecosystem Integration

Scenario: Search Song Annotations

Migration Path

See Also