Search Strategy

Last Updated: 2025-10-28

Multi-strategy search implementation: semantic, keyword, temporal, and hybrid approaches.

Overview

Cortex provides three search strategies that can be used independently or combined:

Semantic Search - Vector similarity (meaning-based)
Keyword Search - Full-text matching (exact words)
Temporal Search - Recent/time-based retrieval

Each strategy has different strengths, and Cortex can intelligently combine them.

┌─────────────────────────────────────────────────────┐
│              Search Strategy Selection              │
├─────────────────────────────────────────────────────┤
│                                                     │
│  Has embedding? ──Yes──> Semantic Search            │
│        │                                            │
│        No                                           │
│        ↓                                            │
│  Keyword Search ──────────> Results                 │
│                                                     │
│  Optional: Boost by recency, importance, access     │
└─────────────────────────────────────────────────────┘

Strategy 1: Semantic Search

How It Works

Uses vector embeddings and cosine similarity:

// User query
const query = "What is the user's preferred communication method?";

// Generate query embedding
const queryEmbedding = await embed(query);

// Convex vector search
const results = await ctx.db
  .query("memories")
  .withIndex("by_embedding", (q) =>
    q.similar("embedding", queryEmbedding, 20).eq("agentId", agentId),
  )
  .collect();

// Returns:
// 1. "User prefers email over phone" (0.92 similarity)
// 2. "Email is best way to reach user" (0.88 similarity)
// 3. "User doesn't like phone calls" (0.85 similarity)
// Even though exact words don't match! ✅

Strengths:

✅ Finds meaning, not just words
✅ Handles synonyms ("car" matches "vehicle")
✅ Understands context
✅ Works across languages (with multilingual models)

Weaknesses:

❌ Requires embeddings (cost + latency)
❌ Can miss exact matches
❌ Less predictable than keywords

Best for:

Natural language queries
Conceptual matching
Cross-language search
Fuzzy matching

Implementation

export const semanticSearch = query({
  args: {
    memorySpaceId: v.string(),
    embedding: v.array(v.float64()),
    filters: v.any(),
  },
  handler: async (ctx, args) => {
    let q = ctx.db
      .query("memories")
      .withIndex("by_embedding", (q) =>
        q
          .similar("embedding", args.embedding, args.filters.limit || 20)
          .eq("agentId", args.agentId),
      );

    // Apply userId filter (pre-filtered via filterFields)
    if (args.filters.userId) {
      q = q.filter((q) => q.eq(q.field("userId"), args.filters.userId));
    }

    const results = await q.collect();

    // Calculate similarity scores
    return results.map((memory) => ({
      ...memory,
      score: cosineSimilarity(memory.embedding, args.embedding),
      strategy: "semantic",
    }));
  },
});

Strategy 2: Keyword Search

How It Works

Uses Convex full-text search indexes:

// User query
const query = "password Blue";

// Convex keyword search
const results = await ctx.db
  .query("memories")
  .withSearchIndex("by_content", (q) =>
    q.search("content", query).eq("agentId", agentId),
  )
  .collect();

// Returns:
// 1. "The password is Blue" (exact match)
// 2. "User's password: Blue123" (contains words)
// 3. "Blue is the password color" (contains both)
// Only returns if words actually appear ✅

Strengths:

✅ Exact word matching
✅ Fast (no embedding needed)
✅ Predictable results
✅ No API costs

Weaknesses:

❌ Misses synonyms
❌ Order matters somewhat
❌ Doesn't understand meaning

Best for:

Exact phrase lookup
Technical terms
IDs, codes, names
When embeddings unavailable

Implementation

export const keywordSearch = query({
  args: {
    memorySpaceId: v.string(),
    keywords: v.string(),
    filters: v.any(),
  },
  handler: async (ctx, args) => {
    let results = await ctx.db
      .query("memories")
      .withSearchIndex("by_content", (q) =>
        q.search("content", args.keywords).eq("agentId", args.agentId),
      )
      .take(args.filters.limit || 20);

    // Convex returns relevance-ranked results
    return results.map((memory, index) => ({
      ...memory,
      score: 1 - index / results.length, // Approximate relevance
      strategy: "keyword",
    }));
  },
});

Strategy 3: Temporal Search

How It Works

Prioritizes recent or time-relevant memories:

// Get recent memories
const results = await ctx.db
  .query("memories")
  .withIndex("by_agent", (q) => q.eq("agentId", agentId))
  .order("desc") // Most recent first
  .take(20)
  .collect();

// Returns most recent memories, regardless of content

Strengths:

✅ Always relevant (recent = relevant)
✅ Very fast (simple index)
✅ No embeddings needed
✅ Great for conversations

Weaknesses:

❌ Ignores content relevance
❌ May miss important old information

Best for:

Conversation context (last N messages)
Recent user interactions
Time-sensitive information
When recency matters more than content

Implementation

export const recentSearch = query({
  args: {
    memorySpaceId: v.string(),
    filters: v.any(),
  },
  handler: async (ctx, args) => {
    let q = ctx.db
      .query("memories")
      .withIndex("by_agent", (q) => q.eq("agentId", args.agentId))
      .order("desc");

    // Filter by importance
    if (args.filters.minImportance) {
      q = q.filter((q) =>
        q.gte(q.field("metadata.importance"), args.filters.minImportance),
      );
    }

    // Filter by user
    if (args.filters.userId) {
      q = q.filter((q) => q.eq(q.field("userId"), args.filters.userId));
    }

    const results = await q.take(args.filters.limit || 20);

    return results.map((memory, index) => ({
      ...memory,
      score: 1 - index / results.length, // Recency score
      strategy: "recent",
    }));
  },
});

Strategy 4: Auto (Hybrid)

Intelligent Strategy Selection

export const autoSearch = query({
  args: {
    memorySpaceId: v.string(),
    query: v.string(),
    embedding: v.optional(v.array(v.float64())),
    filters: v.any(),
  },
  handler: async (ctx, args) => {
    // Decision tree
    if (args.embedding) {
      // Has embedding: Use semantic
      return await ctx.runQuery("memories:semanticSearch", args);
    } else if (args.query && args.query.length > 0) {
      // Has query: Use keyword
      return await ctx.runQuery("memories:keywordSearch", {
        memorySpaceId: args.agentId,
        keywords: args.query,
        filters: args.filters,
      });
    } else {
      // No query: Use recent
      return await ctx.runQuery("memories:recentSearch", args);
    }
  },
});

Hybrid Combination

Combine multiple strategies for best results:

export const hybridSearch = query({
  args: {
    memorySpaceId: v.string(),
    query: v.string(),
    embedding: v.array(v.float64()),
    filters: v.any(),
  },
  handler: async (ctx, args) => {
    // 1. Semantic search (top 20)
    const semantic = await ctx.runQuery("memories:semanticSearch", {
      memorySpaceId: args.agentId,
      embedding: args.embedding,
      filters: { limit: 20 },
    });

    // 2. Keyword search (top 20)
    const keyword = await ctx.runQuery("memories:keywordSearch", {
      memorySpaceId: args.agentId,
      keywords: args.query,
      filters: { limit: 20 },
    });

    // 3. Merge and re-rank
    const combined = mergeResults(semantic, keyword);

    // 4. Apply boosting (importance, recency, access)
    if (args.filters.boostImportance) {
      applyImportanceBoost(combined);
    }

    if (args.filters.boostRecent) {
      applyRecencyBoost(combined);
    }

    // 5. Sort by combined score
    combined.sort((a, b) => b.score - a.score);

    // 6. Return top N
    return combined.slice(0, args.filters.limit || 10);
  },
});

function mergeResults(semantic: any[], keyword: any[]) {
  const map = new Map();

  // Add semantic results
  semantic.forEach((r, i) => {
    map.set(r._id, {
      ...r,
      semanticScore: r.score,
      semanticRank: i,
      keywordScore: 0,
      keywordRank: Infinity,
    });
  });

  // Add keyword results
  keyword.forEach((r, i) => {
    if (map.has(r._id)) {
      const existing = map.get(r._id);
      existing.keywordScore = r.score;
      existing.keywordRank = i;
    } else {
      map.set(r._id, {
        ...r,
        semanticScore: 0,
        semanticRank: Infinity,
        keywordScore: r.score,
        keywordRank: i,
      });
    }
  });

  // Calculate combined score
  return Array.from(map.values()).map((r) => ({
    ...r,
    score: r.semanticScore * 0.7 + r.keywordScore * 0.3,
  }));
}

Boosting Strategies

Importance Boosting

function applyImportanceBoost(results: any[]) {
  results.forEach((r) => {
    const importanceBoost = r.metadata.importance / 100; // 0-1
    r.score = r.score * 0.7 + importanceBoost * 0.3;
  });
}

// Critical information ranks higher
// importance=100: +0.30 to score
// importance=50: +0.15 to score
// importance=0: +0.00 to score

Recency Boosting

function applyRecencyBoost(results: any[]) {
  const now = Date.now();
  const oneWeek = 7 * 24 * 60 * 60 * 1000;

  results.forEach((r) => {
    const age = now - r.createdAt;
    const recencyBoost = Math.max(0, 1 - age / oneWeek); // 0-1

    r.score = r.score * 0.8 + recencyBoost * 0.2;
  });
}

// Recent memories rank higher
// < 1 day old: +0.20 to score
// 3 days old: +0.10 to score
// > 7 days old: +0.00 to score

Access Frequency Boosting

function applyPopularityBoost(results: any[]) {
  // Find max access count
  const maxAccess = Math.max(...results.map((r) => r.accessCount));

  results.forEach((r) => {
    const popularityBoost = maxAccess > 0 ? r.accessCount / maxAccess : 0;
    r.score = r.score * 0.9 + popularityBoost * 0.1;
  });
}

// Frequently accessed memories rank higher

Combined Boosting

export const search = query({
  args: {
    memorySpaceId: v.string(),
    query: v.string(),
    embedding: v.optional(v.array(v.float64())),
    filters: v.any(),
  },
  handler: async (ctx, args) => {
    // Get base results
    const results = await getBaseResults(ctx, args);

    // Apply boosting (configurable)
    if (args.filters.boostImportance) {
      applyImportanceBoost(results);
    }

    if (args.filters.boostRecent) {
      applyRecencyBoost(results);
    }

    if (args.filters.boostPopular) {
      applyPopularityBoost(results);
    }

    // Re-sort by adjusted scores
    results.sort((a, b) => b.score - a.score);

    return results.slice(0, args.filters.limit || 10);
  },
});

Filter Application

Pre-Filtering (Convex Index)

Applied BEFORE search for efficiency:

// ✅ Pre-filtered (fast)
await ctx.db
  .query("memories")
  .withIndex(
    "by_embedding",
    (q) =>
      q
        .similar("embedding", vector, 20)
        .eq("agentId", agentId) // ← Pre-filter
        .eq("userId", userId), // ← Pre-filter
  )
  .collect();

// Only searches vectors for this agent+user
// filterFields: ["agentId", "userId"] enables this

Post-Filtering (Application Logic)

Applied AFTER search for complex logic:

// Post-filter (after vector search)
const results = await ctx.db
  .query("memories")
  .withIndex("by_embedding", (q) =>
    q
      .similar("embedding", vector, 50) // Get more results
      .eq("agentId", agentId),
  )
  .collect();

// Complex filters in code
const filtered = results.filter((memory) => {
  // Importance range
  if (memory.metadata.importance < 50 || memory.metadata.importance > 90) {
    return false;
  }

  // Tag matching (AND logic)
  if (!memory.metadata.tags.includes("password")) {
    return false;
  }

  // Date range
  if (memory.createdAt < someDate) {
    return false;
  }

  // Custom logic
  if (memory.metadata.customField !== "value") {
    return false;
  }

  return true;
});

return filtered.slice(0, 10);

Rule: Use pre-filtering when possible, post-filtering for complex logic.

Universal Filters Implementation

Filter Processing Pipeline

function applyUniversalFilters(
  results: MemoryEntry[],
  filters: UniversalFilters,
): MemoryEntry[] {
  let filtered = results;

  // userId (usually pre-filtered)
  if (filters.userId) {
    filtered = filtered.filter((m) => m.userId === filters.userId);
  }

  // Tags (any or all)
  if (filters.tags && filters.tags.length > 0) {
    if (filters.tagMatch === "all") {
      // Must have ALL tags
      filtered = filtered.filter((m) =>
        filters.tags.every((tag) => m.metadata.tags.includes(tag)),
      );
    } else {
      // Must have ANY tag (default)
      filtered = filtered.filter((m) =>
        filters.tags.some((tag) => m.metadata.tags.includes(tag)),
      );
    }
  }

  // Importance range
  if (filters.importance) {
    if (typeof filters.importance === "number") {
      filtered = filtered.filter(
        (m) => m.metadata.importance === filters.importance,
      );
    } else {
      // RangeQuery
      if (filters.importance.$gte !== undefined) {
        filtered = filtered.filter(
          (m) => m.metadata.importance >= filters.importance.$gte,
        );
      }
      if (filters.importance.$lte !== undefined) {
        filtered = filtered.filter(
          (m) => m.metadata.importance <= filters.importance.$lte,
        );
      }
    }
  }

  // Date ranges
  if (filters.createdAfter) {
    filtered = filtered.filter(
      (m) => m.createdAt >= filters.createdAfter.getTime(),
    );
  }

  if (filters.createdBefore) {
    filtered = filtered.filter(
      (m) => m.createdAt <= filters.createdBefore.getTime(),
    );
  }

  // Source type
  if (filters["source.type"]) {
    filtered = filtered.filter((m) => m.source.type === filters["source.type"]);
  }

  // Access patterns
  if (filters.accessCount) {
    filtered = applyRangeFilter(filtered, "accessCount", filters.accessCount);
  }

  return filtered;
}

Ranking and Scoring

Base Similarity Score

function cosineSimilarity(a: number[], b: number[]): number {
  let dotProduct = 0;
  let normA = 0;
  let normB = 0;

  for (let i = 0; i < a.length; i++) {
    dotProduct += a[i] * b[i];
    normA += a[i] * a[i];
    normB += b[i] * b[i];
  }

  return dotProduct / (Math.sqrt(normA) * Math.sqrt(normB));
}

// Returns 0-1 (1 = identical, 0 = opposite)

Multi-Factor Ranking

function calculateFinalScore(
  memory: MemoryEntry,
  baseScore: number,
  options: SearchOptions,
): number {
  let score = baseScore;

  // Factor 1: Importance (weight: 0.2)
  if (options.boostImportance) {
    const importanceFactor = memory.metadata.importance / 100;
    score = score * 0.8 + importanceFactor * 0.2;
  }

  // Factor 2: Recency (weight: 0.15)
  if (options.boostRecent) {
    const age = Date.now() - memory.createdAt;
    const oneMonth = 30 * 24 * 60 * 60 * 1000;
    const recencyFactor = Math.max(0, 1 - age / oneMonth);
    score = score * 0.85 + recencyFactor * 0.15;
  }

  // Factor 3: Access frequency (weight: 0.1)
  if (options.boostPopular) {
    const popularityFactor = Math.min(1, memory.accessCount / 100);
    score = score * 0.9 + popularityFactor * 0.1;
  }

  return score;
}

Strategy Selection Logic

Automatic Strategy

export const search = query({
  args: {
    memorySpaceId: v.string(),
    query: v.string(),
    embedding: v.optional(v.array(v.float64())),
    filters: v.any(),
  },
  handler: async (ctx, args) => {
    // Auto-select strategy
    let strategy = args.filters.strategy || "auto";

    if (strategy === "auto") {
      // Decide based on available inputs
      if (args.embedding) {
        strategy = "semantic";
      } else if (args.query && args.query.length > 0) {
        strategy = "keyword";
      } else {
        strategy = "recent";
      }
    }

    // Execute chosen strategy
    switch (strategy) {
      case "semantic":
        return await semanticSearch(ctx, args);

      case "keyword":
        return await keywordSearch(ctx, args);

      case "recent":
        return await recentSearch(ctx, args);

      default:
        throw new Error(`Unknown strategy: ${strategy}`);
    }
  },
});

Search Optimization Techniques

1. Limit Before Filter

// ❌ Slow: Filter all, then limit
const all = await ctx.db.query("memories").collect();
const filtered = all.filter((m) => m.metadata.importance >= 80);
const limited = filtered.slice(0, 10);

// ✅ Fast: Limit during query
const results = await ctx.db
  .query("memories")
  .withIndex("by_agent", (q) => q.eq("agentId", agentId))
  .filter((q) => q.gte(q.field("metadata.importance"), 80))
  .take(10); // ← Stop after 10 matches

2. Use Specific Indexes

// ❌ Generic index
await ctx.db
  .query("memories")
  .withIndex("by_agent", (q) => q.eq("agentId", agentId))
  .filter((q) => q.eq(q.field("source.type"), "a2a"))
  .collect();

// ✅ Specific compound index
await ctx.db
  .query("memories")
  .withIndex("by_agent_source", (q) =>
    q.eq("agentId", agentId).eq("source.type", "a2a"),
  )
  .collect();

3. Cache Frequent Queries

const searchCache = new Map<string, { results: any[]; timestamp: number }>();

export const cachedSearch = query({
  handler: async (ctx, args) => {
    const cacheKey = JSON.stringify(args);
    const cached = searchCache.get(cacheKey);

    // Cache for 60 seconds
    if (cached && Date.now() - cached.timestamp < 60000) {
      return cached.results;
    }

    // Execute search
    const results = await doSearch(ctx, args);

    // Cache results
    searchCache.set(cacheKey, {
      results,
      timestamp: Date.now(),
    });

    return results;
  },
});

Real-World Search Patterns

Pattern 1: Conversational Context

// Get recent relevant context for conversation
async function getConversationContext(
  memorySpaceId: string,
  userId: string,
  currentMessage: string,
) {
  const embedding = await embed(currentMessage);

  return await cortex.memory.search(agentId, currentMessage, {
    embedding,
    userId, // User-specific
    minImportance: 50, // Skip trivial
    limit: 5,
    boostRecent: true, // Prioritize recent
    strategy: "semantic",
  });
}

Pattern 2: Knowledge Retrieval

// Find best answer from knowledge base
async function findAnswer(query: string) {
  const embedding = await embed(query);

  return await cortex.memory.search("kb-agent", query, {
    embedding,
    minImportance: 70, // Only important articles
    tags: ["kb-article"],
    limit: 3,
    boostImportance: true, // Trust high-importance content
    strategy: "semantic",
  });
}

Pattern 3: Multi-Criteria Search

// Complex search with multiple criteria
async function advancedSearch(memorySpaceId: string, criteria: any) {
  const embedding = await embed(criteria.query);

  const results = await cortex.memory.search(agentId, criteria.query, {
    embedding,
    userId: criteria.userId,
    tags: criteria.tags,
    tagMatch: "all", // Must have all tags
    importance: { $gte: criteria.minImportance },
    createdAfter: criteria.since,
    "source.type": criteria.sourceType,
    limit: criteria.limit,
    boostImportance: true,
    boostRecent: true,
    strategy: "auto",
  });

  return results;
}

Fallback Strategies

Graceful Degradation

async function searchWithFallback(
  memorySpaceId: string,
  query: string,
  embedding?: number[],
) {
  try {
    // Try semantic first
    if (embedding) {
      const semantic = await cortex.memory.search(agentId, query, {
        embedding,
        limit: 10,
        strategy: "semantic",
      });

      if (semantic.length > 0) {
        return semantic;
      }
    }

    // Fall back to keyword
    const keyword = await cortex.memory.search(agentId, query, {
      limit: 10,
      strategy: "keyword",
    });

    if (keyword.length > 0) {
      return keyword;
    }

    // Fall back to recent
    return await cortex.memory.search(agentId, "*", {
      limit: 10,
      strategy: "recent",
      minImportance: 50,
    });
  } catch (error) {
    console.error("All search strategies failed:", error);
    return [];
  }
}

Performance Benchmarks

Search Latency by Strategy

Strategy	Index Used	Typical Latency	Dataset Size Impact
Semantic	Vector index	50-100ms	Logarithmic (with filterFields)
Keyword	Search index	20-50ms	Logarithmic
Recent	Regular index	10-20ms	Logarithmic
Hybrid	Multiple	100-200ms	Logarithmic (parallel)

Throughput

Queries per second (estimated):

Semantic: 50-100 QPS (embedding generation is bottleneck)
Keyword: 200-500 QPS (no embedding needed)
Recent: 500-1000 QPS (simple index lookup)

Optimizations:

Cache query embeddings (5-10× faster)
Batch embedding generation
Use Convex reactive queries (cached by Convex)

Next Steps

Context Chain Design - Context propagation architecture
Performance - Optimization techniques
Semantic Search Guide - Usage patterns

Questions? Ask in GitHub Discussions or Discord.

Overview​

Strategy 1: Semantic Search​

How It Works​

Implementation​

Strategy 2: Keyword Search​

How It Works​

Implementation​

Strategy 3: Temporal Search​

How It Works​

Implementation​

Strategy 4: Auto (Hybrid)​

Intelligent Strategy Selection​

Hybrid Combination​

Boosting Strategies​

Importance Boosting​

Recency Boosting​

Access Frequency Boosting​

Combined Boosting​

Filter Application​

Pre-Filtering (Convex Index)​

Post-Filtering (Application Logic)​

Universal Filters Implementation​

Filter Processing Pipeline​

Ranking and Scoring​

Base Similarity Score​

Multi-Factor Ranking​

Strategy Selection Logic​

Automatic Strategy​

Search Optimization Techniques​

1. Limit Before Filter​

2. Use Specific Indexes​

3. Cache Frequent Queries​

Real-World Search Patterns​

Pattern 1: Conversational Context​

Pattern 2: Knowledge Retrieval​

Pattern 3: Multi-Criteria Search​

Fallback Strategies​

Graceful Degradation​

Performance Benchmarks​

Search Latency by Strategy​

Throughput​

Next Steps​

Overview

Strategy 1: Semantic Search

How It Works

Implementation

Strategy 2: Keyword Search

How It Works

Implementation

Strategy 3: Temporal Search

How It Works

Implementation

Strategy 4: Auto (Hybrid)

Intelligent Strategy Selection

Hybrid Combination

Boosting Strategies

Importance Boosting

Recency Boosting

Access Frequency Boosting

Combined Boosting

Filter Application

Pre-Filtering (Convex Index)

Post-Filtering (Application Logic)

Universal Filters Implementation

Filter Processing Pipeline

Ranking and Scoring

Base Similarity Score

Multi-Factor Ranking

Strategy Selection Logic

Automatic Strategy

Search Optimization Techniques

1. Limit Before Filter

2. Use Specific Indexes

3. Cache Frequent Queries

Real-World Search Patterns

Pattern 1: Conversational Context

Pattern 2: Knowledge Retrieval

Pattern 3: Multi-Criteria Search

Fallback Strategies

Graceful Degradation

Performance Benchmarks

Search Latency by Strategy

Throughput

Next Steps