本文面向:想在 Node.js 项目中实现本地语义搜索的开发者。
预计阅读时间:12 分钟
最终效果:掌握 vectra 的索引创建、向量插入、查询、删除、事务模式的完整用法,理解 ChatCrystal 的候选集升级和双写策略。
想在 Node.js 项目里加语义搜索,但不想装 Python、不想跑 Docker、不想申请云服务 API Key?vectra 就是为这个场景设计的——一个纯 JavaScript 实现的本地向量搜索引擎,零原生依赖,数据全部存在本地文件里。
这篇文章从零开始,带你用 vectra 完成向量索引的创建、插入、查询、删除全流程,所有代码来自 ChatCrystal 的生产级实现。
vectra 是什么
vectra 是 Steve Bilig 开发的轻量级向量数据库,核心特点:
- 纯 JS。没有任何 C++ 原生模块,
npm install即可,不需要编译 - 文件存储。索引数据存在本地文件系统,不依赖 SQLite 或外部服务
- TypeScript 原生。类型定义完整,IDE 补全友好
- HNSW 算法。基于 Hierarchical Navigable Small World 算法做近似最近邻搜索,查询速度快
vectra 不是为大规模生产环境设计的(百万级以上向量应该用 Qdrant 或 Pinecone),但它非常适合本地工具、CLI 应用、Electron 桌面软件这类场景。ChatCrystal 用它存储所有笔记的 embedding 向量,支撑语义搜索功能。
为什么选 vectra
选型时考虑过几个方案:
| 方案 | 问题 |
|---|---|
| chroma | 需要 Python 运行时,Node.js 项目集成成本高 |
| hnswlib-node | 有 C++ 原生依赖,跨平台编译容易出问题 |
| 自己实现 | HNSW 算法复杂度高,不适合项目初期 |
| vectra | 纯 JS、零配置、文件存储、API 简洁 |
vectra 的优势在于零摩擦:npm install vectra 装完就能用,不需要配置数据库连接、不需要启动额外进程、不需要处理原生模块编译失败的问题。对于 Electron 桌面应用这种需要跨平台分发的场景,这一点尤其重要。
安装和初始化
npm install vectra
创建索引实例:
import { LocalIndex } from 'vectra';
import { resolve } from 'node:path';
const INDEX_PATH = resolve('./data', 'vectra-index');
const index = new LocalIndex(INDEX_PATH);
LocalIndex 构造函数只接收一个路径参数,不创建任何文件。需要显式调用 createIndex() 初始化:
if (!(await index.isIndexCreated())) {
await index.createIndex();
}
isIndexCreated() 检查路径下是否已有索引文件。这个模式适合应用启动时调用——首次运行创建索引,后续运行直接复用。
ChatCrystal 用单例模式管理索引实例,避免重复创建:
// server/src/services/vector-index.ts
const INDEX_PATH = resolve(appConfig.dataDir, 'vectra-index');
let _index: LocalIndex | null = null;
export async function getIndex(): Promise<LocalIndex> {
if (_index) return _index;
_index = new LocalIndex(INDEX_PATH);
if (!(await _index.isIndexCreated())) {
await _index.createIndex();
}
return _index;
}
插入向量
向 vectra 插入数据需要两样东西:向量(浮点数组)和元数据(任意 JSON 对象)。
先拿到一个向量。实际项目中会调用 Embedding 模型,这里用随机向量演示:
// 模拟一个 768 维的 embedding 向量
const vector = Array.from({ length: 768 }, () => Math.random() * 2 - 1);
const item = await index.insertItem({
vector,
metadata: {
noteId: 42,
chunkIndex: 0,
title: 'SQLite WAL 模式并发写入问题',
projectName: 'my-project',
},
});
console.log(item.id); // vectra 自动生成的唯一 ID
insertItem 返回的对象包含 id 字段,这是 vectra 分配的内部标识符。后续删除、查询都会用到它。ChatCrystal 把这个 id 存到 SQLite 的 embeddings 表中,建立 vectra 向量和业务数据之间的关联。
在 ChatCrystal 的实际代码中,一条笔记会被切分成多个 chunk,每个 chunk 独立生成向量并插入:
// server/src/services/embedding.ts
const item = await index.insertItem({
vector: chunk.vector,
metadata: {
noteId: id,
chunkIndex: chunk.chunkIndex,
conversationId,
title,
projectName,
} as NoteChunkMeta,
});
// 保存 vectra ID 到 SQLite,建立关联
newItems.push({
chunkIndex: chunk.chunkIndex,
chunkText: chunk.chunkText,
vectraId: item.id,
});
metadata 里的字段完全自定义。vectra 不关心你放什么进去,它只负责存储和返回。但 metadata 在查询时可以用来做过滤,所以合理设计 metadata 结构很重要。
查询向量
查询是 vectra 最核心的功能。给一个查询向量,它返回余弦相似度最高的 top-K 结果:
const queryVector = Array.from({ length: 768 }, () => Math.random() * 2 - 1);
const results = await index.queryItems(queryVector, '查询文本', 10);
for (const result of results) {
console.log(`笔记: ${result.item.metadata.title}`);
console.log(`相似度: ${result.score}`);
console.log(`chunk: ${result.item.metadata.chunkIndex}`);
}
queryItems 的三个参数:
- queryVector — 查询向量(浮点数组)
- queryText — 查询文本(vectra 内部用于辅助,传空字符串也行)
- topK — 返回结果数量
返回的每个 result 包含 item(含 metadata)和 score(相似度分数,0-1 之间,越大越相似)。
ChatCrystal 在实际搜索中加入了候选集升级机制——因为一个笔记可能有多个 chunk,直接取 top-10 可能返回的 10 个 chunk 全来自同一条笔记。所以先取小批量,不够就翻倍:
let candidateK = requestedTopK;
let directResults: DirectSearchHit[] = [];
while (candidateK > 0) {
const results = await index.queryItems<NoteChunkMeta>(embedding, query, candidateK);
directResults = await materializeDirectSearchHits(db, results);
if (directResults.length >= requestedTopK || results.length < candidateK) break;
// 翻倍候选集,但不超过索引总条数
const nextCandidateK = candidateLimit === undefined
? candidateK * 2
: Math.min(candidateK * 2, candidateLimit);
if (nextCandidateK <= candidateK) break;
candidateK = nextCandidateK;
}
materializeDirectSearchHits 从 SQLite 读取 chunk 原文,按 noteId 去重保留最高分。这样即使 vectra 返回了同一笔记的 5 个 chunk,最终结果里也只出现一条。
按 metadata 过滤
vectra 支持按 metadata 字段过滤查询结果。比如只搜索某个项目的笔记:
// 获取指定笔记的所有 chunk
const items = await index.listItemsByMetadata({ noteId: 42 });
listItemsByMetadata 接收一个 metadata 对象,返回所有字段完全匹配的条目。ChatCrystal 用它来做两件事:
删除前查找:先找到某条笔记在 vectra 中的所有 chunk ID,然后逐个删除:
// server/src/services/vector-index.ts
export async function committedVectraIdsForNote(index: LocalIndex, noteId: number): Promise<string[]> {
const items = await index.listItemsByMetadata({ noteId });
return items.map((item) => item.id);
}
存在性检查:确认 vectra 中的向量是否和 SQLite 记录一致:
export async function currentVectraIdsCommitted(index: LocalIndex, vectraIds: string[]): Promise<boolean> {
if (vectraIds.length === 0) return false;
for (const vectraId of vectraIds) {
if (!(await index.getItem(vectraId))) {
return false;
}
}
return true;
}
getItem(vectraId) 按 ID 获取单个条目,如果不存在返回 undefined。
需要注意的是,vectra 的 listItemsByMetadata 是精确匹配,不支持范围查询或模糊匹配。如果你需要复杂的过滤逻辑,应该在 vectra 查询之后用业务代码二次过滤。
删除向量
删除单个向量:
await index.deleteItem(vectraId);
ChatCrystal 在更新笔记的 embedding 时,会先删除旧向量再插入新向量:
// 找到旧向量
const oldVectraIds = await committedVectraIdsForNote(index, noteId);
// 插入新向量后,删除旧的
for (const vectraId of oldVectraIds) {
await index.deleteItem(vectraId);
}
如果要清空整个索引重建,可以直接删除索引目录:
import { existsSync, rmSync } from 'node:fs';
export function clearEmbeddingIndex(): void {
_index = null; // 清空内存缓存
if (existsSync(INDEX_PATH)) {
rmSync(INDEX_PATH, { recursive: true, force: true });
}
// 下次 getIndex() 调用会自动重建空索引
}
事务模式:beginUpdate / endUpdate
这是 vectra 最重要的设计模式。单个 insertItem 或 deleteItem 调用会立即写入磁盘,但如果你要批量操作,每次都写盘会很慢。vectra 提供了事务式的批量写入:
await index.beginUpdate();
// 批量插入/删除,不会立即写盘
await index.insertItem({ vector: v1, metadata: { ... } });
await index.insertItem({ vector: v2, metadata: { ... } });
await index.deleteItem(oldId);
await index.endUpdate(); // 这时候才一次性写入磁盘
如果中途出错,可以用 cancelUpdate() 回滚:
let updateOpen = false;
try {
await index.beginUpdate();
updateOpen = true;
// ... 写入操作 ...
await index.endUpdate();
updateOpen = false;
} catch (error) {
if (updateOpen) {
try {
index.cancelUpdate(); // 丢弃未提交的变更
} catch {
// 忽略取消失败,优先抛出原始错误
}
}
throw error;
}
ChatCrystal 在所有批量写入的地方都用了这个模式。updateOpen 标志位确保 cancelUpdate 只在事务确实开启的情况下才调用,避免二次异常。
实际代码(删除某笔记的所有向量):
// server/src/services/vector-index.ts
export async function deleteVectraItemsForNote(index: LocalIndex, noteId: number): Promise<number> {
const vectraIds = await committedVectraIdsForNote(index, noteId);
if (vectraIds.length === 0) return 0;
let updateOpen = false;
try {
await index.beginUpdate();
updateOpen = true;
for (const vectraId of vectraIds) {
await index.deleteItem(vectraId);
}
await index.endUpdate();
updateOpen = false;
return vectraIds.length;
} catch (error) {
if (updateOpen) {
try {
index.cancelUpdate();
} catch {
// Ignore cancel failures
}
}
throw error;
}
}
索引统计
获取索引中的向量总数:
const stats = await index.getIndexStats();
console.log(`索引中有 ${stats.items} 个向量`);
ChatCrystal 用这个数字来决定查询时的候选集大小——如果索引里只有 5 个向量,就没必要请求 top-100。
文件存储结构
vectra 的索引存储在你指定的目录下。ChatCrystal 的路径是 {dataDir}/vectra-index/:
~/.chatcrystal/data/vectra-index/
├── items/ # 向量数据文件
├── index.json # 索引元信息
└── ...
因为是纯文件存储,备份只需要复制整个目录,迁移也只需要把目录搬到新位置。不需要 pg_dump、不需要 mysqldump,cp -r 搞定。
这个特性对 Electron 桌面应用特别友好:用户卸载重装后,只要数据目录还在,索引就还在。
vectra vs chroma vs hnswlib
| 维度 | vectra | chroma | hnswlib-node |
|---|---|---|---|
| 语言 | 纯 JS/TS | Python | C++ binding |
| 原生依赖 | 无 | 有 | 有 |
| 安装难度 | npm install | pip install + server | 需要编译环境 |
| 运行方式 | 进程内嵌入 | 独立服务 | 进程内嵌入 |
| 存储方式 | 文件系统 | SQLite / 文件 | 文件 |
| 适合场景 | Node.js 本地工具 | Python 应用、服务端 | 需要极致性能 |
| 元数据过滤 | 精确匹配 | 丰富过滤表达式 | 无内置支持 |
| 最大规模 | 万级 | 十万级 | 百万级 |
vectra 的定位很清晰:Node.js 生态里的轻量级本地向量存储。如果你的项目是 Python 技术栈,chroma 更合适。如果你需要处理百万级向量,应该上 Qdrant 或 Pinecone。但如果你是 Node.js 开发者,想要一个零配置的本地语义搜索能力,vectra 是目前最好的选择。
下一步
- 从零实现 Embedding 服务 — Embedding 的完整流程:文本构建、分块、API 调用、存储
- nomic vs openai embedding 横评 — 本地与云端 Embedding 模型的性能对比
- 大量对话导入时的内存优化 — vectra 索引一致性与内存管理
- vectra 源码:github.com/Stevenic/ve… — 核心代码不到 2000 行,值得通读