当机器人走进家庭、走进工厂,它们每天产生海量异构数据——视觉、语音、触觉、空间坐标、时间序列……传统数据库要么装不下,要么查不快。moteDB 正是为解决这一痛点而生。
背景:具身智能的数据存储之痛
具身智能(Embodied AI)正在快速从实验室走向商业化:家庭机器人、AR 眼镜、工业机械臂、无人配送车……
这些设备产生的数据和传统服务器完全不同:
| 数据类型 | 示例 | 传统方案痛点 |
|---|---|---|
| 向量数据 | 视觉特征、embedding | 通用向量库缺少事务支持 |
| 空间坐标 | 物体位置、导航路径 | GIS 数据库太重,边缘设备跑不动 |
| 时间序列 | 传感器数据、日志 | 时序库不支持向量检索 |
| 全文文本 | 指令、对话历史 | 无法统一查询多模态数据 |
| 结构化数据 | 配置、状态 | 向量库不支持复杂 JOIN |
核心矛盾:现有方案要么太重(需要独立部署服务器),要么太散(多种数据库组合带来复杂度),要么缺少关键能力(无事务、无向量索引)。
moteDB 是什么
moteDB 是全球首款面向具身智能场景的 AI 原生嵌入式多模态数据库,100% Rust 实现,MIT 开源协议。
motto: 轻量 · 统一 · AI-Native
核心理念
- 嵌入式优先:零部署,直接编译进你的应用,核心内存占用 < 100MB
- 多模态统一:向量、文本、时序、空间坐标统一存储,一个查询搞定
- AI-Native:专为具身智能的感知-决策闭环设计
核心技术特性
1. 五种多模态索引
| 索引类型 | 适用场景 | 性能提升 |
|---|---|---|
| 列索引 (COLUMN) | 等值/范围查询 | 40x |
| 向量索引 (VECTOR) | KNN 相似性搜索 | 100x |
| 全文索引 (TEXT) | BM25 文本搜索 | 50x |
| 空间索引 (SPATIAL) | R-Tree 地理查询 | 30x |
| 时序索引 (TIMESTAMP) | 时间范围扫描 | 20x |
2. 完整 SQL 支持
- 子查询、聚合、JOIN、索引管理
- 预写式日志(WAL)+ MVCC 事务
- 保存点与部分回滚
3. 高性能批处理
- 批量插入比逐行快 10-20 倍
- 实测吞吐量:737,112 行/秒
性能实测
| 指标 | 实测数据 |
|---|---|
| 向量搜索延迟 | < 5ms(95% 召回率) |
| 核心内存占用 | < 100MB |
| 事务吞吐量 | 10,000 TPS |
对比传统方案
| 方案 | 部署复杂度 | 向量+多模态 | 嵌入式 | 事务支持 |
|---|---|---|---|---|
| moteDB | 即嵌即用 | ✅ 原生统一 | ✅ <100MB | ✅ MVCC |
| PostgreSQL + pgvector | 需要部署 | 部分支持 | ❌ | ✅ |
| Milvus / Qdrant | 需要部署 | ✅ | ❌ | ❌ |
| SQLite + 向量插件 | 即嵌即用 | 部分支持 | ✅ | ⚠️ 弱 |
快速上手
添加依赖
[dependencies]
motedb = "0.1"
创建数据库和表
use motedb::{Database, VectorIndexType};
let db = Database::in_memory().unwrap();
db.execute(r#"
CREATE TABLE robot_sensors (
id INTEGER PRIMARY KEY,
embedding FLOAT[128],
position SPATIAL,
timestamp TIMESTAMP,
description TEXT
)
"#).unwrap();
// 创建向量索引
db.execute(r#"
CREATE INDEX idx_embedding
ON robot_sensors(embedding) USING VECTOR
"#).unwrap();
批量写入
use motedb::prelude::*;
let mut batch = BatchInsert::new("robot_sensors");
for i in 0..10000 {
batch.push_row(row! {
"embedding" => generate_embedding(),
"position" => Point::new(x, y, z),
"timestamp" => Utc::now(),
"description" => format!("sensor_{}", i)
})?;
}
db.execute_batch(batch)?;
应用场景
场景 1:家庭机器人
- 存储视觉特征、语音 embedding、空间地图
- 实时查询「类似当前场景的历史记忆」
- 毫秒级响应,支持本地离线运行
场景 2:工业机械臂
- 时序记录操作轨迹,空间索引定位工件
- 向量检索「类似故障模式的处理方案」
- MVCC 事务支持多任务并发
场景 3:AR 眼镜
- 轻量嵌入式(<100MB),适配移动端
- 实时空间锚点存储与检索
- 离线优先,网络不稳定也能用
场景 4:RAG 系统
- 替代向量数据库 + 时序库的组合方案
- 一个库搞定文档 embedding + 元数据 + 检索
总结
moteDB 的定位很清晰:填补嵌入式 + 多模态 + AI-Native 这三个趋势交汇处的空白。
如果你正在做具身智能、边缘 AI、嵌入式 RAG 相关项目,欢迎试试 moteDB,你的反馈对我们非常重要。
安装命令:
cargo add motedb