moteDB 开源｜全球首款面向具身智能的 AI 原生嵌入式多模态数据库MoteDB是全球首款面向具身智能场景的 AI

当机器人走进家庭、走进工厂，它们每天产生海量异构数据——视觉、语音、触觉、空间坐标、时间序列……传统数据库要么装不下，要么查不快。moteDB 正是为解决这一痛点而生。

背景：具身智能的数据存储之痛

具身智能（Embodied AI）正在快速从实验室走向商业化：家庭机器人、AR 眼镜、工业机械臂、无人配送车……

这些设备产生的数据和传统服务器完全不同：

数据类型	示例	传统方案痛点
向量数据	视觉特征、embedding	通用向量库缺少事务支持
空间坐标	物体位置、导航路径	GIS 数据库太重，边缘设备跑不动
时间序列	传感器数据、日志	时序库不支持向量检索
全文文本	指令、对话历史	无法统一查询多模态数据
结构化数据	配置、状态	向量库不支持复杂 JOIN

核心矛盾：现有方案要么太重（需要独立部署服务器），要么太散（多种数据库组合带来复杂度），要么缺少关键能力（无事务、无向量索引）。

moteDB 是什么

moteDB 是全球首款面向具身智能场景的 AI 原生嵌入式多模态数据库，100% Rust 实现，MIT 开源协议。

motto: 轻量 · 统一 · AI-Native

核心理念

嵌入式优先：零部署，直接编译进你的应用，核心内存占用 < 100MB
多模态统一：向量、文本、时序、空间坐标统一存储，一个查询搞定
AI-Native：专为具身智能的感知-决策闭环设计

核心技术特性

1. 五种多模态索引

索引类型	适用场景	性能提升
列索引 (COLUMN)	等值/范围查询	40x
向量索引 (VECTOR)	KNN 相似性搜索	100x
全文索引 (TEXT)	BM25 文本搜索	50x
空间索引 (SPATIAL)	R-Tree 地理查询	30x
时序索引 (TIMESTAMP)	时间范围扫描	20x

2. 完整 SQL 支持

子查询、聚合、JOIN、索引管理
预写式日志（WAL）+ MVCC 事务
保存点与部分回滚

3. 高性能批处理

批量插入比逐行快 10-20 倍
实测吞吐量：737,112 行/秒

性能实测

指标	实测数据
向量搜索延迟	< 5ms（95% 召回率）
核心内存占用	< 100MB
事务吞吐量	10,000 TPS

对比传统方案

方案	部署复杂度	向量+多模态	嵌入式	事务支持
moteDB	即嵌即用	✅ 原生统一	✅ <100MB	✅ MVCC
PostgreSQL + pgvector	需要部署	部分支持	❌	✅
Milvus / Qdrant	需要部署	✅	❌	❌
SQLite + 向量插件	即嵌即用	部分支持	✅	⚠️ 弱

快速上手

添加依赖

[dependencies]
motedb = "0.1"

创建数据库和表

use motedb::{Database, VectorIndexType};

let db = Database::in_memory().unwrap();

db.execute(r#"
    CREATE TABLE robot_sensors (
        id INTEGER PRIMARY KEY,
        embedding FLOAT[128],
        position SPATIAL,
        timestamp TIMESTAMP,
        description TEXT
    )
"#).unwrap();

// 创建向量索引
db.execute(r#"
    CREATE INDEX idx_embedding
    ON robot_sensors(embedding) USING VECTOR
"#).unwrap();

批量写入

use motedb::prelude::*;

let mut batch = BatchInsert::new("robot_sensors");
for i in 0..10000 {
    batch.push_row(row! {
        "embedding" => generate_embedding(),
        "position" => Point::new(x, y, z),
        "timestamp" => Utc::now(),
        "description" => format!("sensor_{}", i)
    })?;
}
db.execute_batch(batch)?;

应用场景

场景 1：家庭机器人

存储视觉特征、语音 embedding、空间地图
实时查询「类似当前场景的历史记忆」
毫秒级响应，支持本地离线运行

场景 2：工业机械臂

时序记录操作轨迹，空间索引定位工件
向量检索「类似故障模式的处理方案」
MVCC 事务支持多任务并发

场景 3：AR 眼镜

轻量嵌入式（<100MB），适配移动端
实时空间锚点存储与检索
离线优先，网络不稳定也能用

场景 4：RAG 系统

替代向量数据库 + 时序库的组合方案
一个库搞定文档 embedding + 元数据 + 检索

总结

moteDB 的定位很清晰：填补嵌入式 + 多模态 + AI-Native 这三个趋势交汇处的空白。

如果你正在做具身智能、边缘 AI、嵌入式 RAG 相关项目，欢迎试试 moteDB，你的反馈对我们非常重要。

安装命令：

cargo add motedb