moteDB 开源|全球首款面向具身智能的 AI 原生嵌入式多模态数据库

1 阅读4分钟

当机器人走进家庭、走进工厂,它们每天产生海量异构数据——视觉、语音、触觉、空间坐标、时间序列……传统数据库要么装不下,要么查不快。moteDB 正是为解决这一痛点而生。

背景:具身智能的数据存储之痛

具身智能(Embodied AI)正在快速从实验室走向商业化:家庭机器人、AR 眼镜、工业机械臂、无人配送车……

这些设备产生的数据和传统服务器完全不同:

数据类型示例传统方案痛点
向量数据视觉特征、embedding通用向量库缺少事务支持
空间坐标物体位置、导航路径GIS 数据库太重,边缘设备跑不动
时间序列传感器数据、日志时序库不支持向量检索
全文文本指令、对话历史无法统一查询多模态数据
结构化数据配置、状态向量库不支持复杂 JOIN

核心矛盾:现有方案要么太重(需要独立部署服务器),要么太散(多种数据库组合带来复杂度),要么缺少关键能力(无事务、无向量索引)。


moteDB 是什么

moteDB 是全球首款面向具身智能场景的 AI 原生嵌入式多模态数据库,100% Rust 实现,MIT 开源协议。

motto: 轻量 · 统一 · AI-Native

核心理念

  • 嵌入式优先:零部署,直接编译进你的应用,核心内存占用 < 100MB
  • 多模态统一:向量、文本、时序、空间坐标统一存储,一个查询搞定
  • AI-Native:专为具身智能的感知-决策闭环设计

核心技术特性

1. 五种多模态索引

索引类型适用场景性能提升
列索引 (COLUMN)等值/范围查询40x
向量索引 (VECTOR)KNN 相似性搜索100x
全文索引 (TEXT)BM25 文本搜索50x
空间索引 (SPATIAL)R-Tree 地理查询30x
时序索引 (TIMESTAMP)时间范围扫描20x

2. 完整 SQL 支持

  • 子查询、聚合、JOIN、索引管理
  • 预写式日志(WAL)+ MVCC 事务
  • 保存点与部分回滚

3. 高性能批处理

  • 批量插入比逐行快 10-20 倍
  • 实测吞吐量:737,112 行/秒

性能实测

指标实测数据
向量搜索延迟< 5ms(95% 召回率)
核心内存占用< 100MB
事务吞吐量10,000 TPS

对比传统方案

方案部署复杂度向量+多模态嵌入式事务支持
moteDB即嵌即用✅ 原生统一✅ <100MB✅ MVCC
PostgreSQL + pgvector需要部署部分支持
Milvus / Qdrant需要部署
SQLite + 向量插件即嵌即用部分支持⚠️ 弱

快速上手

添加依赖

[dependencies]
motedb = "0.1"

创建数据库和表

use motedb::{Database, VectorIndexType};

let db = Database::in_memory().unwrap();

db.execute(r#"
    CREATE TABLE robot_sensors (
        id INTEGER PRIMARY KEY,
        embedding FLOAT[128],
        position SPATIAL,
        timestamp TIMESTAMP,
        description TEXT
    )
"#).unwrap();

// 创建向量索引
db.execute(r#"
    CREATE INDEX idx_embedding
    ON robot_sensors(embedding) USING VECTOR
"#).unwrap();

批量写入

use motedb::prelude::*;

let mut batch = BatchInsert::new("robot_sensors");
for i in 0..10000 {
    batch.push_row(row! {
        "embedding" => generate_embedding(),
        "position" => Point::new(x, y, z),
        "timestamp" => Utc::now(),
        "description" => format!("sensor_{}", i)
    })?;
}
db.execute_batch(batch)?;

应用场景

场景 1:家庭机器人

  • 存储视觉特征、语音 embedding、空间地图
  • 实时查询「类似当前场景的历史记忆」
  • 毫秒级响应,支持本地离线运行

场景 2:工业机械臂

  • 时序记录操作轨迹,空间索引定位工件
  • 向量检索「类似故障模式的处理方案」
  • MVCC 事务支持多任务并发

场景 3:AR 眼镜

  • 轻量嵌入式(<100MB),适配移动端
  • 实时空间锚点存储与检索
  • 离线优先,网络不稳定也能用

场景 4:RAG 系统

  • 替代向量数据库 + 时序库的组合方案
  • 一个库搞定文档 embedding + 元数据 + 检索

总结

moteDB 的定位很清晰:填补嵌入式 + 多模态 + AI-Native 这三个趋势交汇处的空白

如果你正在做具身智能、边缘 AI、嵌入式 RAG 相关项目,欢迎试试 moteDB,你的反馈对我们非常重要。


安装命令:

cargo add motedb