首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
探秘新一代向量存储格式Lance-format
语落心生
创建于2026-01-21
订阅专栏
Lance-format是一种新的多模态向量格式,面向多大规模训练,推理的场景. 感兴趣的朋友可以多多关注下
等 3 人订阅
共28篇文章
创建于2026-01-21
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
探秘新一代向量存储格式Lance-format (二十三) Manifest 与版本管理
第23章:Manifest 与版本管理 🎯 核心概览 Manifest 是 Lance 的核心版本管理机制,记录了数据集的完整历史。每次提交都会生成一个新的 Manifest,包含指向数据的指针、版本
探秘新一代向量存储格式Lance-format (二十二) 表达式与投影
第22章:表达式与投影 🎯 核心概览 表达式和投影是查询执行的基础。表达式用于计算结果列的值(如函数调用、算术运算、条件判断),投影用于选择和转换输出的列。Lance 实现了一套高效的表达式求值和投影
探秘新一代向量存储格式Lance-format (二十八) 性能优化技巧
第28章:性能优化技巧 🎯 核心概览 性能优化涉及多个层面:批处理、内存池管理、CPU SIMD 特性检测等。这些技巧可以获得 2-5 倍的性能提升。 📦 批处理优化 批大小选择 列式存储的批处理 💾
探秘新一代向量存储格式Lance-format (二十) DataFusion 集成架构
第20章:DataFusion 集成架构 🎯 核心概览 Lance 通过与 Apache DataFusion 的深度集成,实现了向量搜索与 SQL 查询的无缝融合。DataFusion 是一个高性能
探秘新一代向量存储格式Lance-format (十九) 向量索引 - 向量搜索查询优化
第19章:向量搜索查询优化 🎯 核心概览 向量搜索的查询优化是实现高效、精准搜索的关键。通过调整搜索参数、应用过滤策略和重排机制,可以在精度和速度之间找到最优平衡,获得 5-10 倍的性能提升。 📊
探秘新一代向量存储格式Lance-format (二十四) 事务与提交协议
第24章:事务与提交协议 🎯 核心概览 Lance 通过乐观并发控制和分布式锁机制实现 ACID 事务。多个客户端可以并发读写,通过版本机制解决冲突,确保数据一致性和可用性。 🔐 ACID 保证实现
探秘新一代向量存储格式Lance-format (二十七) Blob 数据支持
第27章:Blob 数据支持 🎯 核心概览 Blob(Binary Large Object)是指图像、视频、音频等大型非结构化数据。Lance 支持在同一数据集中混合存储结构化数据(向量、标量)和非
探秘新一代向量存储格式Lance-format (二十五) RowID 系统
第25章:RowID 系统 🎯 核心概览 RowID 是 Lance 中每一行数据的唯一标识符。RowID 系统负责生成、管理和映射行号,支持行级的增删改查操作。RowID 通常是一个 64 位整数,