首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
语落心生
掘友等级
算法infra
Github: kaori-seasons/undertaker86001/kitalkuyo-gita 人生如棋,落子无悔。不过片刻之间,闲敲棋子落灯花而已。 Apache Geaflow Committer, 百度飞桨PPDE(开发者专家). 参与过两次Gsoc,目前在研究AGI相关
获得徽章 8
动态
文章
专栏
沸点
收藏集
关注
作品
赞
190
文章 182
沸点 8
赞
190
返回
|
搜索文章
最新
热门
探秘新一代向量存储格式Lance-format (二十七) Blob 数据支持
第27章:Blob 数据支持 🎯 核心概览 Blob(Binary Large Object)是指图像、视频、音频等大型非结构化数据。Lance 支持在同一数据集中混合存储结构化数据(向量、标量)和非
探秘新一代向量存储格式Lance-format (二十六) 数据清理与压缩
第26章:数据清理与压缩 🎯 核心概览 随着数据的不断更新、删除,Lance 会产生大量的过期版本和碎片化文件。数据清理与压缩通过删除过期版本、合并小文件等操作,回收存储空间并提高查询性能。定期清理可
探秘新一代向量存储格式Lance-format (二十五) RowID 系统
第25章:RowID 系统 🎯 核心概览 RowID 是 Lance 中每一行数据的唯一标识符。RowID 系统负责生成、管理和映射行号,支持行级的增删改查操作。RowID 通常是一个 64 位整数,
探秘新一代向量存储格式Lance-format (二十四) 事务与提交协议
第24章:事务与提交协议 🎯 核心概览 Lance 通过乐观并发控制和分布式锁机制实现 ACID 事务。多个客户端可以并发读写,通过版本机制解决冲突,确保数据一致性和可用性。 🔐 ACID 保证实现
探秘新一代向量存储格式Lance-format (二十三) Manifest 与版本管理
第23章:Manifest 与版本管理 🎯 核心概览 Manifest 是 Lance 的核心版本管理机制,记录了数据集的完整历史。每次提交都会生成一个新的 Manifest,包含指向数据的指针、版本
探秘新一代向量存储格式Lance-format (二十二) 表达式与投影
第22章:表达式与投影 🎯 核心概览 表达式和投影是查询执行的基础。表达式用于计算结果列的值(如函数调用、算术运算、条件判断),投影用于选择和转换输出的列。Lance 实现了一套高效的表达式求值和投影
探秘新一代向量存储格式Lance-format (二十一) SQL 查询支持
第21章:SQL 查询支持 🎯 核心概览 Lance 通过完整的 SQL 解析、规划和执行框架,提供对向量数据的 SQL 查询支持。用户可以使用熟悉的 SQL 语法进行向量搜索、标量过滤、联接等复杂操
探秘新一代向量存储格式Lance-format (二十) DataFusion 集成架构
第20章:DataFusion 集成架构 🎯 核心概览 Lance 通过与 Apache DataFusion 的深度集成,实现了向量搜索与 SQL 查询的无缝融合。DataFusion 是一个高性能
探秘新一代向量存储格式Lance-format (十九) 向量索引 - 向量搜索查询优化
第19章:向量搜索查询优化 🎯 核心概览 向量搜索的查询优化是实现高效、精准搜索的关键。通过调整搜索参数、应用过滤策略和重排机制,可以在精度和速度之间找到最优平衡,获得 5-10 倍的性能提升。 📊
探秘新一代向量存储格式Lance-format (十八) 向量量化技术
第18章:向量量化技术 🎯 核心概览 量化是向量压缩和加速的关键技术。通过牺牲极小的精度,换取 100 倍的空间节省和 10-100 倍的速度提升。 📊 三种主要量化方式 Product Quanti
下一页
个人成就
文章被点赞
191
文章被阅读
81,202
掘力值
3,812
关注了
87
关注者
275
收藏集
1
关注标签
32
加入于
2018-02-05