首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
人工智能
LLM
Agent
AIGC
程序员
OpenAI
后端
AI编程
前端
展开
全部
人工智能
LLM
Agent
AIGC
程序员
OpenAI
后端
AI编程
前端
算法
LangChain
Python
深度学习
计算机视觉
架构
暂无数据
推荐
最新
🚀 Supabase:强力的服务端助手
Supabase 是一个开源的 Postgres 开发平台,被誉为「Firebase 的开源平替」,但它不仅仅是替代品——它是一个为 Web、移动端与 AI 应用 构建的企业级后端体系。 🧱 一、Su
Agent 上下文管理系列 - mem0 设计全解
mem0 是一个围绕「记忆系统」构建的开源框架,它让大模型具备“长期记忆”的能力。本文将通过源码拆解,带你深入理解 mem0 的核心设计与工作原理,尤其是最关键的记忆创建(add)机制。
探秘新一代向量存储格式Lance-format (二十一) SQL 查询支持
第21章:SQL 查询支持 🎯 核心概览 Lance 通过完整的 SQL 解析、规划和执行框架,提供对向量数据的 SQL 查询支持。用户可以使用熟悉的 SQL 语法进行向量搜索、标量过滤、联接等复杂操
探秘新一代向量存储格式Lance-format (二十) DataFusion 集成架构
第20章:DataFusion 集成架构 🎯 核心概览 Lance 通过与 Apache DataFusion 的深度集成,实现了向量搜索与 SQL 查询的无缝融合。DataFusion 是一个高性能
LeanSpec:一个轻量级的 SDD 框架
LeanSpec 是一种为 AI 时代设计的轻量级 Spec 驱动开发(Spec-Driven Development, SDD) 方法论。
无界通信与主题切换:当主系统邂逅子系统的浪漫史
前言:命运的邂逅 🎭 在数字宇宙的某个角落,主系统(Lord System)端坐于内存的宝座上,子系统(Sub System)在另一块地址空间里默默耕耘。它们彼此隔绝,像被薯片袋隔开的两片海苔——明明
探秘新一代向量存储格式Lance-format (二十四) 事务与提交协议
第24章:事务与提交协议 🎯 核心概览 Lance 通过乐观并发控制和分布式锁机制实现 ACID 事务。多个客户端可以并发读写,通过版本机制解决冲突,确保数据一致性和可用性。 🔐 ACID 保证实现
探秘新一代向量存储格式Lance-format (二十八) 性能优化技巧
第28章:性能优化技巧 🎯 核心概览 性能优化涉及多个层面:批处理、内存池管理、CPU SIMD 特性检测等。这些技巧可以获得 2-5 倍的性能提升。 📦 批处理优化 批大小选择 列式存储的批处理 💾
探秘新一代向量存储格式Lance-format (二十五) RowID 系统
第25章:RowID 系统 🎯 核心概览 RowID 是 Lance 中每一行数据的唯一标识符。RowID 系统负责生成、管理和映射行号,支持行级的增删改查操作。RowID 通常是一个 64 位整数,
探秘新一代向量存储格式Lance-format (二十七) Blob 数据支持
第27章:Blob 数据支持 🎯 核心概览 Blob(Binary Large Object)是指图像、视频、音频等大型非结构化数据。Lance 支持在同一数据集中混合存储结构化数据(向量、标量)和非
Apache Geaflow推理框架Geaflow-infer 解析系列(一)Geaflow-Infer 模块简介
第1章:Geaflow-Infer 模块简介 章节导读 本文将从宏观的角度出发,系统地介绍这个模块的定位、应用场景、核心功能和组织结构。通过本章的学习,你将对 geaflow-infer 模块有一个全
探秘新一代向量存储格式Lance-format (十九) 向量索引 - 向量搜索查询优化
第19章:向量搜索查询优化 🎯 核心概览 向量搜索的查询优化是实现高效、精准搜索的关键。通过调整搜索参数、应用过滤策略和重排机制,可以在精度和速度之间找到最优平衡,获得 5-10 倍的性能提升。 📊
探秘新一代向量存储格式Lance-format (二十六) 数据清理与压缩
第26章:数据清理与压缩 🎯 核心概览 随着数据的不断更新、删除,Lance 会产生大量的过期版本和碎片化文件。数据清理与压缩通过删除过期版本、合并小文件等操作,回收存储空间并提高查询性能。定期清理可
探秘新一代向量存储格式Lance-format (十五) 标量索引实现
第15章:标量索引实现 🎯 核心概览 BTree、Bitmap 和倒排索引是标量数据加速的三大支柱。 📊 BTree 索引 原理 BTree 是自平衡的排序树,支持范围查询。 实现 查询性能 🎯 Bi
探秘新一代向量存储格式Lance-format (十六) 向量索引 - IVF 系列
第16章:向量索引 - IVF 系列 🎯 核心概览 IVF(Inverted File)和 IVF_PQ 是 Lance 中最重要的向量索引,提供 100-1000 倍的加速。 📊 IVF 原理 🔧
探秘新一代向量存储格式Lance-format (十八) 向量量化技术
第18章:向量量化技术 🎯 核心概览 量化是向量压缩和加速的关键技术。通过牺牲极小的精度,换取 100 倍的空间节省和 10-100 倍的速度提升。 📊 三种主要量化方式 Product Quanti
探秘新一代向量存储格式Lance-format (十四) 索引系统架构
第14章:索引系统架构 🎯 核心概览 索引系统是 Lance 查询加速的核心。本章讲解索引接口设计、元数据管理和生命周期。 📊 第一部分:索引架构 Index Trait 定义 索引注册表 🔧 第二部
探秘新一代向量存储格式Lance-format (二十三) Manifest 与版本管理
第23章:Manifest 与版本管理 🎯 核心概览 Manifest 是 Lance 的核心版本管理机制,记录了数据集的完整历史。每次提交都会生成一个新的 Manifest,包含指向数据的指针、版本
探秘新一代向量存储格式Lance-format (十七) 向量索引 - HNSW 实现
第17章:向量索引 - HNSW 实现 🎯 核心概览 HNSW(Hierarchical Navigable Small World)是一种分层图结构,支持高效的向量搜索和增量索引。 📊 HNSW 原
探秘新一代向量存储格式Lance-format (八) Dataset 核心实现与生命周期
第8章:Dataset 核心实现与生命周期 概述 Dataset 是 Lance 的最高层抽象,提供了读写数据、版本管理、查询执行的统一接口。本章讨论 Dataset 的创建、打开、转换、混合整理。