[240823] Qdrant 内部结构：不可变的数据结构 | 从“造神”到“造物”：AI公司商业化之路的五大挑战

Qdrant 内部结构：不可变数据结构

博客介绍了 Qdrant 如何利用不可变数据结构来提升性能，主要包括以下内容：

1. 数据结构概述

2. 不可变性的优势

潜在改进：

功能	可变数据结构	不可变替代方案	潜在改进
按索引读取	数组	固定内存块	分配确切的内存量
向量存储	数组	内存映射文件	将数据卸载到磁盘
读取排序范围	B 树	排序数组	存储所有相邻数据，避免缓存未命中
按键读取	哈希表	完美哈希的哈希表	避免哈希冲突
按关键字获取文档	倒排索引	带排序和位压缩 Posting 的倒排索引	更少的内存使用，更快的搜索
向量搜索	HNSW 图	负载感知连接的 HNSW 图	使用过滤器获得更好的精度
租户隔离	向量存储	去碎片化的向量存储	更快地访问磁盘上的数据

3. Qdrant 中的不可变数据结构

数据量	`ph::Function`	`std::hash::Hash`	`HashMap::get`
1000	60ns	~20ns	34ns
100k	90ns	~20ns	220ns
10M	238ns	~20ns	500ns

热子集百分比	租户大小（向量）	RPS，未去碎片化	RPS，去碎片化
2.5%	50k	1.5	304
12.5%	50k	0.47	279
2.5%	5k	56	490
12.5%	5k	5.8	488

4. 更新不可变数据结构

5. 缺点和弥补措施

6. 结论

不可变数据结构为读密集型系统提供了显著的性能优势，Qdrant 通过结合完美哈希和去碎片化等技术，进一步提高了向量搜索操作的速度和效率。

来源：
qdrant.tech/articles/im…

AI 公司正投入巨资发展人工智能，但实际成果却乏善可陈。文章分析了 AI 公司在商业化道路上犯下的错误，以及他们正在如何修正，并探讨了未来 AI 产品成功商业化需要克服的五大挑战。

一、产品市场匹配度：从“造神”到“造物”

早期误区：
- OpenAI 和 Anthropic 等公司过度关注模型构建，忽视产品开发。
- Google 和 Microsoft 则急于将AI应用于所有产品，缺乏针对性和实用性。
后果：
- 早期用户多为“技术尝鲜者”，而非普通用户，导致公众对 AI 的负面认知。
- AI 功能的过度使用反而降低了用户体验，引发反弹。
转变：
- OpenAI 等公司开始转型，从研究实验室转向产品公司，更加注重产品开发。
- Apple 的成功案例表明，缓慢而周到的 AI 整合方式更能获得用户认可。

二、AI消费级产品面临的五大挑战

为了打造出真正吸引用户的 AI 产品，开发者需要解决以下五大局限性：

1. 成本

2. 可靠性

3. 隐私

4. 安全性

5. 用户界面

AI 技术的发展速度很快，但 AI 产品的商业化进程将更加缓慢。开发者需要解决上述挑战，并将 AI 融入现有产品和工作流程中，才能真正实现 AI 的价值。

来源：
www.aisnakeoil.com/p/ai-compan…

更多内容请查阅 : blog-240823

关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法