大家好,我是孟健。
MCP 市场上的 web 搜索工具实在太多了,多的让人眼花缭乱,看一下 Smithery 上面的搜索工具,已经有 6000 多个了:
面对如此丰富的选择,如何挑选一款真正适合自己的搜索工具?
今天,我就精选了五款在开发者和 AI 圈内热度较高的搜索工具,帮你理清思路,选出最优解。
Exa
Exa 是一款面向 AI 模型的 Web 搜索工具,它的官网是:
Exa 成立于 2020 年,总部位于美国旧金山,隶属于专注于人工智能领域的 Cerebral Valley 社区。
由两位哈佛大学计算机科学专业的年轻校友——CEO Will Bryk(27 岁)和联合创始人 Jeff Wang(26 岁)共同创立。两人在 ChatGPT 推出前已开始探索 AI 与搜索的结合。
截至 2024 年 7 月,Exa 累计融资 2200 万美元。
Exa 有自己训练的模型,预测用户可能点击的链接(而非下一个单词),通过分析网络链接共享行为优化结果,避免传统搜索引擎中的 SEO 垃圾信息。
目前它的计费模式是每 1000 次收费 5-25 美元,根据结果数量分级。新用户可获得$10 免费额度,无需信用卡。
主要面向开发者和 B 端客户,特别是需要高质量数据训练 AI 模型的公司。像 Databricks 是他们的明显客户,以及我们这些 AI 开发者。
Brave Search
Brave Search 是由 Brave Software 推出的隐私搜索引擎,Brave 浏览器以保护用户隐私而闻名。它的官网是:
该公司成立于 2015 年,总部位于美国旧金山。
创始团队包括前 Mozilla CEO/CTO Brendan Eich,曾主导开发 Firefox 浏览器,后因对广告行业的不满,创立 Brave Software,旨在通过技术革新解决广告与隐私的冲突。
2021 年,Brave Software 收购注重隐私的搜索引擎 Tailcat,并于同年推出 Brave Search。初期部分搜索结果依赖微软必应(Bing)API(占比 7%),但在 2023 年 4 月宣布完全剔除第三方依赖,实现 100%独立运营。
2023 年起开放 Brave Search API,提供分层服务(免费版 2000 次/月查询):
Tavily
Tavily 是一家专注于为 AI 应用提供实时信息检索服务的公司,它的官网是:
Tavily 实际上是整合了多个来源的信息,并没有自己的索引。属于比较轻量级实时搜索。
目前 Tavily 完全开源,在开源社区生态较好,像和 langchain 等框架集成度是非常好的。
目前 Tavily 提供免费的每月 1,000 次 API 调用:
DuckDuckGo
DuckDuckGo 也是非常著名的以隐私保护为核心的搜索产品,官网是:
DuckDuckGo 成立于 2008 年 9 月 25 日,总部位于美国宾夕法尼亚州 Valley Forge 市,创始人为 Gabriel Weinberg(麻省理工学院毕业生)
早期基于 Perl 语言开发,运行于 FreeBSD 系统与 nginx 服务器,依赖 Yahoo! Search BOSS 等第三方 API 混合生成结果;2023 年后逐步建立独立索引库,覆盖超 100 亿网页。
DuckDuckGo 其实并没有提供 API 服务,把它放在这里的原因是它的 mcp 在 Smithery 上比较火。
它的源码是爬取了 DuckDuckGo 的网页来调用,猜测火的原因是不需要额外的 Key 就可以使用:
Perplexity
Perplexity 应该很多人都听过了,是新一代的 AI 驱动搜索引擎,官网是:
Perplexity AI 是一家成立于 2022 年 8 月的美国人工智能公司,总部位于旧金山。
由四位技术专家联合创立,包括 CEO Aravind Srinivas(前 OpenAI 研究科学家、谷歌 DeepMind 实习生)、CTO Denis Yarats(Meta AI 研究院前成员)、CSO Johnny Ho(华尔街量化交易背景)以及总裁 Andy Konwinski(Databricks 联合创始人)
Perplexity 的核心功能是提供对话式搜索,用户以自然语言提问,直接获得结构化答案,并附来源引用(类似学术论文格式)。
Perplexity 提供了两类 API:Sonar API 和 Sonar Pro API,基础版每 1000 次搜索 5 美元,输入/输出每百万字各 1 美元;高级版每 1000 次搜索 6 美元,输入每百万字 3 美元,输出每百万字 15 美元。
实测对比
我设计了几个编程相关的问题,试一下各个搜索工具的效果如何:
-
React 19 有哪些更新?
-
最近 TypeScript 的 breaking changes 有哪些?
-
解释一下 MVC、MVP、MVVM 三种架构模式的区别
-
为什么浏览器要有跨域限制?
-
Vue 和 React 哪个更适合企业后台开发?
实测过程比较繁琐,我省去中间过程,直接同步结果:
Exa (优秀)
表现最优,结果权威且新,技术文档和开源社区链接丰富,适合深度开发和技术研究。
Brave Search(一般)
整体相关性一般,很多搜索出来的都是二手资料,质量一般,不太权威。甚至 React 官网都没有去搜索。
Tavily(中等)
整合多源信息,中文社区内容较多,适合快速了解主流观点。
DuckDuckGo(还行,速度很快)
速度极快,结果覆盖面广,适合日常检索和简单技术查询。
Perplexity
由于创建密钥需要 credit,暂时放弃,根据之前的经验,我认为不大可能超过 exa 的质量。
综合排名
从编程和技术检索角度:Exa > DuckDuckGo > Tavily > Brave Search > Perplexity
综合对比
| 维度 | Exa | Brave | Tavily | DuckDuckGo | Perplexity |
|---|---|---|---|---|---|
| 成立 | 2020年 | 2015年 | 未明确 | 2008年 | 2022年 |
| 总部 | 旧金山 | 旧金山 | 未明确 | 宾夕法尼亚 | 旧金山 |
| 核心技术 | 自研模型预测点击链接,优化相关性 | 独立索引库,零第三方依赖,隐私优先 | 整合多源信息,无自建索引 | 独立索引库覆盖100亿+网页,隐私为核心 | 对话式搜索,AI生成答案附引用 |
| 计费 | 5-25元/千次(按结果量分级) | 免费版2000次/月,付费可定制 | 免费版1000次/月 | 无官方API | 基础版5元/千次,高级版6元/千次 |
| API特点 | 面向AI开发,高吞吐低延迟 | 隐私优先,分层服务 | 开源生态集成度高 | 无官方API,社区爬取实现 | 提供Sonar API,自然语言处理强 |
| 适用场景 | AI训练、企业数据检索 | 隐私敏感场景、日常搜索 | 轻量级搜索、开源项目集成 | 个人隐私保护、简单查询 | 自然语言问答、学术研究 |
| 实测结果 | 优秀(覆盖全面,权威) | 一般(部分冗余,时效性弱) | 中等(信息碎片化) | 还行(速度快,无API) | 未实测(推测低于Exa) |
推荐方案
-
AI 开发
- 推荐工具:Exa
- 理由:专为 AI 优化,支持复杂语义检索,技术文档和开源代码库丰富,适合高质量数据需求。
-
隐私敏感场景
- 推荐工具:Brave Search
- 理由:独立索引和隐私保护设计,适合医疗、金融等对数据安全要求高的领域。
-
开源与自动化集成
- 推荐工具:Tavily
- 理由:免费额度充足,与 LangChain 等框架深度集成,适合自动化脚本和轻量级应用。
-
个人日常搜索
- 推荐工具:DuckDuckGo
- 理由:无需 API 密钥,隐私保护强,响应速度快,适合简单查询和个人使用。
-
自然语言问答与学术场景
- 推荐工具:Perplexity
- 理由:生成结构化答案并附来源引用,适合需要快速获取摘要和参考文献的场景。
总结与思考
MCP 搜索工具的选择,归根结底还是要结合自身需求:
是追求极致的技术深度,还是看重隐私保护?是需要自动化集成,还是日常轻量查询?
从个人的角度,exa 应该是我目前最优的选择,也推荐大家亲自试试。
AI 时代,搜索工具正加速进化,唯有不断试用、持续关注,才能选出最适合自己的那一款。
希望本次的实测能为你的工具选型带来启发。如果你有更好的搜索工具推荐,欢迎留言交流!
(点击我的个人主页,可以加入技术群深度交流)