过去三年里,我为完成不同任务尝试过数十款 AI 工具。
其中,有些表现出色,有些糟糕透顶,还有些早已不复存在。
以下是我筛选出的最佳 AI 工具,按类别划分并归为不同等级,还附上了大部分工具的学习指南:
- S 级:所有人都必须用的 AI 工具
- A 级:大部分人都该用的 AI 工具
- B 级:特定领域专用的最佳 AI 工具
S 级:所有人都必须用的 AI 工具(至少选一款)
毫无疑问,ChatGPT、Gemini( Gemini )和 Claude 是目前最顶尖的 AI 工具。它们能解答日常疑问、进行网页搜索、辅助写作,功能十分全面。
三款工具的核心优势如下:
- ChatGPT:擅长深度研究与语音交互模式
- Claude:在写作与代码生成方面表现最佳
- Gemini:图像与视频生成能力突出,非常适合学习场景
接下来的内容会详细说明,为何它们在这些任务上能做到顶尖。
🎁 免费 ChatGPT 课程:为感谢粉丝突破 14 万,我将免费开放自己的 ChatGPT 课程,点击此处获取。
A 级:大部分人都该用的 AI 工具
学习类:NotebookLM
NotebookLM 是由 Gemini 驱动的 AI 研究工具,能基于你上传的文档生成内容。你可以将 PDF、谷歌文档和文字稿上传到平台,它会自动生成摘要、带引用来源的问答,甚至还能制作播客脚本。
最核心的优势是什么?它的回答严格局限于你上传文档中的信息!
这意味着几乎不会出现“幻觉输出”,而且 NotebookLM 会标注答案对应的具体文档来源。我常用它来理解学术论文,或是挖掘书籍中的深层信息。
AI 网页搜索与浏览类:Perplexity 和 Comet
如果你已经用腻了谷歌浏览器,不妨试试 Perplexity:
- 能直接给出问题答案,并附带嵌入式引用来源
- 会记忆历史问题,支持追问以深入探索主题
- 搜索结果顶部无广告或赞助网站
我虽然喜欢 Perplexity,但最近更常用它旗下的 AI 浏览器 Comet。Comet 定位是“网页浏览个人助手”,能自动完成任务、进行网络调研、整理邮件等。
📚 Perplexity 使用指南
Comet 就像“自带多种 AI 功能的 Chrome”,以下是我最常用的两个功能:
- 侧边栏助手:能查看你当前浏览的内容(即使是付费墙后的内容),无需跳转页面就能针对当前页面追问、草拟邮件回复、预订餐厅等
- 智能体模式:可代你操控浏览器,比如点击链接、跳转页面、完成多步骤任务等
下方示例展示了 Comet 如何自动在谷歌表单中创建所有问题。
如果你已是 ChatGPT Plus 订阅用户,不想额外付费订阅 Perplexity,ChatGPT 的网页搜索功能和 Atlas 也是不错的替代选择。
📚 ChatGPT Atlas 使用指南
注意:尽管我常用 Comet 和 Atlas,但尚未用它们替代 Chrome——主要是出于安全顾虑,不建议向 AI 浏览器分享敏感信息。
研究类:ChatGPT 的深度研究功能
“深度研究”是一款能自动执行网页搜索的 AI 功能,5 到 30 分钟内就能生成一份引用完整、几乎无幻觉的报告。目前 ChatGPT、Perplexity 和 Gemini 都支持该功能,但我试过所有版本后发现,ChatGPT 的深度研究功能表现最佳。
对于需要为工作写报告、或在大学做研究的人来说,这款工具强烈推荐。不过若是学术和科学研究,Consensus 会是更合适的选择。
下方指南包含了 ChatGPT 深度研究功能的全部用法。
📚 ChatGPT 深度研究功能使用指南
B 级:特定领域专用的最佳 AI 工具
写作类:Claude
Claude 是与 ChatGPT 类似的 AI 聊天机器人,但在写作领域更具优势。它内置多种风格模板,可自定义回复风格,甚至支持创建专属风格。
你只需上传自己的写作样本,Claude 就能自动模仿你的表达风格。
此外,Claude 对指令的执行力极强。我用自己设计的提示词,让 Claude 自动校对整篇文章——既能修正错误,又能保留我的原意和语气。我曾在 ChatGPT 中用同样的提示词尝试,但效果极差。
演示文稿生成类:Gamma
Gamma 能通过简单的提示词生成完整的演示文稿。
你只需输入提示词、选择幻灯片数量、页面风格和语言,几分钟内就能得到一份演示文稿。
Claude 也是生成演示文稿的好选择。虽然它并非专为演示文稿设计,但经过一段时间使用后发现,它生成幻灯片的效果很不错。
图像生成类:Nano Banana
整体来看,Nano Banana(尤其是新版 Pro 版)是目前最佳的 AI 图像生成工具,理由如下:
- 对提示词的理解准确度高
- 能生成风格统一的角色形象
- 美学表现出色,适合平面设计等场景
下方文章中,我介绍了这款工具的最佳使用场景。
📚 Nano Banana Pro 使用指南
总体而言,Nano Banana 综合表现最佳,但特定场景下有更优选择——比如 ChatGPT 的提示词理解能力更强,Reve 生成的角色形象更统一。
音频生成类:ElevenLabs
ElevenLabs 是一款能生成逼真语音、音效和音乐的 AI 工具,核心功能包括:文本转拟人化语音、声音克隆、多语言配音。
声音克隆是我最喜欢的功能:ElevenLabs 提供“快速声音克隆”(仅需 10 秒音频)和“专业声音克隆”(需至少 30 分钟音频以生成高还原度声音)。目前我没有付费订阅,所以还没尝试克隆自己的声音,但官网提供了“克隆声音与原声音”的对比样本,可供参考。
AI 视频虚拟形象与语言翻译类:HeyGen
HeyGen 是一款文本转视频 AI 工具,在生成视频虚拟形象方面表现突出。你可以选择平台自带的虚拟形象,也能将自己的照片或视频转化为数字分身,用于制作广告、社交媒体内容、产品讲解视频、教程视频等。
我最青睐的功能是它的 AI 视频翻译:能将视频翻译成 175 种以上的语言和方言,同时保留原视频的语音、语气和节奏,还能让虚拟形象的口型与翻译后的语音同步。
下方视频是将一段英文原视频翻译成德语后的效果。
📚 HeyGen 使用指南
自动化与 AI 智能体类:N8N
N8N 是一款低代码工作流自动化工具,可连接不同应用与服务,自动完成重复性任务。
它采用可视化节点编辑器:你可以通过连接“节点”(每个节点代表一个操作,如发送邮件、调用 API 等),搭建自定义工作流。
N8N 主要被技术人员用于创建 AI 智能体。之所以说它是最佳选择,是因为它开源且支持自托管——团队能更好地掌控数据、灵活定制功能,并控制成本。
📚 N8N 使用指南
不过,如果你是非技术人员,Zapier 和 Make 会是更合适的替代工具:无需复杂设置,就能快速实现自动化。
文本转视觉内容类:Napkin AI
Napkin AI 能将文本转化为思维导图、图表、插画等视觉内容。
你只需粘贴文本、点击“生成视觉内容”,几秒钟内它就会根据文本生成最匹配的视觉素材。之后你可以选择最优素材,并在平台内直接自定义编辑。
我曾用它将“ChatGPT 十大提示词原则”转化为视觉图表,效果非常好!
📚 如何用 AI 制作专业视觉内容
音乐生成类:Suno
Suno 能通过文本提示词生成带 vocals(人声)和乐器伴奏的完整歌曲。比如你可以要求它生成“前卫金属爵士融合风格”的歌曲,还能指定歌词中必须包含的内容。
虽然我已经有段时间没弹吉他了,但仍能分辨音乐好坏——必须承认,现在的 AI 生成音乐与人类创作的音乐几乎难分高下。
📚 Suno 使用指南
视频生成类:Sora 2 与 Veo3
谈到 AI 视频生成,Sora 2 和 Veo3 都是优质选择。
过去几年,AI 视频生成工具发展迅猛:如今能生成物理逻辑准确、画面逼真的视频,不仅瑕疵更少,生成成功率也更高。比如用 Sora 2,你甚至能通过“客串”功能把自己插入视频中。
下方指南包含了我用 Sora 2 制作的多个视频案例。
📚 Sora 2 使用指南
氛围编程类:Cursor
“氛围编程”是一种新的编程方式:由 AI 承担复杂工作,任何人只需通过简单提示词就能搭建并部署应用(无需编程基础)。
Cursor 是一款热门 AI 代码编辑器,自带聊天界面,生成代码的过程直观且快速。当然,它也有不少优秀的同类替代工具。
要不要我帮你整理一份2026 年 AI 工具分类速查表?表格会按“工具类别-工具名称-核心优势-适用人群”梳理,方便你快速找到适合自己的工具,节省筛选时间。