陆游这两句诗,用在学习 AI 上也很贴切。许多人一开始接触 AI,容易把它当成一部无所不知的百科全书:问一句,它答一句;答得流畅,就默认可信。可真正用久了才会发现,AI 的本事并不神秘,它的强处和短处都有迹可循。
它有时像读书破万卷的助手,能迅速解释生活常识、历史典故、科学概念;有时又像翻着旧书找答案的学生,对最新消息、小众事实、专业细节把握不稳。要用好 AI,第一步不是急着学习提示词模板,而是先弄清楚:它的知识从哪里来,什么时候会过时,什么时候需要搜索,什么时候值得做更深入的研究。
这一篇先从“知己知彼”开始。只有知道 AI 何以聪明、何以糊涂,我们后面谈上下文、提示词、写作和多模态应用,才不会变成空中楼阁。
一、问渠那得清如许:AI 到底“读过”什么
AI 的“源头活水”,首先来自预训练。所谓预训练,可以粗略理解为:模型在正式与你对话之前,已经读过海量文本,包括互联网网页、百科、书籍、新闻、论文、论坛、问答社区和各类公开语料。它正是在这些材料中学习语言如何组织、概念如何关联、问题通常如何被回答。
这也是为什么 AI 常常显得“什么都懂”。你问它手机进水怎么办,它大概率会提醒你立刻断电、擦干、不要开机、尽快送修;你问某个广为人知的科学或历史常识,它也能很快组织出答案。这些问题之所以容易回答,并不是因为 AI 正在现场观察世界,而是因为类似信息在公开文本中出现得足够多。
所以,理解 AI 的第一条原则是:它的可靠性与训练数据的分布密切相关。常见主题、稳定知识、反复被讨论的问题,通常更容易得到靠谱回答。比如烹饪、电影、科学概念、历史人物,AI 往往能给出结构清楚、细节也还过得去的解释。
反过来,如果一个问题在公开语料中很少出现,或者只存在于很小的圈子里,AI 就容易不稳。冷门概念、小众活动、公司内部制度、私人合同条款,都不该默认它知道。你问“某个小众山地活动的由来”,它可能需要搜索;你问“我们公司今年的报销规则”,如果没有提供制度文件,它只能猜;你问一份租房合同里某个特殊条款如何理解,最好的做法是把合同原文交给它,而不是让它凭常识发挥。
语言分布也会影响答案质量。像 ChatGPT 这类大模型读过的英文资料通常更多,因此在英文世界里被充分讨论过的问题,知识覆盖往往更厚;而对于一些中文地方性表达、方言、小语种材料或本土行业细节,模型可能会更依赖有限材料。它不是不能回答,而是回答时更需要你提供背景、原文和判断标准。
因此,不要把 AI 的流畅回答误认为真实世界本身。更准确的理解是:AI 像一个读过很多公开资料的助手,擅长在常见知识和语言模式中快速组织答案;但它没有天然通向私有信息、冷门事实和最新变化的神通。遇到常见、稳定、低风险的问题,可以直接问;遇到冷门、隐私或会变化的问题,就要准备更多上下文,或者进入下一步:让它搜索和验证。
二、及时当勉励:知识截止与信息过期
及时当勉励,岁月不待人。知识也是如此。
预训练让 AI 拥有一套广泛的基础知识,但这套知识并不会自动随着现实世界每一天的变化而更新。模型训练在某个时间点结束,它对世界的“记忆”也会在那个时间点附近冻结。之后发生的新事件、新政策,模型默认并不知道。
这就像家里有一套很厚的百科全书。它内容丰富,解释经典概念没有问题;但你不能指望它告诉你今天哪家餐厅还在营业、某款手机此刻的最低价、或者最近网上流行的梗到底从哪来。不是书不好,而是问题本身要求“现在”的信息。
判断一个问题是否可能“过期”,可以看它是否带有时间、地点和状态变化。比如“附近哪家餐厅评分高”“今天适不适合去公园露营”,这些问题都不适合只靠模型记忆。评分会变,天气会变,事情也会变。
相反,一些稳定知识通常可以直接问。比如“为什么水烧开会沸腾”、“简历里项目经历应该怎么写得更清楚”,这些问题不依赖实时状态。即使没有搜索,AI 也能基于已有知识给出有用答案。
所以,使用 AI 时可以先在心里问一句:**这个答案会不会随着时间变化?**如果不会,直接问通常足够;如果会,就要提醒 AI 搜索最新资料,或者自己提供最新文件和链接。知识截止并不可怕,可怕的是把会变化的问题当成不会变化的问题来问。
不过,搜索并不等于万无一失。它能让 AI 临时翻阅现实世界的新材料,却也会带来另一个问题:新材料本身是否可靠?这就进入下一节。
三、尽信书不如无书:Web 搜索也要辨来源
尽信书,则不如无书。
Web 搜索能弥补知识截止,让 AI 接触到更新的信息,但它并不能保证搜到的每一页都可靠。互联网不是一座只收藏经典的图书馆,它更像一条热闹的街市:有官方公告,有学术论文,也有论坛闲聊、灌水软文。
因此,搜索让 AI “看见当下世界”的同时,也会把当下世界的杂质一起带进来。比如你问某种保健品、药物是否安全,如果 AI 随手抓到的主要是商家页面和用户评论,答案就可能有失偏颇,甚至包含错误信息。它可能总结了很多人的说法,却没有真正回答“这些说法有没有证据”。
还有一种更隐蔽的问题:AI 的搜索过程并不总是等同于人完整阅读原网页。很多时候,它会先由搜索系统找到网页,再提取摘要,最后让对话模型基于摘要组织答案。这个流程效率很高,但也可能带来偏差:网页本身没错,摘要可能漏掉限定条件;引用来源存在,解释却被说歪了。于是你会看到一种危险的答案:链接看起来正规,结论却未必严谨。
解决办法不是不用搜索,而是学会约束搜索。凡是涉及健康、药品、法律、金融、政策等高风险问题,都不要只说“帮我查一下”。更好的问法是直接指定来源质量:
请进行网页搜索,但优先参考官方机构、权威组织、同行评议论文或原始法规文件。
请区分事实、来源观点和你的推断。
如果来源之间有冲突,请列出冲突点,不要直接给单一结论。
这类提示的作用,是把 AI 从“谁声音大就总结谁”拉回到“谁证据强就参考谁”。例如判断药品安全性,可以要求优先参考监管机构、医院系统、医学论文,而不是销售页面;了解签证或税务政策,可以要求优先查看官方政府网站,而不是旅行博客;比较产品价格,可以要求说明搜索时间和来源平台,而不是只给一个孤零零的数字。
最后还有个保底的办法:重要信息自己点开原文看一眼。AI 很适合替你收集线索、整理差异、提炼重点,但它不应该替你承担所有判断责任。搜索解决的是“有没有新资料”的问题,辨别来源解决的才是“这些资料值不值得信”的问题。
这里也能看出 AI 和传统搜索引擎的分工。你要找某个官网、下载页面、商品链接,搜索引擎通常更直接;你要比较几份资料、归纳不同观点、形成一份带取舍的说明,AI 更有优势。前者擅长定位原始信息,后者擅长整合与解释。真正稳妥的做法,是让 AI 帮你整理线索,再在关键处回到原始来源核查。
四、操千曲而后晓声:复杂问题需要深度研究
操千曲而后晓声,观千剑而后识器。有些问题,不是查到一两个网页就能回答的。它们需要比较多个来源,拆分多个维度,识别相互冲突的信息,再把证据、限制和取舍合在一起看。这个时候,普通 Web 搜索就显得太薄,深度研究才更合适。
普通搜索擅长回答单点问题。比如“这周天气如何”、“店铺今天是否营业”,核心是找到较新的事实。深度研究面对的则是另一类问题:天气、预算、同行人的年龄、交通方式、节假日人流、酒店位置,会如何共同影响一次旅行安排?这就不是“查一个答案”,而是 “做一轮分析”。
深度研究的工作方式更像研究助理。它通常会先把问题拆开,判断需要哪些信息;再围绕不同方向多轮搜索,筛选来源,补充缺口;最后把材料整理成结构化报告。比较好的深度研究,不是上来就写结论,而是先给出研究计划,让你有机会检查方向是否跑偏。这个过程会更慢,可能需要几十秒到几分钟,但换来的是更完整的视野。
生活里适合深度研究的场景很多。比如你要给一家人规划假期旅行,普通搜索能告诉你某地天气和机票价格,深度研究则可以进一步比较路线、预算、老人孩子体力、交通方式和备选方案。再比如你想判断“每天走一万步是否真的有必要”,普通搜索可能给你几篇健康文章,深度研究则应该比较医学研究、年龄差异、运动强度、伤病风险和长期坚持的现实难度。
但深度研究也不是越多越好。它适合复杂、重要、需要权衡的问题,不适合替代所有查询。问“明天会不会下雨”,不必动用深度研究;问“今年暑假带父母和孩子去哪里更合适”,就值得让 AI 多花些时间。关键不在于把工具用得多复杂,而在于问题本身是否值得这么处理。
可以用一个简单标准判断:如果答案只需要一个事实,用搜索;如果答案需要多项事实之间的关系,用深度研究。前者解决 “是什么”,后者解决 “如何看、怎么选、为什么这样选”。
五、知其先后,则近道矣:三层工具选择法
《大学》:“物有本末,事有终始,知所先后,则近道矣。”用 AI 也是如此。很多回答质量不高,并不是因为提示词不够花哨,而是从一开始就选错了信息路径:该凭常识时大动干戈,该查资料时闭门造车,该深入研究时又贪图秒回。
可以把 AI 的信息能力分成三层。
第一层,是预训练知识。它适合常识、稳定知识和低风险问题,速度最快。比如解释一个概念、整理一段文字、给出常见故障的处理思路,通常可以直接问。这里要利用的是 AI 已经“读过很多书”的优势。
第二层,是Web 搜索。它适合最新、本地、动态变化的信息,比如天气、价格、政策、营业时间、评分和新闻。这里要利用的是 AI 临时查资料的能力,同时记得约束来源,别让论坛闲聊和商业软文替你做判断。
第三层,是深度研究。它适合复杂分析、重大决策和多来源整合,比如旅行规划、职业选择、行业调研。这里要利用的是 AI 拆问题、找资料、做权衡的能力,但也要接受它需要更长时间。
下次提问前,可以先问自己三个问题:
- 这个问题是不是稳定常识?如果是,直接问。
- 这个问题会不会随时间、地点、价格、政策而变化?如果会,要求搜索。
- 这个问题是不是需要比较多个因素并做取舍?如果是,用深度研究。
这就是“知其先后”。会用 AI 的第一步,不是写出漂亮提示词,而是先判断问题属于哪一类。问题分清了,后面的上下文、提示词和工具选择才有着力点。否则,再长的提示词也可能只是把错误方向说得更详细。