我问了九个哲学家:AI时代的"知识"到底是什么?
三司&桐行,一个正在做智能应用工程化的架构师
一、一个让我停下来思考的问题
我在整理过往的工作经验时,遇到了一个绕不开的问题。
我的履历上涉及过几个看似不相关的领域:团险的承保与核保规则,银行对公业务的供应链金融,以及政务场景下的一网通办。表面上是三个不同的行业,但我逐渐意识到,我其实一直在做同一件事
把人类专家的知识,变成机器能调用的结构化资产。
只不过每个行业叫法不同。在保险,它叫核保规则引擎;在金融,它叫风控知识图谱;在政务,它叫智能审批中台。剥掉这些标签,底层的工程问题完全一样:怎么让AI真正"利用"这些知识?
然后我发现了一个更根本的问题。如果你去回顾任何一个知识工程化项目,在立项初期最常听到的一句口号一定是:"我们有大量资料,把它们处理好喂给模型就行。"
但实际落地的结果是:"明明把所有资料都给了AI,它为什么还是干不好?"
不是模型不够强。不是检索没做好。不是 prompt 写得不好。
是更深层的鸿沟。 "让AI看到文档"和"让AI真的理解文档在说什么"之间,有一段我们还无法轻易跨越的距离。
这个距离叫什么?我一开始以为是工程问题。后来发现不是——它跟架构、跟模型甚至跟数据量,都没太大关系。
它涉及到更底层的东西:知识到底是什么?什么样才算"理解"?判断力和信息有什么区别?
于是我做了一件在程序员圈子里可能有点反常的事——去翻哲学书。
我不是哲学科班出身。我只是个每天在跟模型幻觉、数据漂移和项目验收打交道的工程师。但我需要搞清楚一件事:
我们嘴上说着"知识工程""知识库""知识图谱",但我们真的明白"知识"这两个字是什么吗?
二、九个哲学家,九个问题
2.1 柏拉图:知识不是正确的信息
柏拉图在《泰阿泰德篇》里讨论过一个定义,后来被称为知识的标准定义:
翻译过来:知识 = 正确的信念 + 有理由能论证它为什么正确。
三个条件,缺一个:
| 条件 | 含义 | AI的现实问题 |
|---|---|---|
| 是真的 | 符合事实 | 现实中大量知识本身就存在灰色地带。比如保险合同中的"重大疾病定义"该不该赔,人判断都要争议半天,AI怎么靠概率输出? |
| 你相信它 | 主体有信念 | AI没有信念。它输出"建议拒保"不是因为它在判断风险——只是统计上这个输出概率最高 |
| 你有理由 | 能论证为什么 | AI或许能检索到条款原文,但它分不清"这个条款为什么适用这个案例"和"历史上类似案例的共同结论"之间的区别 |
一个有经验的核保师说"这个case不保",他知道自己在拍板,出了问题他要负责。 AI说同一句话——它只是觉得这个 token 序列出现的概率最高。它不知道自己在做决策,也不知道什么是"责任"。
柏拉图如果看到今天的大模型,他大概率会说:AI不是在输出知识,它只是在输出"看起来像知识的信息"。
2.2 亚里士多德:知识有三层,AI只搞定了一层
亚里士多德在《尼各马可伦理学》里区分了三种知识:
他把知识分成了三层:
| 知识类型 | 希腊文 | 含义 | 工程映射 |
|---|---|---|---|
| 理论知识 | episteme | 不变的、可推演的第一原理 | 保险条款、金融法规 |
| 技艺知识 | techne | 知道怎么做出东西 | 核保调查表的填写规则、授信报告的模板格式 |
| 实践智慧 | phronesis | 在具体情境下判断该怎么做 | 自由裁量权、例外判断、超规则处理 |
AI能搞定 episteme(检索法律条款)。勉强能学一点 techne(训练它生成规范格式的输出)。
但 phronesis 搞不定。
为什么?因为 phronesis 是实践中的智慧——它不光需要知道规则,还需要判断在这个具体的、例外的、从未见过的个案里,这条规则该不该用、该怎么用。
一个有五年经验的核保师,扫一眼体检报告就知道"这单麻烦",但你问他为什么,他可能说"感觉不对"。这不是信息差,是实践智慧的经验编码。亚里士多德管这叫"phronesis",我们管它叫"老法师的直觉"。
AI 要取代这种人——至少目前,做不到。
2.3 笛卡尔:那个让我毛骨悚然的问题
"I think, therefore I am." — Descartes, Discourse on the Method (1637), Part IV
笛卡尔"我思故我在",本质上不是在证明自己的存在——他在找什么是不可能被怀疑的。
他怀疑感官(会做梦),怀疑记忆(会出错),怀疑外部世界(没法区分真实和幻觉)。唯一不能怀疑的,是"我正在怀疑"这件事本身。
那AI在思考吗?
如果你把"思考"定义成"推理并组织语言输出",那AI可以无缝通过图灵测试。 但如果你认为"思考"需要一个会怀疑的"我"作为起点——一个有第一人称视角、能问"为什么是我"的主体——那AI没在思考。它只是一场极其复杂的矩阵乘法。
工程的结论很直接:你永远不能把最终决策权交给一个没有"我"的系统。不是它不够聪明,而是它无法承担后果。
核保能不能过?授信给不给批?这些决定一旦出错,能被问责的,只有人。这也是AI落地中那根看不见的红线。
2.4 休谟:AI学了一堆统计规律,不是因果关系
休谟说了一句对AI时代极其刺痛人的话:你以为你看到了因果关系,其实你只是看到了一堆重复发生的序列,习惯了而已。
他举了太阳升起的例子:
"That the sun will not rise tomorrow is no less intelligible a proposition, and implies no more contradiction, than the affirmation, that it will rise." — Hume, ibid.
意思是:你说明天太阳会升起,和说明天太阳不会升起,在逻辑上没有任何区别。都说得通。
你之所以觉得前一句"对",只是因为到目前为止每天都"重复发生"了而已。这是习惯,不是推理。
这正是大语言模型最根本的认识论缺陷。
AI学到的是"这个体检指标异常"和"延期承保"在训练数据里经常一起出现。但人学到的是"因为有XX风险,所以不建议现在承保"。
一个是统计关联,一个是因果推断。
输出结果可能碰巧一样,但一旦出错:前者你不知道它为什么错;后者可以倒推是推理链条的哪一步偏差了。
2.5 康德:知识不是镜子,是透镜
"The understanding does not derive its laws (a priori) from nature, but prescribes them to nature." — Kant, Critique of Pure Reason, Preface to the Second Edition (1787)
康德的这句话是西方哲学的一次"哥白尼式革命"。他想说的是:
人不是被动接收外部世界的"知识",而是用大脑里自带的认知框架,主动去构造对世界的理解。
时间、空间、因果关系——这些不是外部世界塞给你的,是你用来"整理"外部世界的先天工具。
这个思想用在AI上,有一个极其惊人的对应:
大模型的"先天范畴"就是它的预训练权重。
Transformer不是在"记东西"。它在预训练阶段学习的,是一套稳定的注意力分配规律——什么该关注、什么该忽略、什么和什么有潜在联系。这,就是AI版的"先天范畴"。
而SFT微调,本质上是在修改这个先天范畴。所以SFT的数据量不需要特别大,但一定要超级精准。你缺一条信息,模型最多是"不知道";但你要是改错了一个框架,模型的整个判断体系都可能歪掉。
2.6 维特根斯坦:语言的边界就是AI的边界
维特根斯坦有前后两期哲学,但把它们放在一起看,结论非常残酷。
早期:
"Whereof one cannot speak, thereof one must be silent." — Wittgenstein, Tractatus Logico-Philosophicus (1921), Proposition 7
单看这句,你可能觉得"那就不说那些说不清的东西呗"。但到了后期,他的核心思想变成了:
"The meaning of a word is its use in the language." — Wittgenstein, Philosophical Investigations (1953), §43
很多人把这句话理解成"字典定义不重要,看你怎么用"。但它的真正意思要沉重得多——他把"意义"彻底从抽象的、权威的定义里拽了出来,扔回了混乱、流变、取决于情境的人类日常语言游戏里。
这对AI意味着什么?
意味着AI处理不了人类语言里那些"局内人约定俗成"的东西。
一份保险合同中出现的"合理且必要",一份银行授信报告中出现的"重点关注",一份企业规章制度里出现的"原则上"。人知道这些词的潜台词——什么时候需要严肃对待、什么时候可以酌情松口、什么时候是在甩锅。但AI不知道,因为它没有参与过人类的语言游戏。
维特根斯坦会告诉你:语言的边界就是AI的认知边界。而人类语言的大部分,其实并不在AI能清晰理解的安全区里。
2.7 波普尔:可证伪——知识的安全气囊
"The criterion of the scientific status of a theory is its falsifiability, or refutability, or testability." — Popper, Conjectures and Refutations (1963), Chapter 1
波普尔的判断标准简单到让人不安:
区分科学与伪科学的唯一标准,不是"它是不是对的",而是"它在什么条件下能被证明是错的"。
一个AI系统说:"基于现有资料,建议通过。"
这句话有可证伪的条件吗?
- 如果你知道它是基于哪一条规则、哪一段条款作出的判断,那你可以去核查——去问"这条规则在这里用对了吗?"——这是可证伪的
- 如果这句话背后只是一个黑箱的概率输出,"模型在这个context下这么认为的"——那它就不是可证伪的
不可证伪的断言不是知识,是观点。 在任何一个需要为决策承担责任的领域(无论是医疗核保还是金融审批),用观点冒充判断,不是工程瑕疵——是致命的。
2.8 波兰尼:人类有无法被编码的知识
"We can know more than we can tell." — Polanyi, The Tacit Dimension (1966), p.4
这是波兰尼最著名的一句话。他把人类的知识分成了两类:
| 类型 | 你能写成文档吗 | 你能教给别人吗 | AI能学会吗 |
|---|---|---|---|
| 显性知识 | ✅ 可以 | ✅ 培训可传递 | ✅ RAG可以 |
| 隐性知识 | ❌ 无法 | ❌ 只能跟师傅学 | ❌ 根本性困难 |
你骑自行车时身体怎么保持平衡的——你写不下来。但你确实会骑。
一个核保老法师扫一眼体检报告说"这个不留"。他脑子里的某个模式被激活了,但他自己说不清是什么激活的,怎么激活的。
波兰尼会告诉我们一个残酷的事实:知识工程化,能帮你捕获所有显性知识。但隐性知识,至今只能用"人在旁边看着学"的方式传递。 这就是为什么"老法师"不会失业。他们拥有的不是信息差,是无法编码的判断力。
2.9 香农:信息的量 ≠ 知识的质
"The fundamental problem of communication is that of reproducing at one point either exactly or approximately a message selected at another point." — Shannon, A Mathematical Theory of Communication (1948), Part I
这是信息论的开篇第一句话。香农定义了信息量(熵)的数学公式,但他明确表示,他的理论不关心"含义"——只关心"信号能从A传到B,误差低于某个阈值"。
把香农和柏拉图放在一起看,你会发现一件很有意思的事:
- 香农视角:一段500字的保险合同和一段500字的胡言乱语,如果字母分布一样,信息量完全相同。
- 柏拉图视角:前者是知识,有结构、有论证、有适用范围。后者是对社会资源的浪费。
这就是早期"数据工程"和现在"知识工程化"的根本区别:
早期是香农式的——拼命堆数据量,以为"够多"就会"够好"。 现在必须是柏拉图式的——先问"这条数据能构成知识吗",再谈工程。
你的五维评估体系、你的场景匹配、你的可追溯校验,每一个维度,本质上都是在回答柏拉图替人类问了两千五百年的那个问题:
"这条信息,有资格称为知识吗?"
三、九个哲学问题,一张工程地图
| 哲学家 | 他提出的核心问题 | 你的知识工程在做什么 |
|---|---|---|
| 柏拉图 | 知识是什么? | 五维评估——确保每条数据"够格称为知识" |
| 亚里士多德 | 知识分几层? | 分级策略——episteme做检索,phronesis留给人 |
| 笛卡尔 | 谁在思考? | 人机边界——AI没有"我",责任归属只能是人 |
| 休谟 | 因果在哪? | 可追溯体系——强制输出带证据链,拒绝统计关联冒充因果 |
| 康德 | 认知框架从哪来? | SFT微调——精准修改模型的"先天范畴" |
| 维特根斯坦 | 语言的边界在哪? | 数据标注——在人类黑话上加入人工脚手架 |
| 波普尔 | 怎么验证? | 评测闭环——只有可证伪可验证的输出才算质量 |
| 波兰尼 | 什么无法编码? | 承认边界——隐性知识载体至今仍然是人 |
| 香农 | 信息和知识有什么不同? | 从"量"到"质"的范式转换 |
四、未完成的答案:一个开放结尾
从柏拉图到香农,人类花了两千五百年追问"什么是知识"。
现在轮到我们用工程来回答这个问题的延伸版: "怎么让AI也拥有知识?"
我只是个在做知识工程化项目的架构师。我的困惑来自非常具体、非常"不哲学"的地方:核保规则到底该写成什么样的结构?银行的产业链上下游数据,应该怎么组织成图谱?一份会议的决策纪要,怎么确保半年后AI还能准确引用?
这些问题,逼着我不得不去追问那个最基础的题。
我还没有答案。但至少现在我知道:
- 没想清楚知识是什么 → 做什么都是在"处理数据"
- 想清楚了知识是什么 → 才真正开始了"构建知识"
人的角色:从执行者,变成定义者和判断者 AI 的角色:从替代者,变成知识放大镜 知识的终点:永远在人的判断力里
问题还在继续。欢迎加入深夜脑暴。