我问了九个哲学家:AI时代的"知识"到底是什么?

0 阅读13分钟

我问了九个哲学家:AI时代的"知识"到底是什么?

三司&桐行,一个正在做智能应用工程化的架构师


一、一个让我停下来思考的问题

我在整理过往的工作经验时,遇到了一个绕不开的问题。

我的履历上涉及过几个看似不相关的领域:团险的承保与核保规则,银行对公业务的供应链金融,以及政务场景下的一网通办。表面上是三个不同的行业,但我逐渐意识到,我其实一直在做同一件事

把人类专家的知识,变成机器能调用的结构化资产。

只不过每个行业叫法不同。在保险,它叫核保规则引擎;在金融,它叫风控知识图谱;在政务,它叫智能审批中台。剥掉这些标签,底层的工程问题完全一样:怎么让AI真正"利用"这些知识?

然后我发现了一个更根本的问题。如果你去回顾任何一个知识工程化项目,在立项初期最常听到的一句口号一定是:"我们有大量资料,把它们处理好喂给模型就行。"

但实际落地的结果是:"明明把所有资料都给了AI,它为什么还是干不好?"

不是模型不够强。不是检索没做好。不是 prompt 写得不好。

是更深层的鸿沟。 "让AI看到文档"和"让AI真的理解文档在说什么"之间,有一段我们还无法轻易跨越的距离。

这个距离叫什么?我一开始以为是工程问题。后来发现不是——它跟架构、跟模型甚至跟数据量,都没太大关系。

它涉及到更底层的东西:知识到底是什么?什么样才算"理解"?判断力和信息有什么区别?

于是我做了一件在程序员圈子里可能有点反常的事——去翻哲学书。

我不是哲学科班出身。我只是个每天在跟模型幻觉、数据漂移和项目验收打交道的工程师。但我需要搞清楚一件事:

我们嘴上说着"知识工程""知识库""知识图谱",但我们真的明白"知识"这两个字是什么吗?

rag-artitacture.png


二、九个哲学家,九个问题

2.1 柏拉图:知识不是正确的信息

柏拉图在《泰阿泰德篇》里讨论过一个定义,后来被称为知识的标准定义: 柏拉图的知识三条件.png 翻译过来:知识 = 正确的信念 + 有理由能论证它为什么正确。

三个条件,缺一个:

条件含义AI的现实问题
是真的符合事实现实中大量知识本身就存在灰色地带。比如保险合同中的"重大疾病定义"该不该赔,人判断都要争议半天,AI怎么靠概率输出?
你相信它主体有信念AI没有信念。它输出"建议拒保"不是因为它在判断风险——只是统计上这个输出概率最高
你有理由能论证为什么AI或许能检索到条款原文,但它分不清"这个条款为什么适用这个案例"和"历史上类似案例的共同结论"之间的区别

一个有经验的核保师说"这个case不保",他知道自己在拍板,出了问题他要负责。 AI说同一句话——它只是觉得这个 token 序列出现的概率最高。它不知道自己在做决策,也不知道什么是"责任"。

柏拉图如果看到今天的大模型,他大概率会说:AI不是在输出知识,它只是在输出"看起来像知识的信息"。

2.2 亚里士多德:知识有三层,AI只搞定了一层

亚里士多德在《尼各马可伦理学》里区分了三种知识:

亚里士多德的知识三层.png

他把知识分成了三层:

知识类型希腊文含义工程映射
理论知识episteme不变的、可推演的第一原理保险条款、金融法规
技艺知识techne知道怎么做出东西核保调查表的填写规则、授信报告的模板格式
实践智慧phronesis在具体情境下判断该怎么做自由裁量权、例外判断、超规则处理

AI能搞定 episteme(检索法律条款)。勉强能学一点 techne(训练它生成规范格式的输出)。

phronesis 搞不定

为什么?因为 phronesis 是实践中的智慧——它不光需要知道规则,还需要判断在这个具体的、例外的、从未见过的个案里,这条规则该不该用、该怎么用

一个有五年经验的核保师,扫一眼体检报告就知道"这单麻烦",但你问他为什么,他可能说"感觉不对"。这不是信息差,是实践智慧的经验编码。亚里士多德管这叫"phronesis",我们管它叫"老法师的直觉"。

AI 要取代这种人——至少目前,做不到。

2.3 笛卡尔:那个让我毛骨悚然的问题

"I think, therefore I am." — Descartes, Discourse on the Method (1637), Part IV

笛卡尔"我思故我在",本质上不是在证明自己的存在——他在找什么是不可能被怀疑的

他怀疑感官(会做梦),怀疑记忆(会出错),怀疑外部世界(没法区分真实和幻觉)。唯一不能怀疑的,是"我正在怀疑"这件事本身。

那AI在思考吗?

如果你把"思考"定义成"推理并组织语言输出",那AI可以无缝通过图灵测试。 但如果你认为"思考"需要一个会怀疑的"我"作为起点——一个有第一人称视角、能问"为什么是我"的主体——那AI没在思考。它只是一场极其复杂的矩阵乘法。

工程的结论很直接:你永远不能把最终决策权交给一个没有"我"的系统。不是它不够聪明,而是它无法承担后果。

核保能不能过?授信给不给批?这些决定一旦出错,能被问责的,只有人。这也是AI落地中那根看不见的红线。

2.4 休谟:AI学了一堆统计规律,不是因果关系

休谟的因果幻觉.png

休谟说了一句对AI时代极其刺痛人的话:你以为你看到了因果关系,其实你只是看到了一堆重复发生的序列,习惯了而已。

他举了太阳升起的例子:

"That the sun will not rise tomorrow is no less intelligible a proposition, and implies no more contradiction, than the affirmation, that it will rise." — Hume, ibid.

意思是:你说明天太阳会升起,和说明天太阳不会升起,在逻辑上没有任何区别。都说得通。

你之所以觉得前一句"对",只是因为到目前为止每天都"重复发生"了而已。这是习惯,不是推理。

这正是大语言模型最根本的认识论缺陷。

AI学到的是"这个体检指标异常"和"延期承保"在训练数据里经常一起出现。但人学到的是"因为有XX风险,所以不建议现在承保"。

一个是统计关联,一个是因果推断。

输出结果可能碰巧一样,但一旦出错:前者你不知道它为什么错;后者可以倒推是推理链条的哪一步偏差了。

2.5 康德:知识不是镜子,是透镜

"The understanding does not derive its laws (a priori) from nature, but prescribes them to nature." — Kant, Critique of Pure Reason, Preface to the Second Edition (1787)

康德的这句话是西方哲学的一次"哥白尼式革命"。他想说的是:

人不是被动接收外部世界的"知识",而是用大脑里自带的认知框架,主动去构造对世界的理解。

康德的认知透镜.png 时间、空间、因果关系——这些不是外部世界塞给你的,是你用来"整理"外部世界的先天工具。

这个思想用在AI上,有一个极其惊人的对应:

大模型的"先天范畴"就是它的预训练权重。

Transformer不是在"记东西"。它在预训练阶段学习的,是一套稳定的注意力分配规律——什么该关注、什么该忽略、什么和什么有潜在联系。这,就是AI版的"先天范畴"。

而SFT微调,本质上是在修改这个先天范畴。所以SFT的数据量不需要特别大,但一定要超级精准。你缺一条信息,模型最多是"不知道";但你要是改错了一个框架,模型的整个判断体系都可能歪掉。

2.6 维特根斯坦:语言的边界就是AI的边界

维特根斯坦有前后两期哲学,但把它们放在一起看,结论非常残酷。

维特根斯坦的语言边界.png

早期:

"Whereof one cannot speak, thereof one must be silent." — Wittgenstein, Tractatus Logico-Philosophicus (1921), Proposition 7

单看这句,你可能觉得"那就不说那些说不清的东西呗"。但到了后期,他的核心思想变成了:

"The meaning of a word is its use in the language." — Wittgenstein, Philosophical Investigations (1953), §43

很多人把这句话理解成"字典定义不重要,看你怎么用"。但它的真正意思要沉重得多——他把"意义"彻底从抽象的、权威的定义里拽了出来,扔回了混乱、流变、取决于情境的人类日常语言游戏里。

这对AI意味着什么?

意味着AI处理不了人类语言里那些"局内人约定俗成"的东西。

一份保险合同中出现的"合理且必要",一份银行授信报告中出现的"重点关注",一份企业规章制度里出现的"原则上"。人知道这些词的潜台词——什么时候需要严肃对待、什么时候可以酌情松口、什么时候是在甩锅。但AI不知道,因为它没有参与过人类的语言游戏。

维特根斯坦会告诉你:语言的边界就是AI的认知边界。而人类语言的大部分,其实并不在AI能清晰理解的安全区里。

2.7 波普尔:可证伪——知识的安全气囊

"The criterion of the scientific status of a theory is its falsifiability, or refutability, or testability." — Popper, Conjectures and Refutations (1963), Chapter 1

波普尔的判断标准简单到让人不安:

区分科学与伪科学的唯一标准,不是"它是不是对的",而是"它在什么条件下能被证明是错的"。

波普尔的可证伪性.png 一个AI系统说:"基于现有资料,建议通过。"

这句话有可证伪的条件吗?

  • 如果你知道它是基于哪一条规则、哪一段条款作出的判断,那你可以去核查——去问"这条规则在这里用对了吗?"——这是可证伪的
  • 如果这句话背后只是一个黑箱的概率输出,"模型在这个context下这么认为的"——那它就不是可证伪的

不可证伪的断言不是知识,是观点。 在任何一个需要为决策承担责任的领域(无论是医疗核保还是金融审批),用观点冒充判断,不是工程瑕疵——是致命的。

2.8 波兰尼:人类有无法被编码的知识

"We can know more than we can tell." — Polanyi, The Tacit Dimension (1966), p.4

这是波兰尼最著名的一句话。他把人类的知识分成了两类:

类型你能写成文档吗你能教给别人吗AI能学会吗
显性知识✅ 可以✅ 培训可传递✅ RAG可以
隐性知识❌ 无法❌ 只能跟师傅学❌ 根本性困难

波兰尼的隐性知识冰山.png 你骑自行车时身体怎么保持平衡的——你写不下来。但你确实会骑。

一个核保老法师扫一眼体检报告说"这个不留"。他脑子里的某个模式被激活了,但他自己说不清是什么激活的,怎么激活的。

波兰尼会告诉我们一个残酷的事实:知识工程化,能帮你捕获所有显性知识。但隐性知识,至今只能用"人在旁边看着学"的方式传递。 这就是为什么"老法师"不会失业。他们拥有的不是信息差,是无法编码的判断力。

2.9 香农:信息的量 ≠ 知识的质

"The fundamental problem of communication is that of reproducing at one point either exactly or approximately a message selected at another point." — Shannon, A Mathematical Theory of Communication (1948), Part I

这是信息论的开篇第一句话。香农定义了信息量(熵)的数学公式,但他明确表示,他的理论不关心"含义"——只关心"信号能从A传到B,误差低于某个阈值"。

把香农和柏拉图放在一起看,你会发现一件很有意思的事:

  • 香农视角:一段500字的保险合同和一段500字的胡言乱语,如果字母分布一样,信息量完全相同。
  • 柏拉图视角:前者是知识,有结构、有论证、有适用范围。后者是对社会资源的浪费。

这就是早期"数据工程"和现在"知识工程化"的根本区别:

早期是香农式的——拼命堆数据量,以为"够多"就会"够好"。 现在必须是柏拉图式的——先问"这条数据能构成知识吗",再谈工程。

你的五维评估体系、你的场景匹配、你的可追溯校验,每一个维度,本质上都是在回答柏拉图替人类问了两千五百年的那个问题:

"这条信息,有资格称为知识吗?"


知识工程全景地图.png

三、九个哲学问题,一张工程地图

哲学家他提出的核心问题你的知识工程在做什么
柏拉图知识是什么?五维评估——确保每条数据"够格称为知识"
亚里士多德知识分几层?分级策略——episteme做检索,phronesis留给人
笛卡尔谁在思考?人机边界——AI没有"我",责任归属只能是人
休谟因果在哪?可追溯体系——强制输出带证据链,拒绝统计关联冒充因果
康德认知框架从哪来?SFT微调——精准修改模型的"先天范畴"
维特根斯坦语言的边界在哪?数据标注——在人类黑话上加入人工脚手架
波普尔怎么验证?评测闭环——只有可证伪可验证的输出才算质量
波兰尼什么无法编码?承认边界——隐性知识载体至今仍然是人
香农信息和知识有什么不同?从"量"到"质"的范式转换

四、未完成的答案:一个开放结尾

从柏拉图到香农,人类花了两千五百年追问"什么是知识"。

现在轮到我们用工程来回答这个问题的延伸版: "怎么让AI也拥有知识?"

我只是个在做知识工程化项目的架构师。我的困惑来自非常具体、非常"不哲学"的地方:核保规则到底该写成什么样的结构?银行的产业链上下游数据,应该怎么组织成图谱?一份会议的决策纪要,怎么确保半年后AI还能准确引用?

这些问题,逼着我不得不去追问那个最基础的题。

我还没有答案。但至少现在我知道:

  • 没想清楚知识是什么 → 做什么都是在"处理数据"
  • 想清楚了知识是什么 → 才真正开始了"构建知识"

人的角色:从执行者,变成定义者和判断者 AI 的角色:从替代者,变成知识放大镜 知识的终点:永远在人的判断力里

问题还在继续。欢迎加入深夜脑暴。