通往 AI 理解之路:写代码多年后,我回到了数学

126 阅读5分钟

“我不想只在 API 的低处,我想到理解的高处。”

这句话,是我在学习 AI 的过程中最深的感触。它不是一句标语,而是一种真实的成长疼痛。刚写代码的时候,从没想过,有一天我会为了理解一个 attention 机制而去啃线性代数、微积分、概率论;更没想过,数学这门从前觉得陌生的学科,会变成我理解世界的一把钥匙。


一、我从写代码出发,却在数学中回头

我大学时并不擅长数学,看到公式就发懵,也从没想过“数学”会在我的职业生涯中再次回头。

直到 AI 的出现。

我第一次使用大模型时是通过 API,把一些文本送进去,能拿到结构化结果,甚至帮我自动生成表格字段定义。我惊叹于它的能力,也陷入深深的不安——

为什么它能做这些?为什么它的输出这么准?它真的理解我了吗?

我试图“再进一步”。我想读懂模型结构,想优化提示词,想知道它怎么“知道”字段是什么意思。可当我打开 Transformer 的论文、看那些 attention 的图、读那些函数时,我意识到:我还是在门外。

二、数学,是打开 AI 的真正钥匙

我们常说“数学是科学的语言”,但很少人真正理解它的本质:数学是对现实世界的高度抽象。

我们看见现实中的物体运动、电流传导、数据波动,数学用符号和结构将它们概括、建模、计算,最终演化出我们今天所依赖的一切技术。

但这个“从具体到抽象”的过程,对大多数人来说是困难的。因为它意味着:要从感性的世界抽离出来,去掌握那些没有形状的逻辑和关系。

在 AI 的世界中,模型看到的不是“人话”,而是矩阵,是概率,是向量空间的距离。而数学,就是让我们与这些底层结构对话的语言。而数学,就是让我们与这些底层结构对话的语言。就像英语是莎士比亚著作的语言载体,数学之于现代科技,也承担着同样的角色——没有数学的理解,我们读不懂科技真正的内涵,只能停留在表层的使用。

我们常说“数学是科学的语言”,但对于 AI 来说,数学是它的“母语”。它的底层不说自然语言,也不说代码,而是:

  • 矩阵
  • 向量
  • 梯度
  • 分布
  • 极值

我以前看不懂这些,是因为我不知道它们“在现实中干了什么”。但现在我知道了:它们就在我们写的代码背后,在模型每次训练的过程里,在每个你以为“magic”的推理过程中。

数学分支在 AI 中的作用
线性代数理解向量空间、特征表示、注意力机制、矩阵乘法
微积分理解梯度下降、反向传播、模型训练过程
概率与信息论理解模型生成、Softmax 分布、交叉熵损失、熵与信息量
最优化方法优化目标函数、Loss 函数、正则化策略等
图论与组合Transformer 结构、图神经网络、搜索路径等

三、不是学不好数学,只是以前不知道它为什么重要

很多人说“我学不好数学”,其实不是“笨”,而是“脱离上下文”。

当年我们在课堂上学导数、积分、矩阵乘法,却不明白:

  • 导数就是机器学习中损失函数下降的方向;
  • 矩阵乘法就是模型结构的核心;
  • 交叉熵就是语言模型训练的指标;
  • Softmax 是模型做选择时的大脑思维;
  • 注意力机制的“点乘”背后就是线性空间的相似性判断。

只有当我真的需要做字段生成器、需要读懂 LoRA 的实现逻辑、想在本地部署模型时,我才意识到,这些数学知识是工程世界的语法,是理解 AI 的语言。

数学不是我们职业路上的门槛,它是那把被我们忽略太久的钥匙。


四、复习备查表:数学能力与 AI 场景映射

AI 场景依赖的数学知识应用说明
注意力机制向量运算、线性代数计算 token 相似度
Embedding 层矩阵变换、空间投影特征向量表示
模型训练微积分、链式法则、优化理论计算梯度,反向传播
损失函数设计信息论、概率论如交叉熵、KL 散度、熵等
正则化与泛化能力最优化理论L1/L2正则项
推理与生成策略概率论、采样理论Top-K、Top-P、温度控制等
模型压缩与微调低秩分解、矩阵近似LoRA、Adapter、剪枝、蒸馏等

五、我想理解的,不只是结果,而是原理

现在的我,不再满足于“调用 API”,我想知道:“这个模型为什么这样输出?”、“这个 attention 权重是怎么计算出来的?”、“我能不能定义一个更适合自己的结构?”

我曾站在 API 的低处,如今想爬到理解的高处。不是为了炫技,而是为了更有掌控力。为了在未来的 AI 世界里,不只是使用者,而是创造者

我现在开始系统性学习数学,不是从课本开始,而是从我想理解的问题出发:

  • 从 Transformer 理解向量变换
  • 从 LoRA 理解矩阵秩与近似
  • 从损失函数理解概率分布与优化

一步步打通,像在黑夜中点起一个又一个灯。


六、结语:写代码多年后,又回到数学

我们不是因为数学天赋好才去学数学,而是因为我们有了目标,有了方向,有了想理解这个世界的渴望。

数学,是理解 AI 的语言,是我真正通向未来的钥匙。

也许你也像我一样,曾以为自己“数学不好”,但你愿意去问一个问题:为什么 attention 用的是点积?这就够了。

你已经在走向“理解的高处”。