“我不想只在 API 的低处,我想到理解的高处。”
这句话,是我在学习 AI 的过程中最深的感触。它不是一句标语,而是一种真实的成长疼痛。刚写代码的时候,从没想过,有一天我会为了理解一个 attention 机制而去啃线性代数、微积分、概率论;更没想过,数学这门从前觉得陌生的学科,会变成我理解世界的一把钥匙。
一、我从写代码出发,却在数学中回头
我大学时并不擅长数学,看到公式就发懵,也从没想过“数学”会在我的职业生涯中再次回头。
直到 AI 的出现。
我第一次使用大模型时是通过 API,把一些文本送进去,能拿到结构化结果,甚至帮我自动生成表格字段定义。我惊叹于它的能力,也陷入深深的不安——
为什么它能做这些?为什么它的输出这么准?它真的理解我了吗?
我试图“再进一步”。我想读懂模型结构,想优化提示词,想知道它怎么“知道”字段是什么意思。可当我打开 Transformer 的论文、看那些 attention 的图、读那些函数时,我意识到:我还是在门外。
二、数学,是打开 AI 的真正钥匙
我们常说“数学是科学的语言”,但很少人真正理解它的本质:数学是对现实世界的高度抽象。
我们看见现实中的物体运动、电流传导、数据波动,数学用符号和结构将它们概括、建模、计算,最终演化出我们今天所依赖的一切技术。
但这个“从具体到抽象”的过程,对大多数人来说是困难的。因为它意味着:要从感性的世界抽离出来,去掌握那些没有形状的逻辑和关系。
在 AI 的世界中,模型看到的不是“人话”,而是矩阵,是概率,是向量空间的距离。而数学,就是让我们与这些底层结构对话的语言。而数学,就是让我们与这些底层结构对话的语言。就像英语是莎士比亚著作的语言载体,数学之于现代科技,也承担着同样的角色——没有数学的理解,我们读不懂科技真正的内涵,只能停留在表层的使用。
我们常说“数学是科学的语言”,但对于 AI 来说,数学是它的“母语”。它的底层不说自然语言,也不说代码,而是:
- 矩阵
- 向量
- 梯度
- 分布
- 熵
- 极值
我以前看不懂这些,是因为我不知道它们“在现实中干了什么”。但现在我知道了:它们就在我们写的代码背后,在模型每次训练的过程里,在每个你以为“magic”的推理过程中。
| 数学分支 | 在 AI 中的作用 |
|---|---|
| 线性代数 | 理解向量空间、特征表示、注意力机制、矩阵乘法 |
| 微积分 | 理解梯度下降、反向传播、模型训练过程 |
| 概率与信息论 | 理解模型生成、Softmax 分布、交叉熵损失、熵与信息量 |
| 最优化方法 | 优化目标函数、Loss 函数、正则化策略等 |
| 图论与组合 | Transformer 结构、图神经网络、搜索路径等 |
三、不是学不好数学,只是以前不知道它为什么重要
很多人说“我学不好数学”,其实不是“笨”,而是“脱离上下文”。
当年我们在课堂上学导数、积分、矩阵乘法,却不明白:
- 导数就是机器学习中损失函数下降的方向;
- 矩阵乘法就是模型结构的核心;
- 交叉熵就是语言模型训练的指标;
- Softmax 是模型做选择时的大脑思维;
- 注意力机制的“点乘”背后就是线性空间的相似性判断。
只有当我真的需要做字段生成器、需要读懂 LoRA 的实现逻辑、想在本地部署模型时,我才意识到,这些数学知识是工程世界的语法,是理解 AI 的语言。
数学不是我们职业路上的门槛,它是那把被我们忽略太久的钥匙。
四、复习备查表:数学能力与 AI 场景映射
| AI 场景 | 依赖的数学知识 | 应用说明 |
|---|---|---|
| 注意力机制 | 向量运算、线性代数 | 计算 token 相似度 |
| Embedding 层 | 矩阵变换、空间投影 | 特征向量表示 |
| 模型训练 | 微积分、链式法则、优化理论 | 计算梯度,反向传播 |
| 损失函数设计 | 信息论、概率论 | 如交叉熵、KL 散度、熵等 |
| 正则化与泛化能力 | 最优化理论 | L1/L2正则项 |
| 推理与生成策略 | 概率论、采样理论 | Top-K、Top-P、温度控制等 |
| 模型压缩与微调 | 低秩分解、矩阵近似 | LoRA、Adapter、剪枝、蒸馏等 |
五、我想理解的,不只是结果,而是原理
现在的我,不再满足于“调用 API”,我想知道:“这个模型为什么这样输出?”、“这个 attention 权重是怎么计算出来的?”、“我能不能定义一个更适合自己的结构?”
我曾站在 API 的低处,如今想爬到理解的高处。不是为了炫技,而是为了更有掌控力。为了在未来的 AI 世界里,不只是使用者,而是创造者。
我现在开始系统性学习数学,不是从课本开始,而是从我想理解的问题出发:
- 从 Transformer 理解向量变换
- 从 LoRA 理解矩阵秩与近似
- 从损失函数理解概率分布与优化
一步步打通,像在黑夜中点起一个又一个灯。
六、结语:写代码多年后,又回到数学
我们不是因为数学天赋好才去学数学,而是因为我们有了目标,有了方向,有了想理解这个世界的渴望。
数学,是理解 AI 的语言,是我真正通向未来的钥匙。
也许你也像我一样,曾以为自己“数学不好”,但你愿意去问一个问题:为什么 attention 用的是点积?这就够了。
你已经在走向“理解的高处”。