【AI转行01】小白也能懂：机器学习、深度学习与有监督学习【AI转行01】小白也能懂：机器学习、深度学习与有监督学习（通

【AI转行01】小白也能懂：机器学习、深度学习与有监督学习（通俗图解）

写在前面：大家好，我是正在从传统开发转行 AI 大模型工程师的阿强。面对铺天盖地的 AI 概念，我决定用最通俗的语言，把我的学习笔记整理成一个系列分享给大家。这是一个“能听懂人话”的 AI 基础专栏。欢迎大家一起交流！

给初学者的定心丸：别被这些高大上的名词吓到。其实 AI 的底层逻辑，跟你教家里的小朋友认字、认动物是一模一样的。

传统编程 = 你写好规则：“看见红灯就停”。

机器学习 = 你带他过马路 100 次，他自己总结出：“哦，原来红灯亮的时候大家都停了”。

想象这只是一个俄罗斯套娃：

这是目前 AI 最主流的学习方式，也是大模型的基础。

一句话解释：这就是“刷题战术”。

想象你要教一个从未见过猫的小朋友（AI 模型）识别“猫”。

准备教材（训练数据）：你找来 100 张照片，有的照片里是猫，有的不是。
贴标签（Labeling）：
- 照片A -> 告诉他：这是“猫”。
- 照片B -> 告诉他：这不是“猫”，是“狗”。
学习过程（训练）：
- 小朋友一开始瞎猜。
- 猜错了（比如指着狗说是猫），你就纠正他（这叫反馈误差）。
- 慢慢地，他脑子里就自己总结出了规律：有尖耳朵、胡须、瞳孔竖着的，大概率是猫。
考试（推理/预测）：
- 你拿出一张他没见过的照片（新数据）。
- 他自信地说：“这是猫！”（预测成功）。

这就是 有监督学习：有标准答案的学习。

ChatGPT 那么牛，其实它也是在做“有监督学习”，只不过它的题目是**“猜字谜”**。

它读了互联网上所有的书，做了几万亿道这种填空题，最后就学会了说话。

既然都是学习，区别在哪？

像个只会死记硬背的学生。

像个有悟性的天才。

作为未来的大模型工程师，这一章你只需要记住三个词：

数据 (Data)：
- 巧妇难为无米之炊。没有数据，AI 就是个空壳。
- 大模型启示：现在的竞争核心不是模型架构（大家长得都差不多），而是谁有更优质的高质量数据。
模型 (Model)：
- 就是一个巨大的数学公式。
- 训练过程，就是在这个公式里填数字（参数），让算出来的结果尽可能接近真实答案。
算力 (Compute)：
- 就是显卡（GPU）。
- 因为要算的数太多了（几千亿个参数），CPU 算不过来，必须用 GPU 并行计算。

既然是“刷题”，那咱们也来两道题练练手。

请判断以下场景属于 有监督学习 吗？

ChatGPT 有时候会一本正经地胡说八道（比如问它“林黛玉倒拔垂杨柳”的故事）。结合本章学的“Next Token Prediction（猜字谜）”原理，你想想为什么会这样？

👉 下一章预告：多元线性回归 这名字听着吓人？别怕！其实就是初中学的 y = ax + b。只不过现在变成了 房价 = 面积 × 单价 + 装修费。下一章我们用最简单的数学，通过“买房子”的例子，搞懂 AI 是怎么做预测的。