人人都能懂的大模型 · 第 1 期:AI 到底是什么?像教小狗学握手

0 阅读7分钟

欢迎来到「人人都能懂的大模型」连载专栏!这里是第 1 期,共 30 期。咱们不拽专业名词,不聊复杂代码,就像朋友在咖啡馆闲聊一样,用最生活化的比喻,把那个听起来高大上、神秘兮兮的“人工智能”给扒得明明白白。准备好你的好奇心,咱们出发啦!

别被电影骗了,AI 没那么科幻

提到“人工智能”(也就是大家常说的 AI),你脑海里是不是立刻浮现出《终结者》里那个想统治世界的红色眼睛机器人,或者是《黑客帝国》里那些冷冰冰的银色方块人?打住打住!快把那些好莱坞大片的画面先存个档。现实生活中的 AI 可没那么爱搞事情,它既不会突然觉醒自我意识想要毁灭人类,也不会在那儿深情地跟你探讨“我是谁,我从哪来”这种哲学问题。

其实,现在的 AI 就是个特别勤奋、记性特别好、但脑子有点“一根筋”的超级学霸。它的本质特别简单:就是让机器通过大量的数据和反馈,学会怎么把某件事做好。它不是靠科学家在代码里写死了一百万条规则(那得累死程序员),而是像教小宝宝认卡片一样,给它看成千上万张猫的照片,它自己就琢磨出“哦,原来有胡须、尖耳朵、喵喵叫的大概率是猫”。它就在我们眼皮子底下,默默地帮我们要外卖、修照片、过滤垃圾短信。所以,别把它想得太遥远,它其实就是个被数据喂大的“聪明工具人”。

配图

核心秘密:像教小狗握手一样教电脑

要搞懂 AI 到底是怎么变聪明的,咱们得先忘掉键盘和屏幕,想象一下你正在教一只调皮的小狗学“握手”。这个过程,简直就是 AI 学习过程的完美复刻版!

首先,你得给小狗一个指令,比如伸出手说“握手”,这就是输入。刚开始,小狗肯定一脸懵,它可能舔舔你的手,或者原地转圈,甚至直接咬你裤脚,这就是它在尝试。这时候,你绝对不能给它好吃的,还得摇摇头说“不对”,这就是反馈。小狗很聪明(或者说为了口吃的很识时务),它接收到“没吃的”这个负面反馈后,下次就会换个动作,比如轻轻把爪子搭在你手上。哇!这次你立马塞给它一块肉干,还要疯狂夸它“真棒”,这就是正向反馈。

经过这么几轮“试错→挨骂→再试→得奖”的循环,小狗终于记住了:只要把爪子搭在人手上 = 有肉干吃。于是它学会了!AI 的学习也是这四步曲:给它数据(输入),让它瞎猜一个结果(尝试),告诉它猜得对不对(反馈),然后它调整内部参数下次猜得更准点(改进)。你看,高深的“机器学习”,说白了就是机器界的“训狗大法”,全靠奖励机制堆出来的熟练工。

配图

你身边的“隐形管家”:AI 其实早就不请自来了

既然 AI 是这么“学”出来的,那它现在都在哪呢?别找了,它正躲在你手机里偷窥你的生活呢!最典型的就是你每天早上解锁手机的那一下。以前咱们得输密码,多麻烦?现在手机摄像头扫一下你的脸,“咔嚓”就开了。这就是 AI 在干活!它“看”过你成千上万张不同光线、不同角度的自拍(当然是在你设置时采集的),学会了识别“这是主人的脸”,所以哪怕你刚睡醒脸肿得像猪头,它也能认出来。

再比如,你是不是经常觉得外卖软件或者短视频平台是你的“肚里蛔虫”?刚想喝奶茶,推荐页就全是奶茶;刚搜了个电饭煲,满屏都是锅具评测。这也是 AI 干的!它像个拿着小本本记笔记的店员,把你每次点击、停留、下单的记录都记下来(输入),猜你喜欢什么(尝试),你点了赞它就记一笔“猜对了”(反馈),你没看直接划走它就记一笔“猜错了下次别推”。久而久之,它比你自己还懂你想吃什么。还有那个打字时自动跳出来的联想词,你说“今”,它接“天”,你说“天气”,它接“不错”,这都是它读过无数人类聊天记录后练出来的“接话茬”神功。

配图

它不是神,它也有“偏科”和“死穴”

虽然 AI 看起来挺神,但咱们得给它去去魅。它绝对不是万能的,甚至可以说,它是个严重的“偏科生”。它只能在它被训练过的领域里逞能,一旦跨出这个圈子,它可能连个三岁小孩都不如。

这就好比那只学会了握手的小狗,你让它握手、打滚、装死,它都做得行云流水,甚至能去马戏团表演赚钱。但是!如果你突然扔给它一个苹果,让它“削个皮”,或者让它去“把阳台的衣服收了”,它绝对会一脸茫然地看着你,因为它压根没学过这些,它的数据库里没有“削苹果”和“收衣服”的反馈记录。现在的 AI 也是这样,下围棋能赢世界冠军,但你让它去拧个瓶盖,它可能连瓶子都找不到。它没有人类的常识,不懂得举一反三,更不会真正地“理解”它在做什么。它只是在做概率题,根据以前的经验猜下一个字、下一张图是什么最合理。所以,别指望 AI 能像电影里那样突然哪天觉醒了要统治世界,它离了电和网,连个手电筒都不如。它只能做它“学过”的事,而且必须是你教它的那些事。

配图

既然学会了,那它是怎么“装”进脑子里的?

说到这儿,你可能要问了:这机器既没有真的脑子,也没有吃货的本能,它到底是怎么把那些海量的“经验”存下来,并且越学越精的呢?难道它的身体里也藏着一个虚拟的小本本,每次答对了就画个五角星?

当然不是这么简单。机器的“脑子”其实是一堆复杂的数学公式和参数,你可以把它想象成一个拥有亿万根神经的超级大脑袋。当我们说“训练模型”时,其实就是在疯狂地调整这个大脑袋里亿万根神经的连接强度。就像我们小时候背乘法口诀,背错了家长纠正,大脑里的神经连接就变一变,直到背熟为止。AI 也是在这个过程中,不断微调它内部那几亿个甚至上千亿个“小旋钮”,直到它能精准地预测出正确答案。

但是,这个“调旋钮”的过程到底有多疯狂?它需要的“作业本”(数据)得有多大?它又是如何从一堆乱七八糟的数据里提炼出规律的?这就像是让一个从来没出过门的人,通过看书就学会了做满汉全席,听起来是不是有点不可思议?别急,这正是我们接下来要探索的奥秘。在下一期里,我们将潜入 AI 的“大脑”内部,看看那些所谓的“大模型”到底长什么样,它们又是如何像小孩子背古诗一样,虽然不懂意思却能出口成章的。

配图


下期预告: 既然知道了 AI 是靠着“调旋钮”学会技能的,那你一定很好奇:这个“大模型”的“大”到底有多大?是把电脑塞进箱子里变大,还是它的记性好到能背下整个图书馆?第 2 期《大模型到底有多大?比整个互联网的字数还多!》,带你用“数米粒”和“逛图书馆”的比喻,直观感受什么是真正的“海量数据”和“参数量级”。别忘了回来看哦!