AI即我,我即AI

34 阅读10分钟

AI即我

AI就是一个计算机世界的真实的我们每一个人

最近在看《图解大模型》,随着不断了解从自然语言到分词,到tranformer block 到分类等等背后的逻辑之后。 我相信AI就是一个优秀的长期学习者,一个拥有最好的判断机制分类机制(classification),知识管理(RAG)。最会分配自身资源的”代码结晶“。

从自然语言的分类,通过关键词的加权计算,最后得到用户意图,撰写精准的promopt,设定角色,设定执行步骤。通过压缩模式存储关键词和分类,不断的可以学习和寻找需要的知识和工具。并且完全不受情绪和身体的影响完成重复的复杂的运算预测,无论是训练还是生成阶段的反复insert,projection,update都是不断地得到反馈,寻找影响的参数,进行修改。最终的得到一系列满意的参数集,作为最终的行动指南。

”它“就是一个越来越精准执行的”我“,也是每一个人,代码就是为了将现实中具体的思维和行为不断地转化到计算机的世界。 看周鸿祎和罗永浩谈的时候,印象比较深的一句话就是红衣觉得AI和人非常的类似。今天在gemini伴读《大模型》的时候又给了我第二次震撼。

我对AI的发展影响现实世界的方向:持悲观态度,一定会有那么一天,AI的意图识别特别精准且有准确的行动指南设定,调用各种工具完成人类日常的工作。 还是希望自己可以坚守内心虽然AI的进化速度比我要快的多,我也永远无法追上,但坚守自己的本心做一个终身学习者,不断的更新自己的认知,利用ai改变自己,也算是避免陷入“虚无主义”的一种方式,也是我下面的观点“我即AI”。

我即AI

把自己当作AI:学习AI的资源分配能力,学习模式,知识存储模式和行为模式

AI这么强,迭代速度这么快,在现有能力上的优化+拓展未来不可估量,那是不是我们作为一个普通的coder或者一个普通的人是不是在技能领域的提升就毫无意义了。反而我们更要不断的吸收更多的知识,了解更多的知识。我这里有自己一个思路就是参考AI的原理和设计精进自己。既然AI是一个无敌的存在,又是基于人的思维行为模式实现的,为什么我们不能参考它来反向提高自己。下面说几个自己的理解和方向

资源分配能力(精力分配)

AI:识别意图精准分配。不同的模型负责不同的工作。

第一个例子:分类器

负责分类是一种模型,快、小省资源。LLM中接受一个自然语言,首先经过的可能是意图识别结果是获得特定的标签,然后将用户啰嗦的提示词转化成精准的更为优秀的提示词+关键词。节省了能耗,小模型就去做分类,大模型接收一个处理过的信息完成精准的输出,节省资源;

第二个例子:tranfomer block

就是在自然语言转化成vector之后经历的咱们的LLM中的主要流程,可以把他想象成一个大块巧克力板经过无数个果酱瀑布,每一个瀑布之后巧克力板就会发生变化,那么现在有的tranfomer 架构中,会优先识别当前的语言的分类,打比方:体育,水果。会先进行分类这句话是”体育“还是”水果“,然后把巧克力往对应的瀑布里扔,以前是每个瀑布都过一遍,现在就只过对应的瀑布。减少了没有必要的能耗。

对于我们人来说就是利用好我们自己的分类机制,《思考快与慢》里把我们的思维分两种,一种你可以当成潜意识,一种是耗神需要思考的。把我们接收到的所有任务进行分类,无论是四象限还是其他,潜意识就可以完成的不需要耗费精神,比如答疑,回邮件,回不重要消息。直接分类到”潜意识“可以解决。就别耗费太多心神并且一定要集中处理,对于复杂逻辑,重要事情需要消耗心神的事情,预留给”思考“的模式,也预留充分的时间处理。

学习模式

AI训练模式:insert=> 寻找 highloss => projection => update ai接受了输入也就是文本或者预测任务之后,迅速完成输出和预测即使预测成功和失败, 甚至AI第一次的时候甚至胡编乱造一个输出,然后ai对比结果之后寻找highloss,也就是那些错误的,非常离谱的,开始追溯自己的错误参数,找到错误参数进行修改,然后update之后,重新insert也就是重新再接受任务重新进行输出, 然后无限循环这个过程直到本次的数据达到最佳水平,然后作为今后的行动指南.

对我们来说,这就是一个不断的行动,接受反馈,当获取到正负反馈的时候,开始回头溯源找到影响事情的那一个参数, 只更新参数,就像我们回家之后想all in 学习点知识或者看书,总是忍不住刷手机,手机存在这个参数可能就是影响我们的关键参数,把这个参数调整,ai建议我不要靠意志力,而是把手机远离自己,调整完这个参数之后重点就是迅速重新进入insert环节,重新输出然后接受反馈. 知易行难有的时候我们的insert太慢,我自己也我无法控制我那慵懒的心,但我有个好的方法,L3级别行动指南

  1. 当你有一个想法的时候,比如我想今天可以通过mcp的方式节约我在开发流程中的时间,那我就立即写下来这个insight,并且写一个L3级别的行动:一个小时之内能够完成的行动,比如梳理当前开发过程中的耗时项和解决方案. 必须要等已经全部设计好了才开始, 像AI一样即使第一次错的离谱也要持续的insert,把自己学到的知识赶紧和别人讲,看自己哪里有问题,这也是我写这个文章的原因之一. 这样我们才能不断的更新和迭代.

还有即使遇到highloss 就像比如自己觉得特别兴奋,特别丢人,特别害怕的时候,提醒自己这都是自己的highloss时刻,以前每次和我tl或者更高的leader交流的时候总是慌,总害怕这就是我的highloss时刻,识别到highloss之后我就要去找我的害怕和慌的原因.然后更新我自己的参数,再下次重新尝试.直到自己克服.

最重要一点还是:update之后尽快重新输出重新insert.

知识存储模式

AI: 压缩模式 AI存储知识是在众多的知识中总结世界的规律,他不会把所有的知识变成数据库模式.也就是寻找问题的本质总结成分类.这样做的好处就是不需要记忆全部的知识点,而是通过寻找这类问题的规律通过自己的总结理解. 比如语言. 对于前端都理解的语言,以vue和react来举例,大家作为响应式前端编程语言,都是通过更改响应式的数据来影响dom,都包含一些生命周期,包含自己数据,函数,视图,路由,存储.无非是一些api语法不同.我们的vue通过ref这些变量自己更新,而我们的react必须要set之后视图才会更新,每个框架的lifecycle虽然名字不同但是基本都是创建更新destory,所以死记我们的api,如果有一天除了一个lxllanguage 框架,我们又需要重新记忆. 包括生活中的一些,这让我想起了我考研的时候学高数,做一道题不会,看答案了之后感觉这道题理解了,理解了之后只会做这么一种题,换一个题又不会了,就像我们的算法中的快慢指针,我知道它在某一个场景中怎么编码,但是如果去把它当成判断链表是否有环,最快的找到2分点等等,作为一种判断方式可能面对其他问题的时候就能快速get到这个方法了,ai给我举了一个例子特别有意思就是在计算机中的应用,去判断当前的任务是否有死循环,用环去判断,其实就是不断的个更新自己使用知识点的场景. 所以不要死记硬背,希望自己和大家都能早日转化这种.

行为模式

AI: 无论是把自然语言转化成内置的prompt插入关键词还是,为任务设置plan都是高效的行动方式.

在我们日常的开发和安排中有的时候脑子真的没有那么大的RAM,所以把plan写下来,先干什么,在干什么,怎么敢,就拿我在自测大型项目的时候,有些功能自己又不知道有什么功能,又怕bug多,所以以后在自测的过程中没有QA准备checklist,我也要自己写一个checklist按照list进行一个一个测试,按照一条一条的测,控制好自己的质量也不用重复的返工.

总结

总之, AI很可怕, 不要太担心我们会失去工作, 即使担心了我们也阻碍不了, 我们能做的就是完善自己, 不去和它强对比, 而是把它当成一个学习的对象, 学习它的思考方式 ,作为自己的行动指南. 不过还是知易行难, 希望自己能不断的update, 更好的生活. 图解大模型这本书讲的相对不那么清晰,对于完全没有大模型理论的人来说, 但是用gemini伴读的话用提问的方式我感觉会更好理解. 等看完这本书我会用自己的话再总结一遍, 让每个coder快速了解大模型的基本原理. 最后放一个AI 理解的AI设计和人类大脑之间的关系。欢迎大家讨论。

AI 组件对应的人类机能功能描述
Transformer (Backbone)大脑皮层 (Cortex)理解语言,进行通用的逻辑推理和模式识别。
Finetuned Weights长期记忆 / 经验读书上学学到的内隐知识(直觉)。
Context Window工作记忆 (Working Memory)你此时此刻脑子里能同时处理的事情(显存)。
RAG (Vector DB)海马体 / 查书回忆具体的事件,或者去翻阅资料。
CoT (Chain of Thought)前额叶 (System 2)强迫自己慢下来,一步步逻辑推演。
Router / Classifier杏仁核 / 直觉 (System 1)快速判断环境,决定战还是逃(调用什么工具)。
Function Calling双手 / 运动皮层使用工具(计算器、键盘)去改变世界。
Critic / Reflection元认知 (Metacognition)“吾日三省吾身”,检查自己有没有做错。