所谓的学 AI 到底是学什么?
很多人都有这个疑问,不是直接调用模型回答问题就行了么?
其实不是,你可以想一下:
大模型是不是没法记住你很久之前和他聊过的内容?比如上个月聊过的一个话题。这就需要给他扩展 Memory 能力。
大模型是不是没法调用外部工具?比如你让它发个邮件到某个人的邮箱,发个短信、调用某个后端服务。这就需要给他扩展 tools 能力。
大模型是不是预训练完成后,知识就不再更新了?比如你问他某个新闻,他并不知道,因为他训练数据集里没有。这就需要给他扩展一些 tools 的能力或者知识库。
大模型是不是没法知道一些你公司的私有文档?如果想让他针对这个文档回答问题,就需要给他扩展获取外部知识的能力。
这些能力是不是不管大模型再怎么发展,都无法解决?
比如不管大模型怎么发展,它的记忆总是有限的,都需要开发者给他管理 Memory,然后传给它。
比如不管大模型怎么发展,它总是训练完就不再更新知识了,需要通过 RAG、搜索网络信息的 tools 等给他扩展获取外部知识的能力。
比如不管大模型怎么发展,都不知道一些没有放在互联网上的数据,都需要让他能通过 RAG 获取外部知识。
类似这些,就是我们要学的 AI 技术。
当然,这是在大模型已经训练好的基础上。如果你能够在底层模型的基础上再做一次训练,传给它一些领域特定数据集,这种叫做微调 fine-tuning,调好之后模型就知道这些领域知识了,这种是基于底模产出一个新模型。
但大多数开发者不需要直接微调模型,而是在模型的基础上扩展能力,开发 Agent。
什么是 Agent 呢?
很多人天天听 Agent,但就是说不出 Agent 是什么来。
其实很简单,就是给大模型加上 Memory 记忆,加上 Tools 工具调用能力,这就是 Agent 了。
因为它本来就能够思考,能够计划,然后现在又能够通过 tools 来执行计划了,而且还有记忆,这就是一个能独立完成某些事情的 Agent。
当然,Agent 开发最好是结合后端技术学,也就是 AI 全栈。
虽然 Agent 是可以做本地工具的,比如 Memory 直接存文件,比如 RAG 从本地文件的向量数据库里取数据,比如调用一些本地工具。
但是你在一些 AI 创业公司里做的 AI 产品,绝大多数不是本地工具,它们需要在后端跑。
这时候你的 Memory 可能就要存入 redis,你的 RAG 可能就要从向量数据库 Milvus 中取,你的 tools 可能调用的是一个个后端服务。
虽然说你会开发本地 Agent 工具就已经很好了,但还不够,有 AI 全栈的经验更有价值。
你有了 AI 全栈项目经验后,可以作为全栈负责公司的 Agent 产品开发。
我下本小册就打算写《前端转 AI 全栈通关秘籍》,大概是元旦后上线。在 #神光的幸福生活 这个公众号更。
前端指的是用前端技术栈,比如 node、nest 等
AI 指的是讲 AI 的各种基础知识以及大量 AI Agent 实战
全栈是会在 web 项目前后端代码里集成 Agent 能力,结合后端技术栈开发 AI 产品。
公众号有个好处是可以放视频,可以放图文,这样我可以两者结合,既是视频课又是图文课,充分发挥两者的优点。
简单的条理清晰的直接图文,复杂的需要演示的插入视频。
是不是想想就很令人激动?
我最近就一直在期待 AI 小册上线的兴奋中。
之前说是春节后,但我觉得可以提前上,无非是写多少上线的问题,可能元旦后就上线了。
我在公司也在做 AI 产品,可以融入部分脱敏内容,放到小册里。这些都是真实 AI 产品里的经验。
总之,希望这篇文章能让大家清楚,学 AI 到底是学什么,Agent 是什么,为什么 AI 全栈经验比本地工具更有价值。
我自己对 AI 全栈的理解和实战项目也会近期开始写。
AI 时代其实不用那么焦虑,从另一个方面看,如果你掌握了这些 AI 技术,反而会有更多的机会。加油吧。