范范:你感受到大模型越来越被重视对吗?
现在应该是一个普遍认识了,我来分享一下目前大模型应用在企业里面近况吧。坐标为一个二线城市,项目所在行业是某电网。
我从几个点说一下目前大模型项目的情况。
- 国家将生成式人工智能定义为新质生产力,在电网中出现很多关于大模型项目,并且集团成立专门负责人工智能赛道的公司,负责整个集团所有省的人工功能项目。
应该说无论是资金还是人力投入都是前所未有。
- 从信息中心审批项目来看,关于人工智能的项目科创项目越来越少,而信息化项目越来越多。
这不代表项目就少了,而是未来人工智能技术将嵌入核心业务或者直接应用到生产中,不再是辅助功能。
- 从人才招聘信息看:以前对人工智能岗位要求很模糊,从岗位信息上看根本看不出该岗位技术方向。
但是现在相关岗位要求电网从业经验并且对技术方向有了明确要求(关键字:LLM、大模型微调,LOAR,PPO,Agent)说明对于人工智能岗位要求及人才筛选有了明确要求。
并且团队成员组成朝着小而全的模式在构建(super Team)。以上列举变化让我感觉未来大模型技术将推动垂类行业产业升级重要生产力。
- 如果在国央企的兄弟们都是知道,如果项目中没有亮点或者创新点很难审批过,但是大模型就是突破点,这一点我相信都有感受。
范范:这些听上去非常宏观,对个人的影响是什么样的呢?比如经常提到的35岁魔咒?
不宏观的,山雨欲来风满楼,风会吹向每一个人。不止要等风吹来,也要提升对风的感受。
范范:该怎么做呢?
最近的一个例子,也是我感受很深的。以前我们在企业做项目,项目经理可以不懂技术它负责幻想,技术负责实现梦想。
造成的结果就是甲方吐槽为什么你们开发东西那么难用,配置那么不人性化,老是改来改去的。
其实本质上从一开始设计到开发完成没有吃透业务导致的。而在大模型时代我觉得这个问题将会放大。
这就要求所有* 智能体*更应该解决用户痛点,而不是一些画蛇添足堆砌。
因此如果转型做产品经理小伙伴,需要好好了解大模型技术栈和大模型技术实现的边界在哪。
以前原型图和流程程可能已经变得不再重要,也许我们和甲方需求对接是就直接需要使用像Dify或者Coze这个低代码平台将业务流梳理清楚,而不是幻想一切最终无法实现。
范范:那您认为,技术人该怎么办呢?
这需要我们开发者融入业务中剖析痛点优化解决它。
工程化能力对于大模型应用开发至关重要,以前传统开发项目很有可能算法岗位负责模型训练,只要抛出接口其他有后端来完成串联。
但是目前智能体开发阶段流程的编排、工具接入等等都有大模型应用开发岗完成,所以整个后端(从设计、编码、测试、上线)都需要独立完成,对于我们来说工程化能力要求大大提高了。
范范:那岂不是经验越丰富越吃香
可以这么理解,自己也已经是一个大龄程序员,目前接项目和甲方聊的时候,他们也认可目前大模型应用开发项目确实需要业务+工程化都很强的人,很适合老程序员转过来。
我总结为【业务能力+工程化能力】,这是最核心的竞争力,确实和年龄关系不大。
范范:您同时还是高校的导师,在0基础入门大模型这件事上有什么建议吗?
一定要体系化的学习。
范范:这一点其实大家都知道,但是很少有人能理解。能举些例子吗?
有两个例子很直观,一个是23年4月chatgpt出现时候非常火爆,当时创业公司做了套壳应用,但是2023年9月后,在线模型和开源模型都做了免费且能商用的功能,导致很多创业公司倒闭。
(Chegg2024年Q4财务情况,订阅用户数下降21%)
还有美国的教育科技公司Chegg宣布破产(范范补充:市值跌99%),原因是chatgpt改变了培训生态。
你也许当下会发现一个不错的切入点,但可能一个月后就被颠覆了。
范范:甚至可能更快
是的,可能更快。所以体系学习大模型发展脉络,才能保证自己的核心竞争力
范范:该如何体系学习呢?
同样以我自己为例吧,之前我的学习渠道就是去B站上找热点视频,或是在博客上找免费文章,因为免费(笑
这样学习肯定是有效果的,但真正深入学习后,时间长了就会发现无法满足我的需求。
范范:太杂了。
是的,学了很多知识点,但是没有办法将他们有效串联起来,更别提形成有效的解决方案了。
而跟着九天老师团队学习则很不一样,我也简单说一下我学的过程:
1.先学习在线模型OPENAI所有调用,并且做了第一期mategen项目(范范补充:MateGen为团队自研Agent项目,具备NL2SQL,NL2Python等能力)。
目前这个项目也是我带学生实验一个重点项目,特别适合学生提升大模型应用开发能力提升的优质项目。
2.跟着木羽老师学习langchain+rag项目,当时也是做我们学院本地知识库问答小系统,结果反馈还不错。
这个项目中langchai-chatchat源码解读很到位,我也重新过了一遍,后续优化问题重写、文档标题正则标记等问题,上线后准确率有了进一步提升。
3.跟着木羽老师学了Agent三个框架AisstantAPI、langgraph和AutoGen,做了一个项目mategen Pro。
这个阶段感觉自己Agent开发能力有了很大提升,并且当时也接了一个小项目Langgraph+Vanna 客服中心数据可视化项目。
4.跟着木研老师模型微调这门课,如何微调适配当前业务,这块也很有帮助。
特别目前NL2SQL这块,由于企业目前大量国产化替代,目前数据库都是使用达梦,因此后期需要将项目mysql迁移到达梦数据库上,必须进行微调。
最让我意外的是,2023年底九天老师就提出要学习Agent,在当时业内对这个概念都很模糊。直到现在,才开始慢慢被大众所接受。
范范:最后是否有什么经验可以分享呢?
还是山雨欲来风满楼吧。我觉得任何一个风口到来时,有的人只是把它当做热点来讨论,而有的人却立马入局先干起来。
我觉得openai提出的2025年将实现AGI,并且未来规划ASI,对于传统行业来说都是危+机。如果我们作为局中人也许可以从危转机,行动起来,实时掌握行业东西,深耕技术。让自己在这次变革中成为推动者而不是见证者。
大模型岗位需求
大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元, AI工程师薪资平均值约37336元, 大模型算法薪资平均值约39607元。
掌握大模型技术你还能拥有更多可能性:
• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;
• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;
• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;
• 更优质的项目可以为未来创新创业提供基石。
可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好,希望能够真正帮助到大家。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
零基础入门AI大模型
今天贴心为大家准备好了一系列AI大模型资源,包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
有需要的小伙伴,可以去关注下方伀众呺领取或扫描下方二维码领取【保证100%免费】
👉【全套AI技术和大模型入门资料】👈
1.学习路线图
如果大家想领取完整的学习路线及大模型学习资料包,可以点击下方链接或去公众号获取 !
👉【全套AI技术和大模型入门资料】👈
👉2.大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。(篇幅有限,仅展示部分)
大模型教程
👉3.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(篇幅有限,仅展示部分,公众号内领取)
电子书
👉4.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(篇幅有限,仅展示部分,公众号内领取)
如果大家想领取完整的学习路线及大模型学习资料包,可以点击下方链接或去公众号获取 !
👉【全套AI技术和大模型入门资料】👈