2023:千模大战、ToC、单模态
1、 千模大战
截至今年10月,国内已经发布了238个大模型,而在6月份这个数字还只是79个,已经从“百模大战”向“千模大战”发展,“千模大战”虽然打得火热,与此同时,新一轮的洗牌或许也已悄然到来。从市场需求而言,最终能够历经荡涤留存下来的玩家必将是有限的。
如OpenAI创始人Sam Altman所判断的:“将来应该会出现几个大型的基础模型,开发人员都将基于这些基础模型研发AI应用。”而不是每个市场参与者都从0到1地对大模型进行自研。
不仅如此,由于AI算力、训练数据等赛道资源的稀缺性,训练一个大模型需要持续投入的,要想打造一个技术成熟的大模型,算法、数据、算力缺一不可,这无不需要庞大的人才与资金投入。曾有数据估算,GPT-3 训练一次的成本约为 140 万美元,对于更大的大型语言模型,训练成本甚至在 200 万美元至 1200 万美元之间。
知名AI企业“小冰”的CEO李笛就曾发出论断,认为这一领域“到2024年应该就会退热,发现谁在岸上裸泳”
2、 ToC应用
李开复老师曾说过:AI 2.0是巨大科技革命,平台和应用将改变世界,大模型能力到位后,最大的商机一定是ToC超级应用(Super APP)。
他认为:“PC时代微软Office就是超级应用,在移动互联网时代,微信、抖音是相当好的超级应用,AI 2.0时代毫无疑问最大的商机也会是超级应用。”
目前相比之下,海外市场已经涌现出上千个AI原生应用。然而在中国,尽管大模型的数量在不断增加,但真正的原生应用却寥寥无几。这一年大家都在忙着对已有应用的赋能或者重构,真正的ToC超级应用诞生了吗?
今年8月,妙鸭相机突然走红,成为国内AIGC领域第一个出圈的AI应用,但是随着时间的推移妙鸭相机的声量也逐步走低,昙花一现的迹象愈发明显。七麦数据显示,妙鸭相机自7月17日上线以来,8月8日开始霸榜“社交”软件第一,12日拿下应用总榜第一。但8月15日后开始降温,目前在“社交”榜单排名37,在应用榜单也排在400名开外。
3、 单模态:AIGC
尽管多模态大模型(MLLM)也是这一年的热门,国内外也都出现了蛮多的模型:GPT4-V,Gemini、Qwen-VL,Monkey、ChatGLM-VL等等(github.com/BradyFU/Awe… ;但是国内目前主流的ToC应用都还是单模态偏多(文本或图片),直接上图吧(如有比较好的多模态ToC应用,欢迎补充)。
-
产品A:
-
产品B
- 产品C
2024:ToB、Agent、多模态
1、 ToB:私有化
在C端没有Super APP落地场景背景下,不少大模型厂商瞄准了ToB方向,行业场景在加速落地:
- 阿里云发布通义大模型时宣布已和多家企业已经展开了合作探索,首批合作的企业有OPPO安第斯智能云、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌悦科技等。
- 百度文心行业大模型的数量已经达到11个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科多个领域。
- 华为云盘古大模型沉淀了大量丰富的行业应用实践,覆盖矿山、气象、医药、能源、金融等等重点领域,并打造出了诸多垂直类的行业大模型,如盘古矿山大模型、盘古气象大模型、盘古海浪大模型等。
- ...
此前几年,企业纷纷浩浩荡荡地启动数字化转型,从OA系统、到 CRM、ERP等等,中间累积了大量的数据。随着企业研发、生产、销售、人力等各项业务场景数字化深入,如何借助大模型的力量,发挥出数据的最大价值,用数据进行决策、分析正成为企业商业制胜的关键所在。
企业需要定制化或私有化AI,因为它们拥有特别敏感且价值高的数据,三星3月chatgpt泄密事件给企业敲醒警钟,苹果等很多大公司都禁止员工使用chatgpt,避免公司数据的泄露。ToB的AI需求会带有行业属性,私有化大模型可以针对特定领域数据进行微调,服务于垂直专业领域,例如,金融、医疗、法律,教育等。
2、 Agent:链接
想要革新千行百业,大模型就必须落地到企业具体场景,而Agent是链接企业业务场景,是大模型应用到企业场景的重要着力点。
Agent一词起源于拉丁语中的Agere,意思是“to do”。在LLM语境下,Agent可以理解为某种能自主理解、规划决策、执行复杂任务的智能体。Agent并非ChatGPT升级版,它不仅告诉你“如何做”,更会帮你去做。
企业员工可以通过自然语言,简单且高效地传达任务和目标,而AI Agent将承担任务规划、记录与执行,员工只需进行关键决策即可高质量完成任务,极大提高工作效率:
- Agent+协作办公工具(企业微信、钉钉、飞书)
- Agent+知识库(结构化或非结构化数据)
试想一下每天的工作从与AI交互开始:
- 上班:列一下我今天有哪些工作要做;
- 工作:在CRM分析针对客户A的下一步的推荐跟进策略;
- 下班:总结我一天的工作,并汇总成一个日报。
3、 多模态:载体
从当前ToC端的大模型落地场景来看,现在最大的应用还在文字,其次是图片,视频刚刚起步。而在ToB,行业内企业有大量的多模态数据,可以结合Agent,作为它的输入、输出,扩展大模型在B端的应用范围。
未来文本、图片、视频在价值体现的想象空间更大,而大模型平台型公司则会因为多模态的在ToB领域的接入而逐渐形成自己的护城河。
- 金融领域研报多模态分析
- 医疗领域医学影像多模态分析
参考文献1:对话小冰CEO李笛:大模型到2024年将退热
参考文献2:大模型的下半场:多模态、Agent、ToPC/ToSMB商业模式
参考文献3:https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models/tree/Evaluation
参考文献4:全球首个开源多模态医疗基础模型:人工打分平均超越GPT-4V