京东言犀垂直整合,字节火山横向拉通, 大模型进入混战时代

101 阅读8分钟

从大模型到ChatGPT

今年初, openAI 推出 3.5 模型, 并推出 ChatGPT, 后续还快速推出了 4.0 迅速将大模型热推向了顶峰, 期间张口闭口大模型。

国外的大佬公司们, 谷歌也迅速跟进, 毕竟他们是 AI 的鼻祖。可能由于太过着急, 导致发布会上说错了一个问题, 股价跌了 1000 多亿。

国内AI 最有沉淀的百度也是不甘示弱, 推出了文心一言。 刚推出的反馈其实比较一般, 还闹出了各种笑话。

阿里也迅速跟进, 推出了千义通问, 当然离 ChatGPT3.5 和 4.0 还是有一定的代际差异。

过去无论是阿里还是百度, 其实更多的还是给出的是通用模型, 所谓的大模型, 就是什么都懂, 但是懂得都不是很专业。

京东和字节给出不一样的答案。

京东大模型言犀行业垂直方案

2023 年 7 月 13 日, 京东在京东云峰会上, 发布了京东自己的大模型, 言犀。

京东打法确实别具一格,他将大模型和产业进行结合, 扎根产业, 输出基于大模型的解决方案。

其实这个是对于大模型, 是一个更加深度的思考。

ChatGPT, 更多只是一个搜索引擎的变种, 一个个人助力提效的工具, 某种意义上说, 其实是一个玩具, 你经常可以看到 ChatGPT 各种一本正经的胡说八道。

但是当大模型和 产业进行结合之后, 其实是可以提升整个产业链的价值, 提升整个产业链的运作效率, 提升链路上各个环节的效率。

我们都知道, 在这几个电商公司里面, 其实京东是最重资本的。 而重资本的原因其实是, 京东将很多的钱放到供应链的打造上。

京东的供应链,从仓储, 到配送, 无论是成本还是体验,基本已经是国内最优的了。过去, 京东的供应链,也是大量的运用了各种 AI 的技术, 进行需求预测, 链路分析, 动态补货, 库存健康分析等等。

而今天有了大模型的加持, 可以将补货做的更准, 仓库的排布做的更优, 库存的周转的效率更高。

这里面, 需要过去京东供应量大量的数据, 喂给这个大模型, 可以让大模型更好的输出各种建议

通过大模型和供应链的深入整合, 并输出给其他的供应商, 自然是可以赋能给整个供应链上下游的角色。

同时, 供应链上, 也不是每个节点或者商家, 都是具备相应的算力, 数据 和科技能力, 可以将大模型部署和使用起来, 自然也是非常需要京东在物流行业垂直的大模型的赋能。

只要这个大模型输出的服务足够强,自然会有大量的上下游企业使用这个服务。

这个行业级别的服务, 可比做 ChatGPT 难度大的多, 但是收益也大的多。

当然, 京东在 ai 上, 还实现了基于 AIGC 的实时营销方案(分钟级完成营销方案的配置和投放), 数字人的方案(实时产生可以动态直播的数字人), 以及除了直接使用这个服务之外, 基于模型的定制和训练的云服务, 这块也是比较惊艳。只是不知道,这些服务是否只是停留在视频里面, 还是已经快速落地了。

字节火山工厂,横向模型工厂

每个企业, 对于新技术都有自己的思考路径和切入点。

当大厂们纷纷下场, 发布自己的大模型的时候, 字节后退了一步, 他不是输出自己的大模型。而是通过和国内众多的大模型初创 公司结合, 为各行各业提供一个大模型的商城。

由于众所周知的原因, 中国现在最缺的是 GPU, 是一个可以用于训练模型所需要的显卡。

现在已经不是有钱就可以买到显卡了。

但是就算力而言, 字节的算力应该可以排到国内的前三。

所以, 通过接入各个大模型, 为商家提供训练的服务, 其实对于字节是一个非常好的选择。

目前国内已经发布了 70 多个大模型, 每个模型从训练的参数, 都适用的场景, 都是千差万别。

对于国内其他想使用大模型的企业来说, 具有非常复杂的选择成本。 而字节的这个火山工厂, 正好就可以解决这个 B 端的痛点问题。

另外一个很关键的问题, 是训练模型, 需要使用大量企业私有的数据, 其实大部分企业是不愿意将这些数据公开给到大厂里面了, 这些都是他们的关键资产, 所以, 私有化的部署模型其实也成为了刚需。

而部署模型, 训练模型, 相关的算力、基础设施,其实都是费钱费力, 成本极高, 所以字节通过这个模型商城的方式, 可以很好的解决这个问题。

第三个点, 字节其实还有一个企业协同的飞书, 他也希望使用飞书的企业, 能够基于大模型,个更好的使用飞书, 并业务流程、业务知识, 深度整合到飞书里面, 这个也是很符合整个字节发展方向的一个重要做法。

思考技术应用的方向 从 c 到 b , 从横向到纵向

针对大模型的技术应用, 其实可以发现经历几个阶段。

第一个阶段【科研阶段】,其实是 OpenAI, 在默默的炼丹, 模型的持续的迭代, 从 1.0 ,2.0, 到 3.0, 3.5 , 再到目前的 4.0

第二个阶段【对客 toc】,技术持续的在进步, 参数也在超大规模的增长,但是其实大家并不知道你对厉害,直到 ChatGPT 的出现。 我们才惊奇的

发现, 原来大模型是一个这么厉害的技术。也就是通过 c 端的产品进行引爆, 将这个技术从科研变成了一个消费级别的产品

第三个阶段 【对商家 tob】,才是 ChatGPT 输出给微软, 和微软的 bing 和 office 结合, 这个其实就是一个 toB 的解决方案的服务, OpenAI 辅助关键的算法模型, 微软负责将这个技术能力变成一个可以服务消费者的产品。

第四个阶段【for 产业的智能解决方案】, 我认为是更加深度的整合大模型, 就是类似京东这种方式, 将大模型深度整合到行业里面, 输出一套智能的产业解决方案, 这里面对于数据, 对于服务的要求, 跟之前的 ChatGPT 这种聊天, 就完全不是一个级别, 我认为就是一个工业级别的标准了, 如果能够输出这样的服务, 竞争力自然就更进一步。

第五阶段【云或者叫基础设施】我认为字节这是另外一个方向的进化,他不是说把模型做的多好,而是定位于做模型的市场统一标准, 做大模型计算的基础设施, 本质是将模型训练的能力, 变成一套通用的基础设施进行售卖。

对比历史上的几次混战

太阳底下, 没有新鲜事, 很多事情都是惊人的相识, 历史一直在重演。

百团大战 vs 百模大战

2009 年开始, 团购市场开始在中国兴起, 一时间, 风起云涌, 各种团购网站如雨后春笋般拔地而起, 一下子就出来了很多团购网站, 但是, 最终从死人多里面爬出来的, 只有王兴和他的美团。 他们的组织, 他们的效率, 他们的战略都是让他们走到了最后。

我认为今天的百模大战也是类似的, 这个市场最终都是会重新洗牌的。

大模型的训练和计算, 不是请客吃饭, 需要大量的资金去购买大量的 GPU。 光这个点, 已经打败了很多的中厂 ,小厂。

所以,我认为, 最终中国真的能够炼丹, 获得大模型的公司, 甚至能够获得代际领先的公司是非常少的。 这个必然也是一个赢者通吃的行业。阿里和百度的, 从模型到基础设施和算力, 这个机会是比较大的。

end

大模型, 目前处于战国的混乱时期, 谁能够一统江湖, 还是需要边走边看。