文心大模型4.0综合水平与GPT-4相比已经毫不逊色前言： 10月17日，在百度世界大会上，创始人、董事长兼首席执行官李

前言：

10月17日，在百度世界大会上，创始人、董事长兼首席执行官李彦宏正式主讲，文心大模型4.0版本正式发布！并同步开始邀测。

李彦宏直接放话：“这是迄今为止最强大的文心大模型，实现了基础模型的全面升级，在理解、生成、逻辑和记忆能力上都有着显著提升，综合能力与GPT-4相比毫不逊色。”

简单来说就是：文心大模型4.0综合水平与GPT-4相比已经毫不逊色。

体验地址1： cloud.baidu.com/survey/qian…（需要申请内测资格）
体验地址2: www.aitop100.cn/tools/index （可以体验百度文心一言）

我们来看下现场的演示效果：

1.先来段倒装prompt：

我想回承德买房，能用公积金贷款吗？手续怎么办？我在北京工作。

这次不仅关键信息“北京工作”放在了最后，公积金具体是在哪里交的也没有明示。

但是“文心一言4.0”完全没有被这些小陷阱坑到，顺利给出了正确答案。

百度1.gif

2.生成能力：

当场剪出一整段数字人口播视频，毫不费劲：

百度2.gif

3.逻辑能力：

解起数学题来也得心应手，可以说是家长辅导作业神器了。

百度3.gif

4.记忆能力：

新版文心一言还现场写起了武侠小说，即使持续添加人物角色、增加戏剧冲突，也不会出现记忆混乱、前言不搭后语的情况：

百度4.gif

文心大模型4.0相比文心大模型3.5版本：

相比 3.5 版本，文心大模型 4.0 的理解、生成、逻辑、记忆四大能力都有显著提升，其中理解和生成能力的提升幅度相近。而逻辑和记忆能力的提升则更大。逻辑的提升幅度达到理解的近三倍，记忆的提升幅度也达到了理解的两倍多。

文心大模型4.0是如何炼成的？

先来看看文心大模型4.0的“自进化”程度。

据百度CTO王海峰介绍，大模型表现出的创作、编程、解题、规划等能力，实际上都依赖于背后的4大核心基础能力——理解、生成、逻辑和记忆能力。

文心大模型4.0的技术改进，可以直接用三个“更”来总结：更大的算力、更多的数据、更强的算法。

1.在训练上： 当前飞桨平台已经能在万卡算力上运行，基于集群基础设施、调度系统、软硬件协同优化，支持大规模稳定高效训练；同时，基于可再生训练技术中的增量式参数调优，来节省训练资源和时间。

正是基于这套技术，自3月份以来，文心大模型系列训练算法已经累计提效3.6倍，周均训练稳定有效率超过98%：

2.在数据上，团队建设了一套多维数据体系，从数据挖掘、分析、合成标注和到评估，形成了一整套“流水线”，来进一步提升模型训练效果。

3.算法上，则基于有监督、精调、偏好学习和强化学习等技术，进行了多阶段的对齐，确保大模型能更好地与人类判断和选择进行对齐。

在这其中，有两方面很关键的技术细节造就了文心大模型4.0水平的飞速提升。

一方面是知识点增强的能力。

以前大模型可能只在一个阶段做知识点增强，但现在百度在输入和输出两方面同时进行了知识点增强。

输入先用知识点增强，对用户输入的问题进行理解，拆解出回答问题所需知识点，基于搜索引擎、知识图谱、数据库查找知识，生成第一遍结果；输出再用知识点增强，对第一遍生成的结果进行分析，并用搜索引擎、知识图谱、数据库进行“double check”，对其中有差错的地方进行修正。

另一方面是智能体机制。

《思考，快与慢》这本书中，将认知系统分成系统1（反应快但易出错）、系统2（反应慢但更理性准确）。根据这个原理，百度在大模型基础上，进一步研制了系统2。也就是说，相比大模型直接给出答案，现在进一步让它学会理解、规划、反思和进化，这样大模型执行就能更可靠、甚至完成自我进化，思考过程“白盒化”。

这两大技术细节，也造就了文心大模型4.0水平的飞速提升，甚至光是过去一个月的时间里，就提升了30% 。

这样的技术，也使得文心大模型4.0的用户和开发者人数快速的增长。

百度旗下十余款应用与文心一言相结合：

文心大模型4.0已经全面重构了百度的搜索、GBI、文库、网盘、地图、如流、百度搜索等数十款应用。丰富的AI原生应用才是大模型的价值所在，而分享上述百度旗下的应用，是为了拓展想象力、激发更多人做出更惊艳的AI原生应用。

门槛最低的AI原生应用：插件

“大模型将开启一个繁荣的AI原生应用生态”，李彦宏强调，插件是一种特殊的AI原生应用，门槛最低，也最容易上手，能让开发者、创业者快速加入到生态中。

一个月前，百度上线了灵境插件平台，目前已经有2.7万开发者申请入驻，覆盖法律、职场、学习等多个领域。（没有使用过灵境插件平台，可以去试试）

在开发AI原生应用时，大模型的基础能力也至关重要。李彦宏介绍说，API是AI原生应用调用基础大模型的主要方式，企业和开发者可以在百度的千帆大模型平台上调取包括文心一言在内的大模型API，目前，千帆大模型平台已经成为中国最大的大模型开发平台，有42个主流大模型入驻，覆盖各行各业近500个场景。

“中国有丰富的应用场景，中国用户又天然愿意拥抱新技术，有了先进的基础大模型，我们就能构建起一个繁荣的AI生态，共同创造新一轮经济增长。”李彦宏判断，未来的AI原生应用一定是多模态的，在信息世界之外，一定会重构物理世界。

当前文心一言的基本情况：

截至目前，文心一言用户规模已经达到4500万人，开发者达到5.4万人，遍布4300多个使用场景，应用数量达到825个，并接入了超过500个插件。

结尾：我想借用李彦宏的话来结束本篇文章：

李彦宏说：我们即将进入一个AI原生的时代。一个人机通过prompt交互的时代。

在此过程之中，无论是国产大模型基础能力的快速追赶，还是AI原生应用开发的主动进击，都令人心潮澎湃。 AI原生时代，在各种层面上，都越来越值得期待了。当然，在AI原生态应用开发上面我一点都不担心中国各个企业的能力。

加油我们中国的AI人工智能行业！

文心大模型4.0综合水平与GPT-4相比已经毫不逊色

前言：