ChatGPT 引发的竞争与开启的时代| 豆包MarsCode AI刷题

122 阅读4分钟

一、ChatGPT 引发的竞争与开启的时代

自 ChatGPT 发布后,众多公司如百度、阿里巴巴、华为等纷纷着手研究对标通用大模型,其训练方式和算法原理有相似之处。ChatGPT 开启了第四次产业革命 ——AI 革命,AI 将深刻改变未来社会各方面。

二、未来 AI 大模型的发展趋势

(一)模拟人脑工作模式及 ChatGPT 的局限

通过对比 ChatGPT 与人类在接收输出信息、神经元数量、交流方式、任务融合、学习方式及与环境交互等方面的情况,发现模拟人脑工作模式可总结 ChatGPT 经验并预测 AI 发展方向。但 ChatGPT 仍存在不足,如目前仅采用文字输入输出形式,与人类靠五官感受环境并融合多模态信息的能力相比,尚不具备多模态信息融合能力。

(二)通用多模态大模型的发展

  • 多模态的演进:目前 GPT4 已实现文字、图像输入及文字输出的建模形式,未来还将发展为文字、图像、视频、音频输入输出的通用多模态大模型,实现对计算机视觉、自然语言处理、语音处理等领域的覆盖。

  • 各模态的关键作用

    • 文字的核心地位:在多模态大模型中,文字是承接多种模态信息转换的关键桥梁,虽其他模态也能传递信息,但文字传递效率更高、更灵活便捷,其他模态多通过文字中转。
    • 视频和图像的信息关键:图像以 RGB 矩阵形式在计算机中表示,视频是图像的动态形式,二者信息量占人每日接收信息的 80%,视频模态信息接入是通用多模态大模型的关键,但视频存储、处理形式对神经网络模型仍有挑战。
    • 触觉、嗅觉多模态的困难:触觉、嗅觉模态存在数据采集和计算机存储困难,短期内通用多模态大模型难以接入这两种信息模态。

(三)机器人、具身智能的发展

  • 概念与发展方向:机器人可自主执行任务并与环境交互,具身智能拥有类似人类的身体感觉、运动控制和学习能力。机器人发展方向主要有人形机器人和工业机器人,人形机器人可处理精细任务,工业机器人可完成如 3D 打印等任务。

  • 面临的挑战

    • 算力与实时性需求难契合:高度智能的大模型计算复杂度高、耗时长,与机器人实时控制需求不符,接入更多模态数据后算力需求更大、耗时更严重,如在自动驾驶领域,模型决策耗时可能导致危险。
    • 数据通信限制:视频存储和压缩格式不断发展,多模态大模型与采集设备通信传输视频时,可能存在 4G 传输瓶颈,未来 5G 有望广泛应用解决此问题。

三、第四次工业革命(AI 革命)

  • 前几次工业革命回顾:第一次以蒸汽机发明为标志,涉及纺织业等发展;第二次以电力运用为标志,涉及多行业革新;第三次以计算机发明为标志,开启互联互通时代,前几次主要是机器替代人力的简单重复劳动及信息获取方式的改变。
  • AI 革命的影响:AI 革命标志着由 AI 替代人的脑力劳动,ChatGPT 已应用于诸多实际工作。未来多模态模型成熟后,更多分析类脑力劳动工作可能被替代,但医生、律师、程序员等职业不会被 AI 完全替代,AI 可作为智能助手提高工作效率。若机器人行业取得类似 ChatGPT 的突破,将进入新阶段,可替代复杂灵活劳动。
  • 对社会生产关系的影响:AI 发展将改变社会生产关系,引发责任归属、社会地位等伦理道德问题,目前尚无明确规则。

四、总结与展望

未来多模态通用大模型将逐渐发展成熟,机器人和具身智能是待攻克难题。AI 革命将重塑人类社会生产力和生产方式,ChatGPT 仅是 AI 革命序章,未来会有更多优质模型,希望读者能把握机遇发掘新价值。

ChatGPT的算法原理是什么?

通用多模态大模型的发展会带来哪些影响?

如何应对ChatGPT带来的挑战?