PaLM 2 反攻击 GPT-4

241 阅读2分钟

北京时间5月11日凌晨1点,Google I/O 2023开发者大会上发布的PaLM 2是目前最先进的语言模型,也是其PaLM语言模型的第二个版本。相比PaLM 1,新版本具有升级的多语言、推理和编码能力,将为25种谷歌产品提供支持。

36b25ab00fe1eed7400cd6adfd8a7919.jpeg PaLM 2进行了更多的多语言能力训练,文本横跨100多种语言,还能对成语、诗歌和谜语理解,PaLM 2还能够通过很高级别的语言能力考试,妥妥的语言专家了。 其次PaLM 2 在科学论文、数学表达式进行了训练,能文能武,编码能力上,PaLM 2支持20多种编程语言。由于它是在大量公开可用的源代码数据集上进行预训练,因而擅长Python和JavaScript等流行编程语言,(这是又要抢程序员的饭碗了啊)

eaf1bbcb9993e6686c6dd135be784039.png PaLM 2分为四种模式Gecko、Otter、Bison、Unicorn

  • Gecko:最小尺寸,可以在移动设备上运行,速度足够快,即使离线状态也可以进行交互应用(还能离线,这个有点意思)。
  • Otter:中等大小模型,适合各种任务,包括自然语言处理、机器翻译和代码生成。
  • Bison:更大的模型,可以处理更复杂任务,例如生成逼真的图像和视频。
  • Unicorn:最大尺寸,可处理最复杂的任务,比如编写创意文本,如诗歌、代码、脚本、音乐作品、电子邮件、信件等。

PaLM 2的多模态能力体现在能看懂和生成音频和视频内容之上(又有一大波人即将失业啊)、更厉害的是可以在医院看片室帮助放射科医生解读图像,可以根据X光片分析病人的状况(又成医生了),虽然PaLM 2的能力已经很强,但只有在对特定领域的知识进行微调时,才能真正发挥作用。与基础模型相比,微调帮助Med-PaLM 2实现了将近十倍的精确度,从而在医学问题回答上能做到接近临床专家的表现。

744ac7712eb99080b6e0aaa118826081.png