今天,Claude 系列迎来了新成员:Claude3,一口气推出了三款性能各异的模型——Haiku、Sonnet、Opus。这三款模型,像是台阶一样,一级比一级强,各自针对不同用户的需求。官方用一张图简洁明了地展示了它们的性能层级,大致是这个意思:【haiku < sonnet < opus】,并且把 Opus 定位成了直接和 GPT4 竞争的对手。
模型特点
这次发布的模型不仅拥有跨媒体的处理能力,还在以下几个方面做到了突破:
图像识别
虽说 GPT4 也不差,能识别图像,但是放眼望去,Claude3 的表现实在是太棒了。它不仅能够细致地捕捉图像中的细节,而且在一份评测榜单上与我们先前认为的最强视频/图片理解模型 GPT4V 不相上下,在「Science Diagrams」这一项上更是远远抛离了 GPT4V。
响应速度非常快
- Haiku 模型能在短短三秒内读完一篇带图片的 arxiv 论文(10k token),展现了其非凡的图文处理能力。
- 比起之前的版本,Claude3 的速度提升了不止一倍。
超大上下文
Claude3 能处理超过 20w 个上下文窗口,而且【三个模型都能处理高达 100w 的输入量】!官方还特别提出了一个叫做「Needle In A Haystack」的评测方式,目的是测试模型在大量语料中精准抽取与问题相关信息的能力。Claude3 在这项测试中展现了极高的准确性,准确率能达到 99%。 就这样,Claude3 系列不仅提升了处理速度和准确性,还大幅拓宽了模型的应用场景,无疑为用户带来了更加强大、灵活的工具。