Claude3颠覆物理化学,最新实测Claude3,ChatGPT Plus全面对比,以及Claude3开通订阅教程

296 阅读5分钟

这几天,越来越多博士发现,自己耗费数年心血的研究成果,竟然被Claude 3轻轻松松实现了?化学,物理学,语言学,不断被Claude 3定向爆破,博士手里的论文没发表就被它做出来了。科研还存在吗?

Claude 3,还在不断创造奇迹。

发布还没几天,就有越来越多的博士发现,自己手里还没发表过的研究成果,居然都被Claude 3给破解了?!

微信图片_20240308103159.jpg

下面就来介绍一下当前热议的Claude3模型。

Anthropic一共发布了三个模型,名字分别是:Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。

03025a6f84582a2932580e93224b16d4.jpeg

Claude免费版本只能使用Sonnet,如果要使用Opus就需要充值20美刀,和OpenAI的策略一样。ChatGPT3.5可以免费使用,ChatGPT Plus就需要付费订阅。

两者之间的订阅价格也是一样的,简直是全面向OpenAI看起,完全是有一较高下的含义。

在尝试了各种方法之后,使用 wildcard 成功订阅了 Claude,第一时间用起来。

7c43b147242331b79d52c02a20648662.png

OpenAI依然位居全球人工智能领域技术实力之巅,其即将推出的Sora与GPT-5预计将超越现有所有AI工具,展现无与伦比的优势。一键升级GPT4 体验Plus最新的功能。

训练时间

276226501dfbbe674b216529cf444f70.png

可以看到目前Claude最新训练时间是2023年的8月份,而ChatGPT Plus的数据最新指导2023年的4月份。这一局Claude略胜一筹。

推理能力

通过官方文档的介绍,本次Claude3进化最大的,就是推理,就是逻辑。口说无凭,就通过实际的例子来做说明。

解释补集法的概念,并用补集法计算这道概率题:“一家公司有两个部门,A部门3个男生,2个女生,B部门4个男生,6个女生,现在要派3个人去出差,要求每个部门至少出一人,那么至少有一个女生被派出的概率是多少?”

一道致命题,在已经明确补集法的情况下,GPT4的错误率依然高达50%。但是Claude3 Opus,我测了10遍,准确率90%,就很爽。

1da07da28315bb6d4c5609232eb525ec.png

张三是一名推销员,她在绿房子卖掉了三分之一的吸尘器,在红房子多卖了 2 台,在橙房子卖掉了剩下吸尘器的一半。如果张三还剩下 5 台吸尘器,她一开始有多少台吸尘器?

f8aeb725abef5fde298b32d64779056b.png

当然,还可以直接上物理题,直接传图就行。全对。

5a5965f785cd86c995a9f3c4eb96463b.png

这个功能直接让目前很多的学习类APP直接无路可走。对于家长来说,也是辅导孩子学习的神器。简直就是父母的福音了。

顺便测试下其他学科的能力。

化学问题基本上没有问题。

31a90b57f0fb62c1a40aa115c8546321.png

语文。在中文语境下的一些逻辑怪圈,也没问题。

b35bfc76395fa4808bd4ec2751361923.png

整体看,Claude在逻辑和推理上的进化巨大,初中的理科题基本都能横着走,不过高中题基本都还是全线阵亡状态。很强大!

多模态

GPT4V也出来很久很久了,多模态,绝对是让人永远离不开的功能之一。这一次Claude3也支持绘图功能了。看起来是准备全方位和OpenAI掰腕子了。

按照官方给出的数据

2d2e7fe22070410d8e599df13c1f328d.jpeg

除了在科学示意图(Science diagrams)这个领域超的稍微多一些之外,其他基本没有差别。

放个科学示意图的Case,Claude3表现也很惊艳。

4581c42367c144532ba79ea07ce85424.png

一个网站的截图直接还原网页的源代码。以后设计师之需要设计页面原型,后面由 vv直接生产页面代码了。后面产品经理和设计师直接可以完成产品开发了,前端程序员们很难忽悠到他们了。

70809b6a23a45c5e6e834a5048221016.png

接下来,测试的其他能力,比如看图猜信息的能力。

比如看图猜地名。

8698548101189d809a7751e98522455b.png

看图猜艺术家。

f641b80f8bbd806bb3b938e227c4e4ac.png

完全不在话下。

200K长文本优化

目前是支持最长的文本的AI产品了。相比上一代,Claude3上下文准确性能力大幅度提高。

我们给Claude3丢一个超长文本,要求他回答相关问题。

我们的问题是

“你写妙鸭相机那篇文章时,用了一个人的照片作为案例,那个人是谁?”

7298082eee59abc40137b8342fc40412.png

可以看到Claude3回答得完全正确,没有任何问题。整体精准度和语义理解都很不错。

总体来说,基于超长文本的对话、总结、查询的能力,也终于在Claude3中补齐了。

综合来看,Claude3 Opus,依旧是目前最为水桶的大模型。

Claude模型对比

Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku之间的功能对比。

Claude 3 Opus

5207ce4bed91812c541e6ae7db744f50.png

Claude 3 Sonnet

ae31f1310cf042de65c57a876291cf8b.png

Claude 3 Haiku

ebee3843cd25a1bcd1d719e58023cbcd.png 三张图一眼就能看明白,牛逼的更贵,便宜的更快。付费就可以变得更强。

总结

总结一下,Claude3这次更新后,有独一档的推理能力、跟GPT4V打平的多模态、还有200K长文本优化。

昨天通过一晚上的研究,通过 wildcard ,1分钟成功订阅 Claude3 Pro的能力,我整体尝试下来,还是非常的惊艳wildcard注册教程

但是我想说的是,OpenAI仍然是全球技术实力最为强大的人工智能公司,后续OpenAI即将开放的Sora和GPT-5必将碾压目前的所有的AI智能工具。

对于我个人而言,除了模型本身的能力之外,模型可用的工具也很重要,无论是网页浏览能力、代码解释器还是GPTs可接入的API actions,整个生态也更加完善。所以,对我来说,目前用ChatGPT用得更顺手,有更丰富的在这个模型上的prompt经验,以及GPTs等工具使用经验的情况下。通过 ChatGPT Plus升级教程 可以快速升级到ChatGPT Plus。大家可以自行感受下两者之间的差距。