2024年4月12日,OpenAI在X上宣布GPT-4 Turbo开放了!提高了写作、数学、逻辑推理和编码方面的能力。另外最重要的是,响应速度更快了!!
新的 GPT-4 Turbo 和 Claude 3 测试对比
另外,Open AI对GPT-4 Turbo 和 Claude 3 进行重新的测试对比, GPT-4 Turbo的能力重回了大语言模型榜一大哥。
官方的Benchmark Results 基准测试结果
Model | Prompt | DROP(f1) | GPQA% | MATH% | MGSM% | MMLU% | HumanEval% |
---|---|---|---|---|---|---|---|
GPT4s | |||||||
gpt-4-turbo-2024-04-09 | chatgpt1 | 85.4 | 49.1 | 72.2 | 88.6 | 86.5 | 87.6 |
gpt-4-turbo-2024-04-09 | assistant2 | 86.0 | 49.3 | 73.4 | 89.6 | 86.7 | 88.2 |
gpt-4-1106(-vision)-preview | chatgpt | 81.3 | 42.1 | 64.1 | 86.5 | 84.6 | 82.2 |
gpt-4-1106(-vision)-preview | assistant | 83.2 | 42.5 | 64.3 | 87.1 | 84.7 | 83.7 |
gpt-4-0125-preview | chatgpt | 83.4 | 39.7 | 64.2 | 83.7 | 84.8 | 88.2 |
gpt-4-0125-preview | assistant | 81.5 | 41.4 | 64.5 | 85.1 | 85.4 | 86.6 |
REFERENCE | |||||||
Claude-3-Opus (rerun w/ api) | empty3 | 79.0 | 49.7 | 63.2 | 89.7 | 84.1 | 84.8 |
Claude-3-Opus (rerun w/ api) | lmsys4 | 77.1 | 50.7 | 63.8 | 89.2 | 84.2 | 82.9 |
Claude-3-Opus (report5) | unknown | 83.1 | 50.4 | 60.1 | 90.7 | 86.8 | 84.9 |
Gemini-Ultra-1.0 (report6) | unknown | 82.4 | n/a | 53.2 | 79.0 | 83.7 | 74.4 |
Gemini-Pro-1.5 (report6) | unknown | 78.9 | n/a | 58.5 | 88.7 | 81.9 | 71.9 |
GTP-4 Turbo 体验
例如,使用 ChatGPT 写作时,响应会更直接、更少冗长,并使用更多的对话语言。
如何确认当前GPT-4已经更新为最新的GPT-4 Turbo模型:
当你问GPT-4的最新更新时间时回答的是2023,那就是还没有更新,本人重新登录后就可以。
当ChatGPT-4 回到知识库更新到2024 4月份,那就已经更新为GPT-4 Turbo。就可以尽情享受更好的体验吧~
如果你需要确认的话,也可以问ChatGPT 4: What‘s your knowledge cut off date
另外,另外,GPT-4 Turbo 是开放给GPT-4付费用户的,如果你还没有升级你的GPT-4,可以通过虚拟visa卡进行升级:bewildcard.com
如果你不会,可以参考这个吧:国内的gpt4暂停升级,GPT4、GPT4.0、GPT3.5 升级教程
总结:
- 响应更快,提高了写作、数学、逻辑推理和编码方面的能力。
- 上下文长度提升到 128K
- 知识库更新到 2024年4月