最近关于ChatGPT的新闻一个接一个,本月初奥特曼在openAI的开发者大会上推出了地表最强AI模型ChatGPT-turbo,之后便是一出又一出关于openAI内部的“宫斗大戏”,就在前几天这部大戏以奥特曼入职微软结束。就在同时,Anthropic公司发布了对标ChatGPT-turbo的大模型Claude2.1,在Claude2的基础上做了非常大的升级!
Claude 2.1在为企业提供关键能力方面实现了重大进步,这包括行业领先的200K token上下文窗口、在减少模型幻觉方面的显著改进、系统提示,以及新的测试功能:工具使用。
下面我给大家介绍一下这次Claude2.1更新的重要内容。
200K上下文窗口
Claude为了应对用户对于处理长文档时需要更大的上下文窗口和更精确输出的需求,Claude 将信息传递限制提高到了200,000个token,大约相当于150,000个单词或超过500页的材料(甚至超过了ChatGPT-turbo)。用户现在可以上传技术文档、金融报表,甚至是像《三体》这样的长篇文学作品。Claude可以对大量内容或数据进行概括、进行问答、比较和对照多个文档等。如果你是一位文字工作者,现在只需要一杯咖啡的时间就可以轻松总结之前需要花费几个小时甚至几天才能总结好的文字材料。
诚实度与准确性的提升
Claude 2.1在诚实度方面得到了显著提升,与之前的Claude 2模型相比,虚假陈述减少了2倍。在海量例子的评估中,Claude 2.1在理解和概括长篇、复杂文件(如法律文件、财务报告)方面也取得了显著改进,错误答案减少了30%,错误地得出文档支持特定主张的比率降低了3-4倍。
下面这张图能直观的反映Claude2.1和Claude2在正确率和诚实度上的区别。
Claude2.1在回答长文本的错误率也显著降低。
工具使用
Claude2.1还增加了工具使用功能,目前还处在测试阶段。Claude现在可以跨开发者定义的功能或API进行编排,搜索网络资源,并从私有知识库中检索信息。用户可以为Claude定义一组工具,并指定请求。然后模型将决定完成任务所需的工具,并代表用户执行操作,例如:
- 使用计算器进行复杂的数值推理
- 将自然语言请求转换为结构化的API调用
- 通过搜索数据库或使用网络搜索API回答问题
这个功能有点类似于ChatGPT的插件功能。
总结
作为ChatGPT的最强竞品,Claude并没有ChatGPT那么多限制,而且这些所有的功能全部免费,如果你用不到ChatGPT的绘画功能,那么免费的Claude的是一个非常不错的替代品!
更多文章干货,推荐公众号【程序员老J】