GPT-4又双叒叕变强了!
今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。
关注智言AI,即可免费体验无魔法版本的DALL·E3(画图)、GPT实时联网和4V功能(看图)!
电脑端可以复制链接进行使用: chat.chatgptten.com/
不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。
与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更强的性能,更低的价格」。
-
- GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。输入价格大降50%,输出价格下降25%。性能上也有升级。
-
- 「迄今为止最强」的审核模型text-moderation-007,帮助开发者有效地识别有害文本。
两个新一代embedding模型:
-
- text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型20%!支持512维和1536维两种大小。
-
- text-embedding-3-large,性能相比之前模型大幅提升,高达3072维的嵌入向量,价格是小模型的6.5倍。
最后,OpenAI还强调称,用户通过API传送的数据,都不会被用于训练新的模型。
全新嵌入模型2连发:性能大涨价格狂降
OpenAI推出了两款新的嵌入模型:体积更小、效率更高的text-embedding-3-small模型,以及更大、性能更强的text-embedding-3-large模型。
"嵌入"这一术语,其含义是将各种形式的内容(例如文字或代码)中的概念转化为数字序列。通过这种转换方式,各种机器学习模型和算法能够更有效地理解内容之间的关系,从而进行聚类、检索等操作。
这种嵌入技术在ChatGPT和Assistants API的知识获取功能中,以及许多检索增强生成(RAG)开发工具中发挥了重要作用。
-
「小」文本嵌入模型:text-embedding-3-small
text-embedding-3-small是OpenAI的新型高效嵌入模型,与2022年12月推出的前代产品text-embedding-ada-002相比,性能有了大幅提升。
- 性能更强
在多语言信息检索(MIRACL)的标准测试中,text-embedding-3-small的平均评分从31.4%增加至44.0%。同样,在英语任务(MTEB)的标准测试中,其平均评分也有所上升,从61.0%提升至62.3%。
- 价格实惠
text-embedding-3-small模型的效率明显优于OpenAI之前的text-embedding-ada-002模型,因此其价格已经大幅度减少,从原来每千token的0.0001美元降低到了0.00002美元,降幅达到了5倍。
尽管OpenAI推崇新模型,并鼓励用户使用,但我们不会强制停止对text-embedding-ada-002模型的支持,客户可以根据自身需要选择是否继续使用上一代产品。
-
「大」文本嵌入模型:text-embedding-3-large
text-embedding-3-large是OpenAI的新一代大型嵌入模型,能够生成高达3072维的嵌入向量。
text-embedding-3-large是OpenAI目前性能最强的模型——
与text-embedding-ada-002相比,它在MIRACL上的平均得分从31.4%提升至54.9%,在MTEB上的平均得分从61.0%提升至 64.6%。
text-embedding-3-large的价格定为0.00013美元/1k token。
-
灵活调整嵌入向量
相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。
OpenAI的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。
具体来说,开发者可以通过设定dimensions API参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。
这种做法极大地增加了使用上的灵活性。
**
**
**
**
中文版ChatGPT4.0微信端使用方式
智言AI公众号
标签: