OpenAI 发布 o1-pro API:金子做的token
OpenAI o1-pro[3] API 现已正式上线,输入为 150 美元/百万 token,输出更是高达 600 美元/百万 token。
这 token 是金子做的,还是银子做的?
Reka Flash 3:21B 开源推理模型
Reka Flash 3[1] 是一款开源的 21B 通用推理模型,完全从零开始训练。它在性能上可与 o1-mini 等模型媲美,是目前同等规模中最出色的开源模型之一。
模型本身基于 Apache 2.0 开源,佬们也可以在其官网[2]上体验。
OpenAI 发布全新音频模型:文本转语音与语音转文本
OpenAI 昨天发布了全新的音频模型,主要包括文本转语音(Text-to-Speech, TTS)和语音转文本(Speech-to-Text, STT)两大类:
-
文本转语音模型(gpt-4o-mini-tts):
最大亮点是其“可操控性”(steerability),可以精确控制语音的语调、节奏和表达方式。佬们可以在 OpenAI FM[4] 中测试体验。
我简单测试了下,中文 TTS 发音有的音色还是一股大佐味,而且语速慢听起来感觉怪怪的。
-
语音转文本模型(gpt-4o-transcribe 和 gpt-4o-mini-transcribe):
相较于 OpenAI 之前的 Whisper 模型,在语音识别准确性上有了显著提升,尤其是在处理多样化口音和嘈杂环境下的表现更为出色。