这 token 是金子做的,还是银子做的?

15 阅读1分钟

OpenAI 发布 o1-pro API:金子做的token

OpenAI o1-pro[3] API 现已正式上线,输入为 150 美元/百万 token,输出更是高达 600 美元/百万 token。

这 token 是金子做的,还是银子做的?

Reka Flash 3:21B 开源推理模型

Reka Flash 3[1] 是一款开源的 21B 通用推理模型,完全从零开始训练。它在性能上可与 o1-mini 等模型媲美,是目前同等规模中最出色的开源模型之一。

模型本身基于 Apache 2.0 开源,佬们也可以在其官网[2]上体验。

OpenAI 发布全新音频模型:文本转语音与语音转文本

OpenAI 昨天发布了全新的音频模型,主要包括文本转语音(Text-to-Speech, TTS)和语音转文本(Speech-to-Text, STT)两大类:

  • 文本转语音模型(gpt-4o-mini-tts):

    最大亮点是其“可操控性”(steerability),可以精确控制语音的语调、节奏和表达方式。佬们可以在 OpenAI FM[4] 中测试体验。

    我简单测试了下,中文 TTS 发音有的音色还是一股大佐味,而且语速慢听起来感觉怪怪的。

  • 语音转文本模型(gpt-4o-transcribe 和 gpt-4o-mini-transcribe):

    相较于 OpenAI 之前的 Whisper 模型,在语音识别准确性上有了显著提升,尤其是在处理多样化口音和嘈杂环境下的表现更为出色。