1. 通义千问增加Coder模型
通义千问新增了专用代码模型 qwen-coder-plus,适用于代码生成、修复和推理。该模型上下文长度达128K,最大输出为8K,输入价格为3.5元/百万tokens,输出价格为7元/百万tokens。尽管价格不是最低,但其性能优于DeepSeek、GPT-4o和Claude 3.5 Sonnet,适合专业开发者使用。
2. QwQ-32B-Preview
通义千问团队11月底发布的QwQ模型。这个是专注于增强AI推理能力的模型,定位上似乎是对标o1-preview。目前的话是免费使用,最大上下文32K,最大输出16K。
3. 文心一言更新超值与旗舰模型
智匠MindCraft引入了文心一言系列的三款新模型:
● ernie-speed-128K:免费模型,适用于简单任务,上下文长度128K。
● ernie3.5-128K:超值旗舰模型,输入价格0.8元/百万tokens,输出价格2元/百万tokens,适合中小规模应用。
● ernie4.0-turbo-128K:最强旗舰模型,输入价格20元/百万tokens,输出价格60元/百万tokens,对标GPT-4o,适合高性能需求场景。
4. MiniMax新增abab7.0旗舰模型及图片识别功能
MiniMax推出了新款旗舰模型 abab7-chat-preview,支持245K上下文,输入和输出价格均为10元/百万tokens,并增加了图片识别功能。此外,主力模型 abab6.5s 也增加了识图功能,成为国内价格最低的识图模型(1元/百万tokens),适合简单场景的图像处理。
5. 腾讯发布MOE模型hunyuan-large
腾讯发布了新的旗舰模型 hunyuan-large,参数量达3890亿,上下文长度128K,输入价格4元/百万tokens,输出价格12元/百万tokens。根据评测报告,该模型在多项指标上领先于开源模型Llama3.1-405B,尤其在数学能力方面表现突出。
6. 百川智能更新baichuan4-turbo及baichuan4-air
百川智能推出了两款新模型:
● baichuan4-turbo:针对企业高频场景优化,首token响应速度和token流速大幅提升,最大上下文32K,输入输出价格15元/百万tokens,性价比高。
● baichuan4-air:超值款MoE模型,输入输出价格仅为0.98元/百万tokens,适合低成本部署,但上下文长度为32K,稍显不足。
7. 零一万物发布yi-lightning
零一万物发布了高性价比模型 yi-lightning,上下文长度16K,输入输出价格均为1元/百万tokens。该模型在国际权威盲测榜单LMSYS上的成绩表现出色,值得尝试。