2024年,大模型市场竞争异常激烈,各厂商纷纷推出新模型并调整价格策略。本文将模型分为几类进行盘点,并推荐实用模型。
1. 免费模型
- GLM-4-FLASH(智谱):比较有名的免费模型,128K上下文,适合快速处理简单问题。
- GLM-4V-FLASH(智谱):免费视觉模型,基础任务表现良好。
- hunyuan-lite(腾讯混元):256K上下文,MOE架构,适合大文件摸底。
- ernie-speed-128k(百度):基础免费模型。
- Spark Lite(讯飞星火):免费模型,适合基础任务。
2. 高性价比模型
- deepseek-chat:V3版本性能甚至比肩claude3.5 sonnet,价格仅1元/百万tokens。行业价格战的开启者。
- GLM-4-AIR(智谱):128K上下文,最早响应价格战的模型,年底最后一天价格调至价格降至0.5元/百万 tokens。
- qwen-plus(通义千问):即Qwen2.5 72B,价格便宜,综合性能强。
- doubao-pro-32k:最早响应价格战的一款模型,32K上下文,多次迭代后性能提升。
- abab6.5s(MiniMax):综合能力强,价格实惠。
- ernie-3.5-128k(百度)、yi-lightning(零一万物)、baichuan4-air(百川智能):性价比高。
- gpt4o-mini、gemini-flash-1.5:国外高性价比模型,性价比略逊于国产头部模型。
3. 视觉模型
- GLM-4V-PLUS(智谱):旗舰视觉模型,支持视频识别,性能对标5月份GPT4o,价格10元/百万tokens。国内最早的高质量视觉模型之一,然而现在竞争激烈,不如刚开始独树一帜。
- GLM-4V-FLASH(智谱):免费视觉模型,基础任务表现良好,拥有不俗的生产力。
- doubao-vision-pro-32k:新的性价比王者,输入3元/百万tokens,输出9元/百万tokens,推荐使用。
- qwen-vl-max(通义千问):旗舰视觉模型,基于qwen2-vl开发,原20元/百万tokens,年底最后一天降价,输入3元/百万tokens,输出9元/百万tokens。
- abab6.5s、abab7(MiniMax):原生支持识图。abab6.5s的识图成本低,但是下有免费模型,上有众多模型,没有特别的优势区间。
- hunyuan-vision(腾讯混元)、yi-vision(零一万物):其他国产视觉模型。
- gpt4o、claude3.5 sonnet、gemini 1.5 pro:国外模型基本都支持识图,在复杂识图场景仍具优势。
4. 文档交互模型
- hunyuan-lite:256K上下文,免费,适合大文件摸底。先通过免费模型了解文档大致情况以及文档的token数量,再进一步使用其他模型。
- qwen-plus:128K的上下文,优秀的综合性能,并且具备缓存命中功能,缓存命中时输入价格降低40%。
- deepseek:V3版本性能还更优于qwen-plus。最早实现缓存功能的国产模型,缓存命中后成本降低10倍,使得文件交互极其便宜,唯一不足是最大上下文64K。
- abab6.5s:245K上下文很长,价格便宜,读文档综合性能优异。复杂推理不如qwen-plus和deepseek。
5. 拟人模型
- abab6.5s:适用于拟人化对话场景,优秀的指令遵循能力以及极快出token速度,更适合实时语音交互。
- doubao-pro-32k-character:豆包的角色扮演专精模型,拟人化表现优秀。
6. 推理专注模型
- o1(OpenAI):率先发布思维链推理模型,行业标杆,价格昂贵。
- gemini 2.0 flash thinking experimental(谷歌):限时免费。
- QWQ、QVQ(通义千问):文字和视觉识别版,专注推理应用场景,QVQ在研究生考试题上表现优异。价格实惠。
- GLM-Zero-Preview(智谱):10元/百万tokens,2024年最后一天发布。
7. 推荐模型与总结
- qwen-plus:高性价比,综合性能强,六边形战士。
- deepseek-chat:目前的V3版本可能是国内性价比最高的模型。
- abab6.5s:综合能力强,价格实惠,出token速度快,拟人表现优秀,适合AI智能硬件。
- doubao-vision-pro-32k:视觉模型黑马,性价比高。
- GLM-4V-FLASH:全球首个官方免费视觉模型,基础任务如识图,文字识别,格式化输出表现良好,具有生产力。
- hunyuan-lite:256K MOE免费模型,适合大文件摸底以及简单任务。
- GPT4o:依然是行业标杆,优秀的综合能力,支持多模态,支持16K最大输出。
- Claude3.5 Sonnet:被认为是目前大模型能力天花板,在代码及编程场景甚至不输o1。
大模型更新迅速,日新月异,本文仅为2024年底的盘点,未来可能发生变化。希望本文能为大模型的技术和应用提供一些参考。
现在大家可以在高通智匠(MindCraft AI)的客户端/小程序上体验以上所有模型,也可以在开发者平台上调用API,官方同价。