2024年大模型使用总攻略

高通智匠MindCraftAI

2025-01-02 757 阅读4分钟

2024年，大模型市场竞争异常激烈，各厂商纷纷推出新模型并调整价格策略。本文将模型分为几类进行盘点，并推荐实用模型。

1. 免费模型

GLM-4-FLASH（智谱）：比较有名的免费模型，128K上下文，适合快速处理简单问题。
GLM-4V-FLASH（智谱）：免费视觉模型，基础任务表现良好。
hunyuan-lite（腾讯混元）：256K上下文，MOE架构，适合大文件摸底。
ernie-speed-128k（百度）：基础免费模型。
Spark Lite（讯飞星火）：免费模型，适合基础任务。

免费模型.png

2. 高性价比模型

deepseek-chat：V3版本性能甚至比肩claude3.5 sonnet，价格仅1元/百万tokens。行业价格战的开启者。
GLM-4-AIR（智谱）：128K上下文，最早响应价格战的模型，年底最后一天价格调至价格降至0.5元/百万 tokens。
qwen-plus（通义千问）：即Qwen2.5 72B，价格便宜，综合性能强。
doubao-pro-32k：最早响应价格战的一款模型，32K上下文，多次迭代后性能提升。
abab6.5s（MiniMax）：综合能力强，价格实惠。
ernie-3.5-128k（百度）、yi-lightning（零一万物）、baichuan4-air（百川智能）：性价比高。
gpt4o-mini、gemini-flash-1.5：国外高性价比模型，性价比略逊于国产头部模型。

高性价比模型.png

3. 视觉模型

GLM-4V-PLUS（智谱）：旗舰视觉模型，支持视频识别，性能对标5月份GPT4o，价格10元/百万tokens。国内最早的高质量视觉模型之一，然而现在竞争激烈，不如刚开始独树一帜。
GLM-4V-FLASH（智谱）：免费视觉模型，基础任务表现良好，拥有不俗的生产力。
doubao-vision-pro-32k：新的性价比王者，输入3元/百万tokens，输出9元/百万tokens，推荐使用。

qwen-vl-max（通义千问）：旗舰视觉模型，基于qwen2-vl开发，原20元/百万tokens，年底最后一天降价，输入3元/百万tokens，输出9元/百万tokens。

abab6.5s、abab7（MiniMax）：原生支持识图。abab6.5s的识图成本低，但是下有免费模型，上有众多模型，没有特别的优势区间。
hunyuan-vision（腾讯混元）、yi-vision（零一万物）：其他国产视觉模型。
gpt4o、claude3.5 sonnet、gemini 1.5 pro：国外模型基本都支持识图，在复杂识图场景仍具优势。

视觉模型.png

4. 文档交互模型

hunyuan-lite：256K上下文，免费，适合大文件摸底。先通过免费模型了解文档大致情况以及文档的token数量，再进一步使用其他模型。
qwen-plus：128K的上下文，优秀的综合性能，并且具备缓存命中功能，缓存命中时输入价格降低40%。
deepseek：V3版本性能还更优于qwen-plus。最早实现缓存功能的国产模型，缓存命中后成本降低10倍，使得文件交互极其便宜，唯一不足是最大上下文64K。
abab6.5s：245K上下文很长，价格便宜，读文档综合性能优异。复杂推理不如qwen-plus和deepseek。

文档交互模型.png

5. 拟人模型

abab6.5s：适用于拟人化对话场景，优秀的指令遵循能力以及极快出token速度，更适合实时语音交互。
doubao-pro-32k-character：豆包的角色扮演专精模型，拟人化表现优秀。

拟人模型.png

6. 推理专注模型

o1（OpenAI）：率先发布思维链推理模型，行业标杆，价格昂贵。
gemini 2.0 flash thinking experimental（谷歌）：限时免费。
QWQ、QVQ（通义千问）：文字和视觉识别版，专注推理应用场景，QVQ在研究生考试题上表现优异。价格实惠。
GLM-Zero-Preview（智谱）：10元/百万tokens，2024年最后一天发布。

推理专注模型.png

7. 推荐模型与总结

qwen-plus：高性价比，综合性能强，六边形战士。
deepseek-chat：目前的V3版本可能是国内性价比最高的模型。
abab6.5s：综合能力强，价格实惠，出token速度快，拟人表现优秀，适合AI智能硬件。
doubao-vision-pro-32k：视觉模型黑马，性价比高。
GLM-4V-FLASH：全球首个官方免费视觉模型，基础任务如识图，文字识别，格式化输出表现良好，具有生产力。
hunyuan-lite：256K MOE免费模型，适合大文件摸底以及简单任务。
GPT4o：依然是行业标杆，优秀的综合能力，支持多模态，支持16K最大输出。
Claude3.5 Sonnet：被认为是目前大模型能力天花板，在代码及编程场景甚至不输o1。

推荐模型.png

大模型更新迅速，日新月异，本文仅为2024年底的盘点，未来可能发生变化。希望本文能为大模型的技术和应用提供一些参考。

现在大家可以在高通智匠（MindCraft AI）的客户端/小程序上体验以上所有模型，也可以在开发者平台上调用API，官方同价。