如何选择合适的大模型和合适的参数？火山豆包DeepSeek智谱4通义千问

user5838167523996

2025-07-28 139 阅读1分钟

配置大模型考虑的2个要素

大模型的选择
设置大模型参数

图片描述 32K，指大模型一次能够处理23,000个Token文本。一个Token是一个字或一个词。

豆包的模型

图片描述

DeepSeek模型

图片描述

图片描述

通义千问Max：chatboot Areana基准测试中，名列全球第七。非推理性中国大模型冠军。数学和编程单项能力强，硬提示方面出色，适合需要进行数学计算和编程任务的场景。也适用于日常的智能问答、文本创作场景。采用超大规模的MOE架构，基于20万亿的Token预训练数据。
智谱4:参数量128K，支持JSON输出和function call，中文能力强，超过GPT。支持128k的上下文窗口长度，处理长文本。自动理解复杂的指令。适用于对中文处理要求比较高的场景。可用于处理复杂的多任务。
abab：适合超长文本、及时交互场景，比如在线客服、智能写作助手等。

图片描述