Mac Studio 本地模型搭建避坑介绍在 mac studio 上使用 lm studio 搭建本地模型的过程，重点

背景

本地部署了 OpenClaw，试用了一段时间，实在是养不动这个 Token 消耗怪兽，购买的 CC 没用几分钟就进入了限流冷却状态，不得已淘了一台 Mac Studio 来部署本地模型接入 OpenClaw。 Mac Studio 在闲鱼上淘的，官网的到货时间实在是等不起。配置如下：

本地模型工具，常见的有两个

两者差别不大，看个人喜好，我选择了 lm studio

总体过程很简单，三步：

有坑的是模型选择和lm studio 运行参数的配置

我的工作场景包含如下几个Agent

产品经理/架构师需要具备复杂问题拆解，深度思考能力，要支持长 context length。开发对 code 特调过。最终经过比较选择了 Qwen3 系列的模型：

两个模型都选在 MLX 格式，这种格式针对 apple 芯片进行过优化，整体运行性能更高。模型选择特别需要注意模型大小，基础模型大小不宜超过设备内存 50%。

基础模型估算：模型文件大小 + 2G

Qwen2.5-72b-instruct-gguf-q4_k_m

字段	说明
Qwen2.5	系列名
72b	参数量
instrunct	训练属性，base/foundation 基础模型；instruct/chat/it 指令微调；coder 针对编程优化；math 针对数学优化；vision/VL 多模态
gguf	存储格式，gguf 通用；mlx apple silion；satetensors 原始权重；exl2 nvidia 优化
q4_k_m	量化精度，数字越大精度越高

lm studio 采用单进程架构，多个模型都加载在一个进程中。mac 对于单进程内存占用默认上限通常在总内存70% 左右。我们需要放开这个限制使模型可以使用更多的内存。 lm studio 加载 MLX 格式模型使，可以通过下面几个环境变量控制相关的内存分配&使用：

在命令行中 export 上述变量值后，通过如下命令启动 lm

open -a "LM Studio"