本文面向:不想用 Ollama 本地模型,或需要更高质量摘要的开发者。 预计阅读时间:6 分钟
为什么用云端 LLM
Ollama 本地模型免费、私密,但 7B 模型的摘要质量确实比不上 GPT-4o 或 Claude。如果你对笔记质量有更高要求,或者本机内存不够跑大模型,云端 LLM 是更好的选择。
| 对比 | Ollama 本地 | 云端 LLM |
|---|---|---|
| 费用 | 免费 | 按 token 计费 |
| 质量 | 够用,接近 GPT-3.5 | 更好,GPT-4o / Claude 级别 |
| 速度 | 取决于硬件 | 稳定快速 |
| 隐私 | 数据不出本机 | 发送到云端 |
| 依赖 | 需要 Ollama 运行 | 需要网络 |
支持的 Provider
ChatCrystal 支持 6 种 LLM Provider:
| Provider | 需要 API Key | 需要 Base URL | 支持 Embedding | 说明 |
|---|---|---|---|---|
| Ollama | 否 | 是 | 是 | 本地运行,默认 |
| OpenAI | 是 | 否 | 是 | GPT-4o、GPT-4-turbo |
| Anthropic | 是 | 否 | 否 | Claude Sonnet、Claude Haiku |
| 是 | 否 | 是 | Gemini 2.0 Flash、Gemini 2.5 Pro | |
| Azure OpenAI | 是 | 是 | 是 | 企业级 Azure 部署 |
| Custom | 是 | 是 | 是 | 任何 OpenAI 兼容 API |
注意: Anthropic 不支持 Embedding。如果用 Anthropic 做 LLM,Embedding 必须用其他 Provider(如 OpenAI 或 Ollama)。
方案一:OpenAI
最成熟的云端方案。API Key 在 platform.openai.com 获取。
设置页面配置
在 ChatCrystal 设置页面填写:
| 字段 | 值 |
|---|---|
| LLM Provider | openai |
| LLM Model | gpt-4o |
| LLM API Key | sk-... |
环境变量配置
LLM_PROVIDER=openai
LLM_MODEL=gpt-4o
LLM_API_KEY=sk-your-api-key-here
推荐模型
| 模型 | 适合场景 | 质量 |
|---|---|---|
gpt-4o | 摘要质量最好 | ★★★★★ |
gpt-4-turbo | 性价比平衡 | ★★★★ |
gpt-3.5-turbo | 速度最快、最便宜 | ★★★ |
方案二:Anthropic
Claude 系列模型在长文本理解和摘要方面表现很好。API Key 在 console.anthropic.com 获取。
设置页面配置
| 字段 | 值 |
|---|---|
| LLM Provider | anthropic |
| LLM Model | claude-sonnet-4-20250514 |
| LLM API Key | sk-ant-... |
环境变量配置
LLM_PROVIDER=anthropic
LLM_MODEL=claude-sonnet-4-20250514
LLM_API_KEY=sk-ant-your-api-key-here
推荐模型
| 模型 | 适合场景 | 质量 |
|---|---|---|
claude-sonnet-4-20250514 | 质量最好 | ★★★★★ |
claude-haiku-4-5-20251001 | 速度快、便宜 | ★★★★ |
Embedding 怎么办
Anthropic 没有 Embedding 模型。你需要搭配其他 Provider:
LLM_PROVIDER=anthropic
LLM_MODEL=claude-sonnet-4-20250514
LLM_API_KEY=sk-ant-...
EMBEDDING_PROVIDER=openai
EMBEDDING_MODEL=text-embedding-3-small
EMBEDDING_API_KEY=sk-...
或者用 Ollama 做 Embedding(免费):
EMBEDDING_PROVIDER=ollama
EMBEDDING_MODEL=nomic-embed-text
EMBEDDING_BASE_URL=http://localhost:11434
方案三:Google
Gemini 系列模型性价比很高,免费额度也比较慷慨。API Key 在 aistudio.google.com 获取。
设置页面配置
| 字段 | 值 |
|---|---|
| LLM Provider | google |
| LLM Model | gemini-2.0-flash |
| LLM API Key | AIza... |
环境变量配置
LLM_PROVIDER=google
LLM_MODEL=gemini-2.0-flash
LLM_API_KEY=AIza-your-api-key-here
推荐模型
| 模型 | 适合场景 | 质量 |
|---|---|---|
gemini-2.5-pro | 质量最好 | ★★★★★ |
gemini-2.0-flash | 速度快、便宜 | ★★★★ |
Google 也支持 Embedding:
EMBEDDING_PROVIDER=google
EMBEDDING_MODEL=text-embedding-004
EMBEDDING_API_KEY=AIza...
方案四:Azure OpenAI
企业用户通常有 Azure 订阅。需要在 Azure Portal 部署模型,获取 endpoint 和 API Key。
环境变量配置
LLM_PROVIDER=azure
LLM_MODEL=gpt-4o
LLM_BASE_URL=https://your-resource.openai.azure.com
LLM_API_KEY=your-azure-api-key
Azure 的 Base URL 是必须的,指向你的 Azure OpenAI 资源 endpoint。
方案五:Custom(自定义兼容 API)
任何提供 OpenAI 兼容 API 的服务都能用。比如:
- DeepSeek — 国产模型,性价比高
- Moonshot — Kimi 背后的模型
- Together AI — 开源模型托管
- Groq — 超快推理
- 自建 vLLM / Ollama 远程服务
配置示例(DeepSeek)
LLM_PROVIDER=custom
LLM_MODEL=deepseek-chat
LLM_BASE_URL=https://api.deepseek.com/v1
LLM_API_KEY=sk-your-deepseek-key
配置示例(Groq)
LLM_PROVIDER=custom
LLM_MODEL=llama-3.1-70b-versatile
LLM_BASE_URL=https://api.groq.com/openai/v1
LLM_API_KEY=gsk-your-groq-key
Custom Provider 的 Base URL 和 API Key 都是必填的。
混合搭配
LLM 和 Embedding 可以用不同的 Provider,按需组合:
质量优先
LLM_PROVIDER=anthropic
LLM_MODEL=claude-sonnet-4-20250514
EMBEDDING_PROVIDER=openai
EMBEDDING_MODEL=text-embedding-3-small
性价比优先
LLM_PROVIDER=custom
LLM_MODEL=deepseek-chat
LLM_BASE_URL=https://api.deepseek.com/v1
EMBEDDING_PROVIDER=ollama
EMBEDDING_MODEL=nomic-embed-text
全免费(Ollama)
LLM_PROVIDER=ollama
LLM_MODEL=qwen2.5:7b
EMBEDDING_PROVIDER=ollama
EMBEDDING_MODEL=nomic-embed-text
配置验证
改完配置后,测试连接是否正常:
crystal config test
输出示例:
LLM connection: OK (model: gpt-4o, latency: 1.2s)
Embedding connection: OK (model: text-embedding-3-small, latency: 0.3s)
如果报错,检查:
- API Key 是否正确
- Provider 和 Model 是否匹配
- Base URL 是否正确(Custom / Azure)
- 网络是否能访问对应 API
费用估算
生成一条笔记大约消耗 2000-4000 tokens(输入 + 输出)。
| Provider | 模型 | 单条笔记费用 | 100 条笔记 |
|---|---|---|---|
| OpenAI | gpt-4o | ~$0.02 | ~$2 |
| OpenAI | gpt-3.5-turbo | ~$0.002 | ~$0.2 |
| Anthropic | claude-sonnet-4 | ~$0.03 | ~$3 |
| gemini-2.0-flash | 免费额度内 | 免费额度内 | |
| DeepSeek | deepseek-chat | ~¥0.01 | ~¥1 |
省钱技巧: 用云端 LLM 做摘要(质量好),用 Ollama 做 Embedding(免费)。Embedding 对质量不敏感,本地模型完全够用。
切换 Provider
从 Ollama 切到云端,或在云端之间切换,只需要改配置,不需要重新导入数据。已有的笔记不会受影响,新生成的笔记会用新的 Provider。
# 从 Ollama 切到 OpenAI
crystal config set llm.provider openai
crystal config set llm.model gpt-4o
crystal config set llm.apiKey sk-...
# 验证
crystal config test
下一步
- LLM 和 Embedding 不能混用 — 配置时最常见的坑