云端 LLM 配置：OpenAI / Anthropic / Google 接入为什么用云端 LLM Ollama 本地

本文面向：不想用 Ollama 本地模型，或需要更高质量摘要的开发者。预计阅读时间：6 分钟

为什么用云端 LLM

Ollama 本地模型免费、私密，但 7B 模型的摘要质量确实比不上 GPT-4o 或 Claude。如果你对笔记质量有更高要求，或者本机内存不够跑大模型，云端 LLM 是更好的选择。

对比	Ollama 本地	云端 LLM
费用	免费	按 token 计费
质量	够用，接近 GPT-3.5	更好，GPT-4o / Claude 级别
速度	取决于硬件	稳定快速
隐私	数据不出本机	发送到云端
依赖	需要 Ollama 运行	需要网络

支持的 Provider

ChatCrystal 支持 6 种 LLM Provider：

Provider	需要 API Key	需要 Base URL	支持 Embedding	说明
Ollama	否	是	是	本地运行，默认
OpenAI	是	否	是	GPT-4o、GPT-4-turbo
Anthropic	是	否	否	Claude Sonnet、Claude Haiku
Google	是	否	是	Gemini 2.0 Flash、Gemini 2.5 Pro
Azure OpenAI	是	是	是	企业级 Azure 部署
Custom	是	是	是	任何 OpenAI 兼容 API

注意： Anthropic 不支持 Embedding。如果用 Anthropic 做 LLM，Embedding 必须用其他 Provider（如 OpenAI 或 Ollama）。

方案一：OpenAI

最成熟的云端方案。API Key 在 platform.openai.com 获取。

设置页面配置

在 ChatCrystal 设置页面填写：

字段	值
LLM Provider	`openai`
LLM Model	`gpt-4o`
LLM API Key	`sk-...`

环境变量配置

LLM_PROVIDER=openai
LLM_MODEL=gpt-4o
LLM_API_KEY=sk-your-api-key-here

模型	适合场景	质量
`gpt-4o`	摘要质量最好	★★★★★
`gpt-4-turbo`	性价比平衡	★★★★
`gpt-3.5-turbo`	速度最快、最便宜	★★★

方案二：Anthropic

Claude 系列模型在长文本理解和摘要方面表现很好。API Key 在 console.anthropic.com 获取。

设置页面配置

字段	值
LLM Provider	`anthropic`
LLM Model	`claude-sonnet-4-20250514`
LLM API Key	`sk-ant-...`

环境变量配置

LLM_PROVIDER=anthropic
LLM_MODEL=claude-sonnet-4-20250514
LLM_API_KEY=sk-ant-your-api-key-here

模型	适合场景	质量
`claude-sonnet-4-20250514`	质量最好	★★★★★
`claude-haiku-4-5-20251001`	速度快、便宜	★★★★

Embedding 怎么办

Anthropic 没有 Embedding 模型。你需要搭配其他 Provider：

LLM_PROVIDER=anthropic
LLM_MODEL=claude-sonnet-4-20250514
LLM_API_KEY=sk-ant-...

EMBEDDING_PROVIDER=openai
EMBEDDING_MODEL=text-embedding-3-small
EMBEDDING_API_KEY=sk-...

或者用 Ollama 做 Embedding（免费）：

EMBEDDING_PROVIDER=ollama
EMBEDDING_MODEL=nomic-embed-text
EMBEDDING_BASE_URL=http://localhost:11434

方案三：Google

Gemini 系列模型性价比很高，免费额度也比较慷慨。API Key 在 aistudio.google.com 获取。

设置页面配置

字段	值
LLM Provider	`google`
LLM Model	`gemini-2.0-flash`
LLM API Key	`AIza...`

环境变量配置

LLM_PROVIDER=google
LLM_MODEL=gemini-2.0-flash
LLM_API_KEY=AIza-your-api-key-here

模型	适合场景	质量
`gemini-2.5-pro`	质量最好	★★★★★
`gemini-2.0-flash`	速度快、便宜	★★★★

方案四：Azure OpenAI

企业用户通常有 Azure 订阅。需要在 Azure Portal 部署模型，获取 endpoint 和 API Key。

环境变量配置

LLM_PROVIDER=azure
LLM_MODEL=gpt-4o
LLM_BASE_URL=https://your-resource.openai.azure.com
LLM_API_KEY=your-azure-api-key

Azure 的 Base URL 是必须的，指向你的 Azure OpenAI 资源 endpoint。

方案五：Custom（自定义兼容 API）

任何提供 OpenAI 兼容 API 的服务都能用。比如：

DeepSeek — 国产模型，性价比高
Moonshot — Kimi 背后的模型
Together AI — 开源模型托管
Groq — 超快推理
自建 vLLM / Ollama 远程服务

配置示例（DeepSeek）

LLM_PROVIDER=custom
LLM_MODEL=deepseek-chat
LLM_BASE_URL=https://api.deepseek.com/v1
LLM_API_KEY=sk-your-deepseek-key

配置示例（Groq）

LLM_PROVIDER=custom
LLM_MODEL=llama-3.1-70b-versatile
LLM_BASE_URL=https://api.groq.com/openai/v1
LLM_API_KEY=gsk-your-groq-key

Custom Provider 的 Base URL 和 API Key 都是必填的。

混合搭配

LLM 和 Embedding 可以用不同的 Provider，按需组合：

质量优先

LLM_PROVIDER=anthropic
LLM_MODEL=claude-sonnet-4-20250514

EMBEDDING_PROVIDER=openai
EMBEDDING_MODEL=text-embedding-3-small

性价比优先

LLM_PROVIDER=custom
LLM_MODEL=deepseek-chat
LLM_BASE_URL=https://api.deepseek.com/v1

EMBEDDING_PROVIDER=ollama
EMBEDDING_MODEL=nomic-embed-text

全免费（Ollama）

LLM_PROVIDER=ollama
LLM_MODEL=qwen2.5:7b

EMBEDDING_PROVIDER=ollama
EMBEDDING_MODEL=nomic-embed-text

配置验证

改完配置后，测试连接是否正常：

crystal config test

输出示例：

LLM connection: OK (model: gpt-4o, latency: 1.2s)
Embedding connection: OK (model: text-embedding-3-small, latency: 0.3s)

如果报错，检查：

API Key 是否正确
Provider 和 Model 是否匹配
Base URL 是否正确（Custom / Azure）
网络是否能访问对应 API

费用估算

生成一条笔记大约消耗 2000-4000 tokens（输入 + 输出）。

Provider	模型	单条笔记费用	100 条笔记
OpenAI	gpt-4o	~$0.02	~$2
OpenAI	gpt-3.5-turbo	~$0.002	~$0.2
Anthropic	claude-sonnet-4	~$0.03	~$3
Google	gemini-2.0-flash	免费额度内	免费额度内
DeepSeek	deepseek-chat	~¥0.01	~¥1

省钱技巧： 用云端 LLM 做摘要（质量好），用 Ollama 做 Embedding（免费）。Embedding 对质量不敏感，本地模型完全够用。

切换 Provider

从 Ollama 切到云端，或在云端之间切换，只需要改配置，不需要重新导入数据。已有的笔记不会受影响，新生成的笔记会用新的 Provider。

# 从 Ollama 切到 OpenAI
crystal config set llm.provider openai
crystal config set llm.model gpt-4o
crystal config set llm.apiKey sk-...

# 验证
crystal config test

下一步

LLM 和 Embedding 不能混用 — 配置时最常见的坑

项目地址：github.com/ZengLiangYi…

云端 LLM 配置：OpenAI / Anthropic / Google 接入

为什么用云端 LLM

支持的 Provider

方案一：OpenAI

设置页面配置

环境变量配置

推荐模型

方案二：Anthropic

设置页面配置

环境变量配置

推荐模型

Embedding 怎么办

方案三：Google

设置页面配置

环境变量配置

推荐模型

方案四：Azure OpenAI

环境变量配置

方案五：Custom（自定义兼容 API）

配置示例（DeepSeek）

配置示例（Groq）

混合搭配

质量优先

性价比优先

全免费（Ollama）

配置验证

费用估算

切换 Provider

下一步