做一套Windows 台式机专用、纯一键配置、开机自启、永不掉线的方案: 只用你现有的 LM Studio,不装 Ollama,实现:
- 公网远程调用你的 Gemma4 E4B
- API 无任何输出长度限制(彻底摆脱 2048 截断)
- OpenCode = Claude Code 同款终端编程体验
- 开机自动:启动 LM Studio 服务器 → 加载模型 → 开 ngrok 穿透
- 全程后台静默运行,不弹黑窗口
一、先把 LM Studio 服务器锁死(必须做)
- 打开 LM Studio → 左侧 Local Server
- 点右上角齿轮 Server Settings
- 按这个填:
- Host:
0.0.0.0 - Port:
1234 - Default Model: 选
gemma-4-E4B-it-Q4_K_M - 勾选:
- ✅ Start server automatically on launch
- ✅ Load default model on startup
- ✅ Enable CORS
- Host:
- 点 Save & Restart Server
完成后,页面显示:
Server running on http://0.0.0.0:1234
✅ 本地 API 就永久就绪了。
二、安装 OpenCode(Claude Code 平替)
你只需要装一次 Node.js:
- 下载:nodejs.org/dist/v20.18…
- 全程下一步
然后打开 PowerShell 运行:
npm install -g opencode
新建本地配置:lmstudio-opencode.json
{
"model": "gemma-4-e4b",
"apiBase": "http://localhost:1234/v1",
"apiKey": "none",
"temperature": 0.2,
"topP": 0.8,
"maxTokens": 8192,
"contextWindow": 32768
}
本地测试(在文件目录打开终端):
opencode --config lmstudio-opencode.json
输一句测试:
用 Python 写一个完整的 Blackjack 21点游戏,面向对象,一次性完整输出不要截断
你会看到:一次性直接写完,不会断、不用继续。
三、公网远程:ngrok 稳定穿透
1. 安装并登录 ngrok
然后在 PowerShell 登录(把 你的Token 换成 ngrok 官网的):
ngrok config add-authtoken 你自己的authtoken
2. 创建 ngrok 配置文件(固定域名、后台稳定)
打开文件夹:
C:\Users\你的用户名\.ngrok\
新建文件:ngrok.yml
内容复制这个:
version: "2"
authtoken: 你的authtoken
tunnels:
lmstudio:
proto: http
addr: 1234
schemes:
- https
3. 测试穿透
ngrok start lmstudio
出现类似:
Forwarding https://xxxx-xx-xx-xx-xx.ngrok.io -> http://localhost:1234
这就是你的公网 API 地址。
四、在外/公司电脑远程使用(OpenCode)
在你的笔记本/公司电脑上:
- 装 Node.js
npm install -g opencode- 新建配置
remote-lmstudio.json
{
"model": "gemma-4-e4b",
"apiBase": "https://这里换成你的ngrok地址/v1",
"apiKey": "none",
"temperature": 0.2,
"maxTokens": 8192
}
启动远程 Claude Code 体验:
opencode --config remote-lmstudio.json
✅ 现在你在任何地方,都等于在用你自己的 Claude Code。
五、开机自启全套(核心:永不掉线)
我给你做 Windows 后台静默启动,不弹黑窗口,开机自动:
- 启动 LM Studio 并加载模型
- 启动 API 服务器
- 启动 ngrok 公网穿透
1. 创建 LM Studio 开机启动脚本
新建文件:启动LMStudio服务器.vbs
复制粘贴:
Set ws = CreateObject("Wscript.Shell")
ws.Run "cmd /c start /min """" ""C:\Users\你的用户名\AppData\Local\LMStudio\LMStudio.exe""", 0, False
把路径换成你自己的 LM Studio 位置。
2. 创建 ngrok 开机启动脚本
新建文件:启动ngrok穿透.vbs
Set ws = CreateObject("Wscript.Shell")
ws.Run "cmd /c ngrok start lmstudio", 0, False
3. 放到开机启动文件夹
按 Win + R,输入:
shell:startup
把两个 .vbs 文件粘贴进去。
✅ 重启电脑,全套自动后台运行,永远在线。
六、你现在的最终形态(完全体)
- 模型:LM Studio + Gemma4 E4B(你已优化好)
- 编程体验:OpenCode = Claude Code 平替
- 输出限制:API 无任何限制,一次性 8192 token
- 远程:公网 HTTPS 访问
- 自启:开机全自动化,不用管
- 免费:全部零费用
七、最重要的一句话
LM Studio 自带的聊天窗口有 2048 限制,但 API 接口完全没有限制! 你用 OpenCode / Trae / 任何 IDE 对接 API,都可以无限长生成代码。