受够语音输入又贵又慢?我写了个完全离线的秒输工具

103 阅读2分钟

"人生不在输,而在秒输。" —— 鲁迅可能没说过

(别被名字吓跑,虽然叫"秒输",但它其实是为了让你赢麻了

痛点

会议室里信号差,语音转文字卡了半天,最后全丢了。

用 Whisper/GLMAUTO 本地转写,一段话要等十几秒,急得想砸电脑。

想买个专业工具,Typeless 要 $150+-,还经常连不上服务器。


为什么叫"秒输"?

人生不在输,而在秒输—— 说得快,输得快,赢得也快。

💡 冷知识:连输一秒的时间都没有,因为你已经赢了。

ScreenShot_2026-02-08_221448_052.png


为什么现有方案都不行?

云端方案的问题:

  • 网络不稳定时体验极差
  • 隐私数据全部上传
  • 服务商随时可能涨价或停服

Whisper 的问题:

  • 模型太大,推理慢
  • 主要针对英文优化,中文是"顺带支持"
  • 需要 GPU 才能跑得快

付费工具的问题:

  • 贵($100 起步)
  • 依然依赖网络
  • 出问题没法自己修

我的解决方案:秒输

我基于阿里开源的 SenseVoice 模型,做了一个开箱即用的语音输入工具,取名 秒输

核心优势:

🚀 秒级响应 — 说完松手就出结果,几乎零延迟(真的秒,不是输)

🔒 纯本地运行 — 不联网也能用,隐私完全保护

🎯 中文超准 — 阿里专门优化,不是老外那种"顺带支持"

🆓 完全免费 — 开源项目,代码随便看


效果对比

方案中文识别速度价格离线
秒输⭐⭐⭐⭐⭐秒出免费
Whisper⭐⭐⭐免费
Typeless⭐⭐⭐中等$200
macOS 听写⭐⭐⭐⭐免费
讯飞输入法⭐⭐⭐⭐免费

使用方法

超级简单,三步:

  1. 按住 Ctrl + Option
  2. 说话
  3. 松手

文字就自动输入到光标位置了。

在任何应用里都能用:微信、飞书、VSCode、浏览器...


安装教程(macOS)

第一步:安装 Python 依赖

打开终端,运行:

pip3 install sherpa-onnx sounddevice pynput pyobjc-core pyobjc-framework-Cocoa pyobjc-framework-Quartz

第二步:下载模型

模型大约 200MB,下载一次就行:

# 下载
wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17.tar.bz2

# 解压
tar -xjf sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17.tar.bz2

# 放到默认位置
mkdir -p ~/Models/ASR
mv sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17 ~/Models/ASR/

第三步:下载代码

git clone https://github.com/saddism/miaoshu.git
cd miaoshu

第四步:授权权限

打开 系统设置 → 隐私与安全性

  • 麦克风 → 允许终端(或 Python)
  • 辅助功能 → 允许终端(或 Python)

第五步:运行

python3 voice_input.py

看到绿色界面就说明启动成功了!


进阶配置

创建配置文件 ~/.miaoshu_config.json

{
  "hotkey": "ctrl_alt",
  "language": "auto",
  "use_itn": true,
  "auto_punctuation": true
}

可选快捷键

  • ctrl_alt — Ctrl + Option(默认)
  • cmd_r — 右 Command
  • f13 / f14 / f15 — 功能键

支持语言:中文、英文、日文、韩文、粤语,自动检测。


开源地址

GitHub:github.com/saddism/miaoshu

欢迎 Star ⭐ 和提 Issue!


写在最后

语音输入本该很简单。

按住说话,松手输入。不用等网络,不用担心隐私,不用花钱。

秒输 — 人生不在输,而在秒输。

输了名字,赢了体验。