"人生不在输,而在秒输。" —— 鲁迅可能没说过
(别被名字吓跑,虽然叫"秒输",但它其实是为了让你赢麻了)
痛点
会议室里信号差,语音转文字卡了半天,最后全丢了。
用 Whisper/GLMAUTO 本地转写,一段话要等十几秒,急得想砸电脑。
想买个专业工具,Typeless 要 $150+-,还经常连不上服务器。
为什么叫"秒输"?
人生不在输,而在秒输—— 说得快,输得快,赢得也快。
💡 冷知识:连输一秒的时间都没有,因为你已经赢了。
为什么现有方案都不行?
云端方案的问题:
- 网络不稳定时体验极差
- 隐私数据全部上传
- 服务商随时可能涨价或停服
Whisper 的问题:
- 模型太大,推理慢
- 主要针对英文优化,中文是"顺带支持"
- 需要 GPU 才能跑得快
付费工具的问题:
- 贵($100 起步)
- 依然依赖网络
- 出问题没法自己修
我的解决方案:秒输
我基于阿里开源的 SenseVoice 模型,做了一个开箱即用的语音输入工具,取名 秒输。
核心优势:
🚀 秒级响应 — 说完松手就出结果,几乎零延迟(真的秒,不是输)
🔒 纯本地运行 — 不联网也能用,隐私完全保护
🎯 中文超准 — 阿里专门优化,不是老外那种"顺带支持"
🆓 完全免费 — 开源项目,代码随便看
效果对比
| 方案 | 中文识别 | 速度 | 价格 | 离线 |
|---|---|---|---|---|
| 秒输 | ⭐⭐⭐⭐⭐ | 秒出 | 免费 | ✅ |
| Whisper | ⭐⭐⭐ | 慢 | 免费 | ✅ |
| Typeless | ⭐⭐⭐ | 中等 | $200 | ❌ |
| macOS 听写 | ⭐⭐⭐⭐ | 快 | 免费 | ❌ |
| 讯飞输入法 | ⭐⭐⭐⭐ | 快 | 免费 | ❌ |
使用方法
超级简单,三步:
- 按住 Ctrl + Option
- 说话
- 松手
文字就自动输入到光标位置了。
在任何应用里都能用:微信、飞书、VSCode、浏览器...
安装教程(macOS)
第一步:安装 Python 依赖
打开终端,运行:
pip3 install sherpa-onnx sounddevice pynput pyobjc-core pyobjc-framework-Cocoa pyobjc-framework-Quartz
第二步:下载模型
模型大约 200MB,下载一次就行:
# 下载
wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17.tar.bz2
# 解压
tar -xjf sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17.tar.bz2
# 放到默认位置
mkdir -p ~/Models/ASR
mv sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17 ~/Models/ASR/
第三步:下载代码
git clone https://github.com/saddism/miaoshu.git
cd miaoshu
第四步:授权权限
打开 系统设置 → 隐私与安全性:
- 麦克风 → 允许终端(或 Python)
- 辅助功能 → 允许终端(或 Python)
第五步:运行
python3 voice_input.py
看到绿色界面就说明启动成功了!
进阶配置
创建配置文件 ~/.miaoshu_config.json:
{
"hotkey": "ctrl_alt",
"language": "auto",
"use_itn": true,
"auto_punctuation": true
}
可选快捷键:
ctrl_alt— Ctrl + Option(默认)cmd_r— 右 Commandf13/f14/f15— 功能键
支持语言:中文、英文、日文、韩文、粤语,自动检测。
开源地址
GitHub:github.com/saddism/miaoshu
欢迎 Star ⭐ 和提 Issue!
写在最后
语音输入本该很简单。
按住说话,松手输入。不用等网络,不用担心隐私,不用花钱。
秒输 — 人生不在输,而在秒输。
输了名字,赢了体验。