它是什么
AriaType 是一个面向 macOS 的本地优先语音输入工具。
它常驻后台运行。需要输入时,按住全局热键,说话,松开,文字就会直接进入当前应用。你可以把它理解成一个真正能在日常工作里高频使用的 AI 语音键盘,适合写文档、回消息、记笔记、写代码注释,或者任何“想说得比打得快”的场景。
核心功能与卖点
- 🎙 全局热键语音输入:默认
Shift+Space,按住说话、松开即写,真正适合高频日常使用。 - ↔️ 跨应用直接输入:文字可直接进入当前应用,适用于 VS Code、Slack、Notion、浏览器等常见 macOS 工作流。
- 🔒 本地优先与隐私保护:默认优先使用本地识别与本地润色,语音内容不必上传到云端。
- ⚡ 双本地识别引擎:同时支持
Whisper和SenseVoice,可按语言、速度、准确率需求自由切换。 - 🌍 100+ 语言支持:支持自动检测和手动指定输出语言,适合中英混用和多语言办公场景。
- 🇨🇳 中文与 CJK 场景优化:
SenseVoice对普通话、繁体中文、粤语以及 CJK 使用场景更友好。 - ✨ 语音转文字之外还能顺手润色:可自动补标点、去口头禅、整理语气、压缩表达,让口语更接近可直接发送的文本。
- 🧩 模板化润色:内置
Remove Fillers、Formal Style、Make Concise、Agent Prompt四种模板,也支持自定义模板。 - ☁️ 云端增强按需开启:
Cloud Services中可分别启用Cloud STT和Cloud Polish,兼顾本地优先和云端增强。 - 📡 流式中间结果:支持的云 STT 服务商可在你还没说完时持续返回部分结果,降低等待感。
- 🧠 领域增强与术语词库:支持领域、子领域、初始提示词与 glossary 设置,适合 IT、法律、医疗等专业场景。
- 🧭 按语言推荐模型:首次使用和切换语言时,系统会基于语言给出更合适的模型推荐,降低选择成本。
- 📍 置顶胶囊悬浮窗:录音、转写、润色、音量状态实时可见,不需要来回切窗口确认。
- ⚙️ 胶囊显示与位置可调:支持常显、仅录音显示、隐藏等模式,也支持多种预设位置。
- 🎛 音频前处理可调:支持降噪和静音裁剪(VAD),在嘈杂环境、长停顿、轻声说话等场景下更容易调到合适状态。
- 📝 文本注入更稳:优先键盘模拟,必要时自动走剪贴板粘贴,并在结束后恢复剪贴板内容,减少打断。
- 🔎 本地历史记录与搜索:所有转写结果都可以本地保存、搜索、回看,方便复用常用表达。
- 📊 使用数据面板:可查看录入次数、处理耗时、本地/云端占比、连续使用天数等统计,帮助形成稳定习惯。
- ⬇️ 模型下载与状态管理:本地模型支持下载、删除、状态识别与进度反馈,不需要手动折腾文件。
- 🎨 桌面端体验完善:支持主题切换、开机启动、热键自定义、按住录音/切换录音等基础能力。
使用技巧
- 中文用户如果倾向离线使用,优先推荐
SenseVoice。它对中文场景更友好,项目里也把它作为 CJK 方向的强项模型;如果你常用普通话、繁体中文、粤语,通常值得先试它。 - 英文以及其他多语言用户,优先推荐
Whisper。它覆盖语言更多,模型档位也更完整,适合英文和跨语言输入场景。 - 如果你更看重完全本地、足够稳定的体验,先把本地模型下载好,再只在特定任务里开启云服务,这样更省心。
- 如果你已经有自己的 AI 服务订阅,可以直接去
Cloud Services里配置自己的API Key,按需开启Cloud STT和Cloud Polish。 - 口语内容很多时,先直接转写,再套用
Remove Fillers或Make Concise,通常比一开始就追求“说得很标准”更高效。 - 专业术语较多时,建议提前设置输出语言、领域、子领域和 glossary,识别结果会更稳。
- 胶囊悬浮窗建议放在你视线边缘但不挡内容的位置;如果你是重度用户,常显模式通常更顺手。
许可证
AriaType 使用 AGPL-3.0 开源协议。
- 你可以在遵守 AGPL-3.0 条款的前提下使用、修改和分发本项目。
- 如果你需要了解完整的授权和义务范围,请直接阅读仓库中的
LICENSE文件。