whisper语音转录及obdisian相关插件介绍了whisper语音转录的优缺点（对比主流平台的一些特性），以及ob

转录工具

笔者平时用飞书妙记/豆包转录/get笔记等，进行语音录入。

如果追求“知识管理”，更好的方案，显然是把转录功能按照自己平时的习惯集成到obsidian。也是出于对whisper模型的好奇，就了解了一下whisper模型。

- model 可根据本地GPU/CPU性能，配置为whisper对应的模型名称, 比如 base、medium、large、turbo等

如果配置本地模型：

如果配置为云端模型：

openai-o4mini价格（1M令牌代表100万token）

优点：

pip install faster-whisper-server 
# 启动服务，默认会下载并使用 base 模型，你可以指定 large-v3 
faster-whisper-server --model large-v3

pip install -U openai-whisper

whisper audio.wav --language Chinese --model medium

大概看了下原因，大概是是显卡驱动或者CUDA版本冲突导致的，不想去解决。

总结：现在主流平台的免费额度，足够笔者本人使用，并且笔者也没有一定要构建工作流的需求。所以就先不搞了，先用主流平台的免费额度进行语音转换。