起因
上周开了一个无聊的会议,懂的都懂——领导在上面念 PPT,你在下面灵魂出窍。
这时候 5 岁女儿给我发了一条微信语音:"爸爸你什么时候回来呀?"
我想回复她,但开会不方便说话。还好微信有语音转文字,我打了几个字发过去——"爸爸开完会就回去。"
发完我就愣住了:我女儿 5 岁,她还不认识几个字。
微信能语音转文字,但不能文字转语音。我能听懂别人说的,却没法让自己写的变成语音发给她。
一个 idea 就这么冒出来了:做一个"文字转语音,直接发微信"的小程序。
技术方案
需求很清晰:输入文字 → 转成语音 → 发送到微信聊天。
TTS 方案很成熟,MVP 阶段百度语音合成或 Edge TTS 就够了,成本几乎为零。产品形态选择微信小程序,用户不用下载安装,微信生态内体验最顺。
方案看起来很简单,对吧?
第一个坑:小程序发不了语音消息
这是我调研的第一个问题,答案直接决定了这个产品能不能做。
微信小程序的聊天能力极其有限:
- ❌ 不能主动向用户发送消息
- ❌ 不能往好友聊天里发送语音消息
- ❌ 不能调用微信的发送消息接口
- ✅ 可以通过
wx-share分享小程序卡片到聊天
也就是说,我能让用户在小程序里生成语音,但没法让这段语音变成一条微信语音消息发出去。
用户实际只能:
- 在小程序里生成语音
- 保存音频到手机
- 打开微信聊天
- 找到音频文件,作为文件消息发送
或者分享一个小程序卡片,对方点进去才能听。
用户想要的是"打字 → 语音消息发出去",实际能做的是"打字 → 生成音频 → 手动转发"。差了一步,体验完全不是一个东西。
绕过限制的尝试
网页版微信 API? 微信已经关闭了大部分网页版登录入口,使用非官方 API 有封号风险。做一个可能导致用户被封号的产品,不可取。
企微机器人? 只能企业内部群使用,不适用于 C 端用户,场景太窄。
iOS/Android 系统能力? iOS 快捷指令、Android 无障碍服务可以做简单的 TTS,但都是系统级操作,用户学习成本高,不是产品级方案。
最大的竞品:微信自己
调研到这里,更扎心的事实来了。
2022 年 4 月,微信在关怀模式里上线了"听文字消息"功能。开启后,点击任何文字消息就能听到语音朗读。
截至 2023 年 5 月的数据:关怀模式吸引了 4615 万用户,其中 2295 万人 开启了"听文字消息"功能,每天朗读 12 亿字。
我们的 idea 想解决的"接收端"问题——"对方看不了文字,需要听语音"——微信自己已经解决了。
结论
| 维度 | 结论 |
|---|---|
| 技术难度 | TTS 很简单,难点全在微信生态限制 |
| 市场需求 | 真实存在但很窄,且被微信关怀模式部分替代 |
| 变现能力 | 免费替代方案多,付费意愿弱 |
| 最大风险 | 小程序不能发消息,硬伤,没有绕过方案 |
| 最大竞品 | 微信自己 |
这不是一个"做不出来"的 idea,而是一个"做出来了也没人愿意为此付费"的 idea。技术从来不是瓶颈,平台限制才是。
我是蜗牛老师,一个想法很多但从来不做的程序员。这种"想过但没做"的 idea 我脑子里还有很多,我写了一个专栏 「空想家周报」,每周拆解一个脑洞,聊聊它为什么只停留在脑子里。感兴趣的话可以看看:xiaobot.net/post/9892da…