一个独立开发者的失败调研:微信文字转语音,为什么做不了

0 阅读3分钟

起因

上周开了一个无聊的会议,懂的都懂——领导在上面念 PPT,你在下面灵魂出窍。

这时候 5 岁女儿给我发了一条微信语音:"爸爸你什么时候回来呀?"

我想回复她,但开会不方便说话。还好微信有语音转文字,我打了几个字发过去——"爸爸开完会就回去。"

发完我就愣住了:我女儿 5 岁,她还不认识几个字。

微信能语音转文字,但不能文字转语音。我能听懂别人说的,却没法让自己写的变成语音发给她。

一个 idea 就这么冒出来了:做一个"文字转语音,直接发微信"的小程序。

技术方案

需求很清晰:输入文字 → 转成语音 → 发送到微信聊天

TTS 方案很成熟,MVP 阶段百度语音合成或 Edge TTS 就够了,成本几乎为零。产品形态选择微信小程序,用户不用下载安装,微信生态内体验最顺。

方案看起来很简单,对吧?

第一个坑:小程序发不了语音消息

这是我调研的第一个问题,答案直接决定了这个产品能不能做。

微信小程序的聊天能力极其有限:

  • ❌ 不能主动向用户发送消息
  • ❌ 不能往好友聊天里发送语音消息
  • ❌ 不能调用微信的发送消息接口
  • ✅ 可以通过 wx-share 分享小程序卡片到聊天

也就是说,我能让用户在小程序里生成语音,但没法让这段语音变成一条微信语音消息发出去

用户实际只能:

  1. 在小程序里生成语音
  2. 保存音频到手机
  3. 打开微信聊天
  4. 找到音频文件,作为文件消息发送

或者分享一个小程序卡片,对方点进去才能听。

用户想要的是"打字 → 语音消息发出去",实际能做的是"打字 → 生成音频 → 手动转发"。差了一步,体验完全不是一个东西。

绕过限制的尝试

网页版微信 API? 微信已经关闭了大部分网页版登录入口,使用非官方 API 有封号风险。做一个可能导致用户被封号的产品,不可取。

企微机器人? 只能企业内部群使用,不适用于 C 端用户,场景太窄。

iOS/Android 系统能力? iOS 快捷指令、Android 无障碍服务可以做简单的 TTS,但都是系统级操作,用户学习成本高,不是产品级方案。

最大的竞品:微信自己

调研到这里,更扎心的事实来了。

2022 年 4 月,微信在关怀模式里上线了"听文字消息"功能。开启后,点击任何文字消息就能听到语音朗读。

截至 2023 年 5 月的数据:关怀模式吸引了 4615 万用户,其中 2295 万人 开启了"听文字消息"功能,每天朗读 12 亿字

我们的 idea 想解决的"接收端"问题——"对方看不了文字,需要听语音"——微信自己已经解决了。

结论

维度结论
技术难度TTS 很简单,难点全在微信生态限制
市场需求真实存在但很窄,且被微信关怀模式部分替代
变现能力免费替代方案多,付费意愿弱
最大风险小程序不能发消息,硬伤,没有绕过方案
最大竞品微信自己

这不是一个"做不出来"的 idea,而是一个"做出来了也没人愿意为此付费"的 idea。技术从来不是瓶颈,平台限制才是。


我是蜗牛老师,一个想法很多但从来不做的程序员。这种"想过但没做"的 idea 我脑子里还有很多,我写了一个专栏 「空想家周报」,每周拆解一个脑洞,聊聊它为什么只停留在脑子里。感兴趣的话可以看看:xiaobot.net/post/9892da…