耳语者项目 招募 - 联合创始人/技术合伙人 / 兼职技术顾问****
——攻克端侧多模态AI,打造下一代教育基模型
☞ 我们的愿景: 让AI成为理解与成长的桥梁
“耳语者”不仅是一个产品,更是一场实践。我们致力于在成人与儿童互动的真实瞬间,通过AI提供实时、科学且温柔的指导,让每一次互动都成为滋养成长的契机。
我们相信,未来的教育AI,应是深度理解人性、增强而非替代人际连接的智慧伙伴。
☞ 核心挑战: 一个定义清晰的AI工程攻坚战
我们的首要目标,是在消费级移动设备上,构建一条完整的端侧AI流水线:
“语音+视频实时感知 → 多模态情境理解 → 个性化耳语生成”,并实现 <1秒 的稳定端到端延迟。
这要求我们直面底层AI工程问题,而非简单调用API。这是一个集算法、工程与产品于一体的硬核挑战。
☞ 技术蓝图: 清晰的演进路径
目前已规划了务实且雄心勃勃的三阶段技术路径:
- 第一阶段(MVP):务实验证,闭环先行
-
- 技术栈:MediaPipe + Whisper-Tiny/Silero + 规则引擎。
- 目标:以最快速度验证核心产品价值,实现可演示的<1秒实时交互闭环。
- 第二阶段(产品化):体验优化,智能初现
-
- 技术栈:引入微调后的轻量级模型(如Phi-3 mini),构建本地个性化知识库。
- 目标:让“耳语”更自然、智能,形成初步的数据与用户体验壁垒。
- 第三阶段(平台化):构建生态,定义未来
-
- 技术栈:成熟的 端侧1-4B量化模型 + 云端 RAG教育知识库 混合架构。
- 目标:打造一个具有深度教育智慧、可进化、可解释的下一代教育AI系统。
☞ 创业基石: 全球顶尖的教育策略库
- 清晰的产品定义与基于发展心理学的教育策略库。
- 详尽的MVP场景与可量化的技术性能指标。
- 位于北京海淀AI元点社区的孵化环境与初始资源。
☞ 我们寻找: 技术攻坚者
我们寻找的,是能主导并攻克上述技术挑战的伙伴。希望您具备以下一个或多个领域的深厚架构与实战经验:
- 端侧AI模型部署与优化:精通 TFLite / ONNX Runtime / CoreML 等框架,对模型量化、蒸馏与性能调优有第一手经验。
- 移动端多模态系统架构:熟悉 MediaPipe 等生态,能设计高效的音视频流处理与低延迟融合方案。
- 轻量级LLM与语音技术:对 Whisper、Silero 及 Llama/Phi 系列等模型在资源受限环境下的部署有深刻理解。
☞ 我们召唤: 共创未来者
我们寻找的不是建议者,而是共创者,您的角色:
· 可能始于一行极简代码的优雅
· 一定奠基一种全新范式的智能
· 是打造产品核心壁垒的合伙人
如果,您渴望用技术解决一个高价值的社会问题,并亲手从0到1打造一个有技术深度与社会价值的产品,这里将是您的绝佳舞台。
我们深知技术是实现这一切愿景的基石,期待了解您的技术背景。如果您有 GitHub、技术博客或任何能体现您技术思考的分享,欢迎一并附上,这能帮助我们更快地相互了解。
联系人:John 微信:S18612834612 | 邮箱:xuqiangsun@gmail.com