挑战0元创造AI伴侣,我能成功吗?

53 阅读6分钟

引言

如果说,你想要一个AI伴侣,但是又不想花费一分钱,那么这篇文章就是为你准备的。在这里,我将向你展示如何不花钱打造一个AI伴侣,让你在虚拟世界中找到陪伴。

第一步:下载免费的super agent party!

首先,你需要下载一个免费的super agent party!这是一个开源的AI伴侣软件。你可以从GitHub看到他的源码。

如果你是中国用户,你可以在魔搭社区下载。选择对应版本号的文件夹,然后选择符合你的操作系统的版本,点击下载即可!

如果你是海外用户,你可以在GitHub下载。选择适合你的操作系统的版本,点击下载即可!

如果你是一个爱折腾的极客,你也可以选择docker版本,在GitHub查看使用方法。

第二步:让你的AI伴侣能思考

你需要一个大语言模型,我们一般称为LLM。LLM是AI伴侣的“大脑”,它决定了AI伴侣的智能程度。市面上有非常多的免费的LLM算力,这里我推荐一个我常用的,ollama的云模型,至少在我写下这篇博客时,ollama的云模型还是免费的。

去ollama官网下载ollama

ollama官网:ollama.com/

你可以在网页的右上角看到一个“下载”按钮,点击它,选择适合你的操作系统的版本,点击下载即可!

免费的ollama的云模型

  • 你需要在ollama官网注册一个账号,注册后在ollama应用中登录你的账号,你就可以使用ollama的云模型了。
  • 你可以在ollama官网的“模型”页面点击cloud标签,这些标签下的模型都是免费且不占用你的本地算力的。

  • 你可以选择一个你喜欢的模型,点击它,然后复制CLI命令,比如ollama run deepseek-v3.1:671b-cloud,粘贴到你的终端,然后回车,你就可以使用ollama的云模型了。注意!一定要有cloud后缀的模型。

在super agent party中使用ollama的云模型

  • 打开super agent party,点击模型页面,然后在模型供应商子页面,选择添加供应商

  • 在模态框中,选择ollama,然后点击确认添加按钮

  • 点击卡片上的放大镜按钮,就可以获取你的ollama内的所有模型列表,如果获取失败,可能是你忘记打开ollama应用了

  • 在模型列表中,选择你刚刚复制的模型,比如deepseek-v3.1:671b-cloud

  • 这时候你回到对话界面,就可以愉快地免费和你的AI聊天了!

第三步:让你的AI伴侣能听见

你需要一个语音识别模型,我们一般称为ASR。ASR是AI伴侣的“耳朵”,它决定了AI伴侣能否听懂你说的话。

这里有两个免费的方法:

免费的本地小模型

super agent party内置了一个免费的语音识别模型,你只需要在模型页面,选择语音识别模型,然后选择Sherpa ONNX,就可以使用内置的语音识别模型了。这个模型不吃GPU,只占用CPU和内存,所以普通的笔记本电脑也可以跑,不需要花钱去买好设备。

  • 打开super agent party,点击模型页面,然后在语音识别模型子页面,选择Sherpa ONNX
  • 点击下方的Sherpa ONNX Sense Voice卡片里的下载按钮,国内用户选择魔搭社区下载,海外用户选择huggingface下载
  • 下载完成后,就可以开启语音识别,使用语音和你的AI聊天了

免费的浏览器内置语音识别API

你可以使用浏览器中内置的免费语音识别API,Web Speech API。你需要开启一个浏览器作为你的AI伴侣的“耳朵”,然后使用Web Speech API来识别语音。这个方法不需要花钱,但是需要联网。

  • 打开super agent party,点击模型页面,然后在语音识别模型子页面,选择Web Speech API
  • 开启语音识别,super agent party会自动开启一个浏览器,现在你就可以在浏览器中使用Web Speech API来识别语音了

第四步:让你的AI伴侣能说话

你需要一个语音合成模型,我们一般称为TTS。TTS是AI伴侣的“嘴巴”,它决定了AI伴侣能否用声音和你交流。

这里有两个免费的方法:

免费的系统TTS

windows系统和macOS系统都内置了语音合成模型,语音效果很一般,但是速度非常的快。用来快速测试非常合适。macOS请选择有【Siri/Premium】标识的语音,比如【Siri/Premium】Meijia,就是你经常听到的siri语音啦!

  • 打开super agent party,点击模型页面,然后在语音合成模型子页面,选择系统TTS
  • 选择你的系统TTS,比如【Siri/Premium】Meijia
  • 开启语音合成即可

免费的EdgeTTS

EdgeTTS是微软提供的一个免费的TTS接口,语音效果比较好,但是需要联网。这里额外声明一下,对于小规模或个人课堂使用,微软持默许态度,但是如果你要商业化和盈利,微软是不允许的。微软官网可以找到相关解释。如果你需要商业使用,请使用Azure TTS。

  • 打开super agent party,点击模型页面,然后在语音合成模型子页面,选择EdgeTTS
  • 选择对应语言的音色,比如:xiaoxiao
  • 开启语音合成即可

第五步:让你的AI伴侣能被看见

为了让你的AI伴侣以3D形象出现在你的桌面上,你需要开启VRM桌宠机器人

免费的VRM模型

如果你想要更多的免费3D形象,可以去vroidhub下载,或者去模之屋下载。

  • 打开super agent party,点击机器人页面,然后在VRM桌宠机器人子页面点击启动即可!
  • 鼠标左键旋转,滚轮缩放,右键平移,右上角第一个按钮拖拽整体窗口
  • 如果你希望录制透明背景的数字人口播视频或者在直播时录制桌宠,请在录制软件的浏览器源中添加http://127.0.0.1:3456/vrm.html作为视频源

如果你还想让你的AI伴侣以2D形象出现,那么你需要安装live2D扩展,我将在扩展篇中仔细介绍,欢迎继续关注和收藏本博客专栏。

结语

终于!我们没有花费一分钱就完成了一个AI伴侣!如果你有任何问题,欢迎加入:

博客原文链接

© 2026 heshengtao,采用 CC BY 4.0 国际协议授权 可自由转载、演绎、商用,须署名并给出原链接。