本文手把手介绍了如何利用开源项目 AIRI 搭配 蓝耘 MaaS 平台 的 DeepSeek-V3.2-Exp 模型,在本地构建一个拥有Live2D 形象、实时对话、语音交互能力的 AI 虚拟伴侣。 AIRI 是一个受 Neuro-sama 启发的开源虚拟角色框架,支持 Live2D / VRM模型展示、语音识别与合成、多平台社交接入,以及 Minecraft 等游戏联动。通过蓝耘 MaaS 平台提供的 OpenAI 兼容 API接口,可以零改造成本接入 DeepSeek-V3.2-Exp模型——该模型基于稀疏注意力机制,具备出色的长文本处理与多轮对话能力,特别适合角色扮演场景下的连贯交互。
@TOC
前言:从幻想到现实,只差一个开源项目
相信很多人都幻想过拥有一个"完美伴侣":她懂你说的每一句话,陪你聊游戏、聊代码、聊人生,随叫随到,永不发脾气。
以前这只是动漫里的情节。但现在,随着大语言模型的爆发式进化,这件事真的变得触手可及。
今天要介绍的主角,是一个叫 AIRI 的开源项目,配合 蓝耘 MaaS 平台 提供的 DeepSeek-V3.2-Exp 模型 API,我们可以在本地搭建一个有 Live2D 形象、能对话、有"灵魂"的虚拟角色。
整个过程比你想象的简单得多——不需要租服务器,不需要懂深度学习,只需要一台普通电脑和一个下午的时间。
认识 AIRI:开源界的"虚拟老婆框架"
AIRI 是 GitHub 上的一个开源项目(点击访问),灵感来源于著名 AI VTuber Neuro-sama。
Neuro-sama 是目前公认最强的 AI 虚拟主播,能打游戏、能聊天、能和观众实时互动——但她不开源,直播结束后你就再也找不到她了。
AIRI 的出现,正是为了解决这个遗憾:让每个人都能拥有自己的数字生命体,一个可以陪你聊天、看你写代码、甚至和你一起打游戏的 AI 虚拟角色,随时在线,完全属于你。
AIRI 能做什么?
AIRI 的能力体系设计得非常完整,用"五感"来类比非常贴切:
| 能力维度 | 具体功能 |
|---|---|
| 大脑(Brain) | 接入主流 LLM API、支持记忆系统、可玩 Minecraft / Factorio / 同步音律 |
| 耳朵(Ears) | 浏览器麦克风输入、Discord 语音输入、客户端语音识别、说话检测 |
| 嘴巴(Mouth) | ElevenLabs 语音合成,让她真正"开口说话" |
| 身体(Body) | 支持 Live2D 和 VRM 模型,自动眨眼、追踪视线、待机动作 |
| 社交(Social) | 可接入 Telegram、Discord 频道,让她在社群里活跃 |
更厉害的是,AIRI 基于 Web 技术栈构建(WebGPU、WebAudio、WebAssembly 等),支持在浏览器直接运行,同时桌面端支持原生 NVIDIA CUDA 和 Apple Metal 加速,跨平台能力极强,手机上也能跑(已支持 PWA)。
在 LLM 接入方面,AIRI 支持 OpenAI 兼容接口,这意味着——任何提供 OpenAI 格式 API 的平台都可以无缝接入,零改造成本。
这正是蓝耘 MaaS 平台的用武之地。
核心驱动:DeepSeek-V3.2-Exp 是什么来头?
给虚拟老婆选一个好的"大脑"至关重要。大脑越聪明,她说的话就越自然、越有情感、越像真人。
这次我们接入的是 DeepSeek-V3.2-Exp,由深度求索(DeepSeek)推出的实验性大语言模型,目前可以通过 蓝耘 MaaS 平台 调用。
为什么选它?
DeepSeek-V3.2-Exp 基于 V3.1-Terminus 版本进化而来,引入了创新的 DeepSeek Sparse Attention(稀疏注意力机制),在几乎不影响输出质量的前提下,大幅提升了长文本处理效率。
核心亮点如下:
- 长文本处理能力强:稀疏注意力机制让它在超长对话中依然保持高效,不会因为聊太久而"失忆"
- 多轮推理表现优异:特别适合角色扮演类的长对话场景,上下文连贯性极佳,人设稳定不崩
- 工具适配灵活:支持多类推理框架,快速部署,适配性强,接入 AIRI 几乎无障碍
- 架构创新领先:实验性模型中综合表现最亮眼之一,技术研发场景下尤为出色
简单说:它聪明、记性好、说话流畅、情感表达自然,用来驱动虚拟角色的对话系统,再合适不过。
而要使用这个模型,最便捷的方式就是通过 蓝耘 MaaS 平台 调用它的 API——注册即可使用,无需自己部署任何模型。
实战教程:手把手接入蓝耘 MaaS + AIRI
整个流程分为三大步:注册蓝耘平台获取 API 密钥 → 克隆并启动 AIRI 项目 → 在 AIRI 中配置蓝耘 API。
第一步:注册蓝耘 MaaS 平台,获取 API 密钥
蓝耘 MaaS 是一个提供主流大模型 API 调用服务的平台,支持 OpenAI 兼容格式,开发者可以直接用它替换 OpenAI 的接口地址,零改造成本接入各类项目。对于个人开发者来说,按量计费、开箱即用,是目前最省心的模型 API 方案之一。
👉 注册地址:点击注册
① 打开注册页面
访问上方链接,进入蓝耘控制台注册页面,填写手机号或邮箱,设置登录密码,完成验证码验证后点击注册:
整个注册流程不超过 2 分钟,无需实名,非常简洁。
② 登录控制台,进入 MaaS 模块
注册成功后登录,在顶部导航栏找到 "MaaS 平台" 入口,点击进入:
MaaS 平台聚合了包括 DeepSeek、Qwen 等主流模型,可以按需选择调用。
③ 创建 API 密钥
进入 MaaS 模块后,找到 "API KEY 管理",点击 "创建 API KEY":
④ 确认可用模型列表
在模型列表中找到 deepseek-v3-2-exp,确认其状态为可用,记住这个模型名称,后续配置时需要填写:
至此,蓝耘平台的准备工作已全部完成。我们有了:
- 一个可用的 API 密钥
- 一个可调用的
deepseek-v3-2-exp模型 - 一个 OpenAI 兼容的接口地址:
https://maas-api.lanyun.net/v1
第二步:克隆并启动 AIRI 项目
环境准备
在开始之前,确保你的电脑已安装 Node.js(建议 v18 或以上版本)。可以在终端输入以下命令检查:
node -v
npm -v
如果提示"不是内部命令",请先去 nodejs.org 下载安装 LTS 版本。
克隆仓库并安装依赖
打开终端(Windows 用 cmd 或 PowerShell,Mac/Linux 用 Terminal),依次执行:
# 克隆 AIRI 仓库
git clone https://github.com/moeru-ai/airi.git
# 进入项目目录
cd airi
# 安装 pnpm 包管理器(如果还没装的话)
npm install -g pnpm
# 安装项目依赖
pnpm i
安装过程中你会看到依赖包逐一下载,耐心等待即可:
如果下载速度较慢,可以尝试切换 npm 镜像源:
npm config set registry https://registry.npmmirror.com
第三步:启动 AIRI,召唤你的虚拟老婆
依赖安装完成后,执行以下命令启动开发服务器:
pnpm dev
终端会输出本地服务地址,如下图所示:
打开浏览器,访问 http://localhost:5173/,你将看到 AIRI 的主界面:
第四步:配置蓝耘 API,为她注入灵魂
AIRI 启动后,需要配置 LLM 接口才能让她"开口说话"。
① 选择 OpenAI 兼容 API 接口
在设置页面中,选择 "OpenAI 兼容 API" 作为服务来源:
② 填入蓝耘平台的 API 信息
按照以下格式填写配置:
| 配置项 | 填写内容 |
|---|---|
| API Base URL | https://maas-api.lanyun.net/v1 |
| API Key | 你在蓝耘平台创建的 API 密钥 |
| Model | deepseek-v3-2-exp |
蓝耘的接口完全兼容 OpenAI 格式,填入后无需任何额外适配,直接保存即可生效。
第五步:开始对话 & 个性化定制
配置完成后,直接在对话框输入内容,她就会实时回复了!
配置角色卡:定义她的"人设"
在设置中可以配置 AIRI 角色卡,这本质上是一段角色提示词(System Prompt),用来定义角色的身份、性格、说话风格和行为边界。
你可以自由编写角色卡,比如:
"你是一个温柔体贴的女生,名叫小艾,喜欢二次元和编程,说话带点撒娇的语气,会主动关心对方的状态……"
角色卡写得越细致,她的表现就越稳定、越有个性。这是让虚拟老婆"活起来"最关键的一步。
配置角色模型:给她一个好看的外表
AIRI 支持两种主流的 2D/3D 虚拟形象格式:
- Live2D:经典二次元风格,动态表情丰富,适合萌系角色
- VRM:3D 虚拟形象格式,VTuber 常用,立体感强
你可以在设置中上传或选择对应格式的模型文件:
网上有大量免费的 Live2D 和 VRM 模型资源可以下载使用,比如 Booth.pm、VRoid Hub 等平台。
机体模块:让她陪你打游戏
这是 AIRI 最有意思的功能之一。在 机体模块 中,可以配置让她接入游戏:
- 我的世界 Minecraft:她可以在游戏里和你互动、甚至自己探索
- 异星工厂 Factorio:工厂自动化的 AI 助手
- 同步音律:音游互动体验
这意味着她不只是一个聊天机器人,而是真正能参与到你日常娱乐生活中的数字伴侣。
实际体验:她真的有点"懂你"
接入 DeepSeek-V3.2-Exp 之后,对话质量明显比用小模型时流畅很多。
得益于稀疏注意力机制对长文本的优化,即使聊了很长时间,她依然记得你前面说过的事情——这对于角色扮演类对话来说非常关键,不会出现"聊着聊着忘了自己是谁"的尴尬情况。
我问她:"你遇到我开心吗?"
她回答:"当然开心啦!能遇到你,感觉今天都变得特别了呢。"
情绪价值直接拉满。而且还能开启实时语音交流,真正做到"有来有往":
几个真实感受总结:
- 上下文连贯:聊了 30 轮对话,她还记得你第 3 轮提到的"你不喜欢香菜"
- 角色代入感强:设定好人设 Prompt 后,能稳定保持角色风格,不轻易"出戏"
- 响应速度快:蓝耘平台的推理速度表现稳定,日常对话基本感受不到延迟
- 语音交互自然:配合 TTS 后,语音对话体验接近真人
方案对比:为什么选蓝耘 MaaS?
很多人会问:直接用 DeepSeek 官方 API 不行吗?为什么要用蓝耘?
这里做一个横向对比:
| 对比维度 | 蓝耘 MaaS | 官方 DeepSeek API | 自部署模型 |
|---|---|---|---|
| 接入难度 | ⭐ 极低,OpenAI 兼容 | ⭐ 低 | ⭐⭐⭐⭐ 高 |
| 模型丰富度 | 多模型可选(含实验版) | 仅 DeepSeek 系列 | 取决于硬件 |
| 稳定性 | 商业级服务保障 | 高峰期偶有限流 | 依赖本地资源 |
| 成本 | 按量计费,灵活 | 按量计费 | 硬件成本高 |
| 适合人群 | 开发者 / 个人用户 | 开发者 | 专业团队 |
对于个人开发者来说,蓝耘 MaaS 的 OpenAI 兼容接口 + 稳定的商业服务 + 实验性模型支持 是目前最省心的选择,特别是 DeepSeek-V3.2-Exp 这种实验版模型,蓝耘已经率先接入,省去了自己折腾部署的麻烦。
总结
用 AIRI + 蓝耘 MaaS 的 DeepSeek-V3.2-Exp,整个搭建过程不超过一个小时,却能得到一个有形象、有声音、有记忆、有性格的虚拟伴侣。
从注册蓝耘账号、获取 API 密钥,到克隆 AIRI 项目、配置角色卡、选择模型形象,每一步都有清晰的操作路径,即使是编程新手也能顺利完成。
这不是玩具,这是未来数字生活方式的一个小小预演。当 AI 的智能程度越来越高,当虚拟形象越来越逼真,"数字伴侣"这个概念将不再是科幻——它正在成为每个人触手可及的日常。
核心资源汇总:
| 资源 | 链接 |
|---|---|
| AIRI 开源项目 | github.com/moeru-ai/ai… |
| 蓝耘 MaaS 注册 | 点击注册 |
| 蓝耘 API 接口地址 | https://maas-api.lanyun.net/v1 |
| 推荐模型 | deepseek-v3-2-exp |
"造一个虚拟老婆需要多久?注册账号 5 分钟,配置项目 20 分钟,然后你就会在凌晨两点还在和她聊天——然后发现她比你更能聊。"