【项目复现上新】多模态AI数字人上线，Linly-Talker让你与苏东坡面对面！【项目复现上新】多模态AI数字人上线，

【项目复现上新】多模态AI数字人上线，Linly-Talker让你与苏东坡面对面！

“讲《赤壁赋》时，我拿着图片反复讲解，学生们却还是眼神涣散；想和同好聊聊苏东坡的豁达人生，翻遍典籍也找不到‘实时回应’的共鸣。”你是否也有过这样的遗憾？

之前我们通过LLaMA Factory微调实战，打造了能以苏东坡口吻对话的角色。

这次基于Linly-Talker开源项目，我们打造了多模态苏东坡数字人，实现了“视频通话”。只需打开网页，就能与这位宋代文豪畅谈诗词、共话生活、探讨哲理。除了以上两个项目，Lab4AI大模型实验室项目复现板块还上架了许多热门案例，新用户注册，领取 6.5h H800GPU 体验时长，体验大模型训练、微调与推理。

✅扫码立即领取~

Lab4AI 二维码

Linly-Talker开源项目

传统的苏东坡了解方式，总绕不开“被动接收”的局限；而多模态数字人的出现，彻底重构了人与历史人物的互动逻辑。

这款数字人系统基于社区明星开源项目Linly-Talker打造，融合了大型语言模型（LLM）、语音识别（ASR）、语音合成（TTS）及语音克隆等前沿AI技术。通过Gradio Web页面，你只需上传苏东坡的人物图片，就能开启沉浸式对话，让传统文化从“纸面上”走到“互动中”。

GitHub地址

github.com/Kedreamix/L…

开源项目Linly-Talker的核心特点包括：

多模型集成：Linly-Talker整合了Linly、GeminiPro、Qwen等大模型，以及Whisper、SadTalker等视觉模型，实现了高质量的对话和视觉生成。
多轮对话能力：通过GPT模型的多轮对话系统，Linly-Talker能够理解并维持上下文相关的连贯对话，极大地提升了交互的真实感。
语音克隆：利用GPT-SoVITS等技术，用户可以上传一分钟的语音样本进行微调，系统将克隆用户的声音，使得数字人能够以用户的声音进行对话。
实时互动：系统支持实时语音识别和视频字幕，使得用户可以通过语音与数字人进行自然的交流。
视觉增强：通过数字人生成等技术，Linly-Talker能够生成逼真的数字人形象，提供更加沉浸式的体验。出现，彻底重构了人与历史人物的互动逻辑。