玩转 MCP ｜一文教你用 Trae 实现音频和视频创作🧣⭐️⭐️⭐️⭐️⭐️我正在参加Trae「超级体验官」创意实践

⭐️⭐️⭐️⭐️⭐️我正在参加Trae「超级体验官」创意实践征文，本文所使用的 Trae 免费下载链接：[www.trae.com.cn/?utm_source…]

ChatGPT_Image_2025年5月19日_00_31_44.png

玩转 MCP ｜一文教你用 Trae 实现音频和视频创作🧣

上一期，官方介绍了如何通过使用 MCP Server - Playwright 实现网页自动化测试，大幅提升测试效率！还没看过的小伙伴可以戳这里补课哦👉（玩转 MCP 第二弹），下面我来介绍一下 MiniMax 这一 MCP Server。

在多媒体内容创作领域，AI 生成的音频和视频正成为提升创作效率的新利器。MiniMax 凭借其强大的多模态生成能力，提供了从文本到语音、从文本到视频的全套解决方案。本期「玩转 MCP 」将详细介绍如何在 Trae IDE 中集成 MiniMax 这一 MCP Server，构建智能媒体创作工作流，帮助你快速生成高质量的音频和视频内容！

让我们开始吧！

效果展示

以下为部分使用 Trae IDE 生成音频和视频的效果展示：

网站体验地址：一文教你用 Trae 实现音频和视频创作🧣

播客音频分享：玩转 MCP ｜一文教你用 Trae 实现音频和视频创作🧣

screencapture-127-0-0-1-5500-index-html-2025-05-18-23_23_37.png

文本转语音

基础语音合成：将输入文本转换为自然流畅的语音
多音色选择：支持男声、女声、儿童音等多种音色
情感控制：可生成快乐、悲伤、愤怒等不同情感的语音

语音克隆

个性化语音：基于少量样本克隆特定音色
语音定制：创建专属品牌语音或个性化助手声音

文本转视频

动态视频生成：根据文本描述生成短视频
导演模式：通过指令控制镜头运动（推拉、平移等）
多风格支持：生成写实、卡通、电影等不同风格的视频

操作步骤

跟随教程，在项目中集成 MCP Server - MiniMax，配置智能体，然后使用指令来创作音频和视频内容。

第一步：安装 Trae IDE

前往 Trae CN 官网，下载 Trae IDE 的安装包并安装。

第二步：添加 MiniMax MCP Server

打开 Trae IDE
在 AI 对话框右上角点击"设置"图标，选择"MCP"

截屏2025-05-18 下午10.53.44.png

点击"+ 添加 MCP Servers"按钮
搜索"MiniMax"并点击添加（需要自己添加）

  "mcpServers": {
    "MiniMax": {
      "command": "uvx",
      "args": [
        "minimax-mcp"
      ],
      "env": {
        "MINIMAX_API_KEY": "自己的秘钥",
        "MINIMAX_MCP_BASE_PATH": "/Users/姓名/Desktop",
        "MINIMAX_API_HOST": "https://api.minimax.chat",
        "MINIMAX_API_RESOURCE_MODE": "url"
      }
    }
  }
}

配置 API 密钥（需提前在 MiniMax 平台申请）

截屏2025-05-18 下午9.49.59.png

第三步：创建媒体创作智能体

在"智能体"页签点击"+ 创建智能体"

截屏2025-05-18 下午10.53.31.png

配置智能体：

名称：媒体创作助手
提示词："你是一个专业的媒体创作助手，精通音频和视频生成技术"
工具：勾选 MiniMax 和文件系统

点击"创建"按钮

第四步：开始创作

简单网页制作

# 示例指令
生成一个简单网页，内容为"欢迎使用Trae IDE进行智能开发"，然后通过MCP的能力将内容朗读出来，再生成对应的画面图片，最后再生成视频片段。音频、图片、视频都放到网页上。

 **网页色调美化**：
 使用logo的色调，完成网页的美化。

- 使用 HTML5、TailwindCSS 3.0+（通过CDN引入）和必要的 JavaScript。

- 使用专业图标库如 Font Awesome 或 Material Icons（通过CDN引入）。

- 若需数据展示，引用在线的图表组件，样式跟主题一致。

  **网页外观布局**：

- 超大字体或数字突出核心要点，与小元素的详细描述的比例形成反差。

- 运用高亮透明色渐变制造科技感，画面必须有高饱和的色彩组合，不超过3种，需有单色渐变。

- 页脚信息需带上创作者信息：@XiaoChen，和引用来源。

文本转语音

# 示例指令
生成一段语音，内容为"欢迎使用Trae IDE进行智能开发"，使用女声音色，语速中等，情感为愉快

语音克隆

# 示例指令
基于提供的音频样本(路径：/samples/voice.mp3)克隆语音，并生成"你好，欢迎使用Trae IDE进行智能开发"的语音

文本转视频

# 示例指令
生成一个5秒的视频，描述为"日出时分的海滩，海浪轻轻拍打岸边"，使用电影风格，镜头缓慢拉远

参考信息：MiniMax 支持的能力

MiniMax MCP Server 支持的多媒体创作能力如下：

API 方法	能力描述
text_to_audio	将文本转换为自然语音
voice_clone	克隆特定音色生成语音
generate_video	根据文本提示生成视频
query_video_generation	查询视频生成状态
text_to_image	根据文本生成静态图像
list_voices	获取可用音色列表

高级参数配置

语音生成参数

voice_id: 指定音色类型
speed: 控制语速 (0.5-2.0)
emotion: 设置情感类型
sample_rate: 音频采样率

视频生成参数

model: 选择视频生成模型
aspect_ratio: 设置画面比例
first_frame_image: 首帧图像控制
async_mode: 异步生成模式

最佳实践建议

1. 批量生成：对长文本分段处理，再合并音频

2. 质量控制：通过调整temperature参数控制生成稳定性

3. 成本优化：对测试内容使用低分辨率/短时长版本

4. 工作流整合：将生成的媒体文件自动存入项目目录

现在，你已经掌握了使用 Trae IDE 和 MiniMax MCP Server 进行智能媒体创作的全部技巧！快来尝试为你的项目添加生动的多媒体元素吧！