玩转 MCP |一文教你用 Trae 实现音频和视频创作🧣

992 阅读5分钟

⭐️⭐️⭐️⭐️⭐️我正在参加Trae「超级体验官」创意实践征文,本文所使用的 Trae 免费下载链接:[www.trae.com.cn/?utm_source…]

ChatGPT_Image_2025年5月19日_00_31_44.png

玩转 MCP |一文教你用 Trae 实现音频和视频创作🧣

上一期,官方介绍了如何通过使用 MCP Server - Playwright 实现网页自动化测试,大幅提升测试效率!还没看过的小伙伴可以戳这里补课哦👉(玩转 MCP 第二弹),下面我来介绍一下 MiniMax 这一 MCP Server。

在多媒体内容创作领域,AI 生成的音频和视频正成为提升创作效率的新利器。MiniMax 凭借其强大的多模态生成能力,提供了从文本到语音、从文本到视频的全套解决方案。本期「玩转 MCP 」将详细介绍如何在 Trae IDE 中集成 MiniMax 这一 MCP Server,构建智能媒体创作工作流,帮助你快速生成高质量的音频和视频内容!

让我们开始吧!

效果展示

以下为部分使用 Trae IDE 生成音频和视频的效果展示:

75.gif

网站体验地址一文教你用 Trae 实现音频和视频创作🧣

播客音频分享玩转 MCP |一文教你用 Trae 实现音频和视频创作🧣

screencapture-127-0-0-1-5500-index-html-2025-05-18-23_23_37.png

文本转语音

  • 基础语音合成:将输入文本转换为自然流畅的语音

  • 多音色选择:支持男声、女声、儿童音等多种音色

  • 情感控制:可生成快乐、悲伤、愤怒等不同情感的语音

语音克隆

  • 个性化语音:基于少量样本克隆特定音色

  • 语音定制:创建专属品牌语音或个性化助手声音

文本转视频

  • 动态视频生成:根据文本描述生成短视频

  • 导演模式:通过指令控制镜头运动(推拉、平移等)

  • 多风格支持:生成写实、卡通、电影等不同风格的视频

操作步骤

跟随教程,在项目中集成 MCP Server - MiniMax,配置智能体,然后使用指令来创作音频和视频内容。

第一步:安装 Trae IDE

前往 Trae CN 官网,下载 Trae IDE 的安装包并安装。

第二步:添加 MiniMax MCP Server

  1. 打开 Trae IDE

  2. 在 AI 对话框右上角点击"设置"图标,选择"MCP"

截屏2025-05-18 下午10.53.44.png

  1. 点击"+ 添加 MCP Servers"按钮

  2. 搜索"MiniMax"并点击添加(需要自己添加)

  "mcpServers": {
    "MiniMax": {
      "command": "uvx",
      "args": [
        "minimax-mcp"
      ],
      "env": {
        "MINIMAX_API_KEY": "自己的秘钥",
        "MINIMAX_MCP_BASE_PATH": "/Users/姓名/Desktop",
        "MINIMAX_API_HOST": "https://api.minimax.chat",
        "MINIMAX_API_RESOURCE_MODE": "url"
      }
    }
  }
}
  1. 配置 API 密钥(需提前在 MiniMax 平台申请)

截屏2025-05-18 下午9.49.59.png

第三步:创建媒体创作智能体

  1. 在"智能体"页签点击"+ 创建智能体"

截屏2025-05-18 下午10.53.31.png

  1. 配置智能体:
  • 名称:媒体创作助手

  • 提示词:"你是一个专业的媒体创作助手,精通音频和视频生成技术"

  • 工具:勾选 MiniMax 和文件系统

  1. 点击"创建"按钮

第四步:开始创作

简单网页制作

# 示例指令
生成一个简单网页,内容为"欢迎使用Trae IDE进行智能开发",然后通过MCP的能力将内容朗读出来,再生成对应的画面图片,最后再生成视频片段。音频、图片、视频都放到网页上。

 **网页色调美化**:
 使用logo的色调,完成网页的美化。

- 使用 HTML5、TailwindCSS 3.0+(通过CDN引入)和必要的 JavaScript。

- 使用专业图标库如 Font Awesome 或 Material Icons(通过CDN引入)。

- 若需数据展示,引用在线的图表组件,样式跟主题一致。

  **网页外观布局**- 超大字体或数字突出核心要点,与小元素的详细描述的比例形成反差。

- 运用高亮透明色渐变制造科技感,画面必须有高饱和的色彩组合,不超过3种,需有单色渐变。

- 页脚信息需带上创作者信息:@XiaoChen,和引用来源。

文本转语音

# 示例指令
生成一段语音,内容为"欢迎使用Trae IDE进行智能开发",使用女声音色,语速中等,情感为愉快

语音克隆

# 示例指令
基于提供的音频样本(路径:/samples/voice.mp3)克隆语音,并生成"你好,欢迎使用Trae IDE进行智能开发"的语音

文本转视频

# 示例指令
生成一个5秒的视频,描述为"日出时分的海滩,海浪轻轻拍打岸边",使用电影风格,镜头缓慢拉远

参考信息:MiniMax 支持的能力

MiniMax MCP Server 支持的多媒体创作能力如下:

API 方法能力描述
text_to_audio将文本转换为自然语音
voice_clone克隆特定音色生成语音
generate_video根据文本提示生成视频
query_video_generation查询视频生成状态
text_to_image根据文本生成静态图像
list_voices获取可用音色列表

高级参数配置

语音生成参数

  • voice_id: 指定音色类型

  • speed: 控制语速 (0.5-2.0)

  • emotion: 设置情感类型

  • sample_rate: 音频采样率

视频生成参数

  • model: 选择视频生成模型

  • aspect_ratio: 设置画面比例

  • first_frame_image: 首帧图像控制

  • async_mode: 异步生成模式

最佳实践建议

1. 批量生成:对长文本分段处理,再合并音频

2. 质量控制:通过调整temperature参数控制生成稳定性

3. 成本优化:对测试内容使用低分辨率/短时长版本

4. 工作流整合:将生成的媒体文件自动存入项目目录

现在,你已经掌握了使用 Trae IDE 和 MiniMax MCP Server 进行智能媒体创作的全部技巧!快来尝试为你的项目添加生动的多媒体元素吧!