Suno 语音克隆 API 集成指南

2 阅读3分钟

在当今音频生成领域,Suno 提供了一种强大的语音克隆解决方案,允许我们根据任意音频文件创建自定义语音角色。这一功能特别适合音乐生成,尤其是当我们需要将特定的声音融入到音乐作品中时。与传统的 Persona API(使用 Suno 生成的 audio_id)不同,这个 API 接受一个公开可访问的 audio_url,即我们的个人语音录音。本文将详细介绍如何集成这个语音克隆 API。

第一步:创建语音角色

使用该 API,我们需要提供三个输入参数:audio_url(必填),这是一个公开可访问的 MP3 或 WAV 文件的 URL,文件应包含清晰的单一声音;namedescription(可选),用于指定语音角色的名称和描述。

音频文件要求:

  • 格式:MP3 或 WAV
  • 时长:至少 10 秒
  • 内容:单一清晰的声音,背景噪音或音乐应尽量少

以下是创建语音角色的示例代码:

curl -X POST 'https://api.acedata.cloud/suno/voices' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "audio_url": "http://cos.aitutu.cc/mp4/ru-user-voice.mp3",
  "name": "RU User Voice Test",
  "description": "User voice recording example"
}'

成功响应示例:

{
  "success": true,
  "task_id": "b9150e51-d87c-4556-a55e-100947a63bdf",
  "data": {
    "persona_id": "e95013f8-eaee-4741-a42f-1d559a9d0b2b",
    "name": "RU User Voice Test",
    "is_public": false
  }
}

在响应中,persona_id 字段是创建的语音角色的 ID。请注意,is_public 字段始终为 false,因为通过上传音频创建的语音角色是私有的。

第二步:使用语音角色生成音乐

一旦你拥有了语音角色 ID,就可以使用 Suno 音频生成 API 来生成音乐。将 action 设置为 generate,并将 persona_id 设置为之前返回的语音角色 ID。生成的歌曲将使用克隆的声音进行演唱。

注意: 语音克隆仅支持模型 chirp-v4-5 及以上版本(如 chirp-v4-5chirp-v5chirp-v5-5),不支持 chirp-v4

以下是生成音乐的示例代码:

curl -X POST 'https://api.acedata.cloud/suno/audios' \
-H 'accept: application/json' \
-H 'authorization: Bearer {token}' \
-H 'content-type: application/json' \
-d '{
  "action": "generate",
  "model": "chirp-v5-5",
  "prompt": "A warm synth-pop song about city nights",
  "persona_id": "e95013f8-eaee-4741-a42f-1d559a9d0b2b"
}'

成功响应示例:

{
  "success": true,
  "task_id": "53d8a334-a972-43c5-895e-60c4454e88d5",
  "data": [
    {
      "id": "16463960-077c-4700-bbb3-3c7897b943d3",
      "title": "Soft Neon on My Skin",
      "audio_url": "https://cdn1.suno.ai/16463960-077c-4700-bbb3-3c7897b943d3.mp3",
      "image_url": "https://cdn2.suno.ai/image_16463960-077c-4700-bbb3-3c7897b943d3.jpeg",
      "model": "chirp-v5-5",
      "state": "succeeded",
      "prompt": "A warm synth-pop song about city nights",
      "duration": 156.28
    }
  ]
}

在这个响应中,生成的歌曲将使用克隆的声音进行演唱。你还可以使用 cover 动作让克隆的声音演唱现有歌曲。

总结

通过上述步骤,我们可以轻松地使用 Suno 语音克隆 API 创建个性化的语音角色,并利用这些角色生成音乐。这不仅为音乐创作提供了更多可能性,也为开发者在音频处理领域提供了新的工具。想要深入了解更多信息,可以访问 Ace Data Cloud 或其 API 文档

技术标签:#语音克隆 #音频生成 #API集成