如何实现在直播中播放音频文件

581 阅读6分钟

在我们看直播的时候,经常会在直播过程中听到有掌声、口哨声、背景音乐等音效,那么这些声音特效是如何实现的呢大家有没有想过?anyRTC下面就为大家简单介绍一下如何实现在直播过程中播放音频文件。

功能描述

在通话或者直播的过程中,除了用户端自己说话的声音之外,有时候还需要播放一些特定的音频文件或者背景音乐让频道内的其他用户也可以听到。比如说给游戏添加音效,或者在直播的时候播放一些背景音乐等。为此anyRTC提供了以下两种方法满足用户播放音效和其他音频文件的需求。

如何播放音效文件

音效就是指由声音所制造的效果,是指为增进一场面之真实感、气氛或戏剧讯息,而加于声带上的杂音或声音。所谓的声音则包括了乐音和效果音。包括数字音效、环境音效、MP3音效(普通音效、专业音效)。简单来说音效就是持续很短时间的音频。播放音效文件方法主要用来播放短小的氛围音,比如鼓掌、刀剑等武器之间的撞击声音等,可以多个音效叠加播放,且音效文件可以预加载以提高性能。anyRTC SDK 提供 IAudioEffectManager 类统一管理音效,包含一些管理音效的常用方法。 音效由音频文件路径指定,但在 IAudioEffectManager 内部使用 sound id 来识别和处理音效。音效文件通常保存在 assets 文件夹下;SDK 并不强制如何定义 sound id,保证每个音效有唯一的识别即可。一般的做法有自增 id,使用音效文件名的 hashCode 等。

实现方法

参考如下步骤,在你的项目中实现播放音效文件:

  1. 在加入频道前调用 getAudioEffectManager 方法获取音效管理类 IAudioEffectManager。
  2. 调用 preloadEffect 方法预加载音效文件,可以多次调用该方法加载多个音效文件。
  3. 加入频道后调用 playEffect 方法播放音效文件,可以多次调用该方法同时播放多个音效。我们建议最多同时播放三个音效文件。

管理音效的方法需通过 IAudioEffectManager 接口类调用。

示例代码

// 首先获取全局的音效管理类
IAudioEffectManager manager = rtcEngine.getAudioEffectManager();

// 预加载音效(推荐),需注意音效文件的大小,并在加入频道前完成加载
// 仅支持 mp3,aac,m4a,3gp,wav格式
// 开发者可能需要额外记录 id 与文件路径的关联关系,用来播放和停止音效
int id = 0;
manager.preloadEffect(id++, "path/to/effect1");

// 可以加载多个音效
manager.preloadEffect(id++, "path/to/effect2");

// 播放一个音效
manager.playEffect(
0,                         // 要播放的音效 id 
"path/to/effect1",         // 播放文件的路径
-1,                        // 播放次数,-1 代表无限循环
0.0,                       // 改变音效的空间位置,0表示正前方
100,                       // 音量,取值 0 ~ 100, 100 代表原始音量
true                       // 是否令远端也能听到音效的声音
 );

// 暂停所有音效播放
manager.pauseAllEffects();

// 获取音效的音量,范围为 0 ~ 100
double volume = manager.getEffectsVolume();

// 保证音效音量在原始音量的 80% 以上
volume = volume < 80 ? 80 : volume;
manager.setEffectsVolume(volume);

// 继续播放暂停的音效
manager.resumeAllEffects();

// 停止所有音效
manager.stopAllEffects();

// 释放预加载的音效
manager.unloadAllEffects();

注意事项

1、预加载不是一个必须的步骤,一般来说为了提高性能或者需要反复播放某个特定的音效的时候,我们建议使用预加载。但如果音效文件比较大,不建议预加载。

2、以上方法都有返回值,返回值小于 0 表示方法调用失败。

如何实现音乐混音

混音是音乐制作中的一个步骤,是把多种来源的声音,整合至一个立体音轨或单音音轨中。这些混合声音信号,来源可能分别来自不同的乐器、人声或管弦乐,收录自现场演奏或录音室内。在混音的过程中,混音师会将每一个原始信号的频率、动态、音质、定位、残响和声场单独进行调整,让各音轨最佳化,之后再叠加于最终成品上。这种处理方式,能制作出一般听众在现场录音时不能听到之层次分明的完美效果。

在音视频通话直播场景下,混音是指播放本地或者在线音乐文件,同时让频道内的其他人听到此音乐。混音方法主要用来播放比较长的背景音,比如直播的时候播放的音乐,同时只可以有一个文件播放。如果在混音播放第一个文件的过程中播放第二个文件,会自动停止第一个文件的播放。

anyRTC混音功能如下:

  • 混音或替换: 混音指的是音乐文件的音频流跟麦克风采集的音频流进行混音(叠加)并编码发送给对方;替换指的是麦克风采集的音频被音乐文件的音频流替换掉,对方只能听见音乐播放。
  • 循环:可以设置是否循环播放混音文件,以及循环次数。
  • 调节音量:可以同时或分别调节音乐文件在本地和远端的播放音量。
  • 调节音调:可以分别调节本地人声的音调和音乐文件的音调。

实现方法

示例代码

// 混音设置
int loopCount = -1; //无限循环播放混音文件;设置为正整数表示混音文件播放的次数
boolean loopback = false; ////文件音频流是否发送给对端;如果设置为 true,文件音频流仅在本地可以听见,不会发送到对端
boolean cycle = false; //不替换麦克风采集的音频

// 开始播放混音
rtcEngine.startAudioMixing("path/to/music", loopback, replace, cycle);

// 将本地和远端音乐文件播放音量调节为原始音量的 50%
int volume = 50;
rtcEngine.adjustAudioMixingVolume(volume);

// 将本地人声的音调设为 1.5
double pitch = 1.5;
rtcEngine.setLocalVoicePitch(pitch);

// 将本地音乐文件的音调升 10 个半音。
int pitch = 10;
rtcEngine.setAudioMixingPitch(pitch);

// 获取当前播放的混音音乐的时长
int duration = rtcEngine.getAudioMixingDuration();
// duration 可以用来设置播放进度条的最大进度等
// seekBar.setMax(duration);

// 获取当前混音的播放进度
int currentPosition = rtcEngine.getAudioMixingCurrentPosition();
// 可以设置 timer 定时获取播放进度,用来显示播放进度
// seekBar.setProgress(currentPosition);

// 若用户拖动了进度条,可以在 seekBar 的回调中获取 progress 并重设音乐当前播放的位置
rtcEngine.setAudioMixingPosition(progress);

// 暂停、恢复混音文件播放
rtcEngine.pauseAudioMixing();
rtcEngine.resumeAudioMixing();

// 停止播放混音文件,麦克风采集播放恢复
rtcEngine.stopAudioMixing();

总结

在娱乐行业高速发展的今天,视频通话、直播等行业已经发展的相对完善。如何让用户能有更好的体验,更深层次的感受是值得我们思考的。像播放音频文件这种小小的功能看似不起眼实际上对于直播场景来说是非常重要的,因为他可以让用户更能感受到直播的氛围,主播也能更好的展现节目效果。适当的播放一些音效和背景音乐可以让用户有一种身临其境的感觉,极大的提升用户的体验感。同样的在线上教育行业下,老师在与学生上课的时候,特别是和小朋友上课的时候,适当的掌声、喝彩声等音效可以让小朋友更能专注在课堂上保证课程效果。