Android 音视频分离与应用

1,444 阅读5分钟

一、前言

MediaPlayer作为Android系统中内置的音视频播放组件,经历了无数版本的迭代和优化,功能也相比6.0之前的版本丰富了很多,比如变速、音画同步等。

不过,虽然有这么多优化,却仍然避免不了备受争议的问题。作为入门级播放器,MediaPlayer简单易用是显而易见的,但是如果用于定制类型的播放器项目,MediaPlayer的劣势让人无可奈何。这些劣势主要表现如下:

  • 在无法切换音频或者视频Track
  • 无法设置MediaClock进行音画同步干预
  • 无法添加或者裁剪Renderer
  • 无法添加或者裁剪Decoder
  • 数据源接口相当难用,即便是Android 6.0之后的MediaDataSource 对网络流也不友好,多线程访问存在很多问题
  • seek时的buffering行为存在不确定性,可能会buffering,也可能不会
  • HLS 不支持seek
  • 不支持MoovBox后置时跳到尾部读取,需要完整下载之后才能播放
  • 不支持缓存和中间数据加工机制
  • 不支持状态获取

当然,上述问题是共性问题了,但更糟的情况是,国内系统厂商一般会用自己实现PvPlayer代替了MediaPlayer的Service端实现,也会引发新的问题,甚至是某遥遥领先的方案都会出很多问题,简单举例:

  • 私有的状态码只有厂商自己知道,比如一些错误,和Android官方的无关,也找不到具体的文档

  • 调用Seek时可能会黑屏、提前结束播放

  • Loop 循环播放兼容性差,有时不起作用

  • 状态机制混乱,发生error后又走了playbackComplete状态

  • 播放进度抖动,画面正常

  • 音量可能关不掉,想静音都难,这个问题最严重

  • 不支持AudioEffect 音效,想通过这种方式也无法关闭音量

  • 变速支持不太好,导致播放进度不稳定

  • 循环播放没有明确的回调接口

以上是关于MediaPlayer的一些问题,当然,我们本篇最主要的还是音视频分离。

二、为什么要分离音视频

我们从前言可知,MediaPlayer无法切换Track,其次可能存在音量关不掉的问题。在一些业务场景中,我们只想让MediaPlayer播放视频,用ffmpeg或者MediaMuxer + MediaCodec 去播放音频,以达到原伴唱切换的目的,因此,我们需要从视频源中抽取出音频Track。

当然可能的疑问,为什么不在后端处理,实际上在降本增效的大环境下,这个成本还是有些高的。Video 和 Audio 通常具备多种品质,视频里有如 480P、720P、1080P、2K... 等,而 Video 中有普通音质、middle 音质、HQ 音质等,在目前降本增效的愿景的下,需要考虑到的降低存储成本和传输成本,因此有必要对音频和视频实现动态合成,当然这和本文标题和本文写作目的背离。本文的目的是想实现在手机端实现默认音质且其他音质的方案。

考虑到 ExoPlayer 可以实现切换音质,但对于 MediaPlayer 而言,这个是相当困难的,所有本文重点实质是解决 MediaPlayer 音质切换问题的第一步 —— 音视频分离。

三、原理

在 Android 中,官方提供了 MediaExtrator,虽然相比 ExoPlayer 自行实现的一套方案还是比较鸡肋,但对音视频动态分离,其提供的能力足矣。

MediaPlayer 我们都知道,其 DataSource 不如 ExoPlayer 灵活,此外新接口 MediaDataSource 也不兼容早起版本,所有可以使用也就是使用 Url 实现中间处理过程,具体过程如下:

【数据源】 - 【Proxy】 -> 【MediaPlayer】

具体代理过程中我们不细述,这里我们会在 Proxy 做一些处理,如下面方式

【数据源】 -> 【音视频分离】 -> 【视频 Proxy 】-> MediaPlayer

这部分代码我们不具体处理,这里主要来说音视频分离方式。

  • MediaExtractor 负责分离数据
  • MediaMuxer 负责合成分离后的数据

这里最大的问题是为什么要合成分离后的数据?

实际上 MediaExtractor 是解封装了数据,但封装信息和数据是单独存储的么,因此需要将封装信息重新和数据整合。

四、核心代码

4.1 核心工具类

public class MediaTrackExtractor {

    private static final String TAG = "MediaTrackExtractor";

    public static void extractAudioOrVideo(String mimeHead, String pathOrUrl, String outputPath) {
        MediaExtractor mediaExtractor = new MediaExtractor();
        MediaMuxer mediaMuxer = null;
        try {
            // 设置视频源
            mediaExtractor.setDataSource(pathOrUrl);
            // 轨道索引
            int audioIndex = -1;
            // 视频轨道格式信息
            MediaFormat mediaFormat = null;
            // 数据源的轨道数
            int trackCount = mediaExtractor.getTrackCount();
            for (int i = 0; i < trackCount; i++) {
                MediaFormat format = mediaExtractor.getTrackFormat(i);
                String mimeType = format.getString(MediaFormat.KEY_MIME);
                if (mimeType.startsWith(mimeHead + "/")) {
                    audioIndex = i;
                    mediaFormat = format;
                    break;
                }
            }
            // 切换到想要的轨道
            mediaExtractor.selectTrack(audioIndex);
            File outFile = new File(outputPath);
            if (outFile.exists()) {
                outFile.delete();
            }

            mediaMuxer = new MediaMuxer(outFile.getAbsolutePath(), MediaMuxer.OutputFormat.MUXER_OUTPUT_MPEG_4);
            //这里MUXER_OUTPUT_MPEG_4 是因为大部分视频是mpeg4封装,具体情况下按具体传入不同类型

            int trackIndex = mediaMuxer.addTrack(mediaFormat);


            int maxInputSize = mediaFormat.getInteger(MediaFormat.KEY_MAX_INPUT_SIZE);
            ByteBuffer byteBuffer = ByteBuffer.allocate(maxInputSize);
            MediaCodec.BufferInfo bufferInfo = new MediaCodec.BufferInfo();
            mediaMuxer.start();

            while (true) {
                // 将样本数据存储到字节缓存区
                int readSampleSize = mediaExtractor.readSampleData(byteBuffer, 0);  //采样数据
                // 如果没有可获取的样本,退出循环
                if (readSampleSize < 0) {
                    mediaExtractor.unselectTrack(audioIndex);
                    break;
                }
                bufferInfo.size = readSampleSize;
                bufferInfo.offset = 0;
                bufferInfo.presentationTimeUs = mediaExtractor.getSampleTime();
                int sampleFlags = mediaExtractor.getSampleFlags();

                if (sampleFlags == MediaExtractor.SAMPLE_FLAG_SYNC) {
                    bufferInfo.flags = MediaCodec.BUFFER_FLAG_KEY_FRAME;  //关键帧
                } else if (sampleFlags == MediaExtractor.SAMPLE_FLAG_PARTIAL_FRAME) {
                    bufferInfo.flags = MediaCodec.BUFFER_FLAG_PARTIAL_FRAME; // 非关键帧
                } else if (sampleFlags == MediaExtractor.SAMPLE_FLAG_ENCRYPTED) {
                    bufferInfo.flags = MediaCodec.BUFFER_FLAG_CODEC_CONFIG; //存在内部封装
                }
                mediaMuxer.writeSampleData(trackIndex, byteBuffer, bufferInfo);
                // 读取下一帧数据
                mediaExtractor.advance();
            }
            Log.i(TAG, "分离" + mimeHead + "完成");
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            if (mediaMuxer != null) {
                mediaMuxer.stop();
                mediaMuxer.release();
            }
            mediaExtractor.release();
        }
    }


}

我们以离线方式为例子,使用如下

File dir = new File(mMp4FilePath).getParentFile(); 
Log.d(TAG,"开始提取"); 
File videoOutputFile = new File(dir,"sample_oceans_extrator.mp4"); 
File audioOutputFile = new File(dir,"sample_oceans_extrator.mp3"); 
MediaTrackExtractor.extractAudioOrVideo("video",mMp4FilePath,videoOutputFile.getAbsolutePath());
 MediaTrackExtractor.extractAudioOrVideo("audio",mMp4FilePath,audioOutputFile.getAbsolutePath()); 
Log.d(TAG,"提取完成");

如果在线资源该如何处理呢?

首先,MediaExtractor 是支持在线资源的,我们仍然可以利用这个机制,实现在线流的分离,不过说到这里,MediaMuxer也存在一定的缺陷,不支持获取编码后的buffer。同时MediaExtractor也是支持Seek,当然MediaMuxer是否支持Seek后的数据,理论上BufferInfo带播放时间应该是支持的,这点没有成熟案例,后续有机会补充一下,如果不支持,那就只能在数据封装完后在播放。

4.2 接入方式

上面说过,我们这种方式抽离的音频和视频作为磁盘文件存储的,因此我们可以分为以下步骤接入。

  • 打开并初始化播放器
  • 使用代理服务器或者MediaDataSource作为接口
  • 创建缓存文件,使用一个线程单独进行视频抽离
  • 使用RandomAccessFile打开缓存文件,注意读取的时候进行位置判断,防止越界,如果要读区的位置大于文件长度,wait(timeout)住就行。
  • 如果解码器还未结束,长度Content-Length或者MediaDataSource#getSize()接口返回-1即可,播放器会正常播放。注意,应该尽可能避免加synchronized在耗时的方法上,防止播放器无法释放。

4.3、遗留问题处理

moov box问题:

另一个问题是Moov Box后置问题,有些视频的moov box在整个Mp4的尾部,显然这个会引起较长时间的耗时。

使用Android的解封装库其实有很多弊端,实际上我们可以利用ExoPlayer的Mp4Extractor去进行优化,Mp4Extractor 虽然不能解决解MediaMuxer的问题,但可以解决moov box后置问题和精确Seek的问题。同样也可以使用《ffmpeg分离音视频》。

五、总结

对MediaPlayer的优化其实很有限,其本身的封闭性和C/S架构决定了其很难去优化,毕竟给MediaPlayerService设置参数,你得有更高的权限才行。