一、前言
Android项目常见的轻量级存储一般使用的是SharedPreferences,虽然 SP 兼容性极好, 但其低性能一直被诟病,线上也常出现一些SP导致的ANR。
腾讯的开源框架MMKV能完美解决SP现有缺点并保持原有的优点。MMKV是基于 mmap 内存映射+ protobuf 序列化两者优势于一体的框架,其具有更高性能高,更强的稳定性。
二、MMKV 原理
- 内存准备
通过 mmap 内存映射文件,提供一段可供随时写入的内存块,App 只管往里面写数据,由操作系统负责将内存回写到文件,不必担心 crash 导致数据丢失。 - 数据组织
数据序列化方面我们选用 protobuf 协议,pb 在性能和空间占用上都有不错的表现。 - 写入优化
考虑到主要使用场景是频繁地进行写入更新,我们需要有增量更新的能力。我们考虑将增量 kv 对象序列化后,append 到内存末尾。 - 空间增长
使用 append 实现增量更新带来了一个新的问题,就是不断 append 的话,文件大小会增长得不可控。我们需要在性能和空间上做个折中。 
三、功能特性
- 多进程访问
基于mmap技术,支持多进程数据共享Android 平台第一个想到的就是 ContentProvider:一个单独进程管理数据,数据同步不易出错,简单好用易上手。然而它的问题也很明显,就是一个字慢:启动慢,访问也慢。这个可以说是 Android 下基于Binder的CS 架构组件的通用痛点。再考虑到 MMKV 底层使用 mmap 实现,采用去中心化的架构是很自然的选择。我们只需要将文件 mmap 到每个访问进程的内存空间,加上合适的进程锁,再处理好数据的同步,就能够实现多进程并发访问。 - 匿名内存
对于敏感数据保存在文件中不适合,使用Android 特有的Ashmem 匿名共享内存技术,达到数据保密效果。 - 数据加密
在Android中 MMKV 使用了 AES CFB-128 算法来加密/解密。选择 CFB 而不是常见的 CBC 算法,主要是因为 MMKV 使用 append-only 实现插入/更新操作,流式加密算法更加合适。 
四、使用实践
- 安装引入
 
dependencies {
    implementation 'com.tencent:mmkv:1.2.16'
    // replace "1.2.16" with any available version
}
- 使用方式
 
MMKV 的使用非常简单,所有变更立马生效,无需调用 sync、apply。
// 在application里面
// MMKV的初始化可以指定保存位置,也可以默认保存位置。
// 初始化,默认的保存地址是: /data/user/0/应用包名/files/mmkv
String rootDir = MMKV.initialize(context);
// 指定保存位置初始初始化
String rootDir = MMKV.initialize(dir);
// 根据业务区别存储, 附带一个自己的 ID
MMKV kv2 = MMKV.mmkvWithID("MyID");
- 迁移
 
// MMKV支持完美无损的将SP中保存的数据迁移到MMKV中
MMKV mmkv = MMKV.mmkvWithID("XXX");
SharedPreferences old_man = context.getSharedPreferences("XXXXXX", Context.MODE_PRIVATE);
// 迁移旧数据
mmkv.importFromSharedPreferences(old_man);
// 清空旧数据
old_man.edit().clear().commit();
- 封装MMKVUtils工具类(kotlin代码)
 
object MMKVUtil {
    private var mmkv: MMKV? = MMKV.defaultMMKV()
    @JvmStatic
    fun set(key: String, value: Any) {
        when (value) {
            is String -> mmkv?.encode(key, value)
            is Float -> mmkv?.encode(key, value)
            is Boolean -> mmkv?.encode(key, value)
            is Int -> mmkv?.encode(key, value)
            is Long -> mmkv?.encode(key, value)
            is Double -> mmkv?.encode(key, value)
            is ByteArray -> mmkv?.encode(key, value)
            is Parcelable -> mmkv?.encode(key, value)
            is Nothing -> return
            else -> mmkv?.encode(key, GsonUtils.o2J(value))
        }
    }
    @JvmStatic
    fun <T> get(key: String, defaultValue: T): T {
        if (mmkv?.containsKey(key) == false) {
            return defaultValue
        }
        return when (defaultValue) {
            is String -> mmkv?.decodeString(key, defaultValue) as T
            is Float -> mmkv?.decodeFloat(key, defaultValue) as T
            is Boolean -> mmkv?.decodeBool(key, defaultValue) as T
            is Int -> mmkv?.decodeInt(key, defaultValue) as T
            is Long -> mmkv?.decodeLong(key, defaultValue) as T
            is Double -> mmkv?.decodeDouble(key, defaultValue) as T
            is ByteArray -> mmkv?.decodeBytes(key, defaultValue) as T
            is Parcelable -> mmkv?.decodeParcelable(key, defaultValue.javaClass) as T
            else -> return defaultValue
        }
    }
    @JvmStatic
    fun <T : Parcelable> get(key: String, tClass: Class<T>): T? {
        if (mmkv?.containsKey(key) == false) {
            return null
        }
        return mmkv?.decodeParcelable(key, tClass)
    }
    @JvmStatic
    fun removeKey(key: String) {
        mmkv?.removeValueForKey(key)
    }
    @JvmStatic
    fun clearAll() {
        mmkv?.clearAll()
    }
}
- 使用示例
 
// 获取
MMKVUtil.get(MyConstant.TOKEN, "")// 第二个参数为默认值
// 写入
MMKVUtil.set(MyConstant.TOKEN, token)
// 清除
MMKVUtil.removeKey(MyConstant.TOKEN)
五、性能对比
- 单进程性能
 
MMKV 在写入性能上远远超越 SharedPreferences & SQLite,在读取性能上也有相近或超越的表现。
- 多进程性能
 
MMKV 无论是在写入性能还是在读取性能,都远远超越 MultiProcessSharedPreferences & SQLite & SQLite, MMKV 在 Android 多进程 key-value 存储组件上是不二之选。
六、优缺点
- 优点
 
- MMKV使用了protobuf作为序列化的数据结构,相比json和xml效率更快,空间占用更低。
 - 使用了mmap和匿名Ashmem共享内存,减少了用户空间数据到内核空间的拷贝,提高存储效率和安全性。
 - 需要磁盘空间替换内存空间时,就可以使用MMKV。
 - 支持多进程,多进程安全。
 - MMKV包含进程锁、编码/解码帮助程序和mmap逻辑等等代码,新增MMKV框架一般只会带来60K左右的大小。
 
- 缺点
 
- 在某些情况下读操作会比SP慢(查询数据时存在ProtocolBuffer解码;首次实例化会进行数据的复写剔除重复数据)。
 - 在随机写很多的情况下,会导致随机IO操作,导致效率下降。
 - 不建议太大文件数据存储,会比较快消耗虚拟内存。尽量保证每一个文件存储的数据较小。
 
- SharedPreferences缺点
 
- 跨进程不安全,就算使用了MODE_MULTI_PROCESS,频繁的写入还是会会造成数据丢失。
 - 加载缓慢 SharedPreferences使用异步加载,由于线程没有设置优先级,按照默认的线程优先级会造成时间片抢占机会小导致主线程长时间的等待。
 - 全量写入无论是调用 commit() 还是 apply(),即使我们只改动其中的一个条目,都会把整个内容全部写到文件,写入效率低下。
 - 每次都需要将所有的数据加载到内存,如果存储大量数据,会占用很多的内存。
 - 卡顿由于提供了异步落盘的 apply 机制,在崩溃或者其他一些异常情况可能会导致数据丢失。所以当应用收到系统广播,或者被调用 onPause 等一些时机,系统会强制把所有的 SharedPreferences 对象数据落地到磁盘。如果没有落地完成,这时候主线程会被一直阻塞。这样非常容易造成卡顿,甚至是 ANR,从线上数据来看 SP卡顿占比一般会超过 5%。
 - 通过 getSharedPreferences 可以获取 SP 实例,从首次初始化到读到数据会存在延迟,因为读文件的操作阻塞调用的线程直到文件读取完毕,如果在主线程调用,可能会对 UI 流畅度造成影响。(线程阻塞)
 - 将数据写入文件需要将数据拷贝两次,再写入到文件中,如果数据量过大,也会有很大的性能损耗。(二次写入)
 
七、总结
MMKV作为一种高性能大量数据的存储组件,对比Android传统的存储方式SharedPreferences和SQLite确实有不少优势。核心是使用mmap内存映射文件,对比传统IO,在性能上有很大优势,并且将读写文件的操作变得和操作内存一样简单。
MMKV引入增量写入,重整内存,通过文件大小校验对多进程操作感知,多进程读写锁等等。但它的缺点是可能造成内存的浪费,因为必须映射内存页的整数倍,如果只存储很少量的数据,则显得大材小用。因此,可以作为一种数据存储的选择方案,在一些需要大量存储数据场景时,替代SharedPreferences。
| 项目 | 评价 | 描述 | 
|---|---|---|
| 正确性 | 优 | 支持多进程安全, 使用 mmap, 由操作系统保证数据回写的正确性 | 
| 时间开销 | 优 | 使用 mmap 实现, 减少了用户空间数据到内核空间的拷贝 | 
| 空间开销 | 中 | 使用 protocl buffer 存储数据, 同样的数据会比 xml 和 json 消耗空间小 使用的是数据追加到末尾的方式, 只有到达一定阈值之后才会触发键值合并, 不合并之前会导致同一个 key 存在多份 | 
| 安全 | 中 | 使用 crc 校验, 甄别文件系统和操作系统不稳定导致的异常数据 | 
| 开发成本 | 优 | 使用方式较为简单 | 
| 兼容性 | 优 | 各个安卓版本都前后兼容 |