NSCache 是一种可变集合,用于临时存储在资源不足时容易被回收的 key-value 键值对。NSCache 具有字典的所有功能,并且还具备如下特性:
- 内存不足时,NSCache 会自动清理缓存,并且提供了是否需要清理的开关和缓存清理时的回调;
- NSCache 是线程安全的;
- 区别于 NSMutableDictionary ,NSCache 不需要对 key 进行拷贝。
在 SDWebImage 中就是使用 NSCache 来处理缓存的。接下来围绕以下两个问题去阅读 NSCache 的源码:
- 缓存的自动清理是如何实现的?
- 如何保证缓存操作的线程安全?
由于 ObjC 的 Foundation 框架开源,但是开源的GNUstep是 Cocoa 框架互换框架,虽然不能与苹果的Cocoa实现完全相同,但是两者的行为和实现方式是一样的,或者说非常相似。另外Apple 开源了 Swift 的核心库,包含了 Swift 版本的 Foundation 框架源码swift-corelibs-foundation。接下来就从 GNUstep 和 Swift 版本的 Foundation 框架中去探寻 NSCache 的实现。
GNUstep中的NSCache
数据结构
@interface GS_GENERIC_CLASS(NSCache, KeyT, ValT) : NSObject
{
@private
NSUInteger _costLimit; // 最大缓存开销,默认为0,表示无限制
NSUInteger _totalCost; // 缓存对象的总开销
NSUInteger _countLimit; // 最大缓存数量,默认为0,表示无限制
id _delegate; // 代理,当缓存对象被清理或者移除时会收到通知
BOOL _evictsObjectsWithDiscardedContent; // 是否回收废弃对象的标志
NSString *_name; // 缓存内容名称
NSMapTable *_objects; // 缓存内容
GS_GENERIC_CLASS(NSMutableArray, ValT) *_accesses; // 缓存对象的LRU/LFU排序
int64_t _totalAccesses; // 缓存对象的访问次数,用于LRU/LFU
}
- (NSUInteger) countLimit;
- (NSUInteger) totalCostLimit;
- (id) delegate;
- (BOOL) evictsObjectsWithDiscardedContent;
- (NSString*) name;
- (GS_GENERIC_TYPE(ValT)) objectForKey: (GS_GENERIC_TYPE(KeyT))key;
- (void) removeAllObjects;
- (void) removeObjectForKey: (GS_GENERIC_TYPE(KeyT))key;
- (void) setCountLimit: (NSUInteger)lim;
- (void) setDelegate: (id)del;
- (void) setEvictsObjectsWithDiscardedContent: (BOOL)b;
- (void) setName: (NSString*)cacheName;
- (void) setObject: (GS_GENERIC_TYPE(ValT))obj forKey:(GS_GENERIC_TYPE(KeyT))key cost: (NSUInteger)num;
- (void) setObject: (GS_GENERIC_TYPE(ValT))obj forKey: (GS_GENERIC_TYPE(KeyT))key;
- (void) setTotalCostLimit: (NSUInteger)lim;
@end
NSCacheDelegate 中提供了缓存即将清理的回调:
@protocol NSCacheDelegate
- (void) cache: (NSCache*)cache willEvictObject: (id)obj;
@end
GNUstep 中 NSCache 的实现将 cost、name、delegate、countlimit 都提供了 setter 和 getter 方法,而 Apple 的API中使用属性自动实现 setter、getter 的功能简化了这一操作。
NSCache 使用类型为 NSMapTable 的 _objects
存储缓存的内容,使用 NSMutableArray 类型的 _accesses
存储需要在缓存淘汰算法中可能被淘汰的对象。提供了 cost 和 count 来标记缓存内容的大小,且标记了缓存访问的总次数_totalAccesses
。
在 NSMapTable 和 NSMutableArray 中存储的是 _GSCachedObject 对象,该对象用来保存 cache 的基本信息:
// 缓存的对象,用于保存缓存对象的信息
@interface _GSCachedObject : NSObject
{
@public
id object; // cache 内容
NSString *key; // cache 的 key
int accessCount; // cache 的访问次数
NSUInteger cost; // cache 对象的开销
BOOL isEvictable; // cache 是否支持回收
}
@end
缓存淘汰的实现
NSCache 提供了两个添加缓存对象的方法:-setObject:forKey:cost:
和 -setObject:forKey:
,后一个方法的实现直接调用了前一个方法,传入 cost=0 。
NSCache 中缓存淘汰的时机是在添加对象时,即 -setObject:forKey:cost:
内,该方法的流程为:
- 先根据 key 查看
_objects
中是否有旧的内容,有则先删除旧的 - 调用缓存淘汰算法
- 创建一个 _GSCachedObject 缓存对象,记录 object、key、cost,如果对象实现了 NSDiscardableContent 协议,则将缓存对象添加到
_accesses
数组中,在使用缓存淘汰算法时,就可以从_accesses
去获取符合清理条件的缓存对象 - 将缓存对象添加到
_objects
中,并更新 cost
- (void) setObject: (id)obj forKey: (id)key cost: (NSUInteger)num {
// 先根据key查看是否有旧的内容,有则先删除旧的
_GSCachedObject *oldObject = [_objects objectForKey: key];
_GSCachedObject *newObject;
if (nil != oldObject) {
[self removeObjectForKey: oldObject->key];
}
// 调用缓存淘汰算法
[self _evictObjectsToMakeSpaceForObjectWithCost: num];
// 创建一个_GSCachedObject对象,记录object、key、cost,
newObject = [_GSCachedObject new];
newObject->object = RETAIN(obj);
newObject->key = RETAIN(key);
newObject->cost = num;
// 如果对象实现了NSDiscardableContent协议,则将对象添加到 _accesses 数组中,在使用缓存淘汰算法时,就可以从 _accesses 去获取可以被清理的对象
if ([obj conformsToProtocol: @protocol(NSDiscardableContent)]) {
newObject->isEvictable = YES;
[_accesses addObject: newObject];
}
// 添加到maptable中
[_objects setObject: newObject forKey: key];
RELEASE(newObject);
// 更新cost
_totalCost += num;
}
对于缓存淘汰的具体步骤为:
- 依据
_totalCost
、_costLimit
判断是否需要清理:只有当 cost 大于人工限制时才会清理,即手动设置了_costLimit
,默认的_costLimit = 0
。 - 用
spaceNeeded
标记需要释放的空间,使用evictedKeys
数组存储需要清理的对象的key - 使用迭代器遍历
_accesses
数组 ,将满足清理条件的对象的 key 添加到evictedKeys
数组中,清理的对象为:标记为可自动清理和低于平均访问次数的对象,平均访问次数 = (总访问次数/缓存数量 * 0.2) + 1,即清理使用频率较少的对象。 - 遍历
evictedKeys
数组,使用removeObjectForKey:
方法进行清理
- (void)_evictObjectsToMakeSpaceForObjectWithCost: (NSUInteger)cost {
// 判断是否需要清理
// 只有当 cost 大于人工限制时才会清理,即手动设置了 _costLimit
// 如果 _costLimit = 0 则不进行干预
NSUInteger spaceNeeded = 0; // 标记需要释放的空间
NSUInteger count = [_objects count];
if (_costLimit > 0 && _totalCost + cost > _costLimit) {
spaceNeeded = _totalCost + cost - _costLimit;
}
// 清理具体逻辑
if (count > 0 && (spaceNeeded > 0 || count >= _countLimit)) {
NSMutableArray *evictedKeys = nil; // 使用数组存储需要清理的对象,存储的为对象的key
// 平均访问次数 = (总访问次数/缓存数量 * 0.2) + 1
NSUInteger averageAccesses = ((_totalAccesses / (double)count) * 0.2) + 1;
NSEnumerator *e = [_accesses objectEnumerator];
_GSCachedObject *obj;
if (_evictsObjectsWithDiscardedContent) {
evictedKeys = [[NSMutableArray alloc] init];
}
while (nil != (obj = [e nextObject])) {
// 清理 设置了自动清理 并且 访问次数小于平均访问次数的对象
if (obj->accessCount < averageAccesses && obj->isEvictable) {
// 标识这个对象是可销毁的,如果计数变量为0时将会释放这个对象
[obj->object discardContentIfPossible];
if ([obj->object isContentDiscarded]) {
NSUInteger cost = obj->cost;
obj->cost = 0;
// 避免后续再次被清理
obj->isEvictable = NO;
// 将需要被清理的对象的key 添加到清理数组中
if (_evictsObjectsWithDiscardedContent) {
[evictedKeys addObject: obj->key];
}
// 更新总 cost
_totalCost -= cost;
// 释放了足够空间,则停止操作
if (cost > spaceNeeded) {
break;
}
// 更新需要释放的空间
spaceNeeded -= cost;
}
}
}
// 这里进行清理操作
if (_evictsObjectsWithDiscardedContent) {
NSString *key;
e = [evictedKeys objectEnumerator];
while (nil != (key = [e nextObject])) {
[self removeObjectForKey: key];
}
}
[evictedKeys release];
}
}
在遍历 _accesses
中的内容时,如果对象符合清理的条件,则使用了discardContentIfPossible
标识这个对象是可销毁的,如果计数变量为0时将会释放这个对象。同时对该对象做了一些额外的工作:将 cost 重置为 0,将 isEvictable 设置为 NO,避免后续再次被清理。然后再将对象添加到清理的数组后,更新总 cost。此时,判断如果释放了足够空间,则停止遍历操作,直接进行下一步--遍历清理数组,进行 remove 操作;否则更新需要释放的空间,进入下一次迭代。
最后再对所有需要清理的缓存对象调用了 removeObjectForKey:
方法进行清理,该方法的具体实现为:
- (void) removeObjectForKey: (id)key {
_GSCachedObject *obj = [_objects objectForKey: key];
if (nil != obj) {
// 告知代理方,即将清理缓存对象
[_delegate cache: self willEvictObject: obj->object];
// 更新总的访问次数
_totalAccesses -= obj->accessCount;
// 移除对象
[_objects removeObjectForKey: key];
// 移除LRU/LFU排序中的对象
[_accesses removeObjectIdenticalTo: obj];
}
}
在该方法中,先告知代理方,即将清理缓存对象,然后更新总的访问次数,最后移除对象,同时移除 LRU/LFU 排序数组中的对象。
在 NSCache 中,淘汰的对象为低于平均访问次数的对象,对象的访问频次在-objectForKey:key
中进行更新,同时将标记了自动清理的对象添加到 LRU/LFU 排序数组的末端:
- (id) objectForKey: (id)key {
_GSCachedObject *obj = [_objects objectForKey: key];
if (nil == obj) {
return nil;
}
// 如果标记了自动清理,则将对象添加到_accesses 的末端
if (obj->isEvictable) {
[_accesses removeObjectIdenticalTo: obj];
[_accesses addObject: obj];
}
// 更新访问自次数
obj->accessCount++;
_totalAccesses++;
return obj->object;
}
上述方法中,将标记了可以被自动清理的缓存对象添加到 LRU/LFU 排序数组的末端这一步是非常重要的,这样可以使访问频次高的都聚集在数组的尾部,当进行清理的时候,从头部获取的都是访问频次较低的对象。
小结
GNUstep 的 NSCache 使用 NSMapTable 存储缓存对象。NSMapTable 是 NSDictionary 的通用版本。
GNUstep 的 NSCache 自动清理逻辑为:NSCache 使用 LRU/LFU 进行缓存的清理,使用数组存储标记为可以被清理的对象,并且每次访问对象时,将该对象移动到数组的末端,即实现了一个 LRU/LFU 的排序数组。 NSCache 记录每个缓存对象的访问频次和总的访问频次,在筛选清理对象时,将**(总访问次数/缓存数量 * 0.2) + 1作为平均访问次数**,遍历 LRU/LFU 的排序数组,将低于平均访问次数的对象取出进行清理。如果已经释放了足够空间,则停止操作。
但是在 GNUstep 中并未发现线程安全的逻辑。
Swift中的NSCache
数据结构
在 Swift 版本中,采用一个 NSCacheEntry 类存储 cache 对象的相关信息,NSCacheEntry 的数据结构如下:
private class NSCacheEntry<KeyType : AnyObject, ObjectType : AnyObject> {
var key: KeyType
var value: ObjectType
var cost: Int
var prevByCost: NSCacheEntry?
var nextByCost: NSCacheEntry?
init(key: KeyType, value: ObjectType, cost: Int) {
self.key = key
self.value = value
self.cost = cost
}
}
和 GNUstep 中的_GSCachedObject 缓存对象大致相同,都存储了key、value、cost,不同的是 NSCacheEntry 提供了 prevByCost
和 nextByCost
,用于实现双向链表。
在 Apple Swift 版的 NSCache 中,采用 Dictionary 存储缓存数据,实现了一个以缓存对象的 cost 升序的排序双向链表,提供 head 头节点,当需要淘汰缓存数据时,从头节点开始删除。同时,使用 NSLock 来保证线程安全。
open class NSCache<KeyType : AnyObject, ObjectType : AnyObject> : NSObject {
private var _entries = Dictionary<NSCacheKey, NSCacheEntry<KeyType, ObjectType>>()
private let _lock = NSLock() // 用于线程安全的锁
private var _totalCost = 0
private var _head: NSCacheEntry<KeyType, ObjectType>? // 排序链表的头节点
open var name: String = ""
open var totalCostLimit: Int = 0 // 默认为0,无限制
open var countLimit: Int = 0 // 默认为0,无限制
open var evictsObjectsWithDiscardedContent: Bool = false
open weak var delegate: NSCacheDelegate?
public override init() {}
open func object(forKey key: KeyType) -> ObjectType? {...}
open func setObject(_ obj: ObjectType, forKey key: KeyType) {...}
open func setObject(_ obj: ObjectType, forKey key: KeyType, cost g: Int) {...}
open func removeObject(forKey key: KeyType) {...}
open func removeAllObjects() {...}
}
具体实现
整个缓存的核心逻辑大部分在 setObject(_: forKey: cost: )
方法中,该方法做了以下几件事:
- 将对象存储在 Dictionary 中
- 将对象加入排序链表中
- 执行淘汰策略
- 使用 NSlock 对整个插入和淘汰过程进行加锁
先看一下执行淘汰之前的具体操作:
let g = max(g, 0)
let keyRef = NSCacheKey(key)
_lock.lock() // 对整个insert和淘汰过程进行lock
let costDiff: Int
if let entry = _entries[keyRef] { // 如果已存在相同key的对象,则更新字典中旧对象的value,如果新旧对象的cost不同,则删除sort中的旧元素并插入新元素
costDiff = g - entry.cost // 计算旧对象和新对象cost的差值
entry.cost = g // 更新旧对象的cost
entry.value = obj // 更新旧对象的value
if costDiff != 0 { // 如果cost的差值 != 0,删除旧的,插入新的
remove(entry)
insert(entry)
}
} else { // 不存在,则直接添加到字典中
let entry = NSCacheEntry(key: key, value: obj, cost: g)
_entries[keyRef] = entry
insert(entry)
costDiff = g
}
// 更新总的cost
_totalCost += costDiff
该流程分为两个分支:
- 如果字典中不存在相同 key 的对象,则直接将创建一个 NSCacheEntry 对象并添加到字典和排序链表中;
- 如果已存在相同 key 的对象,则更新字典中旧对象的 cost 和 value 。然后判断新旧对象的 cost 是否有差异,如果有,则删除排序链表中的旧元素,再插入新的元素。这里通过复用旧对象,减少了对字典的写入和删除操作。
执行完上述操作后,就执行淘汰逻辑:
// 根据Cost判断是否需要淘汰
var purgeAmount = (totalCostLimit > 0) ? (_totalCost - totalCostLimit) : 0
while purgeAmount > 0 { // 使用while循环从头开始remove元素,直到达到需要淘汰的数量,或者链表为空
if let entry = _head { // 获取head并remove
delegate?.cache(unsafeDowncast(self, to:NSCache<AnyObject, AnyObject>.self), willEvictObject: entry.value)
_totalCost -= entry.cost
purgeAmount -= entry.cost
// 在remove的时候head会移动到下一个对象上
remove(entry) // _head will be changed to next entry in remove(_:)
_entries[NSCacheKey(entry.key)] = nil
} else {
break
}
}
// 根据count判断是否需要淘汰
var purgeCount = (countLimit > 0) ? (_entries.count - countLimit) : 0
while purgeCount > 0 {
if let entry = _head {
delegate?.cache(unsafeDowncast(self, to:NSCache<AnyObject, AnyObject>.self), willEvictObject: entry.value)
_totalCost -= entry.cost
purgeCount -= 1
remove(entry) // _head will be changed to next entry in remove(_:)
_entries[NSCacheKey(entry.key)] = nil
} else {
break
}
}
_lock.unlock()
Swift 中的淘汰流程分为两部分:先根据缓存的总 cost 进行淘汰,再根据总 count 进行淘汰。淘汰过程为:使用 while 循环从头开始 remove 排序双向链表中的元素,直到链表为空或者淘汰后的 cost/count 满足要求。因为是从链表的 head 开始删除,所以在 remove 的时候 head 会移动到下一个对象上。
接着去看排序链表的 remove
和 insert
。由于链表是有序的,remove
比较简单,如果删除的是 head,则更新 head的 位置:
private func remove(_ entry: NSCacheEntry<KeyType, ObjectType>) {
let oldPrev = entry.prevByCost
let oldNext = entry.nextByCost
oldPrev?.nextByCost = oldNext
oldNext?.prevByCost = oldPrev
if entry === _head { // 如果删除的是head,则更新head的位置
_head = oldNext
}
}
排序链表的插入操作稍显复杂,需要维持链表的排序,整个流程为:
- 当缓存为空时,insert 的对象作为 head,insert 结束。
- 缓存不为空,如果 insert 的对象 cost
<=
head 的 cost,将对象添加到链表头部, insert 结束 - 缓存不为空,如果 insert 的对象 cost
>
head 的 cost,根据对象的 cost 找到合适的位置 insert,形成一个 cost 升序的双向链表
private func insert(_ entry: NSCacheEntry<KeyType, ObjectType>) {
guard var currentElement = _head else { // 当缓存为空时,insert的内容作为head
// The cache is empty
entry.prevByCost = nil
entry.nextByCost = nil
_head = entry
return
}
guard entry.cost > currentElement.cost else { // 如果insert的对象cost <= head的cost,将对象添加到链表头部
// Insert entry at the head
entry.prevByCost = nil
entry.nextByCost = currentElement
currentElement.prevByCost = entry
_head = entry
return
}
// 如果insert的对象cost > head的cost 的后续操作
// 根据对象的cost找到合适的位置insert,形成一个cost升序的双向链表
while let nextByCost = currentElement.nextByCost, nextByCost.cost < entry.cost {
currentElement = nextByCost
}
// Insert entry between currentElement and nextElement
let nextElement = currentElement.nextByCost
currentElement.nextByCost = entry
entry.prevByCost = currentElement
entry.nextByCost = nextElement
nextElement?.prevByCost = entry
}
整个流程图为:
小结
- Swift 版本中的 NSCache 使用 Dictionary 存储对象,在新增内容时,尽量复用内部内容,减少字典的读写操作;
- 通过 NSCacheEntry 维护一个双向链表,链表从 head 到 tail 形成一个 cost 升序的 sort ,在缓存淘汰时,从 head 开始删除。淘汰的标准为两个:cost 和 count,先满足 cost,再满足 count。没有根据访问频次来维护缓存,而是根据 cost 来维护缓存,淘汰的时 cost 较小的元素;
- 使用 NSLock 保证线程安全。
对比
- 淘汰策略:GNUSetup 使用 LRU/LFU 机制进行淘汰,使用频率较少的元素先淘汰;Swfit Foundation 依据对象的 cost 进行淘汰,cost 较少的先淘汰
- 数据结构:GNUSetup 中使用 maptable 存储缓存对象,使用 array 维护 LRU/LFU 排序后的对象,用于缓存淘汰;Swfit Foundation 中使用 dictionary 存储缓存对象,维护一个排序的双向链表,用于缓存淘汰
- 线程安全:GNUSetup 中没有保证 cache 线程安全的代码;Swfit Foundation 中使用 NSLock 保证缓存读写的线程安全
但是需要注意 Apple 官方的这句话:
This is not a strict limit, and if the cache goes over the limit, an object in the cache could be evicted instantly, at a later point in time, or possibly never, all depending on the implementation details of the cache.
NSCache 并是不严格的依据 totalCostLimit
和 countLimit
来做缓存限制的,不一定会在一超出就立马进行移除我们的缓存对象,可能在将来的某一时刻移除,这取决于缓存算法的实现。
SDWebImage的应用
在 SDWebImage 中,通过将图片放到 NSCache 中,利用 NSCache 自动释放内存的特点在内存不足时自动淘汰不常用的图片。在读取图片时,先检查内存里是否有,有则直接返回;没有再从磁盘里读取。以此减少磁盘操作,保证空间合理释放。
- (nullable UIImage *)imageFromCacheForKey:(nullable NSString *)key options:(SDImageCacheOptions)options context:(nullable SDWebImageContext *)context {
// 先检查内存里是否有,有则直接返回
UIImage *image = [self imageFromMemoryCacheForKey:key];
if (image) {
return image;
}
// 再从磁盘里读取
image = [self imageFromDiskCacheForKey:key options:options context:context];
return image;
}
- (nullable UIImage *)imageFromMemoryCacheForKey:(nullable NSString *)key {
return [self.memoryCache objectForKey:key];
}
代码中 self.memoryCache
为 SDMemoryCache, SDMemoryCache 内部就是将 NSCache 扩展为了 SDMemoryCache 协议:
@protocol SDMemoryCache <NSObject>
@required
- (nonnull instancetype)initWithConfig:(nonnull SDImageCacheConfig *)config;
- (nullable id)objectForKey:(nonnull id)key;
- (void)setObject:(nullable id)object forKey:(nonnull id)key;
- (void)setObject:(nullable id)object forKey:(nonnull id)key cost:(NSUInteger)cost;
- (void)removeObjectForKey:(nonnull id)key;
- (void)removeAllObjects;
@end
@interface SDMemoryCache <KeyType, ObjectType> : NSCache <KeyType, ObjectType> <SDMemoryCache>
@property (nonatomic, strong, nonnull, readonly) SDImageCacheConfig *config;
@end