iOS标记指针(Tagged Pointer)技术

905 阅读5分钟

在2013年9月,苹果推出了iPhone5s,配备了首个采用64位架构的A7双核处理器,为了节省内存和提高执行效率,苹果提出了标记指针(Tagged Pointer) 的概念。对于64位程序,引入Tagged Pointer后,相关逻辑能减少一半的内存占用,以及3倍的访问速度提升,100倍的创建、销毁速度提升。

原有的对象为什么会浪费内存?

假设我们要存储一个NSNumber对象,其值是一个整数。正常情况下,如果这个整数只是一个NSInteger的普通变量,那么它所占用的内存是与CPU的位数有关,在32位CPU下占4个字节,在64位CPU下是占8个字节的。而指针类型的大小通常也是与CPU位数相关,一个指针所占用的内存在32位CPU下为4个字节,在64位CPU下也是8个字节。

所以一个普通的iOS程序,如果没有Tagged Pointer对象,从32位机器迁移到64位机器中后,虽然逻辑没有任何变化,但这种NSNumber、NSDate一类的对象所占用的内存会翻倍。

对象为什么会浪费内存

效率上的问题,为了存储和访问一个NSNumber对象,需要在堆上为其分配内存,另外还要维护它的引用计数,管理它的生命期。这些都给程序增加了额外的逻辑,造成运行效率上的损失。

Tagged Pointer

为了改进上面提到的内存占用和效率问题,苹果提出了Tagged Pointer对象。由于NSNumber、NSDate一类的变量本身的值需要占用的内存大小常常不需要8个字节,拿整数来说,4个字节所能表示的有符号整数就可以达到20多亿(注:2^31=2147483648,另外1位作为符号位),对于绝大多数情况都是可以处理的。

使用标记指针.png

NSNumber的优化

Tagged Pointer一个比较典型的应用就是NSNumber,在64位环境下,对于一般的数字,NSNumber不用再分配内存了。我们看看NSNumber是如何运用Tagged Pointer的:

代码 objc:

NSNumber *number1=@1;
NSNumber *number2=@2;
NSNumber *number3=@3;

NSLog(@"number1 pointer is %p", number1);
NSLog(@"number2 pointer is %p", number2);
NSLog(@"number3 pointer is %p", number3);

在64位模拟器中运行后,我得到了如下结果:

number1 pointer is 0xb000000000000012
number2 pointer is 0xb000000000000022
number3 pointer is 0xb000000000000032

可以看出number1、number2和number3的值前4位都是0xb,后4位都是0x2(指针的Tag),中间就是实际的取值,因此,这些NSNumber已经不需要再分配内存(指堆中内存)了,直接可以把实际的值保存到指针中,而无需再去访问堆中的数据。这无疑提高的内存访问速度和整体运算速度。也就是说Tagged Pointer本身就可以表示一个NSNumber了。

那么如果一个数超过了Tagged Pointer所能表示的范围,系统会怎么处理?看看这段代码:

代码 objc:
NSNumber*numberBig=@(0x2233567890ABCDEF);
NSLog(@"numberBig pointer is %p", numberBig);

在64位模拟器中运行后,我得到了如下结果:
代码 objc:
numberBig pointer is 0x1394026a0

numberBig指针最后4位都是0,应该是分配在堆中的对象。因此,如果NSNumber超出了Tagged Pointer所能表示的范围,系统会自动采用分配成对象,可以根据指针的最后4位是否为0来区分。

isa指针优化

查看NSObject类的头文件,你会发现这段定义:

@interface NSObject: <NSObject>
 { 
  Class isa;
 }

所有类都继承自NSObject,因此每个对象都有一个isa指针指向它所属的类。在《ARM64 and You》文章中指出:在32位环境下,对象的引用计数都保存在一个外部的表中,而对引用计数的增减操作都要先锁定这个表,操作完成后才解锁。这个效率是非常慢的。而在64位环境下,isa也是64位,实际作为指针部分只用到的其中33位,剩余的部分会运用到Tagged Pointer的概念,其中19位将保存对象的引用计数,这样对引用计数的操作只需要原子的修改这个指针即可,如果引用计数超出19位,才会将引用计数保存到外部表,而这种情况往往是很少的,因此效率将会大大提高。

在WWDC2013的《Session 404 Advanced in Objective-C》视频中,看到苹果对于Tagged Pointer特点的介绍:

 1.Tagged Pointer专门用来存储小的对象,例如NSNumber和NSDate
 2.Tagged Pointer指针的值不再是地址了,而是真正的值。
     实际上它不再是一个对象了,它只是一个披着对象皮的普通变量而已。
     它的内存并不存储在堆中,也不需要malloc和free。
 3.在内存读取上有着3倍的效率,创建时比以前快106倍。

苹果引入Tagged Pointer,不但减少了64位机器下程序的内存占用,还提高了运行效率。完美地解决了小内存对象在存储和访问效率上的问题。

Tagged Pointer的引入也带来了问题,即Tagged Pointer 因为并不是真正的对象,而是一个伪对象,所以你如果完全把它当成对象来使,可能会让它露马脚。所有对象都有 isa指针,而Tagged Pointer其实是没有的,因为它不是真正的对象。 因为不是真正的对象,所以如果你直接访问Tagged Pointer的isa成员的话,在编译时将会有警告。

总之:

苹果将Tagged Pointer引入,给64位系统带来了内存的节省和运行效率的提高。Tagged Pointer通过在其最后一个bit位设置一个特殊标记,用于将数据直接保存在指针本身中。Tagged Pointer并不是真正的对象,使用时需要注意不要直接访问其isa变量。

参考文章:  Objective-C对象模型及应用 ARM64 and You