对象本质
@interface LGPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation LGPerson
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
NSLog(@"Hello, World!");
}
return 0;
}
用clang编译生成main.cpp. 查看main.cpp中LGPerson类被编译成LGPerson_IMPL:
//main.cpp
//LGPerson类被编译成 LGPerson_IMPL
struct LGPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;//等效于 Class isa;
NSString *_name;
};
//NSObject 的底层编译成 NSObject_IMPL
struct NSObject_IMPL {
Class isa;
};
//NSObject的定义
@interface NSObject <NSObject> {
Class isa OBJC_ISA_AVAILABILITY;
}
LGPerson类被编译成LGPerson_IMPL,第一个属性NSObject_IVARS等效于Class isa,定义为父类结构体;- 结构体在c++可以继承,但在
c中可以通过此种方式实现伪继承。意味着LGPerson拥有NSObject中的所有成员变量。 - OC对象本质是一个结构体。
- 结构体在c++可以继承,但在
为什么isa的类型是Class?
-
在对象原理-alloc和init源码分析文章中,提及过
alloc方法的核心之一的initInstanceIsa方法,通过查看这个方法的源码实现,我们发现,在初始化isa指针时,是通过isa_t类型初始化的, -
而在
NSObject定义中isa的类型是Class,其根本原因是由于isa对外反馈的是类信息,为了让开发人员更加清晰明确,需要在isa返回时做了一个类型强制转换,类似于swift中的as的强转。源码中isa的强转如下图所示:
name的get和set方法
//name的get方法
static NSString * _I_LGPerson_name(LGPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_LGPerson$_name)); }
extern "C" __declspec(dllimport) void objc_setProperty (id, SEL, long, id, bool, bool);
//name的set方法
static void _I_LGPerson_setName_(LGPerson * self, SEL _cmd, NSString *name) {
objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct LGPerson, _name), (id)name, 0, 1);
}
set方法的实现依赖于runtime中的objc_setProperty
objc_setProperty源码如下:
进入
reallySetProperty的源码实现,其方法的原理就是新值retain,旧值release
针对objc_setProperty的底层源码探究总结
-
objc_setProperty方法的目的适用于关联 上层的set方法 以及底层的set方法,其本质就是一个接口。通过接口隔离objc_setProperty适配一个统一入口,通过cmd区分不同set。 -
这么设计的
原因是,上层的set方法有很多,如果直接调用底层set方法中,会产生很多的临时变量,当你想查找一个sel时,会非常麻烦 -
基于上述原因,苹果采用了
适配器设计模式(即将底层接口适配为客户端需要的接口),对外提供一个接口,供上层的set方法使用,对内调用底层的set方法,使其相互不受影响,即无论上层怎么变,下层都是不变的,或者下层的变化也无法影响上层,主要是达到上下层接口隔离的目的。
cls 与 类 的关联原理
在对象原理-alloc和init源码分析中分析了alloc中3个核心方法的前两个,今天来探索initInstanceIsa是如何将cls与isa关联的。
在此之前,需要先了解什么是联合体,为什么isa的类型isa_t是使用联合体定义
联合体(union)
联合体是由不同的数据类型组成,但其变量是互斥的,所有的成员共占一段内存。而且共用体采用了内存覆盖技术,同一时刻只能保存一个成员的值,如果对新的成员赋值,就会将原来成员的值覆盖掉.其占用的内存等于最大的成员占用的内存.
isa的类型 isa_t
union isa_t { //联合体
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
//提供了cls 和 bits ,两者是互斥关系
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
isa_t类型使用联合体的原因也是基于内存优化的考虑,这里的内存优化是指在isa指针中通过char + 位域(即二进制中每一位均可表示不同的信息)的原理实现。通常来说,isa指针占用的内存大小是8字节,即64位,已经足够存储很多的信息了,这样可以极大的节省内存,以提高性能.
从isa_t的定义中可以看出:
-
提供了两个成员,
cls和bits,由联合体的定义所知,这两个成员是互斥的,也就意味着,当初始化isa指针时,有两种初始化方式- 通过
cls初始化,bits无默认值 - 通过
bits初始化,cls有默认值
- 通过
-
还提供了一个结构体定义的
位域,用于存储类信息及其他信息,结构体的成员ISA_BITFIELD,这是一个宏定义,有两个版本__arm64__(对应ios 移动端) 和__x86_64__(对应macOS),以下是它们的一些宏定义,如下图所示:nonpointer有两个值,表示自定义的类等,从第0位开始,占1位0:纯isa指针1:不只是类对象地址,isa中包含了类信息、对象的引用计数等
has_assoc表示关联对象标志位,从第1位开始,占1位0:没有关联对象1:存在关联对象
has_cxx_dtor表示该对象是否有C++/OC的析构器(类似于dealloc),占1位- 如果
有析构函数,则需要做析构逻辑 - 如果
没有,则可以更快的释放对象
- 如果
shiftcls表示存储类的指针的值(类的地址), 即类信息arm64中占33位,开启指针优化的情况下,在arm64架构中有33位用来存储类指针x86_64中占44位
magic用于调试器判断当前对象是真的对象还是没有初始化的空间,占6位weakly_refrenced是 指对象是否被指向或者曾经指向一个ARC的弱变量- 没有弱引用的对象可以更快释放
deallocating标志对象是是否正在释放内存has_sidetable_rc表示 当对象引用计数大于10时,则需要借用该变量存储进位extra_rc(额外的引用计数) ,表示该对象的引用计数值,实际上是引用计数值减1- 如果对象的
引用计数为10,那么extra_rc为9(这个仅为举例说明),实际上iPhone 真机上的extra_rc是使用 19位来存储引用计数的
- 如果对象的
针对两种不同平台,其isa的存储情况如图所示:
源码探究
- 通过
alloc --> _objc_rootAlloc --> callAlloc --> _objc_rootAllocWithZone --> _class_createInstanceFromZone方法路径,查找到initInstanceIsa,并进入其原理实现
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
//初始化isa
initIsa(cls, true, hasCxxDtor);
}
-
进入
initIsa方法的源码实现,主要是初始化isa指针该方法的逻辑主要分为两部分:
- 通过
cls初始化isa - 通过
bits初始化isa
- 通过
验证 isa指针 位域(0-64)
根据前文提及的0-64位域,可以在这里通过initIsa方法中证明有isa指针中有这些位域(目前是处于macOS,所以使用的是x86_64)
-
首先通过main中的
LGPerson断点 -->initInstanceIsa-->initIsa--> 走到else中的isa初始化 -
执行lldb命令:
p newisa,得到newisa的详细信息 -
继续往下执行,走到
newisa.bits = ISA_MAGIC_VALUE;下一行,表示为isa的bits成员赋值,重新执行lldb命令p newisa,得到的结果如下 -
通过与前一个
newisa的信息对比,发现isa指针中有一些变化,如下图所示 -
其中
magic是59是由于将isa指针地址转换为二进制,从47(因为前面有4个位域,共占用47位,地址是从0开始)位开始读取6位,再转换为十进制,如下图所示
isa 关联了指针和类
cls 与 isa 关联原理就是isa指针中的shiftcls位域中存储了类信息,其中initInstanceIsa的过程是将 calloc 指针 和当前的 类cls 关联起来,有以下几种验证方式:
-
【方式一】通过源码
initIsa方法中的newisa.shiftcls = (uintptr_t)cls >> 3;验证 -
【方式二】通过
isa指针地址与ISA_MSAK的值&来验证 -
【方式三】通过runtime的方法
object_getClass验证 -
【方式四】通过
位运算验证
方式一:通过 initIsa 方法
运行至newisa.shiftcls = (uintptr_t)cls >> 3;前一步,其中 shiftcls存储当前类的值信息
-
此时查看
cls,是LGPerson类 -
shiftcls赋值的逻辑是将LGPerson进行编码后,右移3位 -
执行lldb命令
p (uintptr_t)cls,结果为(uintptr_t) $2 = 4294975720,再右移三位,有以下两种方式(任选其一),将得到536871965存储到newisa的shiftcls中p (uintptr_t)cls >> 3- 通过上一步的结果
$2,执行lldb命令p $2 >> 3
-
继续执行程序到
isa = newisa;部分,此时执行p newisa
与bits赋值结果的对比,bits的位域中有两处变化
cls由默认值,变成了LGPerson,将isa与cls完美关联shiftcls由0变成了536871965
所以
isa中通过初始化后的成员的值变化过程,如下图所示:
为什么在shiftcls赋值时需要类型强转?
因为内存的存储不能存储字符串,机器码只能识别 0 、1这两种数字,所以需要将其转换为uintptr_t数据类型,这样shiftcls中存储的类信息才能被机器码理解, 其中uintptr_t是unsigned long
为什么需要右移3位?
主要是由于shiftcls处于isa指针地址的中间部分,前面还有3个位域,为了不影响前面的3个位域的数据,需要右移将其抹零。
方式二:通过 isa & ISA_MSAK
-
在方式一后,继续执行,回到
_class_createInstanceFromZone方法,此时cls 与 isa已经关联完成,执行po objc -
执行
x/4gx obj,得到isa指针的地址0x001d8001000020e9 -
将
isa指针地址 &ISA_MASK(处于macOS,使用x86_64中的宏定义),即po 0x001d8001000020e9 & 0x00007ffffffffff8ULL,得出LGPersonarm64中,ISA_MASK 宏定义的值为0x0000000ffffffff8ULLx86_64中,ISA_MASK 宏定义的值为0x00007ffffffffff8ULL
方式三:通过 object_getClass
通过查看object_getClass的源码实现,同样可以验证isa与类关联的原理,有以下几步:
- main中导入#import <objc/runtime.h>
- 通过
runtime的api,即object_getClass函数获取类信息。
object_getClass(<#id _Nullable obj#>)
-
查看
object_getClass函数 源码的实现 -
点击进入
object_getClass底层实现 -
进入
getIsa的源码实现
-
点击
ISA(),进入源码,可以看到如果是indexed类型,执行if流程,反之 执行的是else流程- 在
else流程中,拿到isa的bits这个位,再& ISA_MASK,这与方式二中的原理是一致的,获得当前的类信息 - 从这里也可以
得出 cls 与 isa 已经完美关联
- 在
方式四:通过位运算
-
回到
_class_createInstanceFromZone方法。通过x/4gx obj得到obj的存储信息,当前类的信息存储在isa指针中,且isa中的shiftcls此时占44位(因为处于macOS环境) -
想要
读取中间的44位类信息,就需要经过位运算,将右边3位,和左边除去44位以外的部分都抹零,其相对位置是不变的。其位运算过程如图所示,其中shiftcls即为需要读取的类信息-
将
isa地址右移3位:p/x 0x001d8001000020e9 >> 3,得到0x0003b0002000041d -
在将得到的
0x0003b0002000041d``左移20位:p/x 0x0003b0002000041d << 20,得到0x0002000041d00000- 为什么是
左移20位?因为先右移了3位,相当于向右偏移了3位,而左边需要抹零的位数有17位,所以一共需要移动20位
- 为什么是
-
将得到的
0x0002000041d00000再右移17位:p/x 0x0002000041d00000 >> 17得到新的0x00000001000020e8
-
-
获取cls的地址 与 上面的进行验证 :
p/x cls也得出0x00000001000020e8,所以由此可以证明 cls 与 isa 是关联的