OC语言的本质
我们平时编写的Objective-C代码,底层实现其实都是C\C++代码
Objective-C的面向对象都是基于C\C++的结构体实现的
将Objective-C代码转换为C\C++代码 用如下命令: xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc OC源文件 -o 输出的CPP文件
OC对象在内存中如何布局
- 系统分配了16个字节给NSObject对象(通过malloc_size函数获得)
- 但NSObject对象内部(isa)只使用了8个字节的空间(64bit环境下,可以通过class_getInstanceSize函数获得)
一个对象占用16个字节
其中isa占8个 ,后面是内存补齐
int占4个,double、long占8个
2个容易混淆的函数
1.创建一个实例对象,实际上分配了多少内存?
#import <malloc/malloc.h>
malloc_size((__bridge const void *)obj);
2.创建一个实例对象,至少需要多少内存?
#import <objc/runtime.h>
class_getInstanceSize([NSObject class]);
OC对象的分类
-
instance对象(实例对象) instance对象就是通过类alloc出来的对象,每次调用alloc都会产生新的instance对象
-
class对象(类对象)
通过调用class生成的对象
- meta-class对象(元类对象) meta-class对象和class对象的内存结构是一样的,但是用途不一样
对象的底层结构
- superClass:实际是class类型的,它指向objc_class类型的这样一个指针
- cache_t:实际上是装满了bucket_t数据结构的Hash表
- class_data_bits_t:实际上是对class_rw_t的数据结构的封装
- class_rw_t中包含了(class_ro_t 类相关的只读信息、protocols 类分类中的协议、properties 类分类中的属性、methods 类分类中的方法)
- class_ro_t包含了name类名、methodList类的方法列表
- method_t、ivars声明的类的成员变量、类的属性、类的协议
1. objc_object
Objective-C的面向对象都是基于C/C++的数据结构——结构体实现的。
我们平时使用的所有对象都是id类型,id类型对象对应到runtime中,就是objc_object结构体。
// A pointer to an instance of a class.
typedef struct objc_object *id;
struct objc_object {
private:
isa_t isa;
/*...
isa操作相关
弱引用相关
关联对象相关
内存管理相关
...
*/
};
objc_object结构体主要包含:
- isa_t:共用体
- 关于isa操作相关的一些方法:通过objc_object结构体,来获取isa所指向的类对象,或者通过类对象的isa指针获取它的元类对象一些遍历的放大
- 弱引用相关:标记一个对象是否曾经有过弱引用指针
- 关联对象相关方法:我们为对象设置了关联属性,关于关联属性的一些相关方法也体现在objc_object结构体中
- 内存管理相关的方法实现:MRC下经常用到的runtain,release等方法实现 ,以上均封装在objc_object结构体中
2. objc_class
Class指针用来指向一个 Objective-C 的类,它是objc_class结构体类型,所以class、meta-class底层结构都是objc_class结构体,objc_class继承自objc_object,所以它也有isa指针,它也是对象。
// An opaque type that represents an Objective-C class.
typedef struct objc_class *Class;
struct objc_class : objc_object {
// Class ISA;
Class superclass; // 指向父类
cache_t cache; // 方法缓存 formerly cache pointer and vtable
class_data_bits_t bits; // 用于获取具体的类信息 class_rw_t * plus custom rr/alloc flags
class_rw_t *data() {
return bits.data();
}
};
2.1 class_data_bits_t
class_data_bits_t主要是对class_rw_t的封装,可以通过bits & FAST_DATA_MASK获得class_rw_t。
struct class_data_bits_t {
// Values are the FAST_ flags above.
uintptr_t bits;
public:
class_rw_t* data() {
return (class_rw_t *)(bits & FAST_DATA_MASK);
}
};
2.1.1 class_rw_t
-
class_rw_t代表了类相关的读写信息,它是对class_ro_t的封装; -
class_rw_t中主要存储着类的方法列表、属性列表、协议列表等; -
class_rw_t里面的methods、properties、protocols都继承于list_array_tt二维数组,是可读可写的,包含了类的初始内容、分类的内容。
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods; // 方法列表
property_array_t properties; // 属性列表
protocol_array_t protocols; // 协议列表
Class firstSubclass;
Class nextSiblingClass;
char *demangledName;
};
2.1.2 class_ro_t
-
class_ro_t代表了类相关的只读信息; -
class_ro_t中主要存储着类的成员变量列表、类名等; -
class_ro_t里面的baseMethodList、baseProtocols、ivars、baseProperties是一维数组,是只读的,包含了类的初始内容; -
一开始类的信息都存放在
class_ro_t里,当程序运行时,经过一系列的函数调用栈,在realizeClass()函数中,将class_ro_t里的东西和分类的东西合并起来放到class_rw_t里,并让bits指向class_rw_t。
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize; // instance对象占用的内存空间
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name; // 类名
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars; // 成员变量列表
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
method_list_t *baseMethods() const {
return baseMethodList;
}
};
2.2 cache_t
- 是用于快速查找方法执行函数的一个结构(当我们调用一个方法时,如果有缓存,我们就不需要去方法列表中遍历了,可以提高方法调用速度)
- 是可增量扩展的哈希表结构(当结构存储量增大的过程中, cache_t会增量扩大它的内存空间来支持更多的缓存,用哈希表实现这个数据结构,是为了提高查找效率)
- cache_t数据结构是计算机局部性原理的最佳应用(计算机局部性原理:在一般调用方法时,有几个方法调用频次较高,把他们放到方法缓存中,下次的命中率就会更高) cache_t具体数据结构说明:
可以理解为是数组来实现的
- 每个对象都是bucket_t这样的一个结构体, bucket_t有两个主要成员变量,key和IMP key对应OC中的selector,在调用方法时是个选择器SEL
- IMP理解为无类型的函数指针,可以通过方法选择器的名称key来寻找这个方法的具体实现IMP
假如现在有个key,可以通过哈希查找算法来定位当前key所对应的bucket_t位于数组当中哪个位置,然后从这个位置中提取出bucket_t中的IMP
struct cache_t {
struct bucket_t *_buckets; // 哈希表
mask_t _mask; // 哈希表的长度 - 1
mask_t _occupied; // 已经缓存的方法数量
};
struct bucket_t {
private:
cache_key_t _key; // SEL
IMP _imp; // IMP 函数的内存地址
};
3. isa 指针
它是C++中的共用体,在OC中名称是isa_t 不论是64位架构上(或者32位架构)上面,共用体是64个(或者32个) 0或者1的数字 (按大多数64位分析)
分两种类型(isa指针是什么含义的时候):
- 指针型isa: 64位的0或者1的整体内容代表所指向的Class的地址,也就是可以通过isa的内容来获得类对象的地址
- 非指针型isa: isa的值得部分代表Class的地址,之所以这样是因为我们在寻址过程中,只有三四十位数就可以保证我们寻找到所有Class地址了,多出来的位可以用来存储其他相关内容,来达到节省内存的目的
isa的指向: 对象的isa指针,指向类对象 类对象的isa指针,指向元类对象
4. method_t
method_t是对函数四要素(名称、返回值、参数、函数体)的封装
函数四要素决定了函数的唯一性
struct method_t {
SEL name; // 方法名
const char *types; // 编码(返回值类型、参数类型)
IMP imp; // 方法的地址/实现
};
- SEL 又称“选择器”,它是一个指向方法的
selector的指针,代表方法/函数名; - IMP 是指向方法实现的函数指针;
- 我们调用方法,实际上就是根据方法 SEL 查找 IMP;
method_t实际上相当于在 SEL 和 IMP 之间做了一个映射。
method_t是个结构体,主要有三个数据类型
- name 函数名称
- types 函数返回值和参数的集合
- imp 无类型的函数指针,对应着函数体