参考链接 www.jianshu.com/p/bb584d704…
Mach-O,是Mach object文件格式的缩写,是一种可执行文件、目标代码、共享程序库、动态加载代码和核心dump。是a.out格式的一种替代。Mach-O提供更多的可扩展性和更快的符号表信息存取。Mach-O应用在基于Mach核心的系统上,目前NeXTSTEP、Darwin、Mac OS X(iPhone)都是使用这种可执行文件格式。熟悉Mach-O文件格式,有助于了解苹果底层软件运行机制,更好的掌握dyld加载Mach-O的步骤,为自己动手开发Mach-O相关的加解密工具注入工具打下基础。
属于MachO格式的常见文件有:
- 目标文件.o
- 库文件
- .a
- .dylib
- Framework
- 可执行文件
- dyld
- .dsym
Mach-O主要由以下三部分组成:
- Mach-O头部(Mach Header)。
- Header 包含该二进制文件的一般信息 字节顺序、架构类型、加载指令的数量等。 使得可以快速确认一些信息,比如当前文件用于32位还是64位,对应的处理器是什么、文件类型是什么
- 加载命令(load command)。
- 一张包含很多内容的表 内容包括区域的位置、符号表、动态符号表等。
- Data。
- 通常是对象文件中最大的部分
包含Segement的具体数据
- 通常是对象文件中最大的部分
包含Segement的具体数据
文件创建
- 1.创建一个命令行工程 命名 Mach-O
- 2.添加脚本
- 3.写入内容 脚本的路径
#/Users/xsj/Desktop/Mach-0/xcode_run_cmd.sh
/bin/sh "$SRCROOT/xcode_run_cmd.sh"
- 4.创建config 配置config
- 5.写入最基本的配置信息
VERBOSE_SCRIPT_LOGGING=-v //显示执行命令的内容
MACH_PATH=${BUILD_DIR}/$(CONFIGURATION)$(EFFECTIVE_PLATFORM_NAME)/${PRODUCT_NAME} //可执行文件的路径
TTY=/dev/ttys003 //终端的链接路径
初次探索
查看Mach-header
CMD = objdump --macho -private-header ${MACH_PATH}
CMD = otool -h ${MACH_PATH}
/*
* The 64-bit mach header appears at the very beginning of object files for
* 64-bit architectures.
*/
struct mach_header_64 {
uint32_t magic; /* 魔数,快速定位属于64还是32位 */
cpu_type_t cputype; /* CPU类型,比如ARM */
cpu_subtype_t cpusubtype; /* CPU的具体类型 arm64\armv7 */
uint32_t filetype; /* 文件类型,比如可执行文件 */
uint32_t ncmds; /* loadCommands条数 */
uint32_t sizeofcmds; /* LoadCommands的大小 */
uint32_t flags; /* 标志位标识二进制文件支持的功能。主要是和系统加载、链接有关 */
uint32_t reserved; /* reserved */
};
LoadCommands
LoadCommands结构及其含义如下表:
LC_SEGMENT_64 将文件中(32位或64位)的段映射到进程地址空间中
LC_DYLD_INFO_ONLY 动态链接相关信息
LC_SYMTAB 符号地址
LC_DYSYMTAB 动态符号表地址
LC_LOAD_DYLINKER 使用谁加载,我们使用dyld
LC_UUID 文件的UUID
LC_VERSION_MIN_MACOSX 支持最低的操作系统版本
LC_SOURCE_VERSION 源代码版本
LC_MAIN 设置程序主线程的入口地址和栈大小
LC_LOAD_DYLIB 依赖库的路径,包含三方库
LC_FUNCTION_STARTS 函数起始地址表
LC_CODE_SIGNATURE 代码签名
DYLD
dyld(the dynamic link editor)是苹果的动态链接器,是苹果操作系统一个重要组成部分,在系统内核做好程序准备工作之后,交由dyld负责余下的工作。
查看__TEXT
- 1.main 全不写内容
- 2.可编译执行文件也只有一个main
CMD = objdump --macho -d ${MACH_PATH}
- 查看一个.o文件
- 终端输入
objdump --macho -reloc 文件路径
- address : 哪个地方需要链接器重定位
- pcrel : 是否使用相对寻址
- length : 地址长度
- extern :
- true : 符号表的索引
- false : section
- type : 指令操作
- scattered : 指明底层的数据结构
查看符号表
- 在计算机科学中,符号表是一种用于语言翻译器(例如编译器和解释器)中的数据结构。在符号表中,程序源代码中的每个标识符都和它的声明或使用信息绑定在一起,比如其数据类型、作用域以及内存地址
CMD = objdump --macho --syms ${MACH_PATH}
- 可以查看到很多信息包括一些调试符号
- 脱去符号表中的debug符号 d 是debug 符号
OTHER_LDFLAGS=$(inherited) -Xlinker -S
了解本地和全局符号的区别
#import <Foundation/Foundation.h>
int global_uninit_value;
int global_init_value = 10;
double default_x __attribute__((visibility("hidden")));
static int static_init_value = 9;
static int static_uninit_value;
int main(int argc, const char * argv[]) {
@autoreleasepool {
static_uninit_value = 10;
NSLog(@"%d",static_init_value);
}
return 0;
}
- g 修饰的时全局符号 l 修饰的时本地符号
- 可以看出全局变量是全局符号,静态全局变量是本地符号
- 1.全局符号和本地符号的差别在于符号的可见性不同
- 2.static 修饰后就是 静态变量->本地变量
- 3.__attribute__((visibility("hidden"))) 修改符号可见性
//定义成全局变量
extern int hidden_y;
extern double default_y;
extern double protected_y;
int hidden_y __attribute__((visibility("hidden"))) = 99; //全局符号便成本地符号
double default_y __attribute__((visibility("default"))) = 100;//如果 //还是全局符号
visibility属性,控制文件导出符号,限制符号可见性 -fvisibility:clang参数 default:用它定义的符号将被导出。 hidden:用它定义的符号将不被导出。
全局符号对整个项目可见
如果我们在一个库的m文件中实现一个全局的global_object函数,我们可以在项目中通过extern void global_object()之后正常使用,但是如果我们项目中也实现global_object函数,代码会优先调用本项目中的global_object方法,这里涉及到命名空间
- two_levelnamespace & flat_namespace:
- 二级命名空间与一级命名空间。链接器默认采用二级命名空间,也就是除了会记录符号 名称,还会记录符号属于哪个Mach-O的,比如会记录下来_NSLog来自Foundation。
查看导出符号
CMD = objdump --macho --exports-trie ${MACH_PATH}
- 对应了上面的2个全局符号
- 全局符号可以变成导出符号 可以让外界来使用
查看间接符号表
间接符号表是我们使用的其他动态库的符号。
CMD = objdump --macho --indirect-symbols ${MACH_PATH}
- 间接符号表->动态库符号
- strip 脱符号的时候 只能脱不是全局符号的符号
- 项目中使用了NSLog 导入了NSLog
- Foundation 导出了NSLog
- 动态库 -> 符号 给外界使用
- 间接符号表 -> 动态库符号
- 全局符号 -> 导出符号 -> strip 动态库 不是全局符号的符号
- 间接符号表
- oc动态库 -> 体积就很大 -> 外界可以随意使用
OC文件
我们创建OC类,查看OC类和方法是本地符号还是全局符号(导出符号)
- 写一个OC的文件 LGOneObjec.h LGOneObjec.m
- main.m 中引入这个OC类
- 编译
- 查看导出符号表
- oc默认是一个导出符号
- oc默认是一个导出符号
怎么修改OC的类变成不导出符号 来解决上面的问题呢
修改链接器
OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_CLASS_$_LGOneObject
OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_METACLASS_$_LGOneObject
OTHER_LDFLAGS=(inherited) -Xlinker -unexported_symbol_list -Xlinker _OBJC_CLASS__LGOneObject
- 这个OC的类就不导出了
map
- 查看信息
OTHER_LDFLAGS=$(inherited) -Xlinker -S -Xlinker -map -Xlinker /Users/xsj/Desktop/Mach-0/Mach-0/Symbol.text
Weak Symbol:
- Weak Reference Symbol: 表示此未定义符号是弱引用。如果动态链接器找不到该符号的定义,则将其设置为0。链接器会将此符号设置弱链接标志。
- Weak defintion Symbol: 表示此符号为弱定义符号。如果静态链接器或动态链 接器为此符号找到另一个(非弱)定义,则弱定义将被忽略。只能将合并部分中的符号标记为弱定义。
WeakSymbol.h
// weak def
void weak_function(void) __attribute__((weak));
// weak 本地符号
void weak_hidden_function(void) __attribute__((weak, visibility("hidden")));
WeakSymbol.m
#import "WeakSymbol.h"
#import <Foundation/Foundation.h>
// 全局符号 -》导出符号
void weak_function(void) {
NSLog(@"weak_function");
}
void weak_hidden_function(void) {
NSLog(@"weak_hidden_function");
}
- 同时在main.m 也定义了一个 运行但是不会报错 这就是因为弱定义符号 找到了一个,后面的在找到就直接忽略了