Mach-0初次探索

623 阅读5分钟

参考链接 www.jianshu.com/p/bb584d704…

Mach-O,是Mach object文件格式的缩写,是一种可执行文件、目标代码、共享程序库、动态加载代码和核心dump。是a.out格式的一种替代。Mach-O提供更多的可扩展性和更快的符号表信息存取。Mach-O应用在基于Mach核心的系统上,目前NeXTSTEP、Darwin、Mac OS X(iPhone)都是使用这种可执行文件格式。熟悉Mach-O文件格式,有助于了解苹果底层软件运行机制,更好的掌握dyld加载Mach-O的步骤,为自己动手开发Mach-O相关的加解密工具注入工具打下基础。

属于MachO格式的常见文件有:

  • 目标文件.o
  • 库文件
    • .a
    • .dylib
    • Framework
  • 可执行文件
  • dyld
  • .dsym

Mach-O主要由以下三部分组成:

  • Mach-O头部(Mach Header)。
    • Header 包含该二进制文件的一般信息 字节顺序、架构类型、加载指令的数量等。 使得可以快速确认一些信息,比如当前文件用于32位还是64位,对应的处理器是什么、文件类型是什么
  • 加载命令(load command)。
    • 一张包含很多内容的表 内容包括区域的位置、符号表、动态符号表等。
  • Data。
    • 通常是对象文件中最大的部分 包含Segement的具体数据

文件创建

  • 1.创建一个命令行工程 命名 Mach-O
  • 2.添加脚本
  • 3.写入内容 脚本的路径
#/Users/xsj/Desktop/Mach-0/xcode_run_cmd.sh
/bin/sh "$SRCROOT/xcode_run_cmd.sh"
  • 4.创建config 配置config
  • 5.写入最基本的配置信息
VERBOSE_SCRIPT_LOGGING=-v  //显示执行命令的内容

MACH_PATH=${BUILD_DIR}/$(CONFIGURATION)$(EFFECTIVE_PLATFORM_NAME)/${PRODUCT_NAME}  //可执行文件的路径

TTY=/dev/ttys003  //终端的链接路径

初次探索

查看Mach-header

CMD = objdump --macho -private-header ${MACH_PATH}

CMD = otool -h ${MACH_PATH}

/*
 * The 64-bit mach header appears at the very beginning of object files for
 * 64-bit architectures.
 */
struct mach_header_64 {
    uint32_t    magic;        /* 魔数,快速定位属于64还是32位 */
    cpu_type_t    cputype;    /* CPU类型,比如ARM */
    cpu_subtype_t    cpusubtype;    /* CPU的具体类型 arm64\armv7 */
    uint32_t    filetype;    /* 文件类型,比如可执行文件 */
    uint32_t    ncmds;        /* loadCommands条数 */
    uint32_t    sizeofcmds;    /* LoadCommands的大小 */
    uint32_t    flags;        /* 标志位标识二进制文件支持的功能。主要是和系统加载、链接有关 */
    uint32_t    reserved;    /* reserved */
};

LoadCommands

LoadCommands结构及其含义如下表:


LC_SEGMENT_64 将文件中(32位或64位)的段映射到进程地址空间中
LC_DYLD_INFO_ONLY 动态链接相关信息
LC_SYMTAB 符号地址
LC_DYSYMTAB 动态符号表地址
LC_LOAD_DYLINKER 使用谁加载,我们使用dyld
LC_UUID 文件的UUID
LC_VERSION_MIN_MACOSX 支持最低的操作系统版本
LC_SOURCE_VERSION 源代码版本
LC_MAIN 设置程序主线程的入口地址和栈大小
LC_LOAD_DYLIB 依赖库的路径,包含三方库
LC_FUNCTION_STARTS 函数起始地址表
LC_CODE_SIGNATURE 代码签名

DYLD

dyld(the dynamic link editor)是苹果的动态链接器,是苹果操作系统一个重要组成部分,在系统内核做好程序准备工作之后,交由dyld负责余下的工作。

查看__TEXT

  • 1.main 全不写内容
  • 2.可编译执行文件也只有一个main
CMD = objdump --macho -d ${MACH_PATH}

  • 查看一个.o文件
  • 终端输入 objdump --macho -reloc 文件路径
  • address : 哪个地方需要链接器重定位
  • pcrel : 是否使用相对寻址
  • length : 地址长度
  • extern :
    • true : 符号表的索引
    • false : section
  • type : 指令操作
  • scattered : 指明底层的数据结构

查看符号表

  • 在计算机科学中,符号表是一种用于语言翻译器(例如编译器和解释器)中的数据结构。在符号表中,程序源代码中的每个标识符都和它的声明或使用信息绑定在一起,比如其数据类型、作用域以及内存地址
CMD = objdump --macho --syms ${MACH_PATH}
  • 可以查看到很多信息包括一些调试符号

  • 脱去符号表中的debug符号 d 是debug 符号
OTHER_LDFLAGS=$(inherited) -Xlinker -S

了解本地和全局符号的区别

#import <Foundation/Foundation.h>

int global_uninit_value;
int global_init_value = 10;
double default_x __attribute__((visibility("hidden")));
static int static_init_value = 9;
static int static_uninit_value;

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        static_uninit_value = 10;
        NSLog(@"%d",static_init_value);
    }
    return 0;
}

  • g 修饰的时全局符号 l 修饰的时本地符号
  • 可以看出全局变量是全局符号,静态全局变量是本地符号
  • 1.全局符号和本地符号的差别在于符号的可见性不同
  • 2.static 修饰后就是 静态变量->本地变量
  • 3.__attribute__((visibility("hidden"))) 修改符号可见性
//定义成全局变量
extern int hidden_y;
extern double default_y;
extern double protected_y;

int hidden_y __attribute__((visibility("hidden"))) = 99; //全局符号便成本地符号
double default_y __attribute__((visibility("default"))) = 100;//如果 //还是全局符号

visibility属性,控制文件导出符号,限制符号可见性 -fvisibility:clang参数 default:用它定义的符号将被导出。 hidden:用它定义的符号将不被导出。

全局符号对整个项目可见

如果我们在一个库的m文件中实现一个全局的global_object函数,我们可以在项目中通过extern void global_object()之后正常使用,但是如果我们项目中也实现global_object函数,代码会优先调用本项目中的global_object方法,这里涉及到命名空间

  • two_levelnamespace & flat_namespace:
  • 二级命名空间与一级命名空间。链接器默认采用二级命名空间,也就是除了会记录符号 名称,还会记录符号属于哪个Mach-O的,比如会记录下来_NSLog来自Foundation。

查看导出符号

CMD = objdump --macho --exports-trie ${MACH_PATH}

  • 对应了上面的2个全局符号
  • 全局符号可以变成导出符号 可以让外界来使用

查看间接符号表

间接符号表是我们使用的其他动态库的符号。

CMD = objdump --macho --indirect-symbols ${MACH_PATH}

  • 间接符号表->动态库符号
  • strip 脱符号的时候 只能脱不是全局符号的符号

  • 项目中使用了NSLog 导入了NSLog
  • Foundation 导出了NSLog
  • 动态库 -> 符号 给外界使用
  • 间接符号表 -> 动态库符号
  • 全局符号 -> 导出符号 -> strip 动态库 不是全局符号的符号
  • 间接符号表
  • oc动态库 -> 体积就很大 -> 外界可以随意使用

OC文件

我们创建OC类,查看OC类和方法是本地符号还是全局符号(导出符号)

  • 写一个OC的文件 LGOneObjec.h LGOneObjec.m
  • main.m 中引入这个OC类
  • 编译
  • 查看导出符号表
    • oc默认是一个导出符号

怎么修改OC的类变成不导出符号 来解决上面的问题呢

修改链接器

OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_CLASS_$_LGOneObject
OTHER_LDFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker _OBJC_METACLASS_$_LGOneObject

OTHER_LDFLAGS=(inherited) -Xlinker -unexported_symbol_list -Xlinker _OBJC_CLASS__LGOneObject

  • 这个OC的类就不导出了

map

  • 查看信息
OTHER_LDFLAGS=$(inherited) -Xlinker -S -Xlinker -map -Xlinker /Users/xsj/Desktop/Mach-0/Mach-0/Symbol.text

Weak Symbol:

  • Weak Reference Symbol: 表示此未定义符号是弱引用。如果动态链接器找不到该符号的定义,则将其设置为0。链接器会将此符号设置弱链接标志。
  • Weak defintion Symbol: 表示此符号为弱定义符号。如果静态链接器或动态链 接器为此符号找到另一个(非弱)定义,则弱定义将被忽略。只能将合并部分中的符号标记为弱定义。

WeakSymbol.h

// weak def
void weak_function(void)  __attribute__((weak));
// weak 本地符号
void weak_hidden_function(void) __attribute__((weak, visibility("hidden")));

WeakSymbol.m

#import "WeakSymbol.h"
#import <Foundation/Foundation.h>
// 全局符号 -》导出符号
void weak_function(void) {
    NSLog(@"weak_function");
}

void weak_hidden_function(void) {
    NSLog(@"weak_hidden_function");
}
  • 同时在main.m 也定义了一个 运行但是不会报错 这就是因为弱定义符号 找到了一个,后面的在找到就直接忽略了