编程语言的发展
机器语言
由0和1组成
汇编语言
用符号代替了0和1,比机器语言便于阅读和记忆
高级语言
C\C++\Java\JavaScript\Python等,更接近人类自然语言
举例: 将寄存器ax中的内容放入寄存器bx
机器语言:1000100111011000
汇编语言:movw %ax, %bx
高级语言:bx = ax
汇编语言与机器语言一一对应,每一条机器指令都有与之对应的汇编指令
汇编语言通过编译可以得到机器语言,机器语言可以通过反汇编得到汇编语言
高级语言通过编译得到汇编语言\机器语言,但汇编语言\机器语言几乎不可能还原成高级语言
汇编语言的种类
常见的汇编: 8086汇编(16bit) x86汇编(32bit) x64汇编(64bit) ARM汇编(嵌入式、移动设备)
x86、x64汇编根据编译器的不同,有2种书写格式 Intel:Windows派系 AT&T :Unix派系
iOS开发中,最主要的汇编语言是 AT&T汇编(iOS模拟器) ARM汇编(iOS真机设备)
常用汇编的指令
寄存器
**16个常用寄存器 **
rax、rbx、rcx 、rdx、rsi、rdi、rbp、rsp
r8、r9、r10、r11、r12、r13、r14、r15
寄存器的用途
rax、rdx常作为函数返回值使用
rdi、rsi、rdx、rcx、r8、r9等寄存器常用于存放函数参数
rsp、rbp用于栈操作
rip作为指令指针,存储着CPU下一条要执行的指令的地址,一旦CPU读取一条指令,rip会自动指向下一条指令(存储下一条指令的地址)
lldb常用指令
读取寄存器的值
register read/格式
register read/x
修改寄存器的值
register write 寄存器名称 数值
register write rax 0
读取内存中的值
x/数量-格式-字节大小 内存地址
x/3xw 0x0000010
修改内存中的值
memory write 内存地址 数值
memory write 0x0000010 10
格式
x是16进制,f是浮点,d是十进制
字节大小
b – byte 1字节
h – half word 2字节
w – word 4字节
g – giant word 8字节
expression 表达式
可以简写:expr 表达式
expression $rax
expression $rax = 1
po 表达式
print 表达式
po/x $rax
po (int)$rax
thread step-over、next、n
单步运⾏,把子函数当做整体⼀步执⾏(源码级别)
thread step-in、step、s 单步运⾏,遇到子函数会进⼊子函数(源码级别)
thread step-inst-over、nexti、ni 单步运⾏,把子函数当做整体⼀步执⾏(汇编级别)
thread step-inst、stepi、si 单步运⾏,遇到子函数会进⼊子函数(汇编级别)
thread step-out、finish 直接执⾏完当前函数的所有代码,返回到上一个函数(遇到断点会卡住)
一般规律
内存地址格式为:0x4bdc(%rip),一般是全局变量,全局区(数据段)
内存地址格式为:-0x78(%rbp),一般是局部变量,栈空间
内存地址格式为:0x10(%rax),一般是堆空间