可执行文件格式mach-O,是在苹果的操作系统 macOS 和 iOS 上使用的一种二进制文件格式。
在一些iOS安全扫描中,可能存在需要获取函数具体调用位置的需求,能指导用户更精确的定位漏洞。
现在以NSLog函数为例,用静态方式搜索macho中动态链接函数的具体调用位置。
搜索应用macho中调用NSLog函数的具体位置。
整个搜索过程,是一个解析macho文件的过程,把二进制数据解析为合适的数据结构。
用到了macho中多个部分:
String Table
Symbol Table
Dynamic Symbol Table
Section64(TEXT,stubs)
Section64(TEXT,text)
在Load Commands中找到LC_SYMTAB,能确定StringTable的offset和size,也能找到Symbol Table的offset和Number:
Symbol Table Offset 是 0x18c478
Number of Symbols 是 0x9a2d
String Table offset 是 0x2273b0
String Table Size 是 0x108d58
因为每条symbol数据长度是16个字节,也就是0x10,
所以 Symbol Table 的 size 是 0x9a2d*0x10 = 0x9A2D0
Symbol Table起始地址是 0x18c478
结束地址是 0x18c478 + 0x9A2D0 = 0x226748
String Table 的起始地址是 0x2273b0
结束地址是 0x2273b0 + 0x108d58 = 0x330108
因为字符串的长度不固定,在String Table中的每条数据的长度不固定,
在读取二进制中的String Table数据时,可以用’\x00’作为字符串的分隔符。
可以先读取macho中的String Table数据,用’\x00’作为分隔符,生成字符串数组,
遍历字符串数组,判断每条数据是否等于”_NSLog”。
在 0x23331b 位置找到了 _NSLog,机器码“5F4E534C6F6700”就是”_NSLog\n”字符串。
49003(16进制是 0xBF6B)是当前字符串的索引号,暂定为 strTab_index = 49003。
索引号49003是从String Table的起始地址 0x2273b0 开始计算,第49003个字节,
0x2273b0 + 49003 = 0x23331B,刚好是 _NSLog的起始地址。
在MachOView中能看到地址 0x00224988 对应的就是 _NSLog。
如何通过索引号49003找到匹配的符号表数据呢?
在步骤1中已知:
Symbol Table起始地址是 0x18c478 ,
Symbol Table结束地址是 0x226748。
在这个macho中,单条Symbol Table的数据大小是0x10。
仔Symbol Table中第38993条数据的前四个字节的值是0xBF6B,也就是49003,
与String Table上_NSLog字符串的索引号相同,所以这条数据就对应”_NSLog”:
38993是当前数据在Symbol Table中的索引号,暂定为 symTab_index = 38993,
0x18c478 + 38993 * 0x10 = 0x224988 正好是当前数据的地址。
在Macho中的Load Commands下的 LC_DYSYMTAB 中能确定Indirect Symbols的位置:
起始地址:0x226748,有 794 条数据,每条数据大小是0x4。
遍历Indirect Symbols中的每一条数据,第111条数据中存储的是38993,
所以这条数据对应的就是”_NSLog”,设置 dySymTab_index = 111
0x226748 + 111*0x4 = 0x226904
在Mach-O文件中,Section64(TEXT,stubs)节存储的是用于进行间接跳转(indirect jumps)的存根(stubs)。这些存根是为了支持懒加载和符号解析的过程。具体来说,_stubs 节通常包含指向实际目标函数或符号的跳转指令。
在动态链接时,如果一个函数或符号的地址尚未被解析,链接器会在__stubs节中放置一个跳转指令,该指令在运行时会被替换为实际地址。这有助于在程序执行过程中进行动态解析和加载。
在Load Commands 中能找到 Section64(TEXT,stubs)节的信息:
offset 是 0xAE518
size 是 0xEE8
所以 Section64(TEXT,stubs)节的位置
起始地址是 0xAE518
结束地址是 0xAE518 + 0xEE8 = 0xAF400
每条数据长度是 0xC
解析Section64(TEXT,stubs)的二进制数据结构,每条数据大小是0xC,
因为步骤4中已知 dySymTab_index = 111,所以找到第111条数据:
0xAE518 + 111*0xC = 0xAEA4C
地址0xAEA4C 存储的是NSLog符号的跳转指令。
在Section64(TEXT,text)节中,凡是要调用NSLog函数,都会执行arm指令”bl #0xAEA4C”。
在Load Commands 中能找到 Section64(TEXT,stubs)节的信息:
offset 是 0x5C64
size 是 0xA88B4
所以 Section64(TEXT,text)节的信息:
起始地址是 0x5C64
结束地址是 0x5C64 + 0xA88B4 = 0xAE518
查找到部分调用 NSLog 函数的指令:
使用Capstone库把Section64(TEXT,text)中的机器码反编译成arm汇编指令,
可以批量比较每一条指令是否是”bl #0xAEA4C”,就能知道代码中调用NSLog函数的具体位置。