在使用gcc/g++编译二进制文件过程中,如果添加了-g参数,编译出来的二进制文件会带有debug信息,供调试使用。但是debug信息往往占用空间很大,导致二进制文件太大,在发布到生产环境时,一般会去掉调试信息,以减小二进制文件大小。如此一来,在出现问题后就无法直接使用gdb调试工具进行调试了。一种可行的做法是版本发布时保留debug信息,出现问题后使用debug信息进行问题分析调试,但这种做法相对比较麻烦。mini debuginfo的技术提供了一种有效的解决思路。
mini debuginfo的思路是在二进制ELF文件中添加一个section(.gnu_debugdata),section中仅保留最少的调试信息(如:只保留可调试的函数符号),并对调试进行进行压缩,以尽可能地减少调试信息大小。
下面以一个实际例子说明如何给二进制文件添加该类型的section。
我们以一个简单的例子开始,以下是该例子的代码:
#include int a; void func1() { a = 1; } void func2() { int test; a = 2; test = a; } int main() { func1(); func2(); printf("a is %d\n", a); return 0; }
使用gcc命令将代码编译成二进制可执行文件:
gcc -g -o test_mini_debug test_mini_debug.c
然后使用nm命令查看该二进制文件中的符号信息,其中--defined-only参数指定只关注定义的信息:
nm --defined-only test_mini_debug
二进制文件中有很多符号,我们调试时关心的主要是函数和变量信息,函数位于ELF二进制文件的.TEXT段中,即上图中第二列为T/t的符号;变量分全局变量和局部变量,全局变量位于.BSS段(未初始化的全局变量)或.DATA段(初始化的全局变量)中,即上图中第二列为B/b,D/d的符号,局部变量一般保存在寄存器或栈中,此处看不到。
我们将函数和全局变量保存到一个文件中,后续会使用到,命令如下:
nm --defined-only test_mini_debug |awk '{ if($2 == "T" || $2 == "t" || $2 == "B" || $2 == "b" || $2 == "D" || $2 == "d") print $3 }' > test_mini_debug.syms
在上一步中保存了我们要保留的符号信息,接下来就可以根据这些信息生成minidebug信息了。首先使用objcopy命令将上面的二进制文件的debug信息剥离出来:
objcopy --only-keep-debug test_mini_debug test_mini_debug.debug
然后,对debug信息进行瘦身,只保留我们关注的函数和全局变量信息:
objcopy -S --keep-symbols=test_mini_debug.syms test_mini_debug.debug test_mini_debug.mini_debuginfo
接着,使用xz命令对debug信息进行压缩,进一步减小debug信息大小:
xz test_mini_debug.mini_debuginfo
经过以上一番操作,debug信息从原来的6K减少到了1K左右:
在上面的步骤中,我们将debug信息从二进制文件中剥离了出来,但是原来的二进制文件还存在debug信息,如下图,使用readelf查看,这些debug信息(以.debug开头的段)还在二进制文件中:
readelf -S test_mini_debug
要先将该部分信息删除,直接使用objcopy -S命令即可。
objcopy -S test_mini_debug
再次使用readelf命令查看,已经没有debug信息了:
最后一步,将我们之前生成的mini debuginfo信息添加到二进制文件中,命令如下:
objcopy --add-section .gnu_debugdata=test_mini_debug.mini_debuginfo.xz test_mini_debug
使用readelf命令查看,二进制文件中已经有.gnu_debugdata段了:
使用gdb命令调试该二进制文件,可以看到,已能够识别函数和全局变量了。