gdb调试以及段错误吐核
段错误
我们在Linux环境下编程中,有时执行编译好的文件时会出现段错误(吐核),这是经常出现的一个错误。
它是什么意思呢? 这个错误过程中都有哪些文件? 与VS中IDE直接报错有何不同?我们将通过本篇进行探讨。
查阅相关文档发现,产生段错误的原因主要有:
1,解引用空指针
2,访问不可访问的内存空间(如内核空间)
3,访问不存在的内存地址
4,试图写一个只读内存空间(如代码段)
5,栈溢出(函数递归调用)
6,使用未初始化的指针(定义时没有初始化或者已经回收)
比如我们在程序中 对一个栈溢出(函数递归调用)进行解引用 进行演示:
————————————————
这里就出现了如开头第一张图中所示的段错误(吐核)
吐核:吐出了一个“核心转储文件”(coredump文件)
程序确认出现错误时的“临终遗言” 写入核心转储文件,也是使用gdb调试器最常用到的场景
那么如何查看吐出的 核心转储文件?
我们尝试ls -a查看全部文件 (包含默认隐藏的文件)发现也并没有相关的新文件产生。
其实操作系统有限制,默认不允许随意吐核,在一个工程中coredump文件有可能会特别大,多次吐核过于占存,这样随意吐核会影响机器性能,一定要慎用。
文件什么样?
我们通过指令查看与程序相关的属性,其中会包含核心转储文件信息:
ulimit -a
第一条core file就是coredump—— 核心转储文件,size为0表示不允许吐核,更改一下文件大小就可以顺利产出吐核文件了。
● 通过指令更改为大小为无限制
ulimit -c unlimited
我们再执行./kylin-about,再次吐核。
之后 ls 就会出现core.21319的文件,数字后缀不同机器会不一样,这个不用在意。这个就是核心转储文件,我们成功通过操作查看到了。
那么我们通过vim进入文件内部,看看它究竟是什么样子的:
果然如我们所料看不太懂,不知所云,这时候就借助我们老搭档gdb调试器的力量,输入指令:
gdb 可执行文件名 + 核心转储文件名
核心转储文件通过不同的可执行文件可能吐出不同的核,所以要带上可执行文件名,告诉操作系统这个核心转储文件是哪个可执行文件吐出的。
在这个程序中我们就输入gdb ./kylin-about core.21319,回车后就可以定位程序错误原因了:
错误原因
红线中显示调用库文件libc.so.6中出错,但是具体是什么,尚未看出。
红线上一行显示11号信号,它是段错误(Segmentation fault)的典型图腾。
调用情况
那么这错误的代码到底是怎么执行的?
可以通过bt指令查看函数调用栈:
可以看出最后在main.c中调用main(),main()调用create_canvas(),在第506行出现问题。
再来看看第506行的代码:
while((tmpchar1=fgetc(file))!=EOF)
这是一个循环,可以判断出应该是栈溢出(函数递归调用),即出现了死循环(循环无法正常退出)。
小结
其实段错误就是:
硬件设备MMU发现访问了一个非法的虚拟地址,通知操作系统内核给进程发送11号信号,进程收到了一个11号信号,导致进程异常终止。