因为 C/C++ 没有 Garbage Collection 机制,这使得它们可以做到很高效,但因此也容易产生内存方面的 bug 。 主要分为内存非法访问和内存泄漏两方面。 C/C++ 语法上对存在内存泄漏的程序(即申请了动态内存但没释放就退出了)不提供任何保证,即不保证操作系统会回收泄漏的内存。 现代操作系统基本会在程序结束后立刻回收程序使用的所有内存,否则一旦发生内存泄漏的程序很多,系统很容易崩溃。 比如Linux,会为每个程序建立一个虚拟内存空间(程序只知道虚拟内存地址,操作系统完全知道虚拟内存地址到物理内存地址的转换,也即操作系统能够监控到程序使用的所有内存),程序结束后即会销毁这个空间,也即回收了内存。 但是注意,并非所有系统都会做这一步,在一些实时的操作系统中,为了效率考虑(内存回收需要不少的代价)则不会做类似的处理,依赖程序员自身来保证程序正确性。
最麻烦的地方在于,内存错误不一定会立刻报错,而是可能积累到一定程度才报错,而报错的地方不一定是真正出错的地方。 有时候不同机器上表现也不同,小机器(如笔记本)上报错,但大的服务器上可能就不会报错。
虽然内存调试会很麻烦,但是为了性能考虑,几乎所有的操作系统和系统软件都会采用C/C++来实现。 数据库系统也是如此,但凡强调性能的数据库系统,都要在底层使用 C/C++ 。
Valgrind
输出日志 log4cplus
类型溢出问题:比如int爆上界,应用unsigned,或者unsigned也超过上界,应用long(64位机器上是八字节,为了提高可移植性,在使用其字节数时应用sizeof(long)而不应该直接用8)甚至long long
也有可能出现unsigned爆下界,因为其无法取负值,此时反而应该用int
数组太大
递归调用太深,爆栈
类型溢出导致的各种问题,如非法读写
delete/free/delete[]/new/new[]/malloc 不匹配
尝试释放p+10,但p才是分配的内容起始地址
释放之后再去读
double free
free an invalid address
read/write an invalid address
C++中检查new的返回值与C语言中对malloc的检查不同,必须处理异常而不是判断指针是否非空:
https://blog.csdn.net/hbyzl/article/details/8096007
操作系统对core dump的收集程序,abrt-hook-ccpp。 系统收集的core dump 非常多时,abrt-hook-ccpp的内存占用会非常大。 猜想:程序发生内存错误时,是否立即报错或到底到何时会报错,与操作系统对core dump的收集程度有关?积累到一定量才会直接报错?
gdb -c core.*
kill -s SIGSEGV PID
http://blog.sina.com.cn/s/blog_81fcea16010130w9.html
默认情况下,core dump生成的文件名为core,而且就在程序当前目录下。新的core会覆盖已存在的core。通过修改/proc/sys/kernel/core_uses_pid文件,可以将进程的pid作为作为扩展名,生成的core文件格式为core.xxx,其中xxx即为pid
https://blog.csdn.net/zzhongcy/article/details/42873015
http://blog.chinaunix.net/uid-20279362-id-4962658.html
若是一个程序反复地跑查询,每个查询处理过程中都可能出现一些问题如越界操作,但是不一定会报错。 操作系统会收集这些信息,直到问题累积到一定量才可能报错,而且维护程序abrt-hook-ccpp也会占用很大。 因为一个程序是以一个进程的形式运行的,有自己的虚拟内存空间,所做的内存操作和引发的一切问题都会被记录。 但若一个程序只跑一个查询,通过启动这个程序多次来跑多个查询,就不会有这个隐患。 也不会出现一个个查询分开来跑可以,全合到一个程序跑就会报错停止的情况。 因为一旦程序跑完一个查询,这个进程终止,对应的虚拟空间会被销毁,一切内存问题会被解决,abrt-hook-ccpp也不会占用越来越大!
防止内存泄漏的有效工具,使用很方便可以在不同作用域维持对象的生存周期,,但也不可避免地会带来一些性能的下降。
使用中同样要小心,只有当没有引用指向这个对象时,这个对象才会被析构。
之前在一次C++ web服务的开发中,因为response是shared_ptrHttpServer::Response&类型,里面有一个ostream表示输出流,可以向客户端返回消息。 里面还有一个引用计数,当引用计数降为0,这个对象就会被析构,ostream缓冲区的内容才会真正发给用户。 如果我们自己定义了一个Task类,在里面使用了response,这样就多出了一个对Response对象的引用。 只要Task类没被析构,Response对象就不会被析构,客户端也就永远无法接到内容。
就我的个人看法,做研究的人,从问题中升华得到经验和教训,远比解决一个具体的问题要重要。如果是一个比较有代码经验的人来做这个事情,当常规调试策略全部失败的时候,可以考虑以下几种做法:
-
请一个在这方面非常专业的人来帮忙寻找问题,这种是最快的,但也更可能找不到。也可以请一个这方面不太了解的人来帮忙调试,毕竟不了解就更可能提出问题。(但这2种让别人帮忙调试的做法,是最不可取的)
-
用gdb或cuda-gdb强行单步调试,这需要你去学这个工具,但一旦学会,受益终生
-
通读文档。就像之前我遇到的那个动态申请堆内存的bug,以及你这个,其实都是可以通过先读一遍cuda文档解决的。上面说的很精要很明白,只是我们很多时候不愿花时间,总想取巧罢了
-
强行倒推。我们可以先精简代码,比如一千行的代码跑不起来,我们可以先尝试注释掉某个功能模块,把它变为五百行。不行的话就再精简,去除一些功能,变成一个简单的代码框架,直到不报bug为止。然后,从这个运行正确的代码开始,我们可以不断地把已有的功能加进去,一直加到出问题为止。这样,我们就找到了出问题的功能模块,接下来只要对这个功能模块展开分析就行
以上这些就是调试时一些非常规的方法,都是我在做gstore系统的时候总结出来的,毕竟我接手这个系统的时候,并没有人指导。 但是所有的问题,总是能找到解决方法的。 对于一些不是很关键的问题,大可以用一些简单粗暴的方法,比如: 不行就分,喜欢就买,重启试试。
提高代码可读性与程序的可移植性
10000000000不能被unsigned接收,如果是使用宏定义,必须加上L,即便要赋值给long类型,也必须加上L,输出时应使用ld选项
类型截断,long赋值给unsigned
要发现此类问题可多开警告选项 -Wall -Werror
指针的赋值是不能隐式进行的,比如long* 赋值给unsigned或者unsigned long会报错
size_t与ssize_t
为了增强程序的可移植性,便有了size_t,它是为了方便系统之间的移植而定义的,不同的系统上,定义size_t可能不一样。 在32位系统上 定义为 unsigned int 也就是说在32位系统上是32位无符号整形。在64位系统上定义为 unsigned long 也就是说在64位系统上是64位无符号整形。size_t一般用来表示一种计数,比如有多少东西被拷贝等。例如:sizeof操作符的结果类型是size_t,该类型保证能容纳实现所建立的最大对象的字节大小。 它的意义大致是“适于计量内存中可容纳的数据项目个数的无符号整数类型”。所以,它在数组下标和内存管理函数之类的地方广泛使用。而ssize_t这个数据类型用来表示可以被执行读写操作的数据块的大小.它和size_t类似,但必需是signed.意即:它表示的是signed size_t类型的。
typedef unsigned long size_t
ssize_t是signed size_t
当输入超出了预分配的空间大小,就会覆盖该空间之后的一段存储区域,这就叫Heap Corruption。这通常也被用作黑客攻击的一种手段,因为如果在该空间之后的那段存储区域如果是比较重要的数据,就可以利用Heap Corruption来把这些数据修改掉了,后果当然可想而知了。
http://www.cnblogs.com/lzjsky/archive/2010/09/27/1836807.html
fflush(NULL) is valid, but fclose(NULL) will cause segmenttaion fault
xfree(p) free(p);p=NULL
free(NULL) is valid
pmap -d PID
一个进程到底有没有内存泄露?如果内存泄露数量太少,其他方法很难看到具体内存数量的变化。有什么办法呢?
查看进程wuxi,进程号是29131,则:
cat /proc/29131/status
其中的VmRSS,就是该进程占用的内存。微小变化也能看到。据此判断内存有没有泄露。
如果觉得输出太多,可以用新命令:
cat /proc/5643/status | grep VmRSS
top or ps
using top, shift+M or shift+F then press n
比如char转换为short,在多处的八字节默认是补1的。 如果是unsigned char,则补0.
大端小端法是对于多字节数据而言的,如果是一个char数组,则各个char数据是按内存地址从低到高排列的。 在实现bitset时会遇到大端小端的问题,以及还有一个字节内部的各bit存储的问题。 GPU中titan XP也是采用小端法存储的,这些都是可以检验的。
如果存取都是以unsigned为单位,还存在大小端的问题么?
C语言中有返回值的函数,如果没有写上return 返回值的语句,编译和运行不会报错,但结果很可能有问题。
double的小数位可高达16位,输出浮点数时不一定会输全,也不一定会把非0部分输出来,有时候必须指定宽度。
int的最小值可用INT_MIN,是负值。 但浮点数的最小值有所不同,DBL_MIN是指最小正数,-DBL_MAX才是最小负数。 浮点数的临界值定义在floats.h中,而其他类型的最值定义在limits.h头文件中。
double的指数部分是11位,是2的指数,整体显示成10进制最大的是e+308
有一位是符号位,另外52位是尾数部分,所以小数点后的精度最多到16位。
https://en.wikipedia.org/wiki/Double-precision_floating-point_format
https://blog.csdn.net/eickandy/article/details/48494943
ghex
vim -d 后 :%!xxd``
将信号处理函数用于调试
一个核虽然支持超线程技术,但如果两个线程真是满负荷工作,效率可能比串行执行还低。 比较好的方式是一个线程负荷高,一个线程负荷低。 或者两个线程各自有一些耗时的访存操作,穿插执行。