瓦尔格林德挂起来分析多线程程序
Valgrind hanging to profile a multi threaded program
我有一个在多核机器上运行的多线程程序(在Linux平台上使用Pthreads用C实现)。我正在使用带有 --memcheck 选项的 ValGrind 来查找我在代码中遇到的一些内存问题。但它挂了。为了全面概述问题,以下是背景。
作为初始化的一部分,代码在开始时有一些顺序部分,后来它创建 8 个线程(使用 Pthread API)并完成。我的代码在一段时间后转储"核心"。我使用了GDB,它给出了以下跟踪。
======= Backtrace: =========
/lib/tls/i686/cmov/libc.so.6[0xb7cd47cd]
/lib/tls/i686/cmov/libc.so.6(cfree+0x90)[0xb7cd7e30]
/home/kumar/CycleSim/slack_cp/sim-outorder[0x819a6c9]
/home/kumar/CycleSim/slack_cp/sim-outorder[0x8167e3e]
/home/kumar/CycleSim/slack_cp/sim-outorder[0x804f5e4]
/lib/tls/i686/cmov/libpthread.so.0[0xb7f8c31b]
/lib/tls/i686/cmov/libc.so.6(clone+0x5e)[0xb7d3c57e]
======= Memory map: ========
08048000-081b5000 r-xp 00000000 08:11 11813248
/home/kumar/CycleSim/slack_cp/sim-outorder
081b5000-081b8000 rw-p 0016c000 08:11 11813248
/home/kumar/CycleSim/slack_cp/sim-outorder
081b8000-08549000 rw-p 081b8000 00:00 0 [heap]
ab9fd000-ab9fe000 ---p ab9fd000 00:00 0
ab9fe000-ac1fe000 rw-p ab9fe000 00:00 0
ac1fe000-ac1ff000 ---p ac1fe000 00:00 0
ac1ff000-ac9ff000 rw-p ac1ff000 00:00 0
ac9ff000-aca00000 ---p ac9ff000 00:00 0
aca00000-ad2cb000 rw-p aca00000 00:00 0
ad2cb000-ad300000 ---p ad2cb000 00:00 0
ad3bf000-ad3c0000 ---p ad3bf000 00:00 0
ad3c0000-adbc0000 rw-p ad3c0000 00:00 0
adbc0000-adbc1000 ---p adbc0000 00:00 0
adbc1000-ae3c1000 rw-p adbc1000 00:00 0
ae3c1000-ae3c2000 ---p ae3c1000 00:00 0
ae3c2000-aebc2000 rw-p ae3c2000 00:00 0
aebc2000-aebc3000 ---p aebc2000 00:00 0
aebc3000-b2e7d000 rw-p aebc3000 00:00 0
b2e7d000-b2e7e000 ---p b2e7d000 00:00 0
b2e7e000-b367e000 rw-p b2e7e000 00:00 0
b367e000-b367f000 ---p b367e000 00:00 0
b367f000-b7c6d000 rw-p b367f000 00:00 0
b7c6d000-b7da8000 r-xp 00000000 08:01 12895490 /lib/tls/i686/cmov/libc-2.5.so
b7da8000-b7da9000 r--p 0013b000 08:01 12895490 /lib/tls/i686/cmov/libc-2.5.so
b7da9000-b7dab000 rw-p 0013c000 08:01 12895490 /lib/tls/i686/cmov/libc-2.5.so
b7dab000-b7dae000 rw-p b7dab000 00:00 0
b7dae000-b7dde000 r-xp 00000000 08:21 3828021 /usr/lib/libgslcblas.so.0.0.0
b7dde000-b7ddf000 rw-p 0002f000 08:21 3828021 /usr/lib/libgslcblas.so.0.0.0
b7ddf000-b7f7d000 r-xp 00000000 08:21 3828022 /usr/lib/libgsl.so.0.9.0
b7f7d000-b7f87000 rw-p 0019d000 08:21 3828022 /usr/lib/libgsl.so.0.9.0
b7f87000-b7f9a000 r-xp 00000000 08:01 12895516
/lib/tls/i686/cmov/libpthread-2.5.so
b7f9a000-b7f9c000 rw-p 00013000 08:01 12895516
/lib/tls/i686/cmov/libpthread-2.5.so
b7f9c000-b7f9f000 rw-p b7f9c000 00:00 0
b7f9f000-b7fc4000 r-xp 00000000 08:01 12895498 /lib/tls/i686/cmov/libm-2.5.so
b7fc4000-b7fc6000 rw-p 00024000 08:01 12895498 /lib/tls/i686/cmov/libm-2.5.so
b7fc9000-b7fd4000 r-xp 00000000 08:01 12861504 /lib/libgcc_s.so.1
b7fd4000-b7fd5000 rw-p 0000a000 08:01 12861504 /lib/libgcc_s.so.1
b7fd5000-b7fd9000 rw-p b7fd5000 00:00 0
b7fd9000-b7ff2000 r-xp 00000000 08:01 12861461 /lib/ld-2.5.so
b7ff2000-b7ff4000 rw-p 00019000 08:01 12861461 /lib/ld-2.5.so
bf8a0000-bf8b5000 rw-p bf8a0000 00:00 0 [stack]
ffffe000-fffff000 r-xp 00000000 00:00 0 [vdso]
虽然我使用了 -g 选项并且没有 O 标志,但它没有给出问题存在的确切代码位置。我
在互联网上搜索后,我明白了,这是因为我正在破坏内存。要么越界写入数组中的数据(是的,我正在使用大数组,但我在访问数组中的每个元素之前显式检查)或访问非法堆内存。但是由于代码很大,我无法弄清楚它只是看着它。因此,我转向ValGrind,以查看内存损坏发生的位置。我用ValGrind运行了代码,它运行良好,直到代码的顺序部分,但是当涉及到并行部分(Pthread创建部分)时,它没有做任何事情。在"top -H -p pid"的帮助下,我看到所有线程都已创建,但它们处于睡眠模式。原始代码(没有valgrind)没有挂起,我运行了很长时间(但我不能保证它是无死锁的)。使用Helgrind(valgrind的螺纹误差检测器)有用吗?
任何人都可以指出我的文件或类似问题。它是ValGrind版本2。机器是i686,Linux操作系统。
谢谢库马尔
也许你可以检查一下瓦尔格林德在多线程套接字程序中停滞不前Valgrind 强制应用程序在单核上运行,不确定这是否会给您的情况带来问题。
相关文章:
- 试图创建一个多线程程序来查找0-100000000之间的总素数
- sigwait() 在多线程程序中不起作用
- 多线程程序中出现意外的内存泄漏
- C++多线程程序:变量定义为类成员的隔离错误
- 在以读取为主的多线程程序中,可以使用原子来减少锁定吗
- 多线程程序中的分段故障和gdb回溯上的不完整信息
- 多线程程序卡在优化模式下,但在 -O0 中正常运行
- 在使用 std::cout 和多线程程序中如何避免数据竞争<iomanip>?
- 控制多线程程序中的输出流
- 使用 vector<thread> 和 .join() 未并行运行的多线程C++程序
- gdb:在多线程程序中调用函数,不进行线程
- 关于多线程程序中的临时对象
- C 中的多线程程序:在标志变量上使用Mutex
- c++:写入多线程程序中的文件
- 使用优化编译时的多线程程序块
- 如何读取锁定多线程C++程序
- 使用OpenSSL和锁随机崩溃的多线程程序
- 多线程程序中的K最近的邻居
- MFC多线程程序可以以并行方法运行
- 在多线程程序中创建OpenGL结构