您的位置:首页 > 其它

JVM致命错误日志(hs_err_pid.log)解读

2016-11-11 00:00 357 查看
致命错误出现的时候,JVM生成了hs_err_pid<pid>.log这样的文件,其中往往包含了虚拟机崩溃原因的重要信息。因为经常遇到,在这篇文章里,我挑选了一个,并且逐段分析它包含的内容(文件可以在文章最后下载)。默认情况下文件是创建在工作目录下的(如果没权限创建的话JVM会尝试把文件写到/tmp这样的临时目录下面去),当然,文件格式和路径也可以通过参数指定,比如:

1
java-XX:ErrorFile=/var/log/java/java_error%p.log
这个文件将包括:

触发致命错误的操作异常或者信号;

版本和配置信息;

触发致命异常的线程详细信息和线程栈;

当前运行的线程列表和它们的状态;

堆的总括信息;

加载的本地库;

命令行参数;

环境变量;

操作系统CPU的详细信息。

首先,看到的是对问题的概要介绍:

1
#SIGSEGV(0xb)atpc=0x03568cf4,pid=16819,tid=3073346448
一个非预期的错误被JRE检测到,其中:

SIGSEGV是信号名称

0xb是信号码

pc=0x03568cf4指的是程序计数器的值

pid=16819是进程号

tid=3073346448是线程号

如果你对JVM有了解,应该不会对这些东西陌生。

接下来是JRE和JVM的版本信息:

1
2
3
#JREversion:6.0_32-b05

#JavaVM:JavaHotSpot(TM)ServerVM(20.7-b02mixedmodelinux-x86)
运行在mixed模式下。

然后是问题帧的信息:

1
2
3
#Problematicframe:

#C[libgtk-x11-2.0.so.0+0x19fcf4]__float128+0x19fcf4
C:帧类型为本地帧,帧的类型包括:

C:本地C帧

j:解释的Java帧

V:虚拟机帧

v:虚拟机生成的存根栈帧

J:其他帧类型,包括编译后的Java帧

libgtk-x11-2.0.so.0+0x19fcf4:和程序计数器(pc)表达的含义一样,但是用的是本地so库+偏移量的方式。

接下去第一部分是线程信息:

1
Currentthread(0x09f30c00):JavaThread"main"[_thread_in_native,id=16822,stack(0xb72a8000,0xb72f9000)]
当前线程的:

0x09f30c00:指针

JavaThread:线程类型,可能的类型包括:

JavaThread

VMThread

CompilerThread

GCTaskThread

WatcherThread

ConcurrentMarkSweepThread

main:名字

_thread_in_native:线程当前状态,状态枚举包括:

_thread_uninitialized:线程还没有创建,它只在内存原因崩溃的时候才出现

_thread_new:线程已经被创建,但是还没有启动

_thread_in_native:线程正在执行本地代码,一般这种情况很可能是本地代码有问题

_thread_in_vm:线程正在执行虚拟机代码

_thread_in_Java:线程正在执行解释或者编译后的Java代码

_thread_blocked:线程处于阻塞状态

…_trans:以_trans结尾,线程正处于要切换到其它状态的中间状态

id=16822:线程ID

0xb72a8000,0xb72f9000:栈区间

1
siginfo:si_signo=SIGSEGV:si_errno=0,si_code=1(SEGV_MAPERR),si_addr=0x00000010
这部分是导致虚拟机终止的非预期的信号信息,含义前面已经大致提到过了。其中si_errno和si_code是Linux下用来鉴别异常的,Windows下是一个ExceptionCode。

1
2
3
EAX=0x00000000,EBX=0x0375dd84,ECX=0x00000000,EDX=0x00000000
ESP=0xb72f0fa0,EBP=0xb72f0fb8,ESI=0x00000000,EDI=0x0a6c1800
EIP=0x03568cf4,EFLAGS=0x00010246,CR2=0x00000010
这是寄存器上下文。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
TopofStack:(sp=0xb72f0fa0)
0xb72f0fa0:00000000004022500040217f0375dd84
0xb72f0fb0:000000000a6c1800b72f0fe80356c2c0
0xb72f0fc0:000000000a6c1800b72f0fe8003b3e77
0xb72f0fd0:003e6c8b0a1a70d00a1933580375dd84
0xb72f0fe0:0a2764180a276418b72f104803536c56
0xb72f0ff0:0acad0000b3ca9780000000c00dd0674
0xb72f1000:000000030a2c7d50b72f10380000330c
0xb72f1010:ffffffffffffffff0000000100000001

Instructions:(pc=0x03568cf4)
0x03568cd4:8914248975f889d6897dfc89c7e87e1b
0x03568ce4:eaff8934248987d4020000e83000eaff
0x03568cf4:8b4010893c24c7442408000000008987
0x03568d04:d00200008b838824000089442404e8dd
栈顶程序计数器旁的操作码,它们可以被反汇编成系统崩溃前执行的指令。

1
2
3
4
5
6
7
8
9
10
Registertomemorymapping:

EAX=0x00000000isanunknownvalue
EBX=0x0375dd84:<offset0x394d84>in/usr/lib/libgtk-x11-2.0.so.0at0x033c9000
ECX=0x00000000isanunknownvalue
EDX=0x00000000isanunknownvalue
ESP=0xb72f0fa0ispointingintothestackforthread:0x09f30c00
EBP=0xb72f0fb8ispointingintothestackforthread:0x09f30c00
ESI=0x00000000isanunknownvalue
EDI=0x0a6c1800isanunknownvalue
寄存器和内存映射信息。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Stack:[0xb72a8000,0xb72f9000],sp=0xb72f0fa0,freespace=291k
Nativeframes:(J=compiledJavacode,j=interpreted,Vv=VMcode,C=nativecode)
C[libgtk-x11-2.0.so.0+0x19fcf4]__float128+0x19fcf4
C[libgtk-x11-2.0.so.0+0x1a32c0]__float128+0xc0
......
C[libswt-pi-gtk-3738.so+0x33f6a]Java_org_eclipse_swt_internal_gtk_OS__1Call+0xf
Jorg.eclipse.swt.internal.gtk.OS._Call(III)I
Jorg.eclipse.swt.internal.gtk.OS.Call(III)I

Javaframes:(J=compiledJavacode,j=interpreted,Vv=VMcode)
Jorg.eclipse.swt.internal.gtk.OS._Call(III)I
Jorg.eclipse.swt.internal.gtk.OS.Call(III)I
jorg.eclipse.swt.widgets.Widget.fixedSizeAllocateProc(II)I+5
jorg.eclipse.swt.widgets.Display.fixedSizeAllocateProc(II)I+17
v~StubRoutines::call_stub
......
线程栈。包含了地址、栈顶、栈计数器和线程尚未使用的栈信息,由于栈可能非常长,打印的长度有限制,但是至少本地栈和Java栈都打印出来了(很多时候本地栈打印不出来,但是Java栈一般都能打印出来)。从中可以看到,Eclipse的虚拟机崩溃了。

1
2
3
4
JavaThreads:(=>currentthread)
0x0b4c1000JavaThread"Worker-247"[_thread_blocked,id=25417,stack(0x741bc000,0x7420d000)]
0x0a300c00JavaThread"Worker-246"[_thread_blocked,id=25235,stack(0x7d30c000,0x7d35d000)]
......
线程信息。一目了然,不解释了。

1
VMstate:notatsafepoint(normalexecution)
虚拟机状态。包括:

notatasafepoint:正常运行状态;

atsafepoint:所有线程都因为虚拟机等待状态而阻塞,等待一个虚拟机操作完成;

synchronizing:一个特殊的虚拟机操作,要求虚拟机内的其它线程保持等待状态。

1
VMMutex/Monitorcurrentlyownedbyathread:None
虚拟机的Mutex和Monitor目前没有被线程持有。Mutex是虚拟机内部的锁,而Monitor则关联到了Java对象。

1
2
3
4
5
6
7
8
9
Heap
PSYoungGentotal149056K,used125317K[0xa9700000,0xb41a0000,0xb41a0000)
edenspace123520K,95%used[0xa9700000,0xb0ac0de0,0xb0fa0000)
fromspace25536K,26%used[0xb28b0000,0xb2f50748,0xb41a0000)
tospace25600K,0%used[0xb0fa0000,0xb0fa0000,0xb28a0000)
PSOldGentotal261248K,used239964K[0x941a0000,0xa40c0000,0xa9700000)
objectspace261248K,91%used[0x941a0000,0xa2bf7018,0xa40c0000)
PSPermGentotal163328K,used130819K[0x841a0000,0x8e120000,0x941a0000)
objectspace163328K,80%used[0x841a0000,0x8c160c40,0x8e120000)
堆信息。新生代、老生代、永久代。对JVM有了解的人应该都清楚,不解释了。

1
2
CodeCache[0xb4262000,0xb5ac2000,0xb7262000)
total_blobs=5795nmethods=5534adapters=209free_code_cache=25103616largest_free_block=38336
代码缓存(CodeCache)。这是一块用于编译和保存本地代码的内存,注意是本地代码,它和PermGen(永久代)是不一样的,永久带是用来存放Java类定义的。

1
2
3
4
5
6
Dynamiclibraries:
00101000-00122000r-xp0000000008:013483560/usr/lib/libjpeg.so.62.0.0
00122000-00123000rwxp0002000008:013483560/usr/lib/libjpeg.so.62.0.0
00125000-00130000r-xp0000000008:019093202/lib/libgcc_s-4.1.2-20080825.so.1
00130000-00131000rwxp0000a00008:019093202/lib/libgcc_s-4.1.2-20080825.so.1
......
内存映射。这些信息是虚拟机崩溃时的虚拟内存列表区域。在定位崩溃原因的时候,它可以告诉你哪些类库正在被使用,位置在哪里,还有堆栈和守护页信息。就以列表中第一条为例说明:

00101000-00122000:内存区域

r-xp:权限,r/w/x/p/s分别表示读/写/执行/私有/共享

00000000:文件内的偏移量

08:01:文件位置的majorID和minorID

3483560:索引节点号

/usr/lib/libjpeg.so.62.0.0:文件位置

每一个lib都有两块虚拟内存区域——代码和数据,它们的权限不同,代码区域是r-xp;数据区域是rwxp。守护页(guardpage)由权限为--xp和rwxp的一对组成。

1
2
3
4
5
6
7
8
VMArguments:
jvm_args:-Dosgi.requiredJavaVersion=1.5-XX:MaxPermSize=256m-Xms40m-Xmx512m-Dorg.eclipse.swt.browser.XULRunnerPath=''
java_command:/.../eclipse/plugins/org.eclipse.equinox.launcher_1.2.0.v20110502.jar-oslinux-wsgtk-archx86-showsplash-launcher/.../eclipse/eclipse-nameEclipse...
LauncherType:SUN_STANDARD

EnvironmentVariables:
PATH=...
DISPLAY=:0.0
虚拟机参数和环境变量。

1
2
3
4
SignalHandlers:
SIGSEGV:[libjvm.so+0x726440],sa_mask[0]=0x7ffbfeff,sa_flags=0x10000004
SIGBUS:[libjvm.so+0x726440],sa_mask[0]=0x7ffbfeff,sa_flags=0x10000004
......
信号句柄。对于Linux下的信号机制,参阅wiki百科,链接。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
OS:RedHatEnterpriseLinuxClientrelease5.4(Tikanga)

uname:Linux2.6.18-164.el5#1SMPTueAug1815:51:54EDT2009i686
libc:glibc2.5NPTL2.5
rlimit:STACK10240k,CORE0k,NPROC65536,NOFILE1024,ASinfinity
loadaverage:1.781.581.54

/proc/meminfo:
...

CPU:total4(4corespercpu,1threadspercore)family6model42stepping7,cmov,cx8,fxsr,mmx,sse,sse2,sse3,ssse3

/proc/cpuinfo:
...

Memory:4kpage,physical3631860k(155144kfree),swap5124724k(5056452kfree)
系统信息。

#文中使用的hs_err_pid文件在此下载#
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: