程序在启动或内存压力增加时出现 jvm 崩溃的问题,错误日志显示出现了 sigsegv (0xb) 信号,导致进程崩溃。我们需要仔细分析这个问题的原因,特别是在已经排除了软件问题之后。
根据提供的 hs_err_pid30391.log 文件,我们可以看到关键信息如下:
- JVM 版本:OpenJDK Runtime Environment Zulu21.40 17-CA (21.0.6 7)
- 错误类型:SigsEGV (0xb)
- 问题框架:PhaseChaitin::raise_pressure
- 当前线程:C2 CompilerThread3
SIGSEGV (Segmentation Violation) 表示程序尝试访问内存的权限不足或访问了不存在的内存。这在 JVM 中可能由多个原因导致,包括硬件问题、JVM 本身的 bug,或者 JIT(即时编译)过程中出现的错误。
考虑到问题是在更换电源后出现,但在迁移到其他机器上运行正常,且在原机器上的压力测试无问题,这种情况可能指向以下几种可能的原因:
- 硬件兼容性问题:尽管压力测试没有问题,但在特定负载下,电源或其他硬件可能与JVM有兼容性问题。
- JVM JIT 编译问题:JIT 编译器在特定情况下可能会导致内存访问错误,尤其是在高负载或复杂的计算过程中。
基于这些分析和提供的问题答案,我们可以采取以下步骤来进一步诊断和解决问题:
禁用 JIT 编译
首先尝试禁用 JIT 编译,看是否能解决问题。可以通过在启动命令中添加以下参数来实现:
Java -XX:-UseCompiler mohist-1.20.1-cc9de12e-server.jar nogui
如果禁用 JIT 编译后问题消失,这表明问题可能与 JIT 编译器有关。
排除特定方法的 JIT 编译
如果确实是 JIT 编译的问题,可以尝试排除特定方法的编译。根据日志中的信息,可以尝试排除 java.util.stream.AbstractPipeline 类的所有方法:
java -XX:CompileCommand=exclude,java.util.stream.AbstractPipeline::* mohist-1.20.1-cc9de12e-server.jar nogui
降级 JVM 版本
如果上述方法都不奏效,可以考虑降级 JVM 版本。某些版本的 JVM 可能会包含导致问题的 bug,通过使用更早的稳定版本可能会解决问题。
在尝试这些解决方案时,建议在多个环境中进行测试,以确保问题的解决不仅仅是特定环境下的偶然现象。同时,保持对 JVM 日志和系统监控的关注,以便在发生类似问题时能够快速定位和解决。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END