当前位置: 主页 > JAVA语言

java 内存溢出排查-java内存泄露问题的排查思路和各种工具的使用方法

发布时间:2023-06-23 11:08   浏览次数:次   作者:佚名

摘要: 今天刚刚才加一个故障review会议, 故障非常典型, 在google也可以找到相似案例介绍。 在排查问题的过程中,使用了大量的工具, 发现有问题的地方还不只一个,总结一下. (本篇文章不会重点描述案例本身,重点会介绍个人对java内存泄露问题的排查思路和各种工具的使用)。

今天刚刚才加一个故障review会议, 故障非常典型, google下也可以找到相似案例介绍。 在排查问题的过程中,使用了大量的工具, 发现有问题的地方还不只一个java 内存溢出排查,总结一下. (本篇文章不会重点描述案例本身,重点会介绍个人对java内存泄露问题的排查思路和各种工具的使用)。

java内存泄露典型特征

现象一:堆/Perm 区不断增长, 没有下降趋势(回收速度赶不上增长速度), 最后不断触发FullGC, 甚至crash(如下两张图是同一个应用的GC和Perm数据, GC触发原因确认是Perm不足). 一般是现象二的晚期表现。

java内存泄漏排查_java 内存溢出排查_java栈溢出

现象二:每次FullGC后, 堆/Perm 区在慢慢的增长, 最后不断触发FullGC, 甚至crash(如下图: 示意图)

java 内存溢出排查_java内存泄漏排查_java栈溢出

java内存泄露场景---PermGen space

原因:说明Perm不足. Perm存放class,method相关对象,以及运行时常量对象. 如果一个应用加载了大量的class, 那么Perm区存储的信息一般会比较大.另外大量的intern String对象也会导致Perm区不断增长。 此区域大小由-XX:MaxPermSize参数进行设置. (jdk8相关参数已经改变, 这里不讨论)

java 内存溢出排查_java内存泄漏排查_java栈溢出

案例: Groovy动态编译class, xstream String.intern

本质原因:ClassLoader.defineClass和java.lang.String.intern在大量不适宜的场景被调用.

解决方案:

方案1(直接有效): 使用btrace相关工具输出调用ClassLoader.defineClass栈信息, 从栈信息来追溯问题. (代码如下图). 但Btrace 不能trace jvm native方法(官方release btrace 1.3.1中版本声明可以trace native方法, 但尝试无效。如果你清楚如何使用,麻烦告知一下,谢谢)。

java 内存溢出排查_java栈溢出_java内存泄漏排查

用JProfiler来trace String.intern方法栈

方案2: dump heap, 看看哪些class有异常现象(数量), String被Perm区引用的对象信息等.但这种方式不太直观,可以从String数据看看发现可疑问题,没有方案1直观。(如下图: 如果能在日常调试推荐JProfiler)

java栈溢出_java 内存溢出排查_java内存泄漏排查

java 内存溢出排查_java栈溢出_java内存泄漏排查

方案3: 增加-XX:+TraceClassLoading和-XX:+TraceClassUnloading, 看看哪些class加载了java 内存溢出排查,哪些class卸载了. 如果一些特殊的class一直被加载而没有被卸载说明也是有问题的。(如下图)

java内存泄漏排查_java栈溢出_java 内存溢出排查

方案4:执行jmap -permgen(jstat -gcutil 可以查看内存增长速度和区域)命令看看Perm区中的内容, 初步确定是否存在问题 (如下图)

java 内存溢出排查_java栈溢出_java内存泄漏排查

java 内存溢出排查_java内存泄漏排查_java栈溢出

java内存泄露场景---Java heap space

原因:长生命周期的对象引用了短生命周期(应该尽快GC回收掉)的对象,最后造成一个对象已经不能在堆区分配足够空间. 注: 这种现象不能完全肯定是内存泄露, 比如: heap本身的设置的过小.

案例: 我个人没有遇到过这种案例, 但模拟过这种情形的Demo: 参考我的《深入浅出JProfiler》文章, 也学习过其他同学的案例: 例如:参数过大并且频繁超时导致内存泄露

java栈溢出_java 内存溢出排查_java内存泄漏排查

解决方案:

触发FullGC, dump live heap. 标记堆中对象数量, 重点关注可疑对象

触发FullGC, dump live heap. 标记堆中对象数量, 重点关注可疑对象

对比步骤1和步骤2 相同对象的数量和大小, 找出可疑对象一一进行排查确认。

如果步骤3依然无法明确有问题的对象, 那就多执行几次步骤1和步骤2。 在此过程中可以调整GC触发时间, 模拟真实的故障场景 :)

看看GC后堆的大小是否增长, 如果没有不断增长, 并且持续一段较长时间, 那基本正常(具体看看[深入浅出JProfiler][JProfiler]文章中的实践章节)。

注:Java内存泄露的场景还有很多(可以参考下官方的一些文档java memleaks), 有机会后面会继续补充。

java 内存溢出排查_java内存泄漏排查_java栈溢出

java内存泄漏排查_java 内存溢出排查_java栈溢出

2016杭州• 云栖大会——开发者技术峰会

架构

java 内存溢出排查_java栈溢出_java内存泄漏排查

2016年10月15日

java栈溢出_java内存泄漏排查_java 内存溢出排查

杭州·云栖小镇

峰会议程

这是架构师最好的时代。物联网、移动、云计算、大数据、人工智能等新技术在行业的深入应用不断驱动着企业IT系统的变迁。作为系统的灵魂,架构师的思想、设计、技能和经验,影响深远。峰会将深入分享构师们在高可用、高并发、高性能应用架构搭建与实践的经验与心得体会,以及自我驱动成长、Docker带来的架构设计理念等方面的收获,帮助更多伙伴学习和成长。

java栈溢出_java 内存溢出排查_java内存泄漏排查

13:20-13:30【视频】谈架构师自我修养阿里云云栖社区明星专家们

13:30-13:40开场郭雪梅 阿里云云栖社区总编

13:40-14:20我看分布式系统发展和阿里实践林伟 阿里云大数据计算平台资深架构师

14:20-15:00Docker大规模应用带来的架构设计新挑战吴峥涛 蚂蚁金服高级技术专家

15:00-15:40微博混合云,极端流量下的峰值应对与架构挑战王关胜 新浪微博资深运维架构师

15:40-16:20千万级用户直播App服务端架构设计和思考张华伟 一下科技 技术副总裁

16:20-17:00基于机器学习的阿里智能助理在电商领域的架构构建与实践海青 阿里巴巴高级技术专家

扫码直入活动页:

java 内存溢出排查_java内存泄漏排查_java栈溢出