专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

一次JVMGC长暂停的排查过程

  作者:京东科技徐传乐背景
  在高并发下,Java程序的GC问题属于很典型的一类问题,带来的影响往往会被进一步放大。不管是GC频率过快还是GC耗时太长,由于GC期间都存在StopTheWorld问题,因此很容易导致服务超时,引发性能问题。
  事情最初是线上某应用垃圾收集出现FullGC异常的现象,应用中个别实例FullGC时间特别长,持续时间约为1530秒,平均每2周左右触发一次;
  JVM参数配置Xms2048MXmx2048MXmn1024MXX:MaxPermSize512M
  排查过程
  分析GC日志
  GC日志它记录了每一次的GC的执行时间和执行结果,通过分析GC日志可以调优堆设置和GC设置,或者改进应用程序的对象分配模式。
  这里FullGC的reason是Ergonomics,是因为开启了UseAdaptiveSizePolicy,jvm自己进行自适应调整引发的FullGC。
  这份日志主要体现GC前后的变化,目前为止看不出个所以然来。
  开启GC日志,需要添加如下JVM启动参数:
  XX:PrintGCDetailsXX:PrintGCDateStampsXloggc:exportlogriskpillargc。log
  常见的YoungGC、FullGC日志含义如下:
  进一步查看服务器性能指标
  获取到了GC耗时的时间后,通过监控平台获取到各个监控项,开始排查这个时点有异常的指标,最终分析发现,在5。06分左右(GC的时点),CPU占用显著提升,而SWAP出现了释放资源、memory资源增长出现拐点的情况(详见下图红色框,橙色框中的变化是因修改配置导致,后面会介绍,暂且可忽略)
  JVM用到了swap?是因为GC导致的CPU突然飙升,并且释放了swap交换区这部分内存到memory?
  为了验证JVM是否用到swap,我们通过检查proc下的进程内存资源占用情况
  foriin(cdproc;lsgrep〔09〕awk0100);doawkSwap:{aa2}END{printi,a1024M}procismaps2devnull;donesortk2nrhead10head10表示取出前10个内存占用高的进程取出的第一列为进程的id第二列进程占用swap大小
  看到确实有用到305MB的swap
  这里简单介绍下什么是swap?
  swap指的是一个交换分区或文件,主要是在内存使用存在压力时,触发内存回收,这时可能会将部分内存的数据交换到swap空间,以便让系统不会因为内存不够用而导致oom或者更致命的情况出现。
  当某进程向OS请求内存发现不足时,OS会把内存中暂时不用的数据交换出去,放在swap分区中,这个过程称为swapout。
  当某进程又需要这些数据且OS发现还有空闲物理内存时,又会把swap分区中的数据交换回物理内存中,这个过程称为swapin。
  为了验证GC耗时与swap操作有必然关系,我抽查了十几台机器,重点关注耗时长的GC日志,通过时间点确认到GC耗时的时间点与swap操作的时间点确实是一致的。
  进一步查看虚拟机各实例swappiness参数,一个普遍现象是,凡是发生较长FullGC的实例都配置了参数vm。swappiness30(值越大表示越倾向于使用swap);而GC时间相对正常的实例配置参数vm。swappiness0(最大限度地降低使用swap)。
  swappiness可以设置为0到100之间的值,它是Linux的一个内核参数,控制系统在进行swap时,内存使用的相对权重。
  swappiness0:表示最大限度使用物理内存,然后才是swap空间
  swappiness100:表示积极的使用swap分区,并且把内存上的数据及时的交换到swap空间里面
  对应的物理内存使用率和swap使用情况如下
  至此,矛头似乎都指向了swap。
  问题分析
  当内存使用率达到水位线(vm。swappiness)时,linux会把一部分暂时不使用的内存数据放到磁盘swap去,以便腾出更多可用内存空间;
  当需要使用位于swap区的数据时,再将其换回内存中,当JVM进行GC时,需要对相应堆分区的已用内存进行遍历;
  假如GC的时候,有堆的一部分内容被交换到swap空间中,遍历到这部分的时候就需要将其交换回内存,由于需要访问磁盘,所以相比物理内存,它的速度肯定慢的令人发指,GC停顿的时间一定会非常非常恐怖;
  进而导致Linux对swap分区的回收滞后(内存到磁盘换入换出操作十分占用CPU与系统IO),在高并发QPS服务中,这种滞后带来的结果是致命的(STW)。
  问题解决
  至此,答案似乎很清晰,我们只需尝试把swap关闭或释放掉,看看能否解决问题?
  如何释放swap?
  1。设置vm。swappiness0(重启应用释放swap后生效),表示尽可能不使用交换内存
  a、临时设置方案,重启后不生效
  设置vm。swappiness为0
  sysctlvm。swappiness0
  查看swappiness值
  catprocsysvmswappiness
  b、永久设置方案,重启后仍然生效
  vietcsysctl。conf
  添加
  vm。swappiness0
  2。关闭交换分区swapoffa
  前提:首先要保证内存剩余要大于等于swap使用量,否则会报Cannotallocatememory!swap分区一旦释放,所有存放在swap分区的文件都会转存到物理内存上,可能会引发系统IO或者其他问题。
  a、查看当前swap分区挂载在哪?
  b、关停分区
  关闭swap交换区后的内存变化见下图橙色框,此时swap分区的文件都转存到了物理内存上
  关闭Swap交换区后,于2。23再次发生FullGC,耗时190ms,问题得到解决。
  疑惑
  1、是不是只要开启了swap交换区的JVM,在GC的时候都会耗时较长呢?
  2、既然JVM对swap如此不待见,为何JVM不明令禁止使用呢?
  3、swap工作机制是怎样的?这台物理内存为8g的server,使用了交换区内存(swap),说明物理内存不够使用了,但是通过free命令查看内存使用情况,实际物理内存似乎并没有占用那么多,反而Swap已占近1G?
  free:除了buffcache剩余了多少内存
  shared:共享内存
  buffcache:缓冲、缓存区内存数(使用过高通常是程序频繁存取文件)
  available:真实剩余的可用内存数
  大家可以想想,关闭交换磁盘缓存意味着什么?
  其实大可不必如此激进,要知道这个世界永远不是非0即1的,大家都会或多或少选择走在中间,不过有些偏向0,有些偏向1而已。
  很显然,在swap这个问题上,JVM可以选择偏向尽量少用,从而降低swap影响,要降低swap影响有必要弄清楚Linux内存回收是怎么工作的,这样才能不遗漏任何可能的疑点。
  先来看看swap是如何触发的?
  Linux会在两种场景下触发内存回收,一种是在内存分配时发现没有足够空闲内存时会立刻触发内存回收;另一种是开启了一个守护进程(kswapd进程)周期性对系统内存进行检查,在可用内存降低到特定阈值之后主动触发内存回收。
  通过如下图示可以很容易理解,详细信息参见:http:hbasefly。com20170524hbaselinux
  解答是不是只要开启了swap交换区的JVM,在GC的时候都会耗时较长
  笔者去查了一下另外的一个应用,相关指标信息请见下图。
  实名服务的QPS是非常高的,同样能看到应用了swap,GC平均耗时576ms,这是为什么呢?
  通过把时间范围聚焦到发生GC的某一时间段,从监控指标图可以看到swapUsed没有任何变化,也就是说没有swap活动,进而没有影响到垃级回收的总耗时。
  通过如下命令列举出各进程swap空间占用情况,很清楚的看到实名这个服务swap空间占用的较少(仅54。2MB)
  另一个显著的现象是实名服务FullGC间隔较短(几个小时一次),而我的服务平均间隔2周一次FullGC
  基于以上推测
  1、实名服务由于GC间隔较短,内存中的东西根本没有机会置换到swap中就被回收了,GC的时候不需要将swap分区中的数据交换回物理内存中,完全基于内存计算,所以要快很多
  2、将哪些内存数据置换进swap交换区的筛选策略应该是类似于LRU算法(最近最少使用原则)
  为了证实上述猜测,我们只需跟踪swap变更日志,监控数据变化即可得到答案,这里采用一段shell脚本实现!binbashechoedateymdHMSechoePIDSwapProcName拿出proc目录下所有以数字为名的目录(进程名是数字才是进程,其他如sys,net等存放的是其他信息)forpidinlslprocgrepdawk{print9}grepv〔09〕doif〔pideq1〕;thencontinue;figrepqSwapprocpidsmaps2devnullif〔?eq0〕;thenswap(gawkSwap{sum2;}END{printsum}procpidsmaps)统计占用的swap分区的大小单位是KBprocname(psauxgrepwpidawk!grep{for(i11;iNF;i){printf(s,i);}})取出进程的名字if〔swapgt0〕;then判断是否占用swap只有占用才会输出echoe{pid}{swap}{procname:0:100}fifidonesortk2nrhead10gawkF{排序取前10pid〔NR〕1;size〔NR〕2;name〔NR〕3;}END{for(id1;idlength(pid);id){if(size〔id〕1024)printf(10s15sKBs,pid〔id〕,size〔id〕,name〔id〕);elseif(size〔id〕1048576)printf(10s15。2fMBs,pid〔id〕,size〔id〕1024,name〔id〕);elseprintf(10s15。2fGBs,pid〔id〕,size〔id〕1048576,name〔id〕);}}
  由于上面图中2022。3。219:57:00至2022。3。219:58:00发生了一次FullGC,我们重点关注下这一分钟内swap交换区的变化即可,我这里每10s做一次信息采集,可以看到在GC时点前后,swap确实没有变化
  通过上述分析,回归本文核心问题上,现在看来我的处理方式过于激进了,其实也可以不用关闭swap,通过适当降低堆大小,也是能够解决问题的。
  这也侧面的说明,部署Java服务的Linux系统,在内存分配上并不是无脑大而全,需要综合考虑不同场景下JVM对Java永久代、Java堆(新生代和老年代)、线程栈、JavaNIO所使用内存的需求。
  总结
  综上,我们得出结论,swap和GC同一时候发生会导致GC时间非常长,JVM严重卡顿,极端的情况下会导致服务崩溃。
  主要原因是:JVM进行GC时,需要对对应堆分区的已用内存进行遍历,假如GC的时候,有堆的一部分内容被交换到swap中,遍历到这部分的时候就须要将其交换回内存;更极端情况同一时刻因为内存空间不足,就需要把内存中堆的另外一部分换到SWAP中去,于是在遍历堆分区的过程中,会把整个堆分区轮流往SWAP写一遍,导致GC时间超长。线上应该限制swap区的大小,如果swap占用比例较高应该进行排查和解决,适当的时候可以通过降低堆大小,或者添加物理内存。
  因此,部署Java服务的Linux系统,在内存分配上要慎重。
  以上内容希望可以起到抛转引玉的作用,如有理解不到位的地方烦请指出。

法国卫冕失败!马克龙打气姆巴佩让法国骄傲,希望德尚继续执教北京时间12月18日23时,卡塔尔世界杯决赛,阿根廷对阵法国。全场比赛结束,阿根廷常规时间33战平法国。点球大战42战胜法国,夺得卡塔尔世界杯冠军。法国在世界杯决赛点球不敌阿根廷,是时候说出来了,我们欠国家一个道歉!头条创作挑战赛现在我终于可以肯定的说,我们欠国家一声道歉!今天,济南的天很冷,济南的气温很低,街头也很冷。我驱车行驶在济南的街头,突然发现冷冷清清,昔日的车水马龙再也不见!不是放开国家发改委等11部门印发指导意见多措并举推动家政进社区央广网北京12月20日消息据中央广播电视总台中国之声新闻和报纸摘要报道,国家发展改革委等11部门印发的关于推动家政进社区的指导意见(以下简称意见)19日对外公布。意见提出,到202梅西的家乡阿根廷离中国最远的国家要说今天晚上最热的话题,非阿根廷与法国的冠军争夺赛莫属。提到阿根廷,我们就会想到梅西,可阿根廷不止有梅西哦,今天让我们一起来认识离中国最遥远的国家阿根廷吧!一简介阿根廷,面积278内讧爆发教练混日子!世界杯大热耻辱出局,冠军功勋宣布退队本届世界杯是相当多传奇球星的最后一次世界杯之旅,而西班牙队内同样有着布斯克茨这位2010年世界杯冠军功勋参与。同期的兄弟们都已经退出了国家队,也只有布斯克茨还在继续奋斗。但本届世界一文详解浓眉至少伤停1月专家推断真实伤情湖人又遭重创太不幸北京时间12月19日,湖人球星安东尼戴维斯的核磁检查结果曝光,据名记shams报道,浓眉因右脚受伤至少缺席一个月,无限期缺战暂无具体复出时间表专家推断浓眉右脚的真实伤情中足扭伤或者90后负债2000万赌球老哥站满天台文顾天杰赌球十赌九输2022年卡塔尔世界杯已经持续近一个月。除了在赛场上顽强拼搏的运动员,场外还有另一群人,在暗中用真金白银决胜负。他们也是球迷,只不过他们更爱另一件事赌球。为什么一场相遇,一生回忆,遇见再多不如一个你女人离婚再婚,无非就是想找一个比之前更优秀的人,从而让自己的人生更为圆满,谈何容易呀!其实没有任何一句话,能够让你大彻大悟,醍醐灌顶,真正让你如梦初醒,看透人性的,只能是一段,刻骨你所谓的迷茫,不过是清醒地看着自己沉迷1你努力了,成绩却没变化,这不能代表你没用,只能证明你在为过去的懒散买单,小说再完美,结局也有缺陷,害怕结果就不敢去做,坚持一半就放弃,这是弱者的表现,船停在港口最安全,但这不是造县委大院金句频出,学习!做不到的就不要忽悠,稳扎稳打。求人不丢人,求不到人才丢人。好的成绩不一定都是因为我,但出了问题,算到头,都是我的。心中有党,心中有民,心中有责,心中有戒。人生没有那么多橡皮擦,有些回顾梅西卡塔尔世界杯7粒进球,青春不悔天不负视频加载中梅西不需要另外一个冠军来证明自己,但是阿根廷需要!36年来他们无时无刻不在盼望着重回阿兹台克的荣耀巅峰,这也是梅西肩负的使命。阿根廷诗人博尔赫斯曾经说过,任何命运无论多么
3月手机圈神仙打架,盘点个人比较看好的几款魅族一加荣耀上半年的手机市场越来越热闹了,尤其是3月份简直就是神仙打架的场面。3月份目前已经发布了两款旗舰机,分别是荣耀Magic5系列和努比亚Z50Ultra,还有一款中端机是一加Ace2V清华可穿戴智能喉登Nature子刊,实测准确率90,网友李雪健老师丰色发自凹非寺量子位公众号QbitAI将一块仅硬币大小的圆片,贴在喉咙处,嗓子有问题的人就可以重获新声了。这是清华大学发表在Nature子刊上的最新研究成果,一个用石墨烯材料做成的OPPO小折叠屏已成明星新宠儿?可靠铰链成熟体验是关键因素如果要论对于时尚的把握和引导力,明星绝对是站在最前沿的。而明星会用什么样的手机?也是许多人都去关注和效仿的。最近有许多网友发现,Twins宋轶欧阳娜娜徐梦洁等不少明星用的手机都换成纠结特斯拉Model3和比亚迪海豹,但都叫我买Model3纠结特斯拉Model3和比亚迪海豹,但都叫我买Model3最近试驾了特斯拉Model3和比亚迪海豹,在考虑要买其中的哪一辆,越看越喜欢,平时在市区通勤,女生,海豹感觉有点老气,但是3月还值得入手的四款旧旗舰,不仅配置全,性能强,保值率还高如果您喜欢,可以点击上面的关注二字。后续会为您提供更多有价值的内容。今天分享3月还值得入手的四款旧旗舰,不仅配置全,性能强,保值率还高第一款一加AcePro参考价格2699元(12技术论文基于机器学习的铁路道岔故障自动诊断方法欢迎引用1潘亚康。基于机器学习的铁路道岔故障自动诊断方法J。自动化与仪器仪表,2023,No。280(02)1620。DOI10。14016j。cnki。10019227。2023运输环节奇麟鲜品浅谈物联网技术和区块链技术运输环节通过物联网技术和区块链技术,对运输过程中的温度湿度运输时间等数据进行监测和记录,确保产品的品质和安全性。生鲜产业链数字化落地是当今农业产业升级和转型的重要方向,其覆盖的环节告诉阿里没有技术会要你命的那个男人,他叫王坚!告诉阿里没有技术会要你命的那个男人,他叫王坚!曾经骗马云投10亿给他,项目却长期停滞没有进展,也无法商业化落地变现,背负着质疑和诋毁,但他的坚持与韧劲最终获得了辉煌,十年磨一剑,终打破国外技术垄断!天津这家专精特新企业,如何从种子成长为小巨人?在天津市西青经济技术开发区内,卡本工厂的研发中心生产厂区等多个功能区正在有序的运转中,这是一个占地面积逾2。5万平方米,集研发生产仓储展览于一体的现代化工厂。2009年起航,做建筑NotionAI让信息管理更高效的人工智能工具NotionAI是一款非常实用的工具,它运用了人工智能和自然语言处理技术,让用户能够更加便捷地进行信息管理和知识整理。通过使用NotionAI,用户可以更加高效地处理文本内容,快速logback设置mybatis打印sql方式一修改mybatis全局配置settingnamelogImplvalueSTDOUTLOGGING如下图所示方式二在logback的日志文件中配置,1和2都要配置Consol
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网