SpringBoot项目中ESHighLevelRestClient超时问题排查及解决

　　问题描述
　　最近项目中遇到一个问题，在某一个时刻应用系统出现了大量的ES访问超时的现象，异常日志主要为：  java.io.IOException: Connection reset by peer 	at org.elasticsearch.client.RestClient.extractAndWrapCause(RestClient.java:793) ~[elasticsearch-rest-client-7.4.0.jar!/:7.4.0] 	at org.elasticsearch.client.RestClient.performRequest(RestClient.java:218) ~[elasticsearch-rest-client-7.4.0.jar!/:7.4.0] 	at org.elasticsearch.client.RestClient.performRequest(RestClient.java:205) ~[elasticsearch-rest-client-7.4.0.jar!/:7.4.0] 	at org.elasticsearch.client.RestHighLevelClient.internalPerformRequest(RestHighLevelClient.java:1454) ~[elasticsearch-rest-high-level-client-7.4.0.jar!/:7.4.0] 	at org.elasticsearch.client.RestHighLevelClient.performRequest(RestHighLevelClient.java:1439) ~[elasticsearch-rest-high-level-client-7.4.0.jar!/:7.4.0] 	at org.elasticsearch.client.IndicesClient.exists(IndicesClient.java:785) ~[elasticsearch-rest-high-level-client-7.4.0.jar!/:7.4.0] 	at com.free4inno.scheduler.adapter.service.elasticsearch.GenericEsService.isIndexExists(GenericEsService.java:60) ~[classes!/:0.0.1-SNAPSHOT] 	at com.free4inno.scheduler.adapter.service.elasticsearch.MetricsToEsService.getTodayIndex(MetricsToEsService.java:56) ~[classes!/:0.0.1-SNAPSHOT] 	at com.free4inno.scheduler.adapter.service.elasticsearch.MetricsToEsService.insert(MetricsToEsService.java:49) ~[classes!/:0.0.1-SNAPSHOT] 	at com.free4inno.scheduler.adapter.service.Scheduler.sendMetrics(Scheduler.java:64) [classes!/:0.0.1-SNAPSHOT] 	at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) ~[?:1.8.0_261] 	at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) ~[?:1.8.0_261] 	at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) ~[?:1.8.0_261] 	at java.lang.reflect.Method.invoke(Method.java:498) ~[?:1.8.0_261] 	at org.springframework.scheduling.support.ScheduledMethodRunnable.run(ScheduledMethodRunnable.java:84) [spring-context-5.2.8.RELEASE.jar!/:5.2.8.RELEASE] 	at org.springframework.scheduling.support.DelegatingErrorHandlingRunnable.run(DelegatingErrorHandlingRunnable.java:54) [spring-context-5.2.8.RELEASE.jar!/:5.2.8.RELEASE] 	at org.springframework.scheduling.concurrent.ReschedulingRunnable.run(ReschedulingRunnable.java:93) [spring-context-5.2.8.RELEASE.jar!/:5.2.8.RELEASE] 	at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511) [?:1.8.0_261] 	at java.util.concurrent.FutureTask.run(FutureTask.java:266) [?:1.8.0_261] 	at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180) [?:1.8.0_261] 	at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293) [?:1.8.0_261] 	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) [?:1.8.0_261] 	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) [?:1.8.0_261] 	at java.lang.Thread.run(Thread.java:748) [?:1.8.0_261] Caused by: java.io.IOException: Connection reset by peer 	at sun.nio.ch.FileDispatcherImpl.read0(Native Method) ~[?:1.8.0_261] 	at sun.nio.ch.SocketDispatcher.read(SocketDispatcher.java:39) ~[?:1.8.0_261] 	at sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java:223) ~[?:1.8.0_261] 	at sun.nio.ch.IOUtil.read(IOUtil.java:197) ~[?:1.8.0_261] 	at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:378) ~[?:1.8.0_261] 	at org.apache.http.impl.nio.reactor.SessionInputBufferImpl.fill(SessionInputBufferImpl.java:231) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	at org.apache.http.impl.nio.codecs.AbstractMessageParser.fillBuffer(AbstractMessageParser.java:136) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	at org.apache.http.impl.nio.DefaultNHttpClientConnection.consumeInput(DefaultNHttpClientConnection.java:241) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	at org.apache.http.impl.nio.client.InternalIODispatch.onInputReady(InternalIODispatch.java:81) ~[httpasyncclient-4.1.4.jar!/:4.1.4] 	at org.apache.http.impl.nio.client.InternalIODispatch.onInputReady(InternalIODispatch.java:39) ~[httpasyncclient-4.1.4.jar!/:4.1.4] 	at org.apache.http.impl.nio.reactor.AbstractIODispatch.inputReady(AbstractIODispatch.java:114) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	at org.apache.http.impl.nio.reactor.BaseIOReactor.readable(BaseIOReactor.java:162) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	at org.apache.http.impl.nio.reactor.AbstractIOReactor.processEvent(AbstractIOReactor.java:337) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	at org.apache.http.impl.nio.reactor.AbstractIOReactor.processEvents(AbstractIOReactor.java:315) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	at org.apache.http.impl.nio.reactor.AbstractIOReactor.execute(AbstractIOReactor.java:276) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	at org.apache.http.impl.nio.reactor.BaseIOReactor.execute(BaseIOReactor.java:104) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	at org.apache.http.impl.nio.reactor.AbstractMultiworkerIOReactor$Worker.run(AbstractMultiworkerIOReactor.java:591) ~[httpcore-nio-4.4.13.jar!/:4.4.13] 	... 1 more
　　异常现象表现为：
　　①第一次连接出现timeout，后续连接正常且timeout时长为配置的socket时长。
　　②抛出异常时间段不固定。
　　问题定位
　　这个问题在之前开发多集群管理平台的时候也出现，当时因为存在③跨版本且还没有正式投产的情况下，并没有太关注的此类问题，觉得此问题可能是版本兼容性。项目组报上来问题才认真地排查了一番。
　　应用系统通过ES High Level Rest Client客户端直连且版本相同，可以排查③的情况。起初怀疑是查询或者写入量大，后台处理不及时的原因导致异常。于是查看监控数据和日志，监控显示在几次出现异常的时间点上各项指标这都很正常，没有出现流量陡增的情况，结合现象②，可以排除是因为服务端压力的原因。
　　接着把影响异常的源头定位在客户端。ES客户端和服务端的连接采用的是长连接，查阅源码发现客户端创建了client连接池，每个client持有一个http连接，并且开启http的keep-alive策略复用连接。正是因为这个复用探活的原因导致该异常发生。下面具体分析该问题。
　　问题分析
　　在未处理前restClient客户端创建示意代码： final RestClientBuilder restClientBuilder =  RestClient.builder(redisHostList).setRequestConfigCallBack(requestConfigBuilder -> {;        requestConfigBuilder.setConnectTimeout(5000);        requestConfigBuilder.setSocketTimeout(60000);        requestConfigBuilder.setConnectionRequestTimeout(500);        return requestConfigBuilder;        }).setHttpClientConfigCallback((httpAsyncClientBuilder) -> {            httpAsyncClientBuilder.disableAuthCacheing();         return httpAsyncClientBuilder;    final RestHighLevelClient restHighLevelClient = new RestHighLevelClient(restClientBuilder);
　　客户端与服务端的连接示意图：
　　ES high-level-client 对长连接的实现是把超时时间设置为-1，意味着客户端永远不超时，服务端设备为了资源的利用率会检测与此设备的连接是否在使用，如果一个连接长时间没有使用，服务端会主动把这个连接关闭，而此时客户端不知情，还处在连接状态，可以说当前处于半连接状态。当有流量进来的时候使用了该连接就会发现与服务端连接不上，产生timeout，客户端也断开此链接，如上图 1 所示。客户端使用新连接 2 与服务端通信。因此问题的根源在于客户端没有及时发现连接的不可用并断开，因此需要设置让客户端主动对tcp连接进行探测保活。
　　解决方案  一、客户端显式的设置setKeepAliveStrategy httpAsyncClientBuilder.setKeepAliveStrategy((httpResponse,httpContext) -> TimeUtils.MINUTES.toMillis(3))  二、显示开启 tcp keepalive httpAsyncClientBuilder.setDefaultIOReactorConfig(IOReactorConfig.sustom().setSoKeepAlive(true).build())  三、在系统层面设置tcp keepalive探测保活时间 net.ipv4.tcp_keepalive_time = 60

现阶段换机怎么选？果粉选降价iPhone，安卓看一加Ace2现在智能手机可以说是我们日常生活中，使用最高频率的单品了，所以很多朋友时不时就有着想要换购新手机的想法。因为新推出的手机产品有着更强悍的性能更流畅的体验等等优势。现在也有不少小伙伴索约信用合约案例宠物猫咖！OneMoreTime猫咖位于杭州，是宠物行业一家连锁猫咖。在接入索约平台系统两天的时间内，就用索约信用平台的分期功能成交了9单，获得9万多的额外收益！索约信约分段付的方式将会带来卷轴屏隔空充电！OPPO历代MWC黑科技回顾，2023年还有大招？时隔三年之后，中国科技企业再次集聚西班牙巴塞罗那，参加MWC2023（世界移动通信大会）。据了解，已经确定参展的国产品牌有华为OPPO荣耀中兴等等，各家厂商都会带来最新的技术和产品ampampquot科技股掀起股市繁荣，风险与机遇并存ampampquot最近，美国的股市再次掀起了一股热潮。由于特斯拉和苹果等科技巨头公司的股票价格不断攀升，美国股市迎来了新的历史高峰。然而，这种股市繁荣是否会持续下去，仍存在争议。在过去几个月里，科技怎样得着智慧2分钟前自从始祖吃了禁果后，人类便都有了聪明。聪明是好的。可惜的是，因为老天还还没有把智慧作在人里面，人架不住聪明，结果聪明反被聪明误。人类从此开始了人与人之间的互相争夺，甚至爬到2022年全国95的建制村实现快递服务覆盖央视网消息今天（2月22日），国家邮政局举行新闻发布会。发布会上，国家邮政局发布了2022年邮政快递业更贴近民生七件实事的落实情况。2022年，国家邮政局的七件民生实事分别为深入实想入骁龙8新机？买前记得看看市场反馈，这些用户说的很中肯对于我们想要购买手机的用户们来说，在购机之前除了要综合比较手机的性能配置等因素之外，还有一项最重要的指标就是参考一下入手用户的真实评价，毕竟再好的产品也要经过市场的验证才能证明它的上市一周多狂揽京东50000评价数，一加Ace2圈粉的秘诀是啥？换一台新手机之前，最好是先去看看这款手机的用户评价，再考虑购买。而最近网上爆火的一加Ace2，开售仅仅开售一周多，在京东的评价就超过5W，可见这款产品的产品力还是相当能打的。那么一2023年更适合买中端手机，别看就两三千块钱，花在刀刃上才是重点要说近几年的手机市场，可以用群魔乱舞来形容，各种机型各种配置各种子品牌纷纷推出，再加上骁龙的芯片功耗问题得到好转，联发科芯片也逐渐走上正轨，以致于手机市场新产品层出不穷，对于想换手2023安卓手机好评榜华为高居榜首，红米垫底近期，安兔兔公布了2023年1月安卓手机好评率排行榜，其中华为高居榜首，小米上榜最多，红米垫底！前十名的好评率均超过90，下面一起来看看这十款高评分手机吧。第10名红米K60Pro终于，手机行业到了比拼价值观的赛点作者何文手机行业的坏消息一个接一个。国际数据公司IDC报告显示，2022年，中国智能手机市场出货量约2。86亿台，同比下降13。2，创有史以来最大降幅。时隔10年，中国智能手机市场

<<<<<<－>>>>>>

吉林省西部三大冬捕胜地有多硬核？一起来品鉴一下吧近日，随着气温走低，松原市前郭县查干湖拉响了2022年冬捕的序幕，在零下20多摄氏度的极寒温度下头网捕获了8。8万斤鱼，迎来开门红！查干湖冬捕作为冬季到吉林来玩雪的金字招牌，是吉林跨年文案辞暮尔尔，烟火年年头条创作挑战赛1。新年所愿，四季与你一起。2。今年的遗憾留在今年就好。3。新的剧本以爱自己为主。4。愿今年所有的遗憾，是为了明年更好的铺垫。5。年年有你陪，年年不重样。6。想了一百跨年文案幸好有了你们，今年没有遗憾收尾1。体温正常，进入下一年。2。我们是跨年夜街头即将放飞理想的有志青年。3。往后的日子都是崭新的，谁也不许回头看了。4。这一年故事很简单，遇见你，我很喜欢。5。新的一年，有趣有盼，不DNF包年套的5种骗局，听说你很不服气呀？那就骗到你服春节套就要上线了，这本身没什么问题，不过说出来可能大家不相信，每年都一定会有人被骗，然后才想到去找各位勇士帮忙，骗都骗了，后续还重要吗？所以咱们防患于未然，在年套上线前，来看看往年Psychonauts2一场脑洞大开的脑中冒险作为横跨了十六年的脑航员的续作，本作依旧延续了线性叙事以及颇为奇特的画风，但是本作的流程以及以及关卡设计的巧妙和玩法的多样得益于技能的增加以及升级的选项而大大增加，10平台跳跃30iPhoneSE4曝光，A16芯片XR外观？虽然iPhone14系列全球市场销量不俗，但并不阻碍苹果提前布局明年的销售策略。除了迭代高利润的iPhone1515Pro系列外，想要进一步扩大营收与提升整体销量，就要依靠相对低价256GB存储仅889元，乐视还魂了，外观酷似iPhone13Pro贾跃亭统治的乐视，从辉煌走向了衰败，只因为步子迈得太大，正所谓欲速则不达，历史的发展，要根据现实情况而定，贾跃亭宣布做手机，进军汽车行业，其实并没有错，错的是时机不对，相信贾跃亭出2022入门级平板推荐，这4款使用体验好，每一款都很有诚意现在很多人需要上网课，手机又不太好操作，那么就可以买一台平板电脑，入门款的就足够使用了，不仅可以刷网课看电影，偶然还能打打小游戏，非常实用。有些朋友想买价格不贵还好用的平板电脑，那苹果华为大疆入局激光雷达，到底是个啥？小丹尼本期视频传送门苹果华为大疆入局激光雷达，到底是个啥？我有一个朋友，花了一辆法拉利的钱，买了一排激光雷达。每次看到这排激光雷达旋转跳跃，我闭着眼，仿佛听见法拉利的咆哮声，你觉得他是不eBPF初见（生态篇）在上篇文章eBPF初见（入门篇）我们介绍了eBPF的发展历程和强大的能力，同时也介绍了在内核中的运行时组件，以及为用户空间提供的系统调用bpfAPI，这些细节能够帮助更好的理解eB经济日报携手京东发布数据农产品触网更畅销差异化打造品牌记忆力华北地区是我国重要的农产品生产基地。近年来，随着居民生活水平持续提高，消费者对新鲜优质农产品的需求不断增强。华北地区各省份积极培育特色品牌，布局线上农产品销售渠