范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

ES(elasticsearch)集群数据冷热分离实现

  导语
  这种打标签的操作可以通过滚动,重启集群实例,因为涉及到重启后的数据恢复问题,可能滚动重启的时间会比较长(根据数据量大小和分片数量决定),可以通过如下的方式,增加数据恢复的最大并行度和数据恢复的最大带宽进行调整,逐步调大到不影响集群业务性能为止。冷热数据分离的目的
  1、ES 集群异构,机器硬件资源配置不一,有高性能 CPU 和 SSD 存储集群,也有大容量的机械磁盘集群,比如我们的场景就是存放冷数据的集群,服务器都是多年前买的一批满配的 4T Dell R70,但是新扩容的热节点机器均为 DELL 高性能 SSD 磁盘和 CPU 的 R740 机器。
  2、对于时间型数据来说,一般是当前的数据,写入和查询较为集中,所以高性能的资源应该优先提供给这些数据使用。
  3、集群的搜索和写入性能,取决于最慢节点的性能。冷热数据分离的前提
  1、ES 的索引已经按照天或者月的时间维度生成索引。
  2、历史数据相对于近期数据来说没有高频度的查询需求。冷热数据分离的实现策略
  本文实现策略:最新的天和月索引均为热数据,其他索引根据查询周期不同,调整为冷数据。当然业务不同策略不同,具体实现策略还是需要根据实际的业务场景来决定。
  前置条件
  需要修改 ES 集群配置文件,对节点进行打标签操作,配置如下:
  热数据实例:node.tag: "hot"
  冷数据实例:node.tag: "cold"
  修改集群配置需要进行重启实例生效
  这种打标签的操作可以通过滚动,重启集群实例,因为涉及到重启后的数据恢复问题,可能滚动重启的时间会比较长(根据数据量大小和分片数量决定),可以通过如下的方式,增加数据恢复的最大并行度和数据恢复的最大带宽进行调整,逐步调大到不影响集群业务性能为止。
  设置数据恢复的最大并行度curl -XPUT http://192.168.201.5:9200/_cluster/settings -d" {   "persistent" :   {      "cluster.routing.rebalance.enable": "all",                                                      ## 为特定类型的分片启用或禁用重新平衡:       "cluster.routing.allocation.node_concurrent_incoming_recoveries":6,    ##允许在一个节点上发生多少并发传入分片恢复。 默认为 2       "cluster.routing.allocation.node_concurrent_outgoing_recoveries":6,       ##允许在一个节点上发生多少并发传出分片恢复,默认为 2       "cluster.routing.allocation.node_concurrent_recoveries":6,                       ##为上面两个的统一简写       "cluster.routing.allocation.node_initial_primaries_recoveries":10,               ##在通过网络恢复副本时,节点重新启动后未分配的主节点的恢复使用来自本地 磁盘的数据。这些应该很快,因此更多初始主要恢复可以在同一节点上并行发生。 默认为 4。        "cluster.routing.allocation.same_shard.host":true                                         ##允许执行检查以防止基于主机名和主机地址在单个主机上分配同一分片的多个实例。     }  }"
  设置数据恢复的最大带宽curl -XPUT http://192.168.201.5:9200/_cluster/settings -d" { "persistent" : { "indices.recovery.max_bytes_per_sec": "2g" } }"
  新增索引实现冷热数据分离
  集群滚动重启完成之后,已经具备了冷热数据分离的条件,那么如何让新增索引自动成为热数据呢?
  答案就是修改 ES 索引的模板,为 ES 索引打 tag,配置实例如下:"template": "索引名称*", "settings": {   "index": {     "routing": {       "allocation": {         "require": {           "tag": "hot"    #节点标签         }       }     }   } }
  只要在索引模板中打了热标签的索引,就会在创建的时候自动分布在集群中实例打了热标签的节点上。
  历史索引实现冷热数据迁移
  那么历史的 ES 数据如何让其从热节点迁移到冷节点呢?
  答案就是,通过 api 修改 ES 索引的标签,将其变更为冷标签,这样 ES 索引就会自动迁移到集群中打了冷标签的实例上,配置如下:curl -XPUT http://10.1.11.151:9200/索引名称/_settings -d "{ "index.routing.allocation.include.tag": "cold" }"
  实际生产中会将制定好的冷热数据规则编写成脚本,放到计划任务中,来定时定点的运行,达到热数据自动迁移为冷数据的目的。ES 单机多实例的实现
  熟悉 ES 的同学知道,JVM heap 分配不能超过 32GB,对于使用物理机部署 ES 的环境来说,一台机器的内存往往就动辄 192G 或者 256G,如果只跑一个 ES 实例,只能利用到 32G 的 heap,而且还无法充分发挥 CPU 和 IO 资源,这样显然是不经济的。
  因为我们常常会部署单机多实例的 ES 节点,在多实例配置中除了要隔离日志和数据目录之外,还需要增加以下两个配置,不然一台物理机宕机,可能会因为多个副本存在一个 ES 物理机上面导致业务受到影响。node.max_local_storage_nodes: 2               # 设置一台机器能运行的节点数目 cluster.routing.allocation.same_shard.host: true           # 执行检查以防止基于主机名和主机地址在单个主机上分配同一分片的多个实例。 默认为 false,表示默认情况下不执行检查。 此设置仅适用于在同一台计算机上启动多个节点的情况。这个我的理解是如果设置为 false,则同一个节点上多个实例可以存储同一个 shard 的多个副本没有容灾作用了
  # 执行检查以防止基于主机名和主机地址在单个主机上分配同一分片的多个实例。 默认为 false,表示默认情况下不执行检查。 此设置仅适用于在同一台计算机上启动多个节点的情况。这个我的理解是如果设置为 false,则同一个节点上多个实例可以存储同一个 shard 的多个副本没有容灾作用了。

中考那一年,国足打进了世界杯2002年6月,我参加中考。我在双峰县永丰镇城北学校中23班,那个时候城北学校新建还不久,有小学和初中。教我们语文的是班主任向老师,她平时十分严格。我记得在初一时,就要求我们每周写高速公路周边建房不被允许合法吗?时有群众反馈,高速公路周边不被允许建房。但明明可以看到高速公路周边是有房子的,那位什么其它人可以修,到了我这里就不能修建了。许多群众和相关工作单位就产生了矛盾。作为群众一方的观点是被拘留对自己以后找工作或者后代考公务员有影响吗?被拘留对自己以后找工作或者后代考公务员有没有影响?首先要明确一个问题拘留属于哪一种?拘留共分两种,一种是行政拘留,另一种是刑事拘留。行政拘留属于行政处罚。一概属于行政处罚都不会对自四川成都保留最古老的天主教堂平安堂1897年,一位中文名骆书雅的法国籍天主教神父,在成都老皇城的西面,开始主持修建一座建筑。1904年,一座拜占庭风格式的建筑,出现在今天叫西华门(原名平安桥)的街上还被一片民居包围17消息队列秒杀时如何处理每秒上万次的下单请求?一开始我们就了解了高并发系统的三个目标高性能高可用易扩展。然后我们就讲解了分布式数据库改造缓存的使用。究其原因我们遇到的大部分场景都是读多写少,尤其是在一个系统的初级阶段。但是随着18消息投递如何保证消息仅仅被消费一次?上节课我们通过在电商系统增加消息组件达到了削峰填谷的作用,对次要业务逻辑做了异步处理,对不同的系统模块做了解耦。因为业务逻辑从队列中移除了,所以我们要有响应的队列处理逻辑了,这时系19消息队列如何降低消息队列系统中消息的延迟?这些可我们来思考一下,消息队列除了前面介绍的内容,还有哪些点呢?先来看一个场景在电商项目中,用户在下完单支付之后,会向消息队列发送一条消息,服务程序消费消息后给用户发送优惠券或者增华为跌倒,苹果吃饱?雷军失眠,连夜分享一个天大的好消息这两年手机市场可以说是风云变幻,去年华为麒麟芯片断供之后,华为的手机业务受到了很大的阻力,即便到现在,华为Mate40系列依然处在缺货状态,普通消费者一机难求。而且按照惯例原本4月小米新机黑科技玩法,可变身徕卡索尼,逼格满满!华为苹果学不来小米11Ultra发布已经几个月了,但是讨论热度却一直没有停下。在讨论这部被称为安卓之光的旗舰机时,经常有一个配置点是无法绕过的,那就是小米11Ultra的背部副屏。此次小米11U什么才是合法且无瑕疵的网约车网约车的全称是网络预约出租汽车。随着网约车的不断发展壮大,由单一的称赞变成了今天爱恨夹杂的新局面。当时滴滴网约车刚出现时,那是全国上下一面欢呼。以往困扰出租汽车乘租服务态度不佳的难小说乌蒙山营房夜话(1)之初来乍到今天是叶舟工作11周年的日子,11年前叶舟离开大学校园走向社会,开始了社会磨砺的挫折生涯,有感于过往岁月匆匆流逝,于是执笔,围绕乌蒙山的哨所写下笔记。今天一早,中队长吉中就联络叶舟
打造有温度的智能驾驶,智己汽车IMAD智能驾驶系统伴你出行智能化浪潮下,智能驾驶成为了下一个风口。无论是造车新势力还是传统车企,甚至是互联网科技巨头们,都纷纷进军智能驾驶领域,使出浑身解数,拼资本拼技术拼硬件,在智能驾驶的道路越走越远,为爱普生全新A3彩色商务打印机,以绿色打印引领未来办公新趋势近年来,随着国家大力提倡可持续发展战略,实现碳中和的发展目标正逐步成为社会共识。各行各业积极推行绿色创新,致力于将环保举措融入工作生产的方方面面。在共建绿水青山的时代号召下,对于企平安普惠漯河分公司助力小微企业良性发展早些年,只有逢年过节才能吃上肉制品,现在,国民经济水平得到了质的飞跃,中国绝大多数家庭都已经实现肉制品自由。今天,为大家介绍一位从事猪肉批零的长先生的故事。长先生是漯河本地人,跟妻智驾进行时智己汽车打造智能交互新体验汽车诞生一百多年以来,其动力系统传动系统底盘系统车身设计,甚至全身上下每一个零件,都已经过数轮重大的进化革命。不过,新时代的汽车,不能仅仅满足于机械层面上的进化,更关键的是,作为人新款宝马4系正式上市,外观运动,价格配置有微调成功人士的选车路线总是绕不开BBA,而成功的年轻人,更是离不开宝马4系,对于预算在50万左右,又想拥有一辆跑车的年轻人来说,宝马4系可以说是他们的不二之选了。前不久,宝马正式公布了新款荣威RX5ePLUS来了,外观年轻时尚,售15。28万元起上汽荣威在设计领域一直是走在前沿的,荣威RX5便是一款设计非常成功的SUV,而在取得优异的成绩之后,荣威也并没有放下它,而是趁热打铁,推出了荣威RX5ePLUS,这对于荣威来说是一这款机械键盘,男生女生用着都很好看,洛斐小浪键盘上手测评作为辽宁渤海大学的学生党,虽然之前就入手了洛斐小翘键盘,也特别适合女性用户,不过男朋友一直吐槽,说洛斐为什么就不能出几款中性化的键盘呢,男生也能用,女生也能用,别总出看起来太女性化外观有点帅!捷尼赛思G70正式上市,搭2。0T四驱,售24。98万元起国内豪华品牌市场中,BBA可以说是区域了,那么非主流区域又在哪里呢?这就要说一下专攻个性路线的捷尼赛思了,在打开中国市场的大门时,捷尼赛思从一开始走的就是传统设计路线,而这种方式让奥迪Q5L新增40TRS套件燃速型,外观更运动,配专属标识2。0T引擎在BBA中,奥迪Q5L一直是豪华品牌中一款非常热销的SUV,而在同台竞争中的宝马和奔驰,对奥迪也一直是虎视眈眈,可以见得市场对奥迪Q5L车型的热情之高了。如今,一汽大众奥迪又新增了拍打式按摩新体验,仿真按摩,POSEZOO甫士筋膜枪双模青春版测评第一次接触筋膜枪还是今年的一月份,其实在2020年就听说过这类产品了,特别感兴趣,所以今年也是入手了一款某品牌的筋膜枪,你别说,敲打肌肉所带来的舒适感确实有,也让我对筋膜枪这类产品价格及配置有调整,2022款奥迪A6L上市,外观大气,售41。98万元起近日,从相关渠道获悉,2022款奥迪A6L上市,其中新车售价为41。98万元起。这次仅为改款,并非换代,所以在设计方面并没有太大的变化,只是对部分车型的价格以及配置做了一定的调整,