范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

算法落地探究真的能让运维更智能吗?

  本文根据王鹏老师在〖2022 Gdevops全球敏捷运维峰会-广州站〗现场演讲内容整理而成。王鹏教授也是擎创科技的运维专家团队成员之一。
  分享概要
  一、智能运维现状
  二、问题分析
  三、探索工作
  四、总结
  一、智能运维现状
  大家对智能问答系统都很熟悉,目前许多APP都有智能问答系统——后台是一个机器人,而不是真正的人回答问题。当前众多研究者在对智能问答系统进行研究,提出了许多算法和技术,Google Scholar上关于智能问答系统的文章有30多万不到35万篇。但实际上,智能问答系统远没有达到真正的智能,回答的结果时常是答非所问,那么就会造成海量的算法和技术与差强人意的效果之间的偏差。
  智能运维到现在大概有六七年的发展历程,在此期间智能运维算法一直在快速地发展,包括对性能指标的时间序列的数据、对日志告警的数据以及近两年对CMDB、调用链等图的数据。算法的类型和效果也在不断提升,包括指标异常检测、容量预测、日志聚类、日志日常检测、告警中的场景挖掘、根因定位等。接下来的内容主要涉及指标异常检测、日志智能分析、告警数据分析三个类别。
  指标异常检测
  指标异常检测是一个落地最多的智能运维场景,因为它数据容易准备,效果容易验证,准确率、召回率的指标容易量化。目前许多公司对大规模指标进行异常检测,比如1万个指标、10万个指标。
  针对指标的异常检测,研究者提出了大量的异常检测算法,比如单指标、多指标检测,基于统计、基于深度学习的模型,无监督、有监督的算法,以及近两年许多公司和机构开源了异常检测数据集和算法。但是,往往在落地的场景中应用的效果不尽如人意,主要问题如下:
  1)误报太多
  设置阈值严,为了消除漏报,往往造成大量的误报
  异常数量多,运维人员难以处理,不得不忽略所有的指标异常告警
  2)模型/参数难以设置
  不同类型的指标,往往适合不同类型的模型和参数
  无法单独设置模型和参数,进行分类则效果不佳
  3)缺乏有效的反馈和修正机制  缺乏问题发现能力,难以对指标异常进行类型、主机、时间段、业务等方面的展示和分析,难以对异常进行交互式探索,因此无法判断异常是否应该报   缺乏基于反馈的模型调整能力,难以应对"这个不是我们认为的异常,后续检测中不要再报了"的个性化需求
  2、日志智能分析
  目前,大量企业上线了日志实时聚类和基于日志的异常检测,主要解决了人工难以处理海量日志数据、基于规则的方法维护性差的问题。典型场景对海量日志做实时聚类,再做基于日志的异常检测,比如变量取值异常、模板数量异常、语义异常等,但日志智能分析实践同样存在若干问题。
  1)模板质量难以有效评估  日志聚类完之后,在将其聚到若干模板中时,模板质量难以有效评估,尤其是在实施过程或上线过程中,模板数量大,逐个人工判断耗时太长,可能运维人员没有充足的时间逐个人工判断   不同的应用目标对模板的要求不同,可能做某类型的日志异常检测时该模板不应该被泛化,但做另外一件事情可能就需要泛化,模板是否需要被泛化是一件非常主观的事情
  2)缺乏有效的反馈和修正机制  缺乏基于反馈的模板调整能力,难以应对"这种模板应该根据这个变量拆分"、"这个变量应该被泛化"之类的个性化需求   运维专家和算法人员的沟通难,运维专家与算法团队之间隔着实施团队,反馈链条长,且不是直接反馈
  3、告警数据分析
  近年来告警相关项目快速增长,每天有成千上万的告警,由于告警数量太多,运维人员难以有效处理和派单,因此通过算法进行告警压缩、场景挖掘、根因定位越来越受重视。在告警智能处理中存在两个典型问题:
  1)告警模板提取效果不佳  告警数据更为灵活多变,不同运维人员的告警描述方式存在差异  包含大量中文,告警模板提取效果不尽如人意
  2)根因定位效果欠佳  CMDB质量有待提高,可能存在系统变更但CMDB没有及时变更到最新场景的情况  可能真正的故障原因不存在于告警数据中,无法进行根因定位  标签数据缺失,一方面故障数量少,另一方面企业由于涉及隐私等原因不愿意给予标签
  二、问题分析
  我们在前面对于智能运维的现状和具体的类别及相关问题进行了梳理,那么接下来是我个人的一些思考。我认为算法落地效果不尽如人意有两个深层次原因:
  1、算法需要不断迭代优化
  我们时常认为智能运维的算法是开箱即用,但其实效果远不是如此,算法需要不断迭代优化。算法最开始的时候一般是一个通用算法,到具体在企业部署之后,它一定会成为一个定制化的算法。因为对于每一个具体的项目,算法需要和运维数据、业务特点、运维目标等深度融合,需要不断进行打磨和适配。
  1)算法本身:普遍缺乏反馈修正能力
  对于"这个异常我不需要,后续检测中不要再报了"、"这两个模板应该合并掉,变量不能被泛化"之类的反馈,当前的模型尤其是深度学习模型很难有效吸收,其中主要是两种能力的缺失:   发现问题的能力。 比如说我们一天报2000个异常,能否有半小时或一小时的时间将这2000个异常过一遍,判断其中哪些异常应该报,哪些不应该报,目前很少有人能够在短时间内做到这点。   模型自动修正能力。 比如给了很多"这个要报,那个不要报"之类的很多反馈,模型是否能够很好地适应,因为这个适应其实是个百分百的适应,有的可能一个都不要报,有些是一定要报出来,这种对于模型也是比较难的。
  2)实施过程:运维专家和算法人员的脱离
  对于算法而言,最重要的是标签数据和对算法结果的快速反馈,但是相关领域的专家可能熟悉机理却不熟悉算法,由于沟通链条长、沟通成本高,运维专家和算法人员在一定程度上是脱离的。
  2、系统故障本身是超低频事件
  系统故障本身是一个超低频的事件,严重的故障基本可能只出现一次,并且会被快速解决,不可能再出现。而算法需要基于历史数据学规律进行优化提升,如果之前发现的故障后来很可能不再出现了,那么这其实是一个悖论。
  我们前面也有提到完全依靠算法来实现自动化运维,至少在目前阶段我觉得其实是不现实的,我们仅仅做异常检测、日期类都没有做得非常的好,那么我们相信现在算法能达到自动化运维吗?我觉得更现实的目标是将算法作为一种让运维更高效的辅助手段。
  1)数据量太大,用算法来提高效率。
  对每天几百TB的日志自动提取模板和变量
  对上万的指标自动进行异常检测
  2)在某些场景下,用算法来提高精度。
  因为在因果推断里有些链条比较长,需要考虑的方面比较多,人的思考其实并没有那么发达,所以算法在这些方面是可以帮助提高精度的。
  3)作为一种定位故障过程的辅助手段,帮助运维人员灵活快速地查询和探索数据。
  这是一种非常重要的能力,因为在很多项目里,算法结果的分析工作非常劳累辛苦。
  4)算法作为一种积累知识的方式,构建知识图谱。
  三、探索工作
  1、如何高效地支持反馈
  如果只让运维专家给10个异常/10个模板打标签,应该怎么做?
  1)快速发现问题的能力
  首先可以通过异常置信度、日志模板置信度从2000个异常中选择10个异常,然后通过异常立方体更加系统的能力对异常进行交互式探索,使异常可视化。
  2)模型自动修正的能力
  当我们希望将一个Excel或CSV的记录人的电话、传真信息的表格变成结构化数据进行处理时,我们可以通过算法进行自动转化。通过我们给的少量样本,算法能够自动识别我们的目标,从而达成这个目标,这就是基于样例的算法。基于样例的算法在智能运维领域中同样大有可为,另外还有一种方法是小样本算法,通过给定少量标签或案例快速达成目标是我们正在进行的尝试。
  2、作为辅助手段的数据探索技术
  1)基于自然语言的问答系统
  人可以问类似以下自然语言的问题,能够自动转成SQL并出结果,具有高易用性,便于运维人员进行个性化数据探索。   在2019/11/28 11:25发生突增异常的指标有哪些?   A应用发生异常次数最多的主机是哪台?   B应用告警次数最多的告警种类是什么?   最近一周内存使用率最高的十台主机是哪些?   最近十天发生异常次数最多的应用是什么?   最近一周内失败率最高的应用是哪个?
  2)基于时间关联的复杂查询
  用于事件关联的快速发现,如下图所示的HDFS日志,我们想查询其中三个模板是否经常一起出现,PLQ查询能够更加简洁高效,SQL查询则会更加复杂。
  3)基于拖拽式的分析流程实现
  便于领域专家结合不同分析算法搭建分析流程
  融合了异常检测、聚类、场景挖掘等多种算法
  支持不同语言开发的算法
  支持输入数据格式的智能学习
  四、总结
  需要有持续优化的能力。不妨将算法作为一种运维的辅助手段,使运维人员也能灵活地分析数据,在运维过程中使其变得更高效。

福建省林业局调研组到我市调研互花米草除治工作情况2月7日,省林业局党组书记局长,省林长办主任王智桢和省林业局副局长王宜美等到我市开展互花米草除治工作情况调研。宁德市政府副市长叶其发,福安市委书记周祥祺市政府副市长施智等参加调研活女游客黄山炼丹峰跌落?景区回应未发现坠崖情况图片来源于网络近日,网传安徽黄山一女子跌落,引发网友关注。网传相关视频显示,女子站在一山峰边缘,跳着向远处挥手,期间,还抬起一只脚,因为单脚站立重心不稳女子摔倒,也引起其他游客的注产科寒冬已至,专家称压力大是主因!我国女性终身无孩率快速上升春节过后,各地的医院陆陆续续的忙碌起来,各个科室求医问诊的人数也多了起来,可是与之相反的却是产科,不仅没有忙碌,反而显得十分的冷清,好些医院偌大的产科零零落落几个人,大家不禁要问了慢性肾炎宝妈经历分享,所念皆所愿,所求皆所得!那是2017年2月底,过完新年的时候,我和老公准备要孩子了就去做孕前检查,一直身体挺好的我检查出肌酐偏高,又继续复查了尿蛋白。医生初步解释了一下后,我当时整个人都崩溃了接下来做了肾32岁产子,3年后乳腺癌晚期,女人不懂得这些常识,真的会死头条创作挑战赛楼下邻居,一对结婚多年的小夫妻,一直没有孩子。为了能怀孕,男女双方都去医院检查治疗,尤其是妻子,吃了很多能怀孕的药物。在婚后第6年,终于如愿以偿怀孕了,家人都很高兴。落定!ST凯乐今日摘牌,成今年退市第一股北京日报客户端记者孙杰A股退市已是常态化。2月15日,ST凯乐终止上市并从上交所摘牌。作为2023年退市第一股,这家上市20余年的公司将从此正式退出A股。ST凯乐2000年7月上市原神游戏机制副词条强化数值探讨游戏新春创作纪Ace原创关于圣遗物副词条的强化机制,米游社有很多帖子,甚至还有算概率的,这里不多赘述。仅提两点副词条有10种属性,每种属性有4个初始值,每次强化就是在4个数值中择一1月PlayStation游戏下载排行榜怪猎崛起登顶PlayStation平台1月份有哪些热门游戏?下载排名榜单发布,分别为PS5日服PS5美服PS4日服PS4美服,一起看看有没有你喜欢的游戏上榜吧!(注免费下载的游戏不计入)相较于本泽马梅西的整体比赛能力,比C罗更好!他是年轻人的榜样!梅西整体比赛能力比C罗更突出近日,C罗在皇马的队友本泽马公开对外表示,梅西的整体比赛能力比C罗更加突出。你不仅可以在梅西进球时享受到他的表演。,更重要的是,在梅西没有进球的其他时间李秀满的旧船票,登不上新时代的船多年对头,突变队友。EXO和防弹少年团,被戏称为地团和天团的两大韩国男团,有一天有可能成为一家人,看客始料未及,粉丝五味杂陈。2月9日,防弹少年团所属公司HYBE宣布参与收购EXO怀孕的蕾哈娜上演超级碗中场秀漫长的等待显然是值得的在漫长的五年之后,蕾哈娜周日晚上回到舞台上,在第七届超级碗中场秀上表演了一场炫彩的表演,虽然她没有任何令人惊喜的合作伙伴与她同台演唱,但她确实有一个特别的嘉宾
日常生活中不知不觉变胖的4个习惯没有胡吃海喝,也注意运动了,怎么还是变胖了?生活中是不是时常有这样的感觉?也许是因为以下四个原因习惯1开着电视睡觉开着电视睡觉根据最新的研究,睡眠中如果在电视机发出的光荧光灯蓝光等5个意想不到的使人生病的习惯我们日常生活的许多习惯可能破坏长寿。下面是一些可能会损害您的健康的罪魁祸首。1。害怕打流感疫苗针感冒能够引发严重的炎症,每当这时身体释放的化学物质会损伤血管,并在日后的生活中增加罹小寒养生重在养肾温阳,推荐七款经典汤膳二十四节气小寒小寒,是二十四节气中的第二十三个节气,冬季的第5个节气。数九寒天,民谚小寒时处二三九,天寒地冻冷到抖,也有小寒胜大寒之说。小寒的到来,标志着一年中最寒冷的时节到来了。末节14分,全场高呼MVP!老詹31分率队三连胜,魔兽1414梦回巅峰北京时间1月5日,NBA常规赛湖人VS国王,阿里扎顶替斯坦利进首发,继续打死亡五小!本场比赛最终湖人122114击败对手,取得三连胜,詹姆斯常规操作砍下31分5板5助攻,末节14分中国斯诺克大爆发!肖国栋31击败世界第一,强势晋级小组赛决赛北京时间1月5日凌晨,2022邀请赛版冠军联赛第三小组展开半决赛的争夺。中国帅哥肖国栋在与世界第一马克塞尔比比赛中,轰打4杆50,31战胜对手晋级小组决赛。小组循环赛,肖国栋还曾以这个韩国人已经超越了教练的意义张外龙的泪和跪又让多少球迷破防62岁的张外龙又哭了这位带领重庆队艰难保级的韩籍主教练,在球队击败武汉队后,面对球员一度哽咽难言,翻译也忍着泪水,帮他转达了对于俱乐部人员球员特别是他们家人的歉意,而在他刚开口的时汤普森社媒向科勒道歉,承认外遇并有私生子,这次能得到原谅吗?稍早之前,NBA球星特里斯坦汤普森在自己的社交媒体上公开发文承认自己出轨并且有一个私生子,并且向自己的前妻科勒卡戴珊进行了诚挚的道歉。在文中TT承认自己在和科勒交往期间出轨自己的私小小黑痣竟是癌?加拿大一冰球教练被眼尖球迷提醒后捡回一命据美国ABC新闻3日报道,美国一名女子在观看球赛时一个小小的善意提醒,拯救了北美国家冰球联盟(NHL)一名教练的生命,她被授予1万美元的医学院学费作为奖励。波波维奇与汉密尔顿图源外林丹与儿子豪宅内做运动!绷直身体满脸通红,双腿跪地指导儿子近日,谢杏芳在社交平台更新一则新年动态,还附上一段文字放假父子俩在练平板支撑,儿子比爸爸厉害。视频中林丹罕见露面与儿子小羽拼体力,赢得不少网友的关注。画面中小羽和林丹穿着运动服出镜中国篮球教父蒋兴权如果说中国篮球教父级别的人物,那么我想非蒋兴权蒋老爷子莫属,年过八旬,依然活跃在篮坛。蒋兴权1940年6月5日生人,今年已经82岁高龄,目前老爷子身体健康,精神矍铄,现任辽宁男篮的盖帽王加MVP!四川女版周琦遗憾夺银,中国女篮未来希望1月4日,对于女篮国手韩旭来说,刚刚结束的WCBA总决赛不是一个好的回忆,系列赛第二场她拼尽全力,24中15中砍下33分9篮板5助攻,却还是没能帮助四川女篮赢球,最终系列赛大比分0