范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

华为网盘搜索(华为云官网)

  华为网盘搜索(华为云官网)
  搜索是一个古老的技术,从互联网发展的第一天开始,搜索技术就绽放出了惊人的社会和经济价值。随着信息社会快速发展,数据呈爆炸式增长,搜索技术通过数据收集与处理,满足信息共享与快速检索的需求。基于搜索技术,更是缔造了谷歌、百度、雅虎等一批知名企业。
  搜索也是一个蓬勃发展技术,它串联起了问答、地图、小程序等各式各样新的应用形态。最近十几年间,也应用到了更早前并无直接关联的IT运维等领域。更是通过技术融合推动了AI、NoSQL、OLAP等相关技术的发展。
  日前,华为开发者大会HDC.Cloud DevRunLive开发者技术沙龙上,华为云专家做了关于"云搜索服务技术实践"的技术演讲。本文为大家介绍业界流行的搜索应用场景,开源Elasticsearch的应用,以及华为云搜索服务在此基础上的一些增强。
  一、什么是搜索?
  搜索行为的基本流程
  从技术上来看,搜索指的是:依据不同类型数据的条件组合,筛选出符合条件的记录(或称文档),并依照某种排序规则进行TopN的选择,最后进行呈现。
  具体的过程,如上图所示。我们在生活中遇到的各种类型数据,像新闻文档、电话号码、年龄、体重、地图坐标等,在搜索系统各种会映射成不同类型的索引,比如文本一类的数据被映射成倒排表索引,数字一类的数据被映射成KD-Tree索引。还有一类特殊的数据,像图片、视频等多媒体信息,他们不能直接被表达为索引,而是通过机器学习表达为一个个向量数据,然后存储为搜索系统中的向量索引。
  各种数据转换为索引后,我们就可以通过不同的条件描述组合来进行搜索了。通过索引来搜索相比一条条数据的过滤,通常速度会快好几个数量级,从而快速筛选出符合条件的数据条目。
  最后,当筛选出来的数据条目非常多的时候,人难以一次阅读过来,还有有一个排序的过程,比如按照是否最新、猜测是否最符合搜索目的等方法挑选出其中的Top N条,最后进行呈现。
  上述是从技术角度来阐述什么是搜索,从实际应用来看,更加容易体会搜索的形态以及价值。
  搜索的部分应用
  从业务上来讲,搜索是一种灵活提取/组织企业知识的手段,面向客户或企业自身都有很强的应用价值。在泛互联网/泛政府/大中小企业都有广泛的应用。
  二、企业如何构筑自己的搜索系统?
  如果从头开始构筑自己的搜索系统,会是一个非常耗费时间与资源的事情,因为搜索技术确实比较复杂。就比如前面说过的表达文本索引的倒排表,就会有FST、PForDelta、Skip List等等很多底层数据结构以及工程实践要实现。再加上行列存储、数值索引、向量索引、分布式等其他方面的内容,投入的时间和资源会是一个惊人的数字。对于不是以提供搜索引擎为主业的企业来说,最好的选择是从一个优秀的开源软件开始,比如Elasticsearch。
  Elasticsearch,简称ES
  Elasticsearch拥有着强大的功能,从它开始搭建搜索系统能够节省大量的时间与资源。
  当然使用开源软件也不是一个一劳永逸的事情。如果是一个单机的Demo,很容易。但是一旦上到生产系统,事情就变得不那么简单了。
  生产环境下,事情变得复杂
  在生产环境中,要考虑集群化以应对大量的数据与请求,还要考虑业务连续性所要求的可靠性以及极端情况下可恢复性,防止恶意操作或者误操作的安全准备,以及业务的扩张带来的对应资源添加等等。这些问题都需要大量的经验来支撑操作,这使得企业不得不投入额外的精力来操作这些不属于主业务的事务。
  为了帮助企业更好的完成上述任务,华为云推出了云搜索业务,能够大幅简化生产环境下Elasticsearch的维护工作量,并且在部分ES原本处理较薄弱的地方,进行了增强。
  华为云搜索,为生产环境充分考虑
  华为云为了让企业在生产环境上的搜索系统更易于构筑,做了如下几个方面的工作:
  √兼容性:100% 兼容Elasticsearch APIs,支持5.x到7.x多个版本
  √易用性:分钟级集群创建、扩容,一键式备份与恢复,7*24看护
  √安全性:支持优秀的分权分域,底层磁盘加密
  √高可用:扩容节点、磁盘业务不中断,更新词库业务不中断
  √可靠性:支持跨AZ冗余配置,自动化的增量备份
  √高性能:慢报表自动加速,费时降低百倍,集成向量索引,多媒体检索时延低至ms级
  √低成本:存算分离的架构,长时间数据存留成本降至20%
  前面的5条,可以笼统的归结为生产环境上的必要条件。这里重点聊一下最后两条中的内容:向量索引、存算分离、报表加速。
  三、向量索引
  向量搜索主要是为了多媒体内容检索准备的。一个搜索请求假设带上一张图片,这个图片会被事先转换为一个特征向量(比如人脸图片典型特征就是一个256维的Float向量),这个向量会被送入搜索系统与其他存档的向量进行比对,如果两个向量的距离越近(欧式距离、余弦距离等),那么就意味着原始的图片约相似,从而有可能被搜索出来。由于可以对多媒体进行搜索,向量的搜索技术被大量用于拍照选商品、人脸匹配、高速路口车辆寻迹等场景。
  Elasticsearch也有向量搜索的能力,叫做DenseVector,但是这个方式有一定的缺陷。
  ES的向量处理方式
  如上图所示,进行一个联合条件检索,比如"梅观路口"AND <某汽车照片向量>这样的条件来检索出现在梅观路口某车辆历史经过的记录时, 开源ES的做法是先通过倒排索引快速找到符合"梅观路口"的记录,再一条条和查询的小汽车向量进行比较,找出TopN比如前20条向量距离最近的。这样一来,如果符合"梅观路口"的记录有一亿条,就要比较一亿次,效率很低。
  华为云搜索采用向量索引来解决这个问题。
  华为云搜索的向量处理方式
  如上图所示,主要有两个突破点,第一个突破点是如何对向量采用一种合理的索引编码方式,能够带来远小于O(N)的时间复杂度。我们的方式是采用HNSW的编码方式,带来近似O(Log)的时间复杂度。第二个突破点,是如何与其他类型的索引协同工作,我们通过改写Lucene和ES的代码,在底层新增了一种数据结构,支持与其他索引进行互通,通过向量索引快速锁定搜索范围从而减小其他条件的索引范围。最后的总体效果就是,哪怕是上亿的数据,得出结果也只要数十毫秒。
  四、存算分离
  如文章开头所讲,近十几年来,搜索因为优良的灵活度,被逐步用于企业的日志定位,指标运营运维任务中,替换了原始的Log文件Ctrl+F和Excel表格运维的操作方式。ES有很大一部分的实际应用都是针对这个场景。对于重度依赖IT系统的企业来讲,日志与指标的产生是源源不断的。但是这些数据的价值随着时间的推移,会逐步降低,但价值却不会完全消失。对于企业来讲,这很两难,如果长时间保留这些数据,使用开源ES的成本相当高昂,如果仅仅保留最近几天的数据,那么万一需要回溯一个疑难杂症或者复盘一个运营事件,需要用到上周甚至是上月的数据怎么办呢?
  华为云给出的方案是存算分离。
  通过四个方法解决了其中的四个关键点:
  依照时序数据不会修改的特征,数据分类为热数据与冷数据,热数据可写可搜,冷数据可搜不可写。这样解决了时序数据特征到数据处理模型的映射。
  热转冷时,将数据转移到对象存储,由于对象存储使用的是纠删码存储,冗余与有效载荷的比值远小于1,大幅节约了原先由于多副本带来的存储成本。
  计算节点内还是保留多副本概念,用于维护可靠性,但是都仅仅是指向同一份对象存储,不会重复存储。
  对于冷数据,不会长时间维持全部的元数据以及Cache,而是自建内存管理机制,尽可能的少用内存,实现小马拉大车,少量节点带动大量数据。
  通过上述方式,实现了日志数据保留成本下降至20%,同时数据容量相比优化前提升12倍。
  五、报表加速
  为了统计PV/UV曲线或者请求的平均时延曲线等运营运维的数据用于企业业务或者IT管理的决策参考,通常IT部门会引入ES来根据原始的指标数据来制作报表。但是这个方式在统计跨度稍大的范围时,就很容易出现报表很慢或者OOM的情况。
  华为云采用了报表加速技术解决。
  华为云搜索报表加速方式
  如上图,这个方案分为两个部分,上面一部分是Rollup。Rollup的原理并不复杂,把时间按照一定的粒度比如5分钟进行分割,将里面的数据按照配置好的聚合语句预先进行一遍聚合计算。那么后续再来报表请求的时候,直接基于预先聚合好的粗粒度数据计算,可以大幅提升计算效能。这个方案ES的非开源包XPack中有实现,华为云搜索也采用了自己的实现。
  更贴近客户也是更独特的部分是图中的下半部分。由于ES中Rollup是一套独立的API,用户需要自己进行预聚合的操作与任务维护。华为云搜索则是通过判断用户的慢日志,来自动化的协助用户决策,是否需要进行加速,并生成中间数据辅助计算。优化前后,用户的业务不需要进行任何修改,在已有的接口之上便可获得加速能力。

千古名句(千古唯美名句)千古名句(千古唯美名句)李白(701年762年11月30日),字太白,号青莲居士,又号谪仙人,唐代伟大的浪漫主义诗人,被后人誉为诗仙1。天生我材必有用,千金散尽还复来。李白将进酒2吴道子哪个朝代(吴道子的代表作是什么?)吴道子哪个朝代(吴道子的代表作是什么?)吴道子,汉族,今河南禹州人,大概是生与公元680年,年幼家贫,父母双亡,他曾跟随张旭,贺知章学习书法,但是未有成就后该学画画,成就不凡。吴道赌王女儿与任正非女儿聚会整屋子都是上流圈的人!8月9日,据消息透露,某知名集团董事长的女儿袁九儿晒出了一张和好友们聚会的照片,同场的有某知名企业家的小女儿姚安娜导演陈凯歌的大儿子陈雨昂以及赌王何鸿燊的小女儿何超欣。陈凯歌大儿子温成皇后(温成皇后张氏有多受宠?)温成皇后(温成皇后张氏有多受宠?)宋仁宗因为他的仁而被后人所认可,因为好名声,一直以来受到很多人的敬佩。宋仁宗在位期间,北宋在政治经历文化和科技等各个方面都得到了很大的发展,虽然他王朔沈旭佳(舞蹈演员沈旭佳图片)王朔沈旭佳(舞蹈演员沈旭佳图片)一王子文和王朔的缘起王子文和王朔的瓜葛,要从2006年那场官司说起。那时的王子文,只是个没有人脉和资源的小丫头,任人宰割。年幼无知想出名,便和中国国花木兰是什么朝代(花木兰是什么朝代的人?)花木兰是什么朝代(花木兰是什么朝代的人?)唧唧复唧唧,木兰当户织。这是古代比较有名的一个作品木兰辞节选,其中的花木兰是一个相当传奇的人物,她是一个女子,但曾经去参过军,在古代大家只杨坚的皇后(隋朝文帝杨坚的皇后)杨坚的皇后(隋朝文帝杨坚的皇后)公元581年二月,隋文帝杨坚建立隋朝。即使隋朝在我国古代存在和发展的时间非常短暂,它在历史上的影响依旧非常深远。隋朝一系列政治措施为之后盛唐的发展以秦淮河畔(秦淮河畔南京城)秦淮河畔(秦淮河畔南京城)梧桐给南京增添了风景。一座城市最吸引的人地方,莫过于其历史遗迹与记忆。古都南京,襟江带河,依山傍水,钟山龙蟠,石头虎踞,六代豪华春犹在,因厚重的历史文化底南京为什么叫金陵(十里秦淮金陵一梦意思)江南佳丽地,金陵帝王州,南京拥有着6000多年文明史是中国四大古都之一(后有六朝古都的称谓)。然而为什么南京又叫金陵呢?为什么秦始皇要挖秦淮河要斩断其王气?为什么新中国建都没有选择春风十里在哪里(春风十里名字)打卡美好生活有朋友说,旅途中一场真正的遇见,就是邂逅一个文艺小镇,在那里品味创意,体会浪漫,度过一天的慢生活。在日照就有这样一个文艺小镇,它的名字是春风十里。寓意,春风有你,我愿多杨广的真实历史(杨坚一共有多少个老婆)杨广的真实历史(杨坚一共有多少个老婆)杨广对于后人来说并不陌生,众所周知他是隋朝的第二位皇帝,史称隋炀帝。在历史上隋朝很特别,因为它比起中国很多的朝代来说时间比较短,只有38年,这
清汤火锅做法(清汤豆花火锅的做法)清汤火锅做法(清汤豆花火锅的做法)在成都吃重庆老火锅,这次我们专点鸳鸯锅,清汤锅味道尽如此我是小C!用柴米油盐烹饪菜肴,陪你走过三餐四季。最近的成都时不时傍晚要下雨,白天有一些大太鸡脚花生汤(鸡脚眉豆花生汤)鸡脚花生汤(鸡脚眉豆花生汤)小贝0o,20150421煲一碗广东著名的养生靓汤祛湿美肤的花生眉豆煲鸡脚无论想强身还是补血,想壮骨还是养颜,想益肾还是固腰都可以根据不同的食疗功效选择台积电宣布断供华为为什么台积电会对华为断供这两天关于台积电宣布断供华为为什么台积电会对华为断供在网上的热度是非常高的,很多网友们也都是非常关注台积电宣布断供华为为什么台积电会对华为断供这个事情,为此小编也是在网上进行了一番台积电发布Q3业绩预告文章来源科技讯据外媒报道称台积电近日发布了Q3业绩预告其预计Q3营收将在112亿美元至115亿美元之间此外该公司预计2020年第三季度该公司的毛利率将在50至52之间营业利润率将在Intel可能会扩大与台积电的合作或将下一代基于Atom和Xeon的SoC生产外包CPU,台积电,Intel近日Intel网站上有关招聘信息的一份文件的工作描述中,隐含了Intel外包生产计划的相关信息。虽然Intel将部分的生产外包给台积电已经不是什么秘密。但到目前为止,具体细节一直很今日兴化蟹价多少(兴化官网)螃蟹甲鱼产量有多少。16元斤母蟹68两。毛母。水产和市场管理部门加强对兴化几大蟹市场监管。兴化市民论坛有深度有温度有热度。我市市领导方捷殷俊徐立华夏爱东刘汉梅参加活动。月2日兴化河今日兴化兴国蟹价兴国图片锲而不舍,闻吴中陆子正尝从尹焞学,如果想要长远平稳的发展?荀况,金石可镂?实现你尤其在企业中,都可以做银行抵压贷款,自是用心圣贤践履之学?世上无难事,只要肯攀登,4。郑板桥,影响的今日兴化收购蟹价,兴化官网兴财建今12号。45号。根据省财政厅关于下达今年稻谷补贴资金的通知。该报价根据地各产区价格均算仅做参考。非常实用。全国报价参考。里下河水质比较清澈。规格不同。仅做参考。。5公价格为单倍行距是多少磅(固定值16磅和单倍行距)课题主办方制定了课题研究报告格式规范,本文以具体实例展开说明。1纸张要求及页面设置(1)纸张A4,幅面白色。(2)页面设置上下2。54cm,左右3。18cm,页眉1。5cm,页脚1曲靖师范学院怎么样(曲靖师范学院出入证什么样)1。大理大学大理大学(DaliUniversity),简称理大,坐落于云南大理,入选教育部卓越医生教育培养计划试点高校。是一所以医学药学教育学和生物学为优势,民族学和艺术学为特色,温州属于哪个省的(昆明属于哪个省的)温州是中国经济改革的先行地,温州模式(与苏南的以乡镇企业为主的模式不同,温州是经家庭手工业和专业化市场相结合,形成小商品大市场的发展模式)一度名满天下,享誉全国,温州成了小商品生产