WAIC九章云极方磊Hypernets自动化机器学习的基础框架

　　机器之心报道
　　机器之心编辑部
　　在 WAIC 2021 AI 开发者论坛上，九章云极 DataCanvas 董事长方磊发表主题演讲《Hypernets：自动化机器学习的基础框架》，在演讲中，他主要介绍了 Hypernets 的概念模型和两个具体实例。他认为，好的 AutoML 框架一定要具备富有表现力的搜索空间描述语言、支持高维空间的高效搜索算法和高性能的评估策略。
　　以下为方磊在 WAIC 2021 AI 开发者论坛上的演讲内容，机器之心进行了不改变原意的编辑、整理：
　　很高兴今天有这个机会跟大家分享我们所做的工作，九章云极 DataCanvas 是一家数据科学平台提供商，服务了众多客户，在服务客户的过程中不断做了沉淀。我们自主研发了 Hypernets，并且已在 GitHub 上开源。各位开发者朋友，如果感兴趣的话可以去 GitHub 搜索 Hypernets 或者搜索 HyperKeras，都能找到所开源的框架。
　　AutoML 是具有共性的问题，我将分三个部分介绍 AutoML：研发 AutoML 框架的原因和基本思路；Hypernets 概念模型和重要性；Hypernets 的具体事例。我将按照程序员标准，仔细讲一讲怎么使用，怎么在开发过程中受益。
　　AutoML 框架的重要性和基本抽象
　　首先 AutoML 框架本质是什么？就是空间的搜索，空间可以很复杂也可以很简单，大家对于自动机器学习第一个感觉就是调参，事实上，一个算法特别是机器学习和深度学习算法，本质就是空间的搜索。AutoML 也是空间的算法，在算法定义的超维空间里，去搜索到让算法或者一系列算法组合达到最优效果，其中重要的思想是抽象性和层级的必要性。
　　有些算法框架自带自动机器学习的功能，为什么还要做专门框架？目前解决实际问题由很多不同算法框架组合起来，不再只是简单训练一个模型调参数，而多模态也能够实现，视频结构化的模型，训练好的模型变成结构化的数据，再结合结构化的数据，比如看病，除了看非结构化的片子，还有验血等结构化数据。当构建复杂的真实系统的时候，学习的系统、做模型的系统其实是异构的，搜索空间也不是单个算法框架就能带来的。
　　本质上为什么出现这个层级的重要原因就是，定义 AutoML 本身框架，能够让各种算法非常快的实现自动机器学习的搜索。
　　AutoML 框架的基本抽象
　　基本的抽象主要围绕三个基本部分：第一步是定义搜索空间（Search Space），第二步是搜索策略（Search Strategy），第三步是评估策略 (EstimationStrategy)。通过搜索结果得到更好的模型，即通过一组参数或者算法组合得到模型后进行评估，评估拥有成本问题。AutoML 框架能够快速低成本评估，并且反馈到搜索策略，搜索策略得到反馈后，找到很好的结果。
　　在这三个方面各自的需求是： 第一，搜索空间描述语言相对比较丰富，能够描述各种各样的搜索空间。 第二，搜索策略灵活多变，支持各种各样不同的场景。 第三，高效的评估策略。
　　Hypernets 的概念模型和高级特性
　　下面具体介绍 Hypernets 是怎么实现丰富的搜索空间描述语言、灵活的搜索策略、高性能的评估策略？自动机器学习在已有学习框架中，无论运用什么算法框架，在这之上让它变成更好的模型，都可以使用 Hypernets，所以 Hypernets 与现有的各种框架是结合的关系。对于最新的深度学习 NAS 搜索有很多 paper，这是自动机器学习最重要的领域之一，Hypernets 也在其中做了很好的支持。
　　搜索空间
　　搜索空间本身怎么定义？这是非常经典的定义方式，绝大部分问题可以被定义为一个 DAG，本质搜索空间由三部分组成：一部分叫做 Connection Hypernets，一个点和下一个点连接，拥有有不同的连接方式；另外一个叫 Parameter Space，用算法里的参数，即参数空间；还有 Module Space，算法的使用方式不同，这一步用了算法，下一步可能是填充，不同计算模块本身有模块空间。很多不同的算子代表模块空间，连接方式代表连接空间，参数代表参数空间，将几个不同的空间结合起来就是整个搜索空间。
　　搜索算法
　　在搜索空间使用什么搜索算法？目前有非常多种类搜索算法可以使用。第一个是大家熟悉的并且阿尔法狗使用的算法——Monte-Carlo Tree Search，在很多科普媒体文章都介绍过，简单来说作为经典算法的 Monte-Carlo Tree Search 是在搜索空间中，进行搜索切割，实现向下或向子空间搜索的算法实践。
　　第二种算法叫遗传算法 (Evolutionary Algorithm)，与第一种算法相比，不那么结构有序。但在搜索空间比较复杂的时候，想要找到接近于全局最优的局部最优解，Evolutionary Algorithm 是非常有效的方式。
　　第三类算法 Reinforcement Learning，本身是比较好的一种算法。强化学习的目标是获得最多的累计奖励。
　　目前算法种类有很多，可以做组合，不同算法组合也可使用增强策略。
　　评估策略
　　评估策略在多快好省里最主要的是省，评估的时候在不是太不精确的情况下尽可能减少计算量。评估策略里面主要三个方向：第一，Meta-leaner，指导搜索方向。在搜索过程中使用在线训练的元学习器评估候选参数配置，减少实际执行 Trial 的次数。第二，Caching，节省预处理时间。可以记录很多中间结果，记下来之后可以反复使用，这是缓存的策略。第三，防止过拟合的 Early Stopping。有的时候搜索太深没有用，找到一个貌似很好的点，其实过拟合了，所以会做一些策略防止过拟合，有的时候浅尝辄止也是一件很好的事。
　　高级特性
　　对于高级特性，大家都知道一个框架体现共性的事情是可以解决的，我期待开发者朋友多多使用 Hypernets，Hypernets 也实现了高级的特性。我们经常遇到一些挑战，比如样本不均衡处理以及包括语言学习和二次搜索等特性。
　　高级特性主要干什么用的？第一，数据漂移，大家碰到非常常见的情况，做了不错的模型，上线后不能运行，因为数据基础分布发生变化，做模型要去检测在历史上哪些数据的分布容易发生漂移，并且作为特别处理。比如在营销中构建推介模型，有很多营销事件，你推荐别人买手机，但是昨天苹果开了发布会，可能大家兴趣变化了，或者华为又开了新的发布会，有非常多事件驱动营销场景下，数据漂移非常严重，这个时候如果有数据漂移的处理会让模型准确度大幅度上升。
　　包括二阶段的搜索，通过不同算法组合，首先运用半监督学习训练，打上标签，其次通过标签引导后面的训练，达到叠加的效果，并且对于样本不均衡的情况也是有很好的效果。
　　包括作为基本功的硬件加速和分布式处理，不可能只在一个机器上训练，在几十上百台机器上都有过应用的案例，所以其拥有较强的性能和分布式的能力。
　　同时也有一些训练适合在 GPU 上训练，不一定是深度学习，也有搜索的内容，均可以拆解。在 GPU 上运行，我们也做了一定探索，能实现一定的硬件加速，实事求是讲，不是特别成熟技术一定大幅度提高，但在一些场景之下有比较大的提升。
　　Hypernets 的具体示例：HyperGBM 与 HyperKeras
　　具体看几个例子，最基础的是 Hypernets，Hypernets 刚刚提到了三个空间，训练服务，在这个基础之上，结合不同的 training 框架，产生不同的 hyper 打头的一系列东西，比如 HyperGBM，是 GBM 加上 Hypernets。我们的定位是去帮助别的框架更好更快的找到训练模型。
　　Hypernets 家族开源地址：
　　Hypernets
　　https://github.com/DataCanvasIO/Hypernets
　　HyperGBM
　　https://github.com/DataCanvasIO/HyperGBM
　　HyperKeras
　　https://github.com/DataCanvasIO/HyperKeras
　　HyperGBM
　　举一个例子，大家最经常使用的 XGBoost、LightGBM、CatBoost 的 GBM 的算法，在结构化数据上有不错的效果。一个 GBM 的算法，一个 Full-Pipeline 可能很长，中间有很多步数据的清洗、切割、特征筛选、特征的组合等等，在中间有很长的 Pipeline，有十几、二十步之多，这个时候你想去利用这个技术怎么自动端到端的优化？运用我们研发的 HyperGBM，简单易用，实现自动端到端优化，当然也可以用强大的 Hypernets 来实现，如果用实现过的 HyperGBM，已经发现能够带来非常简便端到端整个自动机器学习的过程。
　　由数据的预处理到特征的筛选、模型参数的优化以及模型的组合，这些结合起来是非常典型的使用 GBM 算法训练的 Pipeline，Pipeline 之上 HyperGBM 实际是调动了 Hypernets 里面不同的 Search 或者自动的组合，在定义好的 SearchSpace 里面，与 GBM 用的算法每一步都有关系，会自动选取不同组合进行自动结合，利用 Search 找到最好的参数。
　　使用 HyperGBM 的五行代码，大大简化开发者使用相对复杂的技术来获得较好的模型。使用五行代码非常简单，在已有的基础上，利用 GBM 算法去进行训练代码技术上增加几行代码，就拥有全自动的搜索能力，大大便捷了我们和客户工作，在更广泛的开源社区里，我们希望开发者也可以使用。
　　HyperKeras
　　HyperKeras 主要在深度学习上去做一些模型的训练。Deep-learning 总结而言是找网络、找链接，网络里面也要找参数，也就刚才说的空间里面的连接、算子、参数，如果一个简单搜索的网络，可以用 Python 在 Hypernets 定义出来。
　　例如我写了好很多例子，你可以简单使用例子，5-10 行代码完全可以搜索模型。
　　Hyperents 的定位非常清晰，希望成为开发者的朋友，不管开发一个训练框架还是开发应用模型。开发训练框架可以让框架使用 Hypernets 很容易结合出框架本身的自动机器学习能力，如果是开发应用模型，可以组合不同学习训练框架的同时，使用 Hypernets，端到端的 Pipeline 进行自动机器学习的参数搜索，得到非常较好的模型。
　　经过在行业上的大量应用，在特征丰富情况下，Hypernets 在搜索能力包括分布式计算能力体现出来很多优势，搜索时间短，算力仅需普通训练的 20-30 倍，就能够得到一个性能大大提升的模型。

耗费22年建造中国天眼遇上暴雨后，会不会积满水？是如何排水的？从图片上来看，中国天眼借天然的溶岩坑为底座，它就像一口巨大的锅被安置在山地中，一眼望去，中国天眼的确很像一口锅，这口锅也的确不小。于是很多人就担心了，若是中国天眼真的遇上大暴雨，那年度大展19位艺术家建筑师舞者重磅集结给你制造别样的时间子在川上曰逝者如斯夫，不舍昼夜。时间，摸不到猜不透，但它似乎就在我们身边无论我们走动还是睡觉，它一分一秒地都在流逝无论我们是否珍惜，它最后依然会令我们走到尽头。古与今，新与旧，别样深圳重量级大展！时尚与自然的关系史图片你有没有想过，我们的身上衣对于自然曾造成过严重的污染，或许我们一直在追求时尚，从不曾去思索材料背后对自然界的影响。这期，我们一起来逛逛这场时尚重磅大展，解构时尚与自然相爱相杀的0755ONLINE没逛过这个展，别说你了解深圳本土艺术0755是深圳的区号，也是一个经济发展标志性的编号。有人因为深圳的发展机遇到而纷纷前往，也有人被深圳的艺术氛围而吸引而来。艺术家们在深圳到底是怎样的一种创作状态？带你看完这场展览就深圳首届Bng儿童艺术节，开启暑假艺术游乐园你的眼睛，像颗水晶通透，里面有一个无穷无尽的宇宙。夏日炎炎，小朋友们都放假了，看着家里脱缰的熊孩子还不知道去哪儿玩？这个地方你一定不能错过！鼓励大小朋友们在运动中欢笑在陪伴中成长在刷新世界纪录！中国科学家将光存储时间提升至1小时！有何用处？我国科学家刷新世界纪录！将光存储时间提升至1小时！问题是他们这样做究竟有什么用？我们知道，光是人类公认的最快速度！光每秒钟大约能跑30万公里，让人望尘莫及。虽说光速无法突破，不过，7月15日空客公司为欧洲航天局研发的机械臂将前往国际空间站7月15日，空中客车公司为欧洲航天局（ESA）研发的机械臂（ERA）将和俄罗斯的多用途实验室模块一同前往国际空间站，将在拜科努尔航天发射场用质子火箭发射。该机械臂有两个分段长度均超Nature封面欧洲科学家成功操纵反物质，有望解开宇宙之谜作者文龙一个世纪前，实验室发现了反物质粒子的存在，拉开了物理学家们对反物质进行实验研究的序幕40年前，普通原子的激光操纵和冷却彻底改变了现代原子物理学，促成了数项获得诺贝尔奖的实验经过长时间的延迟，特斯拉终于开始发售完全自动驾驶测试版9特斯拉开始为其期待已久的完全自动驾驶测试版9发送空中软件更新，这绝对不是自动驾驶，但肯定是先进的驾驶辅助系统。正如埃隆马斯克所承诺的那样，软件更新在2021。07。09午夜后开始上续航比预期更持久，中国火星车的表现超出预期随着祝融号成功登陆火星，中国对太空的探测也到了全新的层次。在火星上进行探测，能量是关键。祝融号的能源来自于哪里？又能够在火星上生存多长时间？遇到火星沙尘暴该如何解决？下面将一一为你微观粒子的排列方式决定着宏观物质的状态和种类这个世界上的基本单一元素只有112种，但是由它们构成的物质却超过了3000多万种。正是因为这些元素的原子构成排列方式不同，所以宏观上物质的种类也不同。这是漂亮的钻石，它是一种单质，

<<<<<<－>>>>>>

周杰伦回应新歌抄袭早看到留言了，懒得理会！态度说明一切周杰伦回应新歌抄袭早看到留言了，懒得理会！态度说明一切近日关于周杰伦新歌前奏抄袭一事，在网络上也闹得沸沸扬扬的，相信大家都不相信，的确以周杰伦的才华，在圈内完全用不着抄袭，造谣周杰中餐厅2热力来袭，嘉宾团队异常亮眼，会上演怎样的精彩故事呢？中餐厅第二季发出官宣。从嘉宾阵容来看，中餐厅来了一些新的员工。赵薇苏有朋舒淇王俊凯白举纲重磅加盟！第一季时，赵薇黄晓明周冬雨张亮靳梦佳五位明星在异国他乡经营一间中餐厅，用心做出一道大麟子爸爸首次曝光，网友难怪人人都说邓莎高攀了！妈妈是超人这档节目相信大家都不陌生，是芒果TV推出的明星育儿观察类真人秀节目，现已经推出第三季。节目集结了不同个性背景和类型的明星妈妈，她们将在节目中展示最原汁原味的家庭生活和最真还珠现状紫薇当妈，小燕子隐形富豪，金锁国际范儿，她却坐公交！一眨眼还珠格格已经过去20年，中间基本每年都可以看见重播，火爆程度不逊色与西游记，而且最重要的是当时这不电视剧老少皆宜，更是瞬间将还珠三女变得家喻户晓。也算陪伴自己童年长大的神剧，周冬雨小小的个子却总散发着超大的能量，成为观众眼中的好演员！说起周冬雨，脑海中总会浮现出一个长相干净单纯，像小黄鸭一般可爱的娇小女孩。然而这样娇小的身躯之中，却藏着一个勇于挑战，敢于拼搏的巨人灵魂。初见周冬雨，她的外表可能让绝大多数人都觉得盘点相声名家，排名不分先后相声分为北派与南派。相声艺术源于华北，流行于京津冀，普及于全国及海内外，始于明清，盛于当代。主要采用口头方式表演。主要道具有折扇手绢醒木。表演形式有单口相声对口相声群口相声等，是扎综艺节目中，经典的怼人场面有那些？要说到综艺节目，应该是普通人最常见的一种消遣方式。其中也诞生了不少的爆笑场面和怼人场面。康熙來了黄渤怼小S小S这个摄影棚里不允许有胸部比我大的女生出现。黄渤所有女生都出去！小S如果人人戴上口罩，能不能把其他病毒预防了，比如手足口病，流感等？任何事情都不是绝对的，戴口罩有助于病毒的预防，但不是一定就能避免。就像开车系安全带，出车祸时可以减轻伤害，但不是一定能保证你不受伤害！人人带口罩并不能预防其他传染病。因为传染病的传海南两位女教师，因长相走红网络，家长最怕单独去老师办公室长相漂亮的人走到哪里都受欢迎，看着养眼确实也讨人喜欢，毕竟颜值即是正义，人人都喜欢和长相好看的人相处，如果要说美貌与智慧并存并且还是从事教育工作的美女，可是在生活中就非常的少见了，新疆棉事件一个月后，HM耐克现状如何，抵制风波平息了？碰瓷新疆棉事件的各大外国服装品牌，毫无疑问败下阵来了，也给打着人权旗号蓄谋政治意图的西方国家好好上了一课。如今新疆棉事件已经过去了一个月，HM耐克等品牌商现状如何？国人也安静了下来这些星二代户口本上的名字！陈小春儿子听着就很贵气逼人！看遍繁华的明星父母给孩子起名时真的很随意？NO！你绝对想不到他们儿子女儿户口本上叫什么！陈奕迅女儿，小名是包包，大名很少有人知道，是陈康堤！是不是意外？话说内涵指数5颗星的陈奕迅是