WAIC2021华为黄之鹏下一代AI基础软件能力展望

　　机器之心报道
　　机器之心编辑部
　　在 WAIC 2021 AI 开发者论坛上，黄之鹏发表主题演讲《下一代 AI 基础软件能力展望》，在演讲中，他主要介绍了下一代 AI 基础软件核心能力的突破方向与着力点，阐述了未来的深度学习框架的发展走向。
　　以下为黄之鹏在 WAIC 2021 AI 开发者论坛上的演讲内容，机器之心进行了不改变原意的编辑、整理：
　　今天一天，整个论坛几乎覆盖了所有深度学习发展的最关键部分。我这部分内容作为论坛的最后一部分，还是很合适的。因为，刚才讲了很多的硬件，也讲了很多算法；包括很多应用，但是要实现所有的这一切，都离不开一些基础的软件，包括底层软件的生态。
　　今天演讲的文稿是基于前一阵在 CCF ADL workshop 的材料编辑的。如果大家对这块技术比较感兴趣的话，那么接下来，可能会看到一个略带诡异却又非常有趣的演讲。
　　一、AI 基础框架发展史
　　首先，希望大家转换一下视角。至少在我见过的讲人工智能或者深度学习的讲义、讲座，基本都会遵从线性叙事，内容基本都是几次高潮、几次低潮。那么，有没有可能转换一个视角呢。
　　如果跳脱出算法之外，我们支撑算法的实现——这些具体的底层软件和硬件，这些工具有没有反过来促进整个人工智能技术发展？或者说，在最常见的（人工智能发展史）时间维度之前和之后，有没有一些有趣的事情发生呢？
　　AI 工具理性主义——从艾舍尔的龙到哥德尔机器
　　首先讲一个背景，今年是哥德尔发布「不完备定理」90 周年。我这里摆的一本书很有名，叫 GEB，讲的是哥德尔、艾舍尔、巴赫，三者思想的连结。其中「艾舍尔的龙」是在试图利用二维化手法表现三维故事；可以看得出该过程非常困难。「哥德尔不完备定理」本来应用在数论当中；其实该定理是对之前罗素、怀特海所建立的整个公理逻辑基础的一次论证或者推翻。「哥德尔不完备定理」的伟大之处在于它可以泛化到很多领域，比如人工智能领域。可以看到，如果单纯用一阶逻辑，我们可能永远没有办法达到 AGI。AGI 一直是所有业界做 AI 的人希望达到终极的目标。为了达成这个目标，最终还是需要非一阶化的系统，这个系统需要逻辑本身再加上实验经验。以上所讲的这一切，想给大家传递一个整体思路，即深度学习发展是逻辑和实现逻辑的工具的纠缠演化的过程。那么，今天我们是把视角放在工具上。
　　AI 工具理性主义——史前时代
　　刚才说到，我们希望看一下从「惯性叙事时间点」之前和之后，从工具角度看发生的事情，是不是也会有收获。我们「惯性认为的计算机时代」的开始，是埃尼阿克（ENIAC）时代或者说二战之后；在那个时间点之前，科技一直是进步的。而且，我们一般会把莱布尼茨（Leibniz）作为现代人工智能所有技术、理论基础的起点。
　　其实在这个时间点很久之前，科技界便一直在持续对人工智能做探索。第一台设计出来的要完整实现逻辑的机器，是由世界第一个女程序员洛芙莱斯（Ada Lovelace）和她的丈夫巴贝奇（Charles Babbage）设计的。机器没有最终实现，巴贝奇含恨而终。
　　世界上第一个可以下棋的机器，在 1914 年就出现了；该机器是由西班牙科学家设计的。30 年代初哥德尔、丘奇、图灵发表了三篇关键的论文；这三篇论文基本上奠定了现在计算机科学所有理论的基础。
　　在 1936 年，出现了第一个可以工作的可编程通用机器，该机器由瑞士 Zuses 发明，被命名为 Z3 机器。
　　以上我们可以看出，人类工具、软件和硬件的持续演化已经支撑了人工智能基础技术持续百年的发展。再往后看，这是跟今天演讲非常贴近的主题。
　　AI 工具理性主义——后现代
　　从 2010 年开始，支撑深度学习发展最重要的是框架，包括支撑框架的基础软件。如果没有这些软件的发展，我们就不可能看到刚刚嘉宾讲的这么多已经实现的模型、系统。
　　从图中大家可以看到，框架时间线非常明显地存在着断代。它也明显对应着深度学习数据集、模型开发能力在几个时期内不同的爆发点。最近一次爆发是去年，尤其是以中国为主，有很多新兴开源框架诞生。
　　我现在负责的是去年三月底华为开源的 MindSpore。这是华为自研的深度学习算法框架。我们认为，MindSpore 的出现，代表着下一代 AI 基础设施一整套全新思路正式走上舞台。
　　二、下一代 AI 基础软件核心能力
　　下面以华为两个主要的 AI 开源项目为例，给大家讲一下，我们所认为的下一代 AI 基础软件能力代表的关键能力是什么。
　　MindSpore 希望解决的问题
　　MindSpore 希望解决的问题很简单，刚才很多嘉宾演讲已经从不同维度都触及过这个问题。显而易见，现在可以开发以及需要训练的模型越来越大，所处理的数据越来越大。如果你的框架不够友好的话，AI 算法工程师需要学越来越多的系统知识，才能搞定大规模分布式系统。另外就是企业方面；有些情况，单纯在学术界做研究还可以，到了真正的产业界就变得不可行；产业界所关心的并不是很新很酷的特性，关心的是鲁棒性、稳定性、安全性等一系列东西。最近人工智能业界的巨大发展是 ASIC 芯片的大量出现，这里存在的问题是一个框架能不能充分发挥专用芯片的能力。再就是学术界和产业界的鸿沟，不再赘述了。开发 MindSpore 正是为了寻找和研究全新的框架，从而解决这些问题。
　　什么是 MindSpore
　　那么，什么是 MindSpore？简而言之，MindSpore 称之为全场景 AI 计算框架。全场景的意思是从「大规模公有云端环境」一直到「智能边缘」的智能相机、边缘盒子、手机，甚至是嵌入式开发板，都可以用这一套框架来开发。
　　MindSpore 有些关键特性：（1）自动并行。有关并行的文献可谓汗牛充栋，从可以进行分布式训练模型那一天开始，「并行」就是大家关注的问题；从最基础的数据并行，到可以做模型并行、再到 Pipeline 并行。MindSpore 是混合自动并行，意思是可以自动进行「最优的分布式并行策略」搜索，可以给开发者提供最优的并行策略。（2）二阶优化。做二阶求导是理论上非常符合直觉，但是工程实践上非常难的事情。尤其是你可以持续保持你做一阶的正增益，效率提高将近 1 倍。MindSpore 是可以做到的（3）动静态图结合。（4）全场景部署协同。MindSpore 和华为昇腾硬件平台配合，可以发挥巨大的性能，我们也会提供很多性能调试工具。
　　有几个最新的比较不错的特性：MindSpore 着力点是和科学计算的结合。我们一直认为深度学习和科学计算结合，或者说把数值计算与深度学习结合，是整个领域向前发展的一大趋势。
　　MindSpore 以及昇腾生态在很多地方都有了很多实践，比如说深圳气象局有短临天气预报、电路巡检，以及来自云南的非物质文化遗产「扎染」与 AI 结合的尝试。
　　MindSpore 会和鹏城实验室做大量千行百业智能化的研究合作。在武汉建立了 AI 计算中心，孵化了大量的 AI 相关应用创新。今年最重要的成果是，我们与鹏城实验室发布了业界首个千亿参数量级的稠密中文自然语义模型——「鹏程. 盘古」。
　　盘古模型发布以后，有很多新闻出来了，称有许多其他框架做的所谓万亿级模型。在这里，大家需要区分稠密模型和稀疏模型。很多推荐类模型，包括为了解决硬件算力不足采用 MOE 模式的大型稀疏模型的训练成本和训练过程，跟稠密模型 GPT3、盘古这样的千亿参数的模型是完全不一样的。我们坚持了盘古大模型开放开源，给整个业界使用。
　　我们和深圳湾实验室的老师一直在合作分子动力学与深度学习结合的相关探索。MindSpore 带来的很多端到端自动并行的能力都对类似的科研任务有极大的推动。
　　整个 MindSpore 开源社区是在 2020 年 3 月 28 日开源的，可以看到短短一年多的时间取得了比较快速的发展。
　　除了深度学习框架之外，想跟大家介绍非常重要的 AI 异构计算架构——CANN。
　　CANN 是我们定义的能够支持异构计算，尤其是进行大量面向底层硬件编译优化的软件系统。CANN 主要是提供统一的编程语言——ACL，有统一网络构图接口，以及高性能计算引擎和算子库。加速硬件的算子性能是非常重要的。CANN 还有很多基础服务，比如集合通讯能力等。
　　CANN 提供了很多针对「利用硬件能力」进行深度优化的技术。CANN 在逐步开源开放出来，比如大家在码云上已经可以找到作为 AI 计算语言开发和运行平台高级接口的 ACL 代码，以及 cann-halo，这个 HALO/ODLA 通过 CANN 的开放接口使能 Ascend 的 Adapter 样例代码。欢迎大家点击「阅读原文」了解我们的项目。
　　三、下一代 AI 基础软件能力主要方向
　　下面快速说一下基础软件 + 底软的层面，未来深度学习发展的几个走向：
　　（1）互操作性。互操作性未来会是巨大的话题，现在互操作性并不是问题，因为每一个框架都有背后的主要公司在维护，且每个框架都拥有可以支撑的主要生态。但是随着人工智能生态的发展，比如说 Huggingface，存在非常有趣的现象。随着预训练模型、跨模态预训练模型的大量丰富，通过业界标准解决互操作问题只是时间问题。
　　（2）高阶 API。高阶 API 并不是新事物。最近可以看到 FastAI 的快速成长，Keras 又从 TensorFlow 的生态圈里独立出来。TinyMS 是我们团队为 MindSpore 开发的高阶 API 项目。「能否有好用的高阶 API」是未来深度学习框架开发者生态发展非常重要的一环。
　　（3）SciML 是 Julia 社区提出的概念。科学计算与深度学习结合，数值计算与深度学习的结合，将来会极大地影响框架的发展。Google 大脑最近一直在推的 JAX，以及 JAX 相关的生态。我们有 Julia 这样非常优秀的传统做科学计算的开源项目，现在也在做大量深度学习的结合。
　　（4）编译优化。这是国内大学团队的一篇论文，本质上大家用框架的前端构造网络模型；框架的后端会跟很多底软层通过编译优化，让模型比较有效地利用其所有硬件环境；从而执行你需要它执行的任务。编译优化一直以来是一个大难题，今天上午也有讲到 RISC-V，尤其是当域专有的架构越来越多的时候，如何做端到端的优化；优化不仅仅是框架层面软件的优化。比如说以 RISC-V 为例。RISC-V 的 Vector 扩展，「如何设计扩展能够更好地优化，所有涉及到矢量计算相关编译的流程」，都将是非常重大的课程。比如说，现在有 MIIR 开源社区着手解决其中一部分问题，所谓的编译基础设施，这块是未来的一大发展方向。
　　当然还有很多其他的方向，前面提到的图神经网络有框架的概念，强化学习也有框架的概念。联邦学习、隐私计算最近非常火，我们也有很多专门做这方面的框架。刚刚也提到很多交叉领域，包括段老师提到的量子力学，MindSpore 也有自己对量子力学的 Mind quantum 相关的支持。
　　结束语
　　我讲的内容就为大家呈现到这里，欢迎大家关注我们的社区。这是一个新生的「立足国内，放眼全球」的深度学习开源社区。欢迎大家关注我们，我们的代码在国内的码云以及大家最常用的 Github 上都有，并且是实时同步的。在抖音、B 站上都有站点，我们投放了很多课程、活动的录屏。
　　欢迎大家关注我们！谢谢大家！

微软账户进入无密码时代现在每一位拥有微软账户的用户都可以从账户中彻底删除密码以提高安全性。微软副总裁VasuJakkal在相关公告中写道，过去几年以来，我们一直在强调未来无密码机制的重要意义。今天我很高每一条消息都抄送给警方An0m手机背后的骗局卫报报道了一个在全球黑社会中发生的病毒式营销故事。以高安全性为卖点的An0m手机发起了草根营销，根据美国一份起诉书所言，让众多黑社会中有影响力的人物即掌握巨大权力及影响力的知名罪犯安全公司发布了免费的REvil勒索软件解密工具安全公司Bitdefender发布了免费的REvil勒索软件主解密工具（exe）。REvil今年7月突然销声匿迹，当时它利用软件供应链同时对数千家公司发动了备受瞩目的勒索软件攻击。亮点！凯泰超纤自主生产的定岛超纤性能简述凯泰超纤是国内最大的绒面超纤生产基地，以超细纤维技术为核心，以高端智能技术及产品创新应用为方向，深耕多领域终端行业应用凯泰不仅拥有专业的技术团队，而且配备了各种国际先进的生产设备，每周在VR元宇宙里逗留40到50小时是个什么感受元宇宙技术专家物理学家与虚拟现实专家PaulTomlinson尝试在虚拟屏幕前待了4500多个小时，他分享了这段体验。元宇宙的部分样貌在2021年崭露头角。Tolinson写道，我三胎正式开放，面对愈发严重的教育内卷，孩子的未来在哪里？三胎生育政策来了教育专家希望三孩政策率先在东北试点什么样的房子能装下三孩前天，有一件重大新闻！三胎生育政策来了！政策一出，一石激起千层浪，引得网上一片热议。为什么会有三胎政策的实施自嘲废物的985大学生，后悔选错专业，如何让孩子未来不迷茫近日，自嘲废物的985大学生挤上热搜，不少人会说，这些人就是凡尔赛，登上了985的快车怎么可能是废物？其实，还真有可能！早在豆瓣985废物引进计划小组中，就聚集着这么一群人，明明都Google抨击欧盟监管机构忽视苹果Google周一抨击欧盟反垄断监管机构忽视竞争对手苹果，并要求欧洲第二高等法院撤回针对Android操作系统提出的创纪录43。4亿欧元（约合51亿美元）罚款。Google律师在五天一只仓鼠的股票交易回报率超过巴菲特股票市场的跌宕起伏是很难预测的，而动物也许比人类更敏锐。两位德国人做了一个玩笑性质的实验，让宠物仓鼠选择股票进行投资。结果几个月后它的回报率比专业投资者还要高。这只仓鼠以著名的日本苹果公司的安全漏洞让黑客能通过iMessage悄悄入侵iPhone一家以色列安全公司自2月以来一直在利用一个重大的安全漏洞通过iMessage悄悄入侵iPhone。用户不需点击链接或打开文件就会让手机被感染。苹果公司（AppleInc。，AAPL丰收的颜色丨这个秋天满眼都是幸福AUTUMN你好秋天每个初始的新阳都期待收获的阳光又到一年丰收季满了粮袋子甜了果盘子丰了菜篮子在中国大地上一幅色彩斑斓的丰收图已然展开丰景如画稻花香甜在你眼中最美的丰收景是怎样的画

<<<<<<－>>>>>>

赵东元院士JACS梯度多级多孔结构，实现快速毛细管辅助催化喜欢就关注我们吧，订阅更多最新消息第一作者ChinTeHungLinlinDuan通讯作者赵东元院士李伟教授通讯单位复旦大学DOI10。1021jacs。2c01444全文速览合成科学家称机器学习将是识别宜居系外行星的最佳方式之一系外行星的研究领域正在经历一场巨大的转变。迄今为止，天文学家们已经在3711个行星系统中确认了4940颗系外行星，另有8709颗候选行星正在等待确认。由于有如此多的行星可供研究，以宇宙只有一个电子？单电子假设探究了反物质与时间反转的联系1940春天，物理学家约翰惠勒灵光一现，他给理查德费曼打了电话我知道为什么所有电子都具有相同的电荷和相同的质量了，因为它们都是同一个电子。惠勒描述的这种方法是单电子宇宙的想法宇宙只恒星相撞是什么样子？人类首次目睹，撞出巨大碎片云，场面震撼太空可能是一个充满暴力的地方。物体相互碰撞，造成破坏或形成更大的天体。科学家们充当天文侦探，并利用这些碰撞留下的证据来拼凑发生的事情并了解所涉及的物体。天文学家有机会观察到一个巨大张艳等为了保护浅层地下水，美国大陆许多被圈闭地层覆盖的深层含水层被用作油气勘探联产废水的地质储存库，此种实践的前提假设是被泥岩或页岩覆盖的深层含水层中注入的流体不会向上迁移污染浅层地下水斯蒂芬森能容纳1亿亿个地球，若地球这样大，我们还可以来往吗？如果将地球与太阳系内的其它行星做对比，我们会发现它其实并不大。那么如果用它与恒星对比呢？很显然，这无异于是在拿一颗玻璃弹珠和太阳做对比，问哪一个更大一些。科技越发达，人类觉得地球越冬越来越深，太阳升起的方向也会变吗？丨Calling太空编者按浩瀚的空天还有许多未知的奥秘有待探索，为此，中科院之声与中国科学院国家空间科学中心联合开设Calling太空科普专栏，为大家讲述有趣的故事，介绍一些与空间科学和航天相关的知识新的测量结果和新技术正帮助物理学家改进万物理论图片来源Wikipedia如果你询问像我这样的物理学家世界是如何运作的，省事的回答是它遵循标准模型。标准模型（theStandardModel）解释了基本物理学中宇宙运作的规律。尽为什么要回收太空垃圾？在太空中，漂浮着许多废弃的航天器及其零部件，我们把它们称为太空垃圾。太空垃圾中，大多数都是金属物品，它们可不是普通的废铜烂铁，而是十分宝贵的黄金钛和钨等，具有很高的回收价值。还有一中国技术迎来巨大突破，科学家把光变成了刀，切割雕刻液体图为激光在成为制造强国之后，中国科技业迎来了巨大突破，如今国内科学家甚至把光变成了刀，用来切割液体，难道中国已经实现了外星科技，可以研制出激光剑吗？对于这项技术成就，直接引来了国内日本成功登陆52亿公里外的小行星，这一技术，比登月难度大吗？日本登上小行星了？这恐怕是很多人都不知道的事情，因为在大家的印象里，太空事业之前一直被美苏把持着。苏联解体之后，美国航天一直一枝独秀，它是唯一集齐八大行星照片的国家，甚至连被除名的