苹果M1更适合强化学习？比V100性能提升200价格低90，功耗减88

　　机器之心专栏
　　作者：南栖仙策
　　M1 芯片能否提升强化学习的训练效率？
　　2020 年底，苹果发布了 M1 芯片，提供了全新的自研 GPU，并和 CPU 集成封装成 SoC，加上随之而来的 ML Compute 框架，macOS 端的深度学习训练有了显著的速度提升。
　　另一方面，强化学习的特性使得训练过程中需要交替使用 CPU 和 GPU，对此，M1 芯片能否提升强化学习的训练效率？据了解，此前业界并无相关测试数据。
　　南栖仙策（南京大学人工智能创新研究院技术孵化企业）算法小组用 M1 芯片设备组建小型服务器集群，并与基于 NVIDIA GPU 的传统服务器进行性能对比测试，结果表明，强化学习的训练效率可以得到显著提升。
　　什么是强化学习
　　强化学习（Reinforcement Learning, RL），又称增强学习，是机器学习的范式和方法论之一。强化学习智能体（Agent）在与环境的交互过程中，通过更新策略以达成回报最大化或实现特定目标。
　　广为人知的人脸识别等技术背后的深度学习，通常需要开发者准备大量做好标注的图像作为训练数据。
　　强化学习与之不同，不需要训练数据，而是设置一个环境。类似于动物处在自然环境中，强化学习需要不断与环境交互，并从中学习。强化学习研究常用的环境是各种各样的游戏。
　　强化学习方法简单、有效且通用，在许多游戏环境中都取得了超越人类的决策水平，被 DeepMind 认为是实现通用人工智能的一种重要途径。
　　强化学习是怎么训练的
　　图 1 强化学习示意图
　　如图 1 所示，在强化学习中，智能体与环境的交互，即在状态 S_t 下，执行动作 A_t，获得对应的奖励 R_(t+1) 并观测到下一个时刻的状态 S_(t+1)。智能体的目的是改进策略（即在不同状态下执行的动作），来获得最大的长期回报。在这个过程中，强化学习智能体按照当前策略（通常用神经网络实现）需要将当前状态 S_t 输入到网络中，进行一次前向推理（inference）得到 A_t，使用 A_t 在环境中执行一步来完成交互。此时，智能体会收到对应的奖励和下一个时刻的状态，然后不断循环该过程，产生新的样本用于策略训练。样本指的是交互过程中的每一个转移（transition），即四元组。
　　通常来说，强化学习中环境执行动作的这一步由 CPU 完成，当策略网络仅输入一个样本时，可以使用 CPU（对于浅层的策略网络）或 GPU（对于深层的复杂策略网络）进行推理，而更新策略网络模型则在 GPU 上完成。常规强化学习任务（以 Atari 游戏为例）通常需要采集十数 M（ 1M 即一兆，为 10^6） 乃至数十 M 样本才能训练好一个策略，那么就需要数千万次，甚至数十亿次的交互。如果能减小时间开销，那将会给强化学习的训练速度带来前所未有的提升。
　　M1 芯片特殊之处
　　M1 架构
　　新的 M1 架构采用了台积电最新的 5nm 技术。M1 处理器中有 1 个 CPU, 1 个 GPU, 1 个神经引擎以及 DRAM 单元。由于 RAM 内置在处理器中，因此所有组件都会访问相同的内存。这意味着不会再因为将内存从一个组件移动到下一个组件而造成性能损失，无需再尝试弄清楚你的模型是否符合 GPU 的内存规格。
　　CPU
　　M1 芯片的 CPU 是 8 核 CPU，其中 4 核是用于数据处理和一些需要高性能任务的高性能内核，另外 4 核被称为「e 核」或高效内核，提供更高的处理效率和更低功耗的任务。
　　简单来说，M1 芯片不仅靠 5nm 制程使处理性能更加强大，而且里面新增的 NPU 也使 M1 更加聪明。该 NPU 采用 16 核架构，每秒进行 11 万亿次运算。M1 芯片使用共享内存，CPU 与 GPU 通信开销小，使用 Thunderbolt ，通信速度最高可达 40Gb/s，突破了限制瓶颈，可使用多台机器组建小型服务器。
　　南栖仙策使用四台 M1 的 Mac mini 组建了小型集群
　　Apple M1 集群性能测试
　　测试设置
　　M1 (单机) ：使用 M1 Mac mini 单机训练；
　　M1 集群 (4 机)：4 台 M1 Mac mini 组成集群进行训练；
　　GPU 服务器 (单机 V100×1)：使用 NVIDIA V100 单 GPU 训练，选择第一张卡；
　　GPU 服务器 (单机 V100×4)：单机使用四块 NVIDIA V100 进行分布式训练；
　　CPU 服务器: 使用 V100 服务器的 CPU 进行训练。
　　环境：Pendulum、MountainCarCont、HalfCheetah
　　算法：PPO, 共采集 100 次数据进行 PPO 训练，每次训练前与环境交互采集 10K step 的轨迹放入 Buffer 进行训练。SAC, 训练 100 个 Epoch，每个 Epoch 与环境交互收集 1k step 放入 Buffer。
　　测试结果
　　由于目前 Tensorflow 2.4 的 Eager 模式不能调用 M1 芯片进行训练，下面的结果是在 Mac mini 的 CPU 设备上测试获得的。
　　测试一：单进程采样对比
　　测试二：4 进程采样对比
　　测试三：16 进程采样对比
　　测试四：32 进程采样对比
　　功耗及价格对比
　　注：单个 Mac mini 功耗 39w，4 台总计 156w(瓦)，传统服务器约为 1300w(瓦)。
　　注：单个 Mac mini 价格 6799 元 (512GB 官网价格），4 个总计 2.7 万元，传统服务器约为 30 万元。
　　M1 的共享内存架构适合于 RL 的训练方式，目前，使用 Apple 的 M1 芯片组建的小型服务器，以 NVIDIA GPU 服务器 10% 的价格和更低的功耗，取得超过 200% 的时间效率提升。在强化学习目前主流训练框架下，训练效率的瓶颈往往在于策略网络的通信速度不够快，而共享内存方案可以减小通信上的开销，为 RL 训练带来巨大的效率提升。

文化生命的永恒论语子张绎义子张篇是论语的第19篇，共计25章。主要的内容为集中记载了孔子的一些主要弟子子张子夏子游曾子子贡等人的言辞。这显然为孔子去世之后，他的及门弟子弘扬老师学说维护老师地位传承儒学传统的史记最重要也最特殊的价值，在于它是百王大法史记不仅在史学上的地位无可撼动，文学成就也是登峰造极，达到里程碑的高度。作为史家之绝唱，史记绝对是史书空前绝后无法逾越的最高峰！无论从史实，从文学，从笔法，从立意，从思想，从系统上被誉中国油画风景第一人白羽平1980年至今350幅作品（一）白羽平，1960年生于山西，满族。1988年毕业于中央民族学院美术系，中国美术家协会会员。1997年毕业于中央美术学院首届高级研修班。现为北京画院专职画家，国家一级美术师，北京画院西方传媒誉为亚洲第一人中国授予世纪之光涂志伟作品集他是美国历史上首位华裔油画家协会主席（20042006）美国油画家协会大师美国印象派协会大师美国油画家协会终身成就奖美国油画家协会大师评委会主任中国授予世纪之光中华新世纪优秀人才走被誉中国油画风景第一人白羽平1980年至今350幅作品（二）白羽平，1960年生于山西，满族。1988年毕业于中央民族学院美术系，中国美术家协会会员。1997年毕业于中央美术学院首届高级研修班。现为北京画院专职画家，国家一级美术师，北京画院中国首次举办委拉斯凯兹绘画ampampamp雕塑大赛决赛入围作品从塞维利亚到中国委拉斯凯兹绘画雕塑大赛由西班牙塞维利亚市政厅经典汇CLATIA全球艺术网主办盛鑫煜艺术承办。据大赛组委会统计，大赛报名人数为883人报名作品总数达到1559幅件，最被誉中国油画风景第一人白羽平1980年至今350幅作品（三）白羽平，1960年生于山西，满族。1988年毕业于中央民族学院美术系，中国美术家协会会员。1997年毕业于中央美术学院首届高级研修班。现为北京画院专职画家，国家一级美术师，北京画院又到全国画院美术作品pk时，回顾五六届胜出的多类作品全国画院美术作品展览是展示画院系统创作研究成果的重要展览，它的前身是全国画院双年展，画院体制是中国文化的优秀传统，是发展当代中国美术事业的一支重要力量，连续几届展出览旨在加强全国画被列宾认为俄罗斯最天才的画家尼古拉费欣油画经典作品140幅NicolaiIvanovichFechin尼古拉伊万诺维奇费欣，俄裔美籍画家，（18791955）。列宾的学生，作品别具一格，代表作有秋天卡努里雅肖像父亲像等。他的画色彩明快明暗这本古书，任何人可以读，也有很多人喜欢读，但又没人能够全懂读过鬼谷子这本书的人都知道，虽然里面并没有太过深奥的文字，每句话看似简单，但是其中却蕴含很多阴阳相关的道理，并不易懂。这本书从语言学的角度来看，是一本关于言谈技巧的学术理论的书籍，上海最早的现代出版社墨海书馆墨海书馆是1843年英国伦敦会传教士麦都思美魏茶慕维廉艾约瑟等在上海创建的书馆，书馆坐落在在江海北关附近的麦家圈（今天福州路和广东路之间的山东中路西侧）的伦敦会总部。上海研究资料中

<<<<<<－>>>>>>

万里穿针技术再现太空交会对接后的空间站组合体效果图航天五院供图2021年5月30日5时01分，天舟二号货运飞船与天和核心舱完成自主快速交会对接，全程历时约8小时，万里穿针技术再现太空。空间交会对接是载一种神奇粒子比氢弹威力厉害真空不是空的。如果我们能够以某种方式从太空中移除所有的物质辐射和引力波，我们仍然会在太空中发现一小部分永远不会被移除的自然能量，而这些能量就是反物质！到目前为止，物理学的前沿延伸出一起去看晨曦中最亮的星，约吗？来源新华视点继2021年12月4日以长庚姿态现身的金星迎来全年最亮之后，2022年2月13日以启明姿态现身的金星将再次迎来全年最亮，届时如果天气晴好，有兴趣的公众可早起面向东南方天中国空间站将在今年建成2月9日下午，记者从中国航天科技活动蓝皮书（2021年）（以下称蓝皮书）发布会上获悉，今年，我国航天发射次数将继续维持高位，完成空间站建造长征六号甲运载火箭以及多型商业运载火箭首飞遇地磁暴星链损失多达40颗卫星新华社北京2月10日电美国太空探索技术公司表示，由于遭遇地磁暴，该公司本月3日发射的49颗星链卫星中有多达40颗于次日损毁。据信这是单次地磁暴对卫星造成的最大规模破坏。图为2018一颗类太阳恒星爆发出巨大耀斑对周围行星上生命造成毁灭性打击在寻找可能适合居住的太阳系外行星时，科学家们主要关注的是恒星活动。像我们自己的G型（G2V）黄矮星，被认为是长期稳定的，而其他类别的恒星则是可变的，容易发生爆炸，特别是M型红矮星。复旦大学马余刚院士发表首次实验观测复旦大学马余刚院士团队在激光核物理领域获得重要进展。2022年1月31日，一项飞秒强激光核物理领域的研究成果，以飞秒泵浦时抖动电子与离子库伦碰撞所产生的同质异能态（Femtosec从汤加富士火山到太阳系火山，6000字全网最详解太阳系火山从汤加富士火山到太阳系火山，6000字全网最详解太阳系火山。目前太阳系有喷火能力的星球，可能只有地球木卫一（IO）和金星。有证据显示火星的火山并没有停歇，还保持活跃。有冰火山的星球重大突破！人造太阳新世界纪录科技日报实习记者张佳欣据欧洲核聚变研发创新联盟（EUROfusion）英国原子能管理局（UKAEA）和国际热核聚变实验堆（ITER）9日联合召开新闻发布会称，欧洲科学家在通过聚变等地理复习地球大陆最深点在哪里地球一直以来是一个神奇的存在，它是一个深蓝色的美丽球体，大家都深爱且守护着它，同时也在不断探索着，那么地球大陆最深点在哪里，有多深呢，以下是小编整理的相关内容，供您参考与阅读。1地小小的蚂蚁竟和恐龙是一个年代世界上至少有1。5万种蚂蚁。除了南极洲，蚂蚁几乎遍布所有的大陆。所有蚂蚁的重量差不多相当于全球人口的总体重。有人戏称，假使外星人来到地球，他们一定认为蚂蚁才是地球的主宰。当然，在地