CVPR一次中66篇，大装置一天训练完GPT3，商汤准备迎战未来

　　机器之心原创
　　作者：张倩
　　商汤的「既要…… 又要…… 还要……」
　　6 月 19 日，CVPR 2021 在线上拉开帷幕。作为计算机视觉三大顶会之一，本届 CVPR 大会一共接收了 7039 篇有效投稿，最终有1366 篇被接收为poster，295篇被接收为oral，接收率大概为 23.6%。
　　在前段时间公布的最佳论文候选名单中，我们发现，华人一作论文占据了半壁江山（16/32）。当然，这一现象并非偶然。其实，早在九年前，华人学者就已经凭借其创新精神在国际 CV 顶会上大放异彩，比如香港中文大学的汤晓鸥团队：2012 年 CVPR 大会仅有的两篇深度学习文章均出自其实验室。2011—2013 年间，该实验室又在 ICCV 和 CVPR 上发表了 14 篇深度学习论文，占据全世界在这两个会议上深度学习论文总数（29 篇）的近一半。
　　2014 年，汤晓鸥等人创办了商汤科技，这种创新精神也被刻入商汤的基因并延续至今。
　　在今年的 CVPR 大会上，商汤共有 66 篇论文被接收，远高于业界平均水平。此外，在同期举办的挑战赛中，商汤 - 南洋理工联合实验室（S-Lab）团队一举斩获 CVPR 2021 NTIRE 视频理解挑战赛三项冠军，包括视频超分辨率、重度压缩视频质量增强（固定量化参数，保真度）和重度压缩视频质量增强（固定比特率，保真度）赛道。商汤研究院团队则摘得 CVPR 2021 ActivityNet 时序动作检测任务弱监督学习赛道冠军。
　　AI 领域发展到今天，如何保持创新活力、加快产业落地是所有企业面临的共同问题。在这一点上，商汤的态度是明确的「既要…… 又要…… 还要……」，即既要保持技术创新的领先，又要加快产业落地，同时还要建设面向整个生态、整个社区的 AI 基础设施，推动 AI 进入工业化发展阶段。
　　从今年的 CVPR 和商汤最近的一些动向中，我们可以看出这家公司为实现上述愿景所做的努力。在这篇文章中，我们就来聊聊这一话题。
　　技术创新不能落下
　　对于商汤今年在 CVPR 中取得的成绩，该公司联合创始人、香港中文大学 - 商汤科技联合实验室主任林达华评价说，「对商汤来说，AI 的研究和创新是刻在基因里的。从公司建立的第一天开始，甚至在建立之前，我们的创始团队就一直把 AI 的基础研究作为持续追求的理想。所以，尽管商汤的整个发展经历了很多阶段，我们也把 AI 落地到了越来越多的产业中去，但我们始终没有忘记，整个 AI 产业发展的最初原动力来自于技术的突破和创新。」
　　商汤的这种理念在历年 AI 顶会中得到了很好的体现，今年的 CVPR 也不例外。从研究方向来看，该公司今年入选的论文分布在多个领域，包括长尾目标检测、轨迹预测、3D 点云补全、3D 场景重建、激光雷达 3D 目标检测等，其中的 3D 点云补全、3D 场景重建等相关论文还被收录为 Oral 论文。
　　3D 点云是 3D 场景和目标的一种直观表示。然而，由于遮挡等问题的存在，扫描得到的 3D 点云通常是不完整的。因此，利用不完整的点云预测目标的完整 3D 形状成为一个重要问题。但是，现有的点云补全方法倾向于生成全局形状骨架，缺乏局部细节。而且，它们大多会学习一个确定性的部分到整体的映射，忽视人造物体中的结构关系。
　　商汤的研究者认为，点云补全应从残缺点云中学习关系性结构属性来恢复可信且高质量的完整点云形状。为了实现这一点，他们在论文中提出了一个两阶段的网络：首先对残缺点云做概率重建以恢复一个粗略的完整点云，再结合残缺点云做关系性结构增强达到高质量的补全。实验显示，该方法显著提高了生成的完整点云质量。这份研究可以结合很多单目深度感知传感器（如激光雷达或深度相机）完成对未知形状部分的恢复和预估。预估出的完整形状可以有效辅助很多下游任务，如 3D 形状分类、姿态检测、避障和交互。
　　论文链接：https://arxiv.org/pdf/2104.10154.pdf
　　3D 场景重建是 3D 计算机视觉的一个核心任务。例如在增强现实（AR）应用中，为了在 AR 效果和周围的物理环境之间形成自然、沉浸式的互动，3D 重建需要非常精确、连贯，还要保持实时性。虽然使用 SOTA 视觉惯性 SLAM 系统可以精确跟踪摄像机运动，但由于重建质量低、计算要求高，基于图像的实时密集重建仍然是一个具有挑战性的问题。
　　在一篇CVPR最佳论文候选论文中，商汤的研究者提出了一种新的基于神经网络的单目实时场景 3D 重建系统——NeuralRecon。不同于以往基于深度图估计与融合的方法，NeuralRecon 直接基于图像特征预测用 TSDF 表示的局部 3D 表面，并创新地提出了一个联合 TSDF 重建与融合的框架。实验结果表明，该方法在准确率和速度方面都优于 SOTA 方法。
　　论文链接：https://arxiv.org/pdf/2104.00681.pdf
　　NeuralRecon的预训练模型在办公区域场景实时重建的结果
　　在被 CVPR 接收的众多论文中，我们发现，很多研究其实都是由应用场景驱动的，比如 3D 点云补全可能用于自动驾驶、机器人，3D 场景重建可以用于增强现实（AR）等。这也解释了商汤能够长期保持创新活力的重要原因。
　　林达华在采访中表示，商汤拥有一个业务跟学术连接的环境，是产生新的学术问题的肥沃土壤，「这些问题带给商汤很多激动人心的研究机会，牵引着我们的技术创新。」
　　产业落地步伐加快
　　积累了那么多技术，终究是要拿出来用的。在前段时间举办的上海国际汽车工业展览会上，商汤将多年积累的 AI 技术打包，一股脑地呈现在了多款智能汽车上。
　　这个打成的「包」就是 Sense Auto 智能汽车解决方案，包括 SenseAuto Pilot 智能驾驶和 SenseAuto Cabin 智能车舱。
　　在 SenseAuto Pilot 智能驾驶方案中，最引人关注的 SenseAuto Pilot-P 驾驶领航方案可实现高速公路场景下的车道跟随、超车自动变道、导航自动变道、自动上下匝道、匝道通行等多种 L2 + 级高级辅助驾驶功能；已装在多个量产车型中的 SenseAuto Pilot-V 前视视觉感知方案可以提供 200m 前向有效探测，支持自动紧急制动、车道保持辅助、双预警功能，还能有效应对近距离行人 / 非机动车横穿等复杂场景。此外，车道分离 / 汇合点、路面标识、交通灯形状、施工区域锥形筒等长尾场景元素的感知也在这套系统的能力范围之内。
　　整套系统背后涉及的技术包括激光雷达高精 3D 感知、点云噪声识别、轨迹预测、长尾目标检测等，这些都出现在了今年的 CVPR 接收论文中。商汤表示，该系统能够在最大程度上发挥摄像头、毫米波雷达、激光雷达等传感器的感知优势，显著提升 3D 目标的检测和跟踪性能，提供智能的道路动态目标轨迹预测，支撑系统安全可靠地拓展至城市工况场景。
　　SenseAuto Pilot-P 驾驶领航方案可以精准识别道路分离、合并点，帮助车辆在匝道内进行合理决策，实现自动上下匝道的 L2 + 级高级辅助驾驶功能
　　SenseAuto Cabin 智能车舱解决方案同样令人眼前一亮，涵盖 SenseAuto Cabin-D 驾驶员感知系统、SenseAuto Cabin-O 座舱感知系统 、SenseAuto Cabin-K 智能进入、SenseAuto Cabin-V 座舱域视觉控制器等模块。这些功能可以为驾驶员提供无接触的车舱交互，减少点触操作频率；对疲劳、分心以及接打手机等危险行为进行提醒；还能自动感知是否有儿童被独自遗留在车内等。这背后离不开成熟的目标检测、跟踪、识别等视觉算法。
　　目前，商汤在智能车舱领域已经和全球超过 30 家头部企业展开合作，定点量产项目数超过 30 个，覆盖车辆总数超过 1300 万辆。
　　搭载了商汤 SenseAuto Cabin 智能车舱解决方案的 WEY 全新旗舰车型摩卡首次亮相上海车展。
　　从智能驾驶到智能车舱，可以看到商汤落地的步伐正在加快。这不仅得益于其与生俱来的创新能力，也离不开丰富的算力资源和算法、数据等方面的积累。这些成果共同构成了商汤正在建设的AI基础设施——SenseCore商汤AI大装置。林达华透露，这个 AI 大装置不仅帮助商汤缩短了创新验证的周期，还将成为未来十年重要的 AI 基础设施，逐渐提供开放服务，演变成一个面向整个生态、整个社区的具有公共性质的设施。
　　AI 大装置蓄势待发
　　在上海临港新片区，一座宛如芯片的建筑群将在今年年底投入使用。这是商汤正在建设的人工智能计算中心（Artificial Intelligence Data Center，AIDC），全部建成后 AI 计算峰值速度将达到 3740 Petaflops（1 petaflop 等于每秒 1 千万亿次浮点运算），可以在一天之内把人类石器时代到现在所有时间录成的视频计算完成，也能在一天之内完整训练 OpenAI 的千亿参数模型 GPT-3。
　　但是，AIDC 仅仅是商汤 AI 大装置的一部分，而远非全部。从结构上看，整个大装置共分为三层： 一是算力层。该层以 AIDC 为基础，兼容 AI 芯片和 AI 传感器的强大能力。 二是平台层。这一层融合了商汤的数据平台、高性能计算引擎、深度学习训练框架（SenseParrots）以及模型生产平台等，打造了创新的人工智能通用算法开发平台，实现从数据存储、标注到模型训练、生产、部署、测试的全链路、批量化过程。 三是算法层。这一层包含各种算法工具箱，不仅有城市交通、园区等高频应用场景算法，还有火灾、垃圾检测等长尾低频的算法。截止目前，商汤已经推出 13000 多个技术模型，以及 17000 多个商业模型。同时他们也推出了 OpenMMLab 开源算法体系，该体系已在 Github 上获得 3 万多颗星。
　　建设这么一个 AI 大装置需要投入大量的精力（AIDC 总投资高达 56 亿元），但在商汤看来，这是面向未来必须迈出的一步。
　　「在经历了几年的产业化之后，AI 已经到了一个全新的阶段，可以说一些简单的问题已经基本上被解决了。下一步就是要深入到更广泛的行业里面，需要新一轮的突破和创新。」林达华说道。
　　GPT-3 等超大模型的出现让商汤看到了实现下一个突破的希望：「以前我们都是针对一些具体的问题或者高度定制化的场景去生产一些中小模型。但随着 AI 落地推演到越来越广的领域，成千上万的具体问题（长尾问题）开始涌现。如果每个问题都有很多的研究人员投入进去，那么我们就很难深化 AI 的进一步落地。这个时候，整个行业需要通用性更强的模型，用一个模型支撑更多的任务。一方面，这种模型能够让 AI 的研发、落地效率得到一个质的提升；另一方面，它们能够更好地去回应综合场景的问题，比如智慧城市、智慧医疗等。这些任务都需要通过多个任务综合解决。」
　　但是，模型的通用性越强，需要的数据、算力往往也越多，这便是商汤建设 AI 大装置的底层逻辑。
　　当然，AI 大装置也不是一朝一夕就建成的。其实早在 2018 年 4 月，商汤就已经开始布局人工智能计算原型机研制项目，虽然当时并不被看好。但好在，后续出现的一些大模型已经显示出了解决长尾问题的巨大潜力。
　　如今，这个 AI 大装置已经开始发挥它的作用。林达华透露说，「我们几乎所有的研究工作都是在这个大装置的基础上进行的。」「它为做算法研究的同学提供了充足的算力，使他们能够快速地进行实验试错。」此外，大装置中所积累的实用工具也缩短了创新的验证周期。
　　借助大装置，商汤已经在超大模型技术研究方面取得一定成绩。例如在计算机视觉的卷积神经网络（CNN）领域，通常模型参数都在 1 亿以下，但商汤的 AI 框架 SenseParrots 能支持 50 亿参数超大视觉模型的训练。AIDC 完全投入使用后，计划支持的超大视觉模型训练参数可达更高的数量级。
　　由于可以显著降低 AI 落地的门槛，商汤的 AI 大装置对于推动整个人工智能行业的发展也有着重要的战略意义。林达华表示，「从整个社会的角度来说，AI 基础设施将逐渐从一个企业内部的平台，发展为逐渐提供开放服务，并最终演变成一个面向整个生态、整个社区的具有公共性质的设施。这些设施的构建能够有效地支撑整个生态，最终使得整个 AI 人才的基础变得更加宽广，从而进一步推动 AI 产业的深化。」

来自另一世界的航班延误NASA宣布推迟机智号第19次飞行航班延误是地球上生活的一个事实。事实证明，它们在火星上也存在。NASA于当地时间周三表示，另一个世界的恶劣天气导致的首次航班延误影响了火星直升机机智号（Ingenuity）的活动日地核冷却速度超预期，地球会成为荒凉之地吗？本周，研究人员在发表在地球杂志上的论文中表示，地核的冷却速度比以往所认为的要快，这将不可避免地加速地球变得不宜居住。事实上，从地球诞生之日起，地球内部便开始逐渐降温。当然，这对地球地球不但在变小，还在变冷！新研究称地球内部在冷却，要变火星吗地球在变小，这是美国宇航局（NASA）兰利研究中心的地球物理学专家纪尧姆格罗诺夫于今年1月初的研究结论，这位专门研究大气逃逸问题的高级研究员。在1月2日于美国趣味科学网上发表了一篇833公里！我国光纤量子密钥分发距离创世界纪录中安在线中安新闻客户端讯记者1月19日从中国科大获悉，中国科学技术大学郭光灿院士团队韩正甫教授及其合作者王双银振强何德勇陈巍等，近期实现833公里光纤量子密钥分发，将安全传输距离世地球氧气进化史，生产过程耗费40亿年时间，10亿年后有变数人类能活到现在，氧气是最大的功臣。没有氧气，或许不会有人类的出现，而无氧生物或将代替成为新的主流。今天，大约21的地球大气是由氧气组成的，但是你知道这21的氧气地球是怎么生产出来的一年只有16小时？这颗行星刷新了最短新年纪录出品科普中国制作赵斐范舟（中科院国家天文台）监制中国科学院计算机网络信息中心Dothereexistmanyworlds，oristherebutasingleworld？This美国将部署新型卫星，将提高生存能力，能探测解决高超声速飞行器美国太空开发局局长说，太空开发局将部署卫星，这些卫星将提供监视能力，在飞行过程中探测机动的高超声速滑翔器，这些卫星将是成本负担得起的，也是多产的，以提供足够多的冗余。今天，太空开发超越光速的可能性抛出一个问题当一个人拿着手电筒坐在车上的时候，手电筒发出的光的速度对于车上的人来说是光速，但对于车下静止的人或物来说是不是超光速呢？光速是指光波或电磁波在真空或介质中的传播速度。真我们对人类进化的未来是如何看待的到现在为止，我们对人类的的诞生有各种猜测，但都无法准确的确认人的起源是来自哪里，达尔文的进化论，人是有几千万年前的古猿演变来的，也有说是地外生命带来的，但这都无法考究。我不想去考古NASA发现一颗小行星，估值高达50亿美元，将于2060年实施开采？地球茫茫宇宙中，只是一粒沙子，而人类自己，也许只是沙子上的细菌但放眼宇宙，比地球小的天体还比比皆是，比如月球，比如火星，再比如那些数量未知，经常给地球带来威胁的小行星们。据科学界统太平洋突现巨大蘑菇云，汤加火山威力惊人，相当于多少氢弹爆炸？据环球网报道，从2022年1月14日上午开始，太平洋岛国汤加的洪加汤加火山开始喷发，到了15日发生了一次最猛烈的喷发，当地人称场景如同世界末日。此次火山喷发引发了汤加的大海啸，目前

<<<<<<－>>>>>>

科学家警告！南极最大冰川或将在未来三年后完全崩塌来源北京日报据国外媒体报道，美国地球物理联合会年度会议上研究人员警告称，目前南极洲最大冰川思韦茨冰川正在逐渐融化，其加速融化趋势可能导致该冰架在未来三年后完全崩塌。位于南极洲西部的令人生畏的龙三角海域龙三角海域为何令人生長？是穿透海面的岩紫卷走了船只吗？日本龙三角海域是个变化无常神秘莫测的海域。千百年来，许多国家的船只都曾在这一片海域失事。近代以来，飞机船只在此地失踪的事件更是2022年，我们将见证以下7项太空大事件人类对太空的探索从未如此深入。2022年有望成为迄今为止最令天文领域从业者们振奋的一年。未来10个月内，我们将见证以下7项太空大事件。NASA首发太空发射系统SLS2022年最令人黄金是生活中非常昂贵的金属，那么怎么用金属探测仪探测黄金呢？黄金是日常生活中非常昂贵并且很稀有的金属，要是你不小心捡到一块手拇指大的也会兴奋的睡不着觉，其实生活中我们周围土壤里或者野外的土壤中都有可能藏有黄金的。那我们就得用到金属探测仪了，变暖速度远高于全球平均，极地为何火气大？近年来，不同科研团队对于北极放大效应提出诸多不同观点。例如北极云量和水汽增加导致更多长波辐射反射回海面或冰面中纬度通过波动和大气环流向北极输送更多热量和水汽海洋变暖向极地输送更多热哈勃太空望远镜迎来新里程碑已运行超10亿秒据CNET报道，当科学家们和太空迷们屏息等待詹姆斯韦伯太空望远镜的漫长部署过程时，这是一个思考长寿的哈勃太空望远镜的成就的好时机。哈勃刚刚迎来了其服役过程中的一个新里程碑。哈勃于1宇宙中三个极端的洞有什么不同？黑洞已现，白洞和虫洞在哪里？黑洞白洞虫洞都是宇宙中的特殊极端存在，它们的共同点为都是引力导致的极端结果，遵从爱因斯坦引力场方程（简称场方程），公式表述如下这个公式的推导过程很复杂，这里就不展开说了。虽然这三个宇航员返回地球后，为何都要坐轮椅不能站着吗？他们经历了什么？宇航员是非常伟大的，他们能带着人民的梦想，来到浩瀚无穷的宇宙当中，为我们探索宇宙的奥秘。她们是值得我们尊敬的人物，其实他们在外太空，执行这种探测活动，是非常危险的行为。面临着各种各已运行超过10亿秒！哈勃曾发现星际大战遗迹星系被打出巨洞随着科技的进步，我们人类的探索范围也越来越大，从深入大洋深处攀登地球高峰，再到走出地球看看宇宙深处的景象。不过受限于当前人类技术水平，人类的足迹最远也只能到达38万公里外的月球表面科学家发现最热恒星，太阳在它面前就跟冰窖一样在太阳系里面最大的天气就是太阳了，但是放眼整个宇宙，太阳也是非常的渺小。在太阳系内部太阳掌握了大部分的星球的温度。太阳表面的温度高达5500摄氏度，这样的温度已经非常高了，但是在宇研究发现三维半导体颗粒具有二维特性，有助于可再生能源技术发展二维半导体在创建下一代电子产品时有很大的优势，它们速度更快，功能更强，效率更高。但它们的制造难度也大得惊人。在这项研究中，研究人员聚焦于可以吸收光的半导体钒酸铋，然后利用这种能量氧