范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

ICRA2022杰出论文把自动驾驶2D图像转成鸟瞰图,准确率立增15

  机器之心报道
  编辑:蛋酱
  来自萨里大学的研究者引入了注意力机制,将自动驾驶的 2D 图像转换为鸟瞰图,使得模型的识别准确率提升了 15%,并斩获了 ICRA 2022 的杰出论文奖。
  对于自动驾驶中的许多任务来说,从自上而下、地图或鸟瞰 (BEV) 几个角度去看会更容易完成。由于许多自动驾驶主题被限制在地平面,所以俯视图是一种更实用的低维表征,对于导航也更加理想,能够捕获相关障碍和危险。对于像自主驾驶这样的场景,语义分割的 BEV 地图必须作为瞬时估计生成,以处理自由移动的对象和只访问一次的场景。
  要想从图像推断 BEV 地图,就需要确定图像元素与它们在环境中的位置之间的对应关系。此前的一些研究以稠密深度图和图像分割地图指导这种转换过程,还有研究延展了隐式解析深度和语义的方法。一些研究则利用了相机的几何先验,但并没有明确地学习图像元素和 BEV 平面之间的相互作用。
  在近期一篇论文中,来自萨里大学的研究者引入了注意力机制,将自动驾驶的 2D 图像转换为鸟瞰图,使得模型的识别准确率提升了 15%。这项研究在不久前落幕的 ICRA 2022 会议上获得了杰出论文奖。
  论文链接:https://arxiv.org/pdf/2110.00966.pdf
  与以往的方法不同,这项研究将 BEV 的转换视为一个「Image-to-World」的转换问题,其目标是学习图像中的垂直扫描线(vertical scan lines)和 BEV 中的极射线(polar ray)之间的对齐。因此,这种射影几何对网络来说是隐式的。
  在对齐模型上,研究者采用了 Transformer 这种基于注意力的序列预测结构。利用其注意力机制,研究者明确地建模了图像中垂直扫描线与其极性 BEV 投影之间的成对相互作用。Transformer 非常适合图像到 BEV 的转换问题,因为它们可以推理出物体、深度和场景照明之间的相互依赖关系,以实现全局一致的表征。
  研究者将基于 Transformer 的对齐模型嵌入到一个端到端学习公式中,该公式以单目图像及其固有矩阵为输入,然后预测静态和动态类的语义 BEV 映射。
  本文构建了一个体系结构,有助于从对齐模型周围的单目图像预测语义 BEV 映射。如下图 1 所示,它包含三个主要组成部分:一个标准的 CNN 骨干,用于提取图像平面上的空间特征;编码器 - 解码器 Transformer 将图像平面上的特征转换为 BEV;最后一个分割网络将 BEV 特征解码为语义地图。
  具体而言,这项研究的主要贡献在于: (1)用一组 1D 序列 - 序列的转换从一幅图像中生成一个 BEV 图; (2)构建了一个受限制的数据高效的 Transformer 网络,具备空间感知能力; (3)公式和语言领域单调注意力的结合表明,对于精确的映射来说,知道图像中一个点下面是什么比知道它上面是什么更重要,尽管两者都使用会导致最佳性能; (4)展示了轴向注意力如何通过提供时间意识来提高性能,并在三个大规模数据集上展示了最新的结果。
  实验结果
  在实验中,研究者做了几项评估:将图像到 BEV 的转换作为 nuScenes 数据集上的转换问题评估其效用;在单调注意力中消融回溯方向,评估长序列水平上下文的效用和极位置信息(polar positional information)的影响。最后,将该方法与 nuScenes 、Argoverse 和 Lyft 数据集的 SOTA 方法进行比较。
  消融实验
  如下表 2 的第一部分所示,研究者比较了软注意力 (looking both ways)、图像底部回溯(looking down) 的单调注意力、图像顶部回溯 (looking up) 的单调注意力。结果表明,从图像中的一个点向下看比向上看要好。
  沿着局部的纹理线索——这与人类在城市环境中试图确定物体距离的方法是一致的,我们会利用物体与地平面相交的位置。结果还表明,两个方向的观察都进一步提高了精度,使深度推理更具有识别力。
  长序列水平上下文的效用。此处的图像 - BEV 转换是作为一组 1D 序列 - 序列转换进行的,因此一个问题是,当整个图像被转换成 BEV 时会发生什么。考虑到生成注意力地图所需的二次计算时间和记忆力,这种方法的成本高得令人望而却步。然而,可以通过在图像平面特征上应用水平轴向注意力,取得近似使用整个图像的上下文效益。借助通过图像行的轴向注意力,垂直扫描线中的像素现在具备了长距离的水平上下文,之后像以前一样,通过在 1D 序列之间转换来提供长距离的垂直上下文。
  如表 2 中间部分所示,合并长序列水平上下文并不会使模型受益,甚至略有不利影响。这说明了两点:首先,每个转换后的射线并不需要输入图像整个宽度的信息,或者更确切地说,比起已经通过前端卷积聚合的上下文,长序列上下文并没有提供任何额外的好处。这表明,使用整个图像执行转换,不会让模型精度提高以至超过 baseline 约束公式;此外,引入水平轴向注意力导致的性能下降意味着使用注意力训练图像宽度的序列的困难,可以看出,使用整个图像作为输入序列的话,会更难训练。
  Polar-agnostic vs polar-adaptive Transformers:表 2 最后一部分比较了 Po-Ag 与 Po-Ad 的变体。一个 Po-Ag 模型没有极化位置信息,图像平面的 Po-Ad 包括添加到 Transformer 编码器中的 polar encodings,而对于 BEV 平面,这些信息会加入到解码器中。在任何一个平面上添加 polar encodings 都比在不可知模型上添加更有益处,其中动态类的增加最多。将它添加到两个平面会进一步强化这一点,但对静态类的影响最大。
  和 SOTA 方法的对比
  研究者将本文方法与一些 SOTA 方法进行了比较。如下表 1 所示,空间模型的表现优于目前压缩的 SOTA 方法 STA-S ,平均相对改善 15% 。在更小的动态类上,改善更加显著,公共汽车、卡车、拖车和障碍物的检测准确度都增加了相对 35-45% 。
  下图 2 中得到的定性结果也支持了这一结论,本文模型显示出更大的结构相似性和更好的形状感。这种差异可以部分归因于用于压缩的全连接层(FCL) : 当检测小而遥远的物体时,图像的大部分是冗余的上下文。
  此外,行人等物体往往部分被车辆挡住。在这种情况下,全连接层将倾向于忽略行人,而是保持车辆的语义。在这里,注意力方法展示出了它的优势,因为每个径向深度都可以独立地注意到图像ーー如此,更深的深度可以使行人的身体可见,而此前的深度只可以注意到车辆。
  下表 3 中 Argoverse 数据集上的结果展示了类似的模式,其中本文方法对比 PON [8]提高了 30% 。
  如下表 4 所示,本文方法在 nuScenes 和 Lyft 上的表现优于 LSS [9]和 FIERY [20]。在 Lyft 上进行真正的对比是不可能的,因为它没有规范的 train/val 分割,而且无法获得 LSS 所使用的分割。
  更多研究细节,可参考原论文。

春日补钙正当季,科学进补要牢记!开学已有一段时间,同学们陆续适应了新的校园生活,脑力和体力消耗加大,日常营养进补成为重要补充。所谓一年之计在于春,春季新学期恰好也是学龄儿童的成长黄金期,你给孩子准备好营养均衡的食葱油饼西施的逆袭人生来源上游新闻重庆晨报华灯初上,霓虹璀璨,夜幕之下的重庆各大夜市人流如织,重新迎来了往日的烟火气。在重庆市渝北区民心佳园的夜市上,空气中是各色美食香味的融合,市民穿梭其中品尝美食购物邀您尽享海鲜盛宴丨千里海岸线最美威海鲜品鲜季来到泰安记者苗润鹏千里海岸线最美威海鲜品鲜季泰安站将于本周六(2月25日)在泰安市高新区五矿万境水岸家家悦超市正式启幕,将细腻鲜美的威海海鲜送到泰安百姓的家门口,尽情享受威海海鲜的迷人魅力能够善守,赖斯会离开铁锤帮吗?虽然是在切尔西青年队出道的,但是赖斯大部分的时间是呆在西汉姆联的。从西汉姆联的梯队一步步来到了成年队。也是从西汉姆联不断地提升自己,获得了索斯盖特的信任,成为了英格兰国家队的主力中足坛反腐突破性进展!体总巡视组将进驻足协,彻查17亿调节费去向最近一段时间以来,中国足球不断抢占头条,成为了无数人关注的对象,只不过他们抢头条的方式,却不怎么光彩。由于涉嫌严重违纪违法,以主席陈戌源为首的多位中国足协高官遭到了调查,中国足坛的为什么范佩西比梅西强梅西和范佩西都是世界足坛的传奇球星,他们拥有惊人的技术,极具破坏力的进攻能力和超强的运动能力,梅西的技巧和范佩西的速度,让他们拥有比其他球员更高的身体素质,他们在足球场上都表现出非王宝强还差一步就再婚,新娘是冯清,板上钉钉因天下无贼傻根形象出名的王宝强,在很长一段时间是草根励志成功的榜样,在剧中傻根代表着朴实真诚善良,我们把他放在宝强身上毫无违和感。2016年8月13日夜晚到8月14日凌晨,是王宝强名声毁了,事业无了,这就是恋爱脑的下场?前两天废姐在首页刷到马浚伟,发现他旁边竟然是好久不见的郭羡妮可能是孩子大了,从前一心相夫教子的郭羡妮这两年又重回台前,新戏就是和马浚伟合作。说起来,在2020年之前,郭羡妮已经有差花开满城!春天里的岳阳,原来这么美天气回暖南湖边珍珠山公园岳阳楼景区旁梅花樱花连片盛开处处呈现粉紫色的海洋吸引众多市民纷纷前来赏花打卡近年来,岳阳市高度重视生态环境保护工作,扛牢守护好一江碧水政治责任,深入践行绿水如果火箭选中文班亚马,那么哈登是否会回归?全明星周末和交易截止日都已经过去了,联盟也开始分化,前面的队伍,开始着力准备季后赛争夺总冠军,后面的队伍则开始竞相摆烂,争取更好的选秀顺位。其中也只有我大湖人,上又上不去,下又不能石智勇十度打破世界纪录,奥运现场向女友表白,夺冠娶你回家2021奥运会举重比赛,石智勇在绝对领先的情况下,遭到裁判组两盏红灯,被判定犯规。明眼人都能看得出来石智勇的动作绝对没有问题,不可能存在犯规。国家队教练组当然不服气,上前理论,但这
不想上班又想拿钱?欧文你学着点!看看人家西蒙斯现在NBA有两位出了名的打工皇帝,他们不想上班,又想拿钱。一个是西蒙斯,另一个就是欧文。但是今天西蒙斯先回到了工作岗位一心跳槽无心工作的西蒙斯打工人西蒙斯跟他老板76队的关系已经恶新赛季CBA首轮比赛,球员们都上脚了哪些球鞋?盘点一下在篮球场上,球鞋永远都是一道亮丽的风景线,其彰显的不仅仅是球员的个性,体现的还是球鞋品牌所采用的最新科技,在场上有着非常重的戏份。恰逢2122赛季CBA开打,我们来盘点一下在新赛季新高!11人完成提前续约超11亿美元合同2018届新秀的提前续约日已截止,目前有11人和球队完成续约,总计拿到11。44亿美元的合同。连5年2。07亿卢卡东契奇卢卡(LukaDoni),1999年2月28日出生于斯洛文尼湖人再增两人,其中包括勇士弃将,詹姆斯新赛季使用情况曝光北京时间10月19日,NBA里继续上演着他们的故事,洛杉矶湖人队一夜之间再增加两名球员,主帅沃格尔对下赛季球员使用情况已经做好了安排。湖人再添两名球员在今日,湖人签下了勇士队弃将布曾繁日,冲向广东挨骂F4的毕业季那你想,我说你,给你打,还是我就不care你,理都不理你,你不打?这是杜锋指导对年轻的曾繁日说过的一段话,在CBA这个职业赛场,这其实正是年轻球员和边缘球员的生存逻辑。2019年夏足协杯1沧州晋级8强后对阵申花北京时间10月19日,足协杯正赛第2轮的较量中,深圳队对阵沧州雄狮。第19分钟,王永珀凌空斩为深圳队打破僵局,第26分钟,卡尔德克的进球让深圳队扩大领先优势,第34分钟,桑戈尔为沧LNGVSTL,D组晋级战,LNG晋级可能性更大北京10月18日晚上8点,LNGVSTL,D组晋级战即将拉开帷幕。那么在TL战队作为北美赛区的一号种子队伍和LNG王牌S赛队伍上,两队谁能夺得最后的胜利呢?我们来分析下两队的比赛阵腾讯网易字节的MOBA手游大乱斗2021年,MOBA手游终于又热了起来。作者哈士柴本文由靠谱编辑部编辑最近一周游戏行业的欢乐几乎都来自于MOBA手游。10月8日英雄联盟手游上线后,从业者一边分享着抽取皮肤英雄的峡万国觉醒丨饰品的梯度排名(下)大家好我是ROK战术大师Alisa一位国际服玩家本篇为饰品的最后一篇最后将为大家规划制造饰品最优路线11hr极昼之耀材料需求120个金色材料装备使用指南通用获取方式征服赛季商店装备中国唯一纯客家地级市,常住人口数283。77万,山水美赴圩景象热闹旅行途中用相机刻录时光行摄乡土看古村镇,平凡的生活风景无需华丽只需熟悉。欢迎来自各地的朋友在评论区留下你身边有特色的美丽风景,黄杨军与你共享生活中平凡又熟悉的景色。四方食事,不过一北京怀柔雁西湖一日游,风景不错今天和同事们去了位于北京怀柔区的雁西湖,一大早我们约定在东直门公交枢纽站集合,坐上开往怀柔的916路公交车,我由于住得比较远,早上起了一个大早,特别的困,所以坐上车以后简单的聊了几