专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

强化学习登Nature封面,自动驾驶安全验证新范式大幅减少测

  机器之心报道
  编辑:陈萍、小舟
  引入密集强化学习,用AI验证AI。
  自动驾驶汽车(AV)技术的快速发展,使得我们正处于交通革命的风口浪尖,其规模是自一个世纪前汽车问世以来从未见过的。自动驾驶技术具有显着提高交通安全性、机动性和可持续性的潜力,因此引起了工业界、政府机构、专业组织和学术机构的共同关注。
  过去20年里,自动驾驶汽车的发展取得了长足的进步,尤其是随着深度学习的出现更是如此。到2015年,开始有公司宣布他们将在2020之前量产AV。不过到目前为止,并且没有level4级别的AV可以在市场上买到。
  导致这一现象的原因有很多,但最重要的是,自动驾驶汽车的安全性能仍大大低于人类驾驶员。对于美国的普通驾驶员来说,在自然驾驶环境(NDE)中发生碰撞的概率约为1。9106permile。相比之下,根据加利福尼亚2021年的脱离报告(DisengagementReports)显示,最先进的自动驾驶汽车的脱离率约为2。0105英里。
  注:脱离率是评定自动驾驶可靠性的重要指标,它描述的是系统运行每1000英里需要驾驶员接管的次数。系统的脱离率越低,意味着可靠性越佳。当脱离率等于0时,也就从某种程度上说明这个自动驾驶系统已经达到无人驾驶级别。
  尽管脱离率会因为存在偏见而受到批评,但它已被广泛用于评价自动驾驶汽车安全性能。
  提高自动驾驶汽车安全性能存在的一个关键瓶颈是安全验证效率低下。目前流行的是通过软件模拟、封闭测试轨道和道路测试相结合的方式来测试自动驾驶汽车的无损检测。这样一来,AV开发人员必须支付大量的经济和时间成本来评估,从而阻碍了AV部署的进展。
  在NDE环境中,进行AV安全性能验证非常复杂。例如,驾驶环境在时空上是复杂的,因此定义此类环境所需的变量是高维的。随着变量维数呈指数增长,计算复杂度也呈指数增长。在这种情况下,即使给定大量数据,深度学习模型也很难学习。
  本文中,来自密歇根大学安娜堡分校、清华大学等机构的研究者,他们提出密集深度强化学习(D2RL,densedeepreinforcementlearning)方法来解决这一挑战。
  该研究登Nature封面。
  论文一作封硕,目前是清华大学自动化系终身助理教授(TenureTrackAssistantProfessor),此外,他还是密歇根大学交通研究所(UMTRI)的助理研究科学家。他于2014年和2019年在清华大学自动化系获得学士和博士学位,师从张毅教授。2017年至2019年,他在密歇根大学土木与环境工程专业做访问博士,师从HenryX。Liu教授(本文通讯作者)。
  研究介绍
  D2RL方法的基本思想是识别和去除非安全关键(nonsafetycritical)数据,并利用安全关键数据训练神经网络。由于只有一小部分数据是安全关键的,因此其余数据的信息将被大量密集化。
  与DRL方法相比,D2RL方法可以在不损失无偏性(unbiasedness)的情况下显著减少多个数量级的策略梯度估计方差。这种显著的方差减少可以使神经网络学习和完成DRL方法难以处理的任务。
  对于AV测试,该研究利用D2RL方法,通过神经网络训练周围车辆(backgroundvehicles,BV)学习何时执行何种对抗性操作,旨在提高测试效率。D2RL在基于AI的对抗性测试环境下可以将AV所需的测试里程减少多个数量级,同时确保了测试的无偏性。
  D2RL方法可以应用于复杂的驾驶环境,包括多条高速公路、十字路口和环岛,这是以前基于场景的方法无法实现的。并且,该研究提出的方法可以创建智能测试环境,即使用AI来验证AI。这是一种范式转变,它为其他安全关键系统进行加速测试和训练打开了大门。
  为了证明基于AI的测试方法是有效的,该研究使用大规模实际驾驶数据集对BV进行了训练,并进行了模拟实验和物理测试轨道的现场实验,实验结果如下图1所示。
  密集深度强化学习
  为了利用AI技术,该研究将AV测试问题表述为马尔可夫决策过程(MDP),其中BV的操作是根据当前状态信息决定的。该研究旨在训练一个由神经网络建模的策略(DRL智能体),它可以控制BV与AV交互的操作,以最大限度地提高评估效率并确保无偏性。然而,如上文所述,受维数和计算复杂度的限制,如果直接应用DRL方法,很难甚至根本无法学习有效策略。
  由于大多数状态都是非关键的,无法为安全关键事件提供信息,因此D2RL的重点是去除这些非关键状态的数据。对于AV测试问题,可以利用许多安全指标来识别具有不同效率和有效性的关键状态。该研究利用的关键性度量指标是当前状态特定时间范围内(例如1秒)内AV碰撞率的外部近似值。然后该研究编辑了马尔可夫过程,丢弃非关键状态的数据,并将剩余数据用于DRL训练的策略梯度估计和Bootstrap。
  如下图2所示,相比于DRL,D2RL的优势是能够最大化训练过程中的奖励。
  AV仿真测试
  为了评估D2RL方法的准确性、效率、可扩展性和通用性,该研究进行了仿真测试。对于每个测试集,该研究模拟了一段固定距离的交通行驶,然后记录并分析测试结果,如下图3所示。
  为了进一步研究D2RL的可扩展性和泛化性,该研究对AVI模型进行了不同车道数(2车道和3车道)和行驶距离(400米、2公里、4公里和25公里)的实验。本文对25公里行程进行了研究,因为在美国,平均通勤者单程旅行约为25公里。结果如表1所示:
  参考链接:
  https:auto。ifeng。comqichezixun202003031390011。shtml
  https:www。nature。comarticlesd41586023007984

科莫多巨蜥的毒液到底有多可怕?2009年,一名31岁的渔民安瓦尔,在印尼科莫多岛上采摘水果,结果不小心从水果树上掉了下来,刚好踩到了一只巨型蜥蜴,蜥蜴瞬间就朝他扑了过去,咬住了他的腿,之后又咬住了他的手臂,身体武汉未来的房价会涨到100000元平米吗?这个问题的答案是肯定的!以目前的趋势,未来武汉房价必然达到10万的水平,只是时间长短的问题。2010年至2017年,短短七年间,武汉的房价已经翻了3番,目前,武汉部分高端楼盘如洞庭兰州青白石片区,中央公园怎么样?兰州北拓的黄金区域,目前基础交通还跟不上建设需要,交通滞后可能会成为十四五期间兰州青白石片区发展的的最大障碍!不过就兰州地理位置和城区格局而言,青白石片区是离主城区最近的待开发区域农民为什么不在国家统计失业范围之内?中国有四个儿子,大儿子叫工人,二儿子叫子弟兵,三儿子叫公务员,四儿子叫农民,所以四儿子就没有纳入统计失业包括养老金范围,因为四儿子有金山银山还有三分地。农民有土地,这是农民可以赖以农村成立社区是什么意思?很多农村驻有村委会办公室,同时也驻有社区管理委员会办公室,特别是在城市郊区的农村和街道的农村都同时设立了村委会和社区管理委员会,很多人弄不明白是怎么回事。那农村成立社区是什么意思呢农村里的剩男,为何一剩再剩呢?到底是什么原因?男女比例失调。计划生育只要一个孩子时,受封建思想影响,都拚命要男孩,等他们长大了,很难找到媳妇。一,农村姑娘远嫁,二,女孩见少,三,彩礼高,四,剩男挣钱少。我就一大龄剩男!个人亲身抖音付费直播试水,看直播要给钱了?我们应该如何思考?使劲收,最好是家人们看的话,一分钟100块钱。毕竟粉丝听话的很。毕竟人设都设计好了打PK,卖货摆错价格,怒亏2个亿回馈粉丝。没事就怼工厂,怼员工反正就是赔钱回馈粉丝。赔完还得补交税马上就要退休了,退休工资才3650元太少了,怎么办?3600不少了。我企业工龄32年,退休时退休金只有2200,涨了这么多年还不到3000。知足常乐吧!如果身体不好,这些钱也够生活了,如果身体还可以,就找一些力所能及的工作,打打工补南宁五象新区未来的发展潜力很大吗?五象新区无法成为国家级新区!!!目前看来,五象新区的潜力也就这样了。我们对比一下贵阳的贵安新区,贵安新区的面积是1700平方公里,由贵阳市的郊区和安顺市合并得来。是全国第8个国家级如果把三峡大坝加高10米,截留更多的洪水,可行吗?我国的三峡大坝,作为当今世界上最大的水利枢纽工程,位于湖北省宜昌市上游,距下游葛洲坝水电站38公里,三峡大坝全长2309米高185米,呈梯形形状,集发电旅游航运调控洪水于一身。三峡大家有经历过亲人去世吗?是怎样走出痛苦和想念的?2018年9月1日下午3点8分,我的妻子在医院里停止了呼吸。她的眼睛没有闭上,我流着泪,帮她合上了双眼。我永远失去了我最亲近的爱人,孩子永远的失去了妈妈。一位好妻子,好女儿,好姑妈
生完孩子胎盘应该保留吗?先说点轻松的,说说我的个人经历,我一共生过两个孩子,每次生完之后,我都让老公给我和胎盘合影,算是一种搞笑吧这一次和胎盘合影之后,医生和护士误解认为我们是要把胎盘拿走,试探着问说你们月子里吃甜酒煮鸡蛋对宝宝有影响吗?(母乳喂养)?可以吧!好像还有发奶的效果。我娘家那边都是买醪糟酒煮鸡蛋给产妇吃。有促进新陈代谢和乳汁分泌的效果。还能润肤,血液循环,富含维生素我婆家这边就是用散子煮鸡蛋感觉好油吃不下去。这次我打每天早上吃一个煮鸡蛋和每天早上吃一条海参的营养价值一样吗?大家好!我是福爸,执业医师。专注体重管理和疾病营养治疗二十年。希望我的回答对您有用。随着大众健康意识提高,对早餐也越来越重视了。现在很多人都知道早餐不能光吃稀饭咸菜,还要吃蛋白质类一直怀不上孩子,刚刚领养了一个女孩,但又突然怀孕了,怎么办?领养了就是你的孩子,她是人,不是宠物,不可以今天想要就养,明天不想要就扔,那不是人干的事。小女孩给你带来好运,别干缺良心的事情!如果送走她,你的孩子也难以平安,这事很多例子,有因果如何激发孩子的内动力?孩子的学习,家长都很上心,甚至在医院体验排队时,交谈的还是孩子的学习和排名。你家孩子学习主动,哎,不行,还是你家内动力足省心。这边又说了,成绩这次不好,坐过山车了。坐过就好,关键我孩子如何练字?我是一位从教23年的小学语文老师,如何让孩子练好字,我想给出以下三个建议一基本功1笔画与偏旁要想写字漂亮,必须天天苦练基本功。著名书法家田英章,今年70多岁,每天还要练笔画达芬奇每为什么有些人穿西服的衬衫不会跑出来,有办法解决衬衫跑出裤腰吗?那要看你穿的是什么西裤,什么衬衫,你的体型是什么样的?如果是那种韩版的收身小脚裤,因为他的腰都不会做得很长,都会在肚脐眼下面一点,所以你配的衬衫要相对长一点,要不然特别容易走出来。一万块左右能买到什么表,瑞士罗马表的机械表怎么样?没有买d过一万多奢侈品还是多多存钱浪琴表款式时尚一些。梅花表也可以瑞士罗马表性价比高。款式好价格低。机械的6000左右就能买到很好看的了。类似万国的款瑞士罗马表机芯机芯比浪琴梅花英相比之下机械增压的优点好于涡轮增压,为什么机械增压被淘汰,有迟滞的涡轮增压能长存?因为涡轮增压的效率比机械增压高啊。涡轮增压是利用发动机高速排出的废气吹动涡轮旋转,带动叶轮给进气管压气,增加发动机的进气量。发动机本来就是要排出废气的,涡轮增压只是把以前浪费掉的这起亚嘉华算得上高性价比的MPV吗?嘉华的配置是不错,横向来说算是良心的车,但是这几天看了凯酷论坛,再加上一些其他车型论坛,发现了一个比较大的隐患,就是颗粒捕捉器,这东西现在很容易堵,尤其是经常在早晚高峰时期开车的人在哪里能真正买到酱香型白酒,大家推荐一下?建议有条件亲自到仁怀茅台镇实地考查!相信会有意外的收货!酱香型白酒类型品牌繁多,在电商平台上也随处可见,真正的酱香型白酒指的是坤沙酒,纯粮食酿造,喝着不上头,不口干,入口柔顺,酒体
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网