范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

模型难复现不一定是作者的错,最新研究发现模型架构要背锅

  在不同初始化条件下,同一神经网络经过两次训练可以得到相同的结果吗?CVPR 2022 的一篇研究通过将决策边界(Decision Boundary)可视化的方法,给出了答案 —— 有的容易,有的很难。
  例如,从下面这张图来看,研究人员就发现,ViT 比 ResNet 要更难复现(两次训练过后,显然 ViT 决策边界的差异更大):
  研究人员还发现,模型的可复现性和模型本身的宽度也有很大关联。同样,他们利用这种方法,对 2019 年机器学习最重要的理论之一 —— 双下降(Double Descent)现象进行了可视化,最终也发现了一些很有意思的现象。
  来看看他们具体是怎么做的。更宽的 CNN 模型,可复现性更高
  深度学习中的决策边界,可以用来最小化误差。简单来说,分类器会通过决策边界,把线内线外的点归为不同类。在这项研究中,作者从 CIFAR-10 训练集中选择了三幅随机图像,然后使用三次不同的随机初始化配置在 7 种不同架构上训练,绘制出各自的决策区域。
  从中我们可以发现:左边三个和右边四个差异很大,也就是说不同架构之间的相似性很低。再进一步观察,左边的全连接网络、ViT 和 MLP Mixer 之间的决策边界图又不太一样,而右边 CNN 模型的则很相似。在 CNN 模型中,我们还可以观察到不同随机数种子之间明显的的重复性趋势,这说明不同初始化配置的模型可以产生一样的结果。
  作者设计了一种更直观的度量方法来衡量各架构的可复现性得分,结果确实验证了我们的直观感受:
  并发现更宽的 CNN 模型似乎在其决策区域具有更高的可复现性,比如 WideRN30。以及采用残差连接结构的 CNN 模型(ResNet 和 DenseNet )的可复现性得分比无此连接的模型要略高(VGG)。此外,优化器的选择也会带来影响。在下表中,我们可以看到 SAM 比标准优化器(如 SGD 和 Adam)产生了更多可重复的决策边界。不过对于 MLP Mixer 和 ViT,SAM 的使用不能总是保证模型达到最高的测试精度。
  有网友表示好奇,如果通过改善模型本身的设计,能改变这种现象吗?对此作者回应称,他们已经试着调整过 ViT 的学习率,但得到的结果仍然比 ResNet 差。
  可视化 ResNet-18 的双下降现象
  双下降(Double Descent)是一个有趣的概念,描述是测试 / 训练误差与模型大小的关系。在此之前,大家普遍认为参数太少的模型泛化能力差 —— 因为欠拟合;参数太多的模型泛化能力也差 —— 因为过拟合。
  而它证明,两者的关系没有那么简单。具体来说:误差会先随着模型的增大而减小,然后经过模型过拟合,误差又增大,但随着模型大小或训练时间的进一步增加,误差又会再次减小。
  作者则继续使用决策边界方法,可视化了 ResNet-18 的双下降现象。他们通过宽度参数(k:1-64)的改变来增加模型容量。训练出的两组模型,其中一组使用无噪声标签(label noise)的训练集,另一组则带有 20% 的噪声标签。最终,在第二组模型中观察到了明显的双下降现象。
  对此作者表示:线性模型预测的模型不稳定性也适用于神经网络,不过这种不稳定性表现为决策区域的大量碎片。
  也就说,双下降现象是由噪声标签情况下决策区域的过度碎片引起的。具体来说,当 k 接近 / 达到 10(也就是插值阈值)时,由于模型此时拟合了大部分训练数据,决策区域被分割成很多小块,变得"混乱和破碎",并不具备可重复性;此时模型的分类功能存在明显的不稳定性。而在模型宽度很窄(k=4)和很宽(k=64)时,决策区域碎片较少,有高水平的可重复性。为了进一步证明该结果,作者又设计了一个碎片分数计算方法,最终再次验证上图的观察结果。
  模型的可复现性得分如下:
  同样可以看到,在参数化不足和过参数化的情况下,整个训练过程的可复现性很高,但在插值阈值处会出现"故障"。有趣的是,即使没有噪声标签,研究人员发现他们设计的量化方法也足够敏感,可以检测到可复现性的细微下降(上图蓝线部分)。
  目前代码已经开源,要不要来试试你的模型是否容易复现?
  论文地址:
  https://arxiv.org/abs/2203.08124
  GitHub 链接:
  https://github.com/somepago/dbViz

欧菲光2020上半年净利5。02亿元,同比暴涨2290。28欧菲光集团股份有限公司(以下简称欧菲光)日前发布2020年半年报。报告显示,2020上半年公司实现营业收入234。65亿元,同比下降0。53归属于上市公司股东的净利润为5。02亿元大疆成立无人机应急救援联盟首批成员覆盖全国26个省份9月23日消息,大疆今日于北京举办大疆应急救援联盟成立仪式,并正式发布了大疆应急救援联盟作业规范。大疆创新高级战略总监张晓楠表示,未来大疆无人机将积极参与自然灾害城市消防人员搜救等数据2025年我国民用无人机产业产值将增至1800亿元9月15日下午消息,天眼查专业版数据显示,我国目前有超过4。7万家企业状态为在业存续迁入迁出,且企业名称或经营范围含无人机的无人机相关企业。其中,近9成的相关企业为有限责任公司。另特斯拉柏林超级工厂宣布已满一年,目前4栋厂房正在建设11月13日消息,据国外媒体报道,电动汽车厂商特斯拉在柏林近郊勃兰登堡州的格伦黑德的超级工厂,目前正在快速建设之中,所生产的ModelY,计划在明年交付。特斯拉柏林超级工厂效果图特蔚来理想小鹏汽车三家市值之和,已超美国三大车企2020年11月13日,理想汽车发布了截至2020年9月30日的第三季度未经审计财务报告。报告显示,理想汽车2020年第三季度汽车销售收入24。65亿元人民币,第二季度19。19亿奔驰母公司戴姆勒预计未来5年将缩小规模由燃油车转向电动汽车11月13日消息,据国外媒体报道,在特斯拉等厂商的推动下,电动汽车已越来越普遍,电力驱动也将是未来汽车行业主要的发展趋势之一,传统汽车厂商也在加速向电力驱动转型,拥有梅赛德斯奔驰品国内首艘纯电池动力集装箱船开工建造总电量超6。55MWh,用于内河运输1月31日消息来自国网电动汽车公司的消息显示,2020年1月28日,由国网电动汽车公司投资国网智慧能源交通技术创新中心负责研发的国内首艘纯电池动力集装箱船在江苏泰州开工建造。此次研台积电将加快汽车芯片生产作为首要任务IT之家1月28日消息台积电周四表示,该公司正将应对影响汽车行业的芯片供应挑战作为首要任务,并通过其晶圆厂加速这些产品的生产。该公司在一份声明中表示台积电目前正通过我们的晶圆厂加速饿了么100迁至阿里云,扩容后可支持1亿人同时点单IT之家6月17日消息饿了么已完成100上云,所有业务系统数据库设施等均已迁移至阿里云。据悉,高峰期,饿了么可在阿里云上快速扩容,以支持1亿人同时在线点单。饿了么在高峰期扩容的计算酷冷至尊推出两款带鱼屏游戏显示器IT之家6月27日消息据外媒报道,著名外设厂商酷冷至尊将发布两款带鱼屏游戏显示器,在2019年年底之前推出。viahexus酷冷至尊是著名的游戏外设厂商,散热器,机箱,键盘鼠标都有400辆五菱宏光18秒抢光,拼多多追加600万补贴国民神车5月17日,拼多多宣布将于5月19日零点首次上线整车销售业务,以最低3。49万抢五菱宏光致敬上汽通用五菱出产的这一国民神车。五菱宏光国民神车秒杀价3。49万元。5月19日零点,新电
小米披露董事配股股份变动权益雷军以相同价格卖出和认购10亿股12月7日下午消息,港交所文件披露显示,小米集团披露董事长雷军的股份权益变动,雷军以相同价格进行卖出和认购10亿股。据悉,这是由于小米集团之前采用先旧后新的方式进行增发,雷军的股份小米集团首届黑客马拉松颁奖典礼举行,一等奖获10万元奖金IT之家12月7日消息据小米公司微博消息,今日首届小米集团黑客马拉松颁奖典礼在小米科技园举行,其中一等奖奖金为10万元,二等奖两名,奖金各5万元,此外还有三等奖优秀奖最佳人气奖,最手机收不到验证码要小心,330万老年机被植入木马近日,浙江新昌县法院审理判决了8。12侵犯公民个人信息一案,案件源于2019年8月,新昌县的小朱给外婆购买了一台老年机,但在更换手机套餐时无法接收到验证码,将电话卡装到自己手机却能南京集成电路大学正式成立,到底是不是一所真正的大学今天上午,备受关注的南京集成电路大学,正式成立了。在江苏南京江北新区,政府举行了隆重的揭牌仪式,还事先邀请了N多媒体围观。揭牌现场媒体邀请函下面这个,就是新大学的LOGO。不得不说南京集成电路大学今天正式成立感谢IT之家网友NicholasL的线索投递!IT之家10月22日消息日前,国务院将集成电路设为一级学科,同时期发布了新时期促进集成电路产业和软件产业高质量发展的若干政策。集成电路RedmiK30Pro变焦版DxoMark相机评分公布120分,前十IT之家7月22日消息今日下午,DxoMark正式公布了RedmiK30Pro变焦版的摄像头评分。RedmiK30Pro变焦版相机总体得分为120分,照片得分为129分,视频得分为抖音开通河南暴雨互助通道IT之家7月20日消息据抖音官方发布,郑州暴雨袭城,单日降雨量突破极值,部分地区停电地铁进水被淹市民被困这场暴雨牵动着所有人的心。为了帮助因汛情受困的人们,抖音开通了河南暴雨互助通2021世界人工智能大会落幕数字人民币造芯与造车AI等绽放IT之家7月11日消息在连续举办三天之后,2021世界人工智能大会(WAIC)昨日正式闭幕。褪去人工智能技术及其产业发展的神秘外衣,在经历了泡沫破灭的阵痛与多家独角兽上市遇阻的打击正版辉瑞,复星医药将向台积电鸿海委托机构提供一千万剂mRNA新冠疫苗IT之家7月11日消息复星医药今日发布公告,控股子公司复星实业将向受台积电鸿海和永龄基金会委托的裕利医药销售共计1000万剂mRNA新冠疫苗,该等疫苗将被买方捐赠予中国台湾疾病管制等等明年,AMDCEO苏姿丰2021年底前芯片缺货持续存在感谢IT之家网友拈花一笑oO的线索投递!IT之家7月10日消息一年多来,世界一直面临着严重的半导体短缺问题。因此,英伟达英特尔和AMD等公司一直无法跟上消费者的需求。IT之家获悉,中国台湾最赚钱产业半导体产业第一,IC设计第二据中国台湾媒体财经新报7月3日报道,2021版台湾大型企业排名TOP5000调查显示,半导体产业登上2020年台湾地区产业经营绩效榜首,已经连续8年进入榜单前十,是长期经营绩效最好