范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

如何写一篇不水的机器学习论文,专家手把手教你

  还在学师阶段的研究生以及从业新手们,想在机器学习研究中少走弯路吗?或许下面这篇论文可以帮到你:
  《如何避免机器学习研究中的陷阱?一本给学术研究人员的指南》
  作者是英国赫瑞-瓦特大学数学与计算机科学学院的副教授,同时也是爱丁堡机器人中心的成员,博士毕业已经十多年,这篇 17 页的论文主要介绍了机器学习学术研究中的一些常犯错误,以及如何避免。
  指南共涵盖了机器学习过程的五大方面:建模前如何准备,如何建出可靠的模型,如何稳健地评估模型,如何公平地比较模型以及如何报告结果。
  一位已经从业的机器学习研究员称赞该论文很有价值,因为文中提到的所有错误他在博士学习和工作期间中都遇到很多次。他准备让后面所有新入职的工程师都好好看看。
  不少人则认为该指南的意见可能并不受欢迎,因为很多都是研究人员本该知道的基本常识,比如多次重复实验并报告平均值和方差进行严格比较,但他们就是为了方便或者让数据更好看而选择性忽视。
  下面就详细看看作者都提了哪些常见错误。建模前的准备
  为了得到符合预期用途的模型、可以顺利发表论文的结果,建模之前你需要做好以下 6 点准备:
  1、确保花时间研究你要用的数据集,来源可靠、质量有保证。
  2、但不要查看测试数据,防止先入为主做出某些假设导致最终模型通用性差。
  3、保证数据量足够大,当然保证不了也是常有的事儿,解决办法:
  比如评估模型时交叉验证数据、采用数据扩充技术(数据集中某类数据不够时也可采用)。
  但总的来说,数据不够模型就不能设计得太复杂,不然分分钟给你过拟合。
  4、要和相关领域专家谈谈,防止研究脱离实际,并且他们也可以帮助你向最合适的期刊/受众发表。
  5、搜遍相关文献,虽然发现别人已经研究过了很沮丧,但是写论文时你该怎么解释为什么要覆盖相同的领域。
  6、一定要提前考虑模型部署的问题:大部分学术研究最终都是要落地吧?好好考虑落地场景的资源、时间限制等问题来设计模型。如何建出可靠的模型
  1、不要让测试数据参与到训练过程中(这点前面也已强调过)。
  2、尝试不同的 ML 模型,别套用,具体问题具体分析找出最适合解决你的问题的那个。
  "凑合"的例子包括将期望分类特征的模型应用于由数字特征组成的数据集、将假定变量之间没有依赖关系的模型应用于时间序列数据,或者只相信最新的模型(旧的不一定不合适)。
  3、一定要优化模型的超参数。使用某种超参数优化策略比较好,这样在写论文时也好整。除了数据挖掘实践之外,可以使用 AutoML 技术优化模型及其超参数的配置。
  4、在执行超参数优化和特征选择要小心:防止测试集"泄漏",不要在模型训练开始之前对整个数据集进行特征选择。理想情况下应使用与训练模型所用数据完全相同的数据。
  实现这一点的常用技术是嵌套交叉验证(也称为双交叉验证)。
  如何稳健地评估模型
  对模型进行不公平的评估,很容易让学术研究的水变浑浊。作者一共提了 5 点:
  1、一个模型在训练集上的表现几乎毫无意义,保证测试集与训练集之间的独立。
  2、在连续迭代多个模型,用前面的数据指导下一个的配置时使用验证集,千万不要让测试集参与进来。可以根据验证集对模型进行测量:当分数开始下降时,停止训练,因为这表明模型开始过拟合。
  3、对模型多次评估,防止低估/高估性能。十次交叉验证是最标准的做法,对很小的数据类进行层化也很重要;需要报告多个评估的平均值和标准偏差;也建议保留单个分数记录,以防以后使用统计测试来比较模型。
  4、保留一些测试数据以无偏评估最终的模型实例。
  5、不要对不平衡的数据集使用准确度(accuracy)指标。这个指标常用于分类模型,不平衡数据集应采用 kappa 系数或马修斯相关系数(MCC)指标。如何公平地比较模型
  这是非常重要的一环,但很惊讶的是很多人都比不对,作者表示一定要确保在同一环境中评估不同的模型,探索多个视角,并正确使用统计测试。
  1、一个更大的数字不意味着一个更好的模型。应将每个模型优化到同等程度,进行多次评估,然后使用统计测试确定性能差异是否显著。
  2、要想让人相信你的模型好,一定要做统计测试。
  3、进行多重比较时进行校正:如果你以 95% 的置信水平做 20 个成对测试,其中一个可能会给你错误的答案。这被称为多重性效应。最常见的解决方法是 Bonferroni 校正。
  4、不要总是相信公共基准测试的结果。
  使用基准数据集来评估新的 ML 模型已变得司空见惯,你以为这会让结果更透明,实际上:
  如果测试集的访问不受限,你没法确保别人没有在训练过程中使用它;被多次使用的公共测试集上的许多模型可能会与之过度匹配;最终都会导致结果乐观。
  5、考虑组合模型。如何报告结果
  学术研究的目的不是自我膨胀,而是一个贡献知识的机会。为了有效地贡献你的想法,你需要提供研究的全貌,包括哪些有效哪些无效。
  1、保持你所做所发现的成果透明,这会方便其他人更容易地在你的工作基础上扩展。共享你的代码也会让你在 coding 的时候更认真。
  2、提供多个测试集上的报告,为每个数据集报告多个度量指标(如果你报告 F 值,请明确这是 F1 得分还是精度和召回率之间的其他平衡;如果报告 AUC,请指出这是 ROC 曲线下的面积还是 PR 下的);
  3、不要在结果之外泛化,不要夸大,意识到数据的局限性。
  4、报告统计显著性时一定要小心:统计人员越来越多地认为,最好不要使用阈值,而只报告 p 值,让读者来解释这些值。
  除了统计意义之外,另一件需要考虑的事是两个模型之间的差异是否真正重要。
  5、最后,再回过头完整的看一眼你的模型,除了报告性能指标,看看它能解决多少实际问题。
  以上就是所有的内容,作者表示,部分意见可能有争议,内文也并非详尽无遗,因此提供了很多参考链接供大家进一步参考。
  另外理论总是落后于实践,我们今天认为正确的东西明天可能不正确,因此大家都要以开放的心态面对机器学习,紧跟最新技术进展,谦虚地接受新知识。
  更多意见欢迎在评论区补充。指南地址:
  https://arxiv.org/abs/2108.02497
  参考链接:
  https://www.reddit.com/r/MachineLearning/comments/ozuphh/r_how_to_avoid_machine_learning_pitfalls_a_guide/

为更好诊断炎症性肠病,志愿者喝下自己的血液北京时间9月29日消息,据国外媒体报道,在一项最新研究中,16名志愿者以更好诊断炎症性肠病为名进行了超越自我的研究他们喝下自己的血液。这项吸血鬼研究揭示了一种诊断克罗恩氏病等疾病常上海微系统所实现片上亚纳米量级的超灵敏位移传感IT之家7月6日消息据中国科学院网站,近日,中国科学院上海微系统所等合作在硅衬底上提出了基于布洛赫表面光场的非对称传输特性实现超灵敏位移测量的方法,并实现了亚纳米级的位移传感。光学科学家发现最早的超大质量黑洞风暴本文简介了近期科学热文1祝融号火星车登陆火星5月15日中国首个火星车祝融号登陆火星,现已正常启动运行,祝融号是天问一号的一部分,天问一号是中国首个完全自主研发的火星探测器,于今年2大气中飘浮的微塑料在全球范围内循环北京时间4月23日消息,一项新的研究称,地球的大气层中飘浮着大量的微塑料碎片,随着空气流动甚至能穿越整个大陆。研究人员表示,未来这一环境问题可能会变得更加严重,并可能对人类健康产生我们如何将石油转变为塑料北京时间1月27日消息,据国外媒体报道,海洋学家查尔斯摩尔称,只有我们人类才能制造出大自然无法消化的垃圾。据悉,1997年他在太平洋航海勘测时发现了海洋垃圾带,这些垃圾主要是塑料垃科学家开发出再生纸隔热材料,有望替代一次性泡沫塑料IT之家1月19日消息在货品运输中,经常会用到一次性泡沫聚苯乙烯泡沫塑料包装,这种包装不可生物降解且难以回收,对环境造成了很大的危害。据外媒newatlas报道,近日,德累斯顿工业3D打印也能造出核燃料和反应堆组件了!北京时间3月3日消息,据国外媒体报道,目前,伴随着金属和高科技复合材料的快速发展,3D打印技术现已在航空航天和医疗领域取得了重大进展,增材制造也被视为生产小型安全的下一代核反应堆的官方科普新冠疫苗加强针要打吗,哪些人需要打IT之家9月3日消息目前新冠病毒德尔塔变异毒株已经在全球流行,我国多个省份报告出现该病毒确诊病例和无症状感染者。截至9月2日,全国累计报告接种新冠病毒疫苗超过20。8亿剂次,其中有蓝色起源首席执行官透露太空航班的定价会超过100万美元IT之家7月21日消息据外媒报道,蓝色起源表示,希望能在今年至少再进行两次载人飞行。目前,蓝色起源官方尚未公布其即将推出的太空航班的定价,但据该公司首席执行官鲍勃史密斯透露,公司将与贝索斯一同上太空,新谢泼德号82岁乘客感悟挤并快乐着北京时间7月21日早间消息,据报道,周二早上,蓝色起源公司将首批乘客送到了太空边缘。大约10分钟后,机组人员在失重状态下只呆了三分钟就回到了位于得克萨斯州西部的沙漠。参与了本次飞行贝索斯的一小步竞争推动人类走向太空贝索斯的一小步穿着蓝色宇航服的贝索斯带着牛仔帽迈出太空舱,向在德州沙漠里等候降落的人群微笑挥手。11分钟的飞行很快结束,两鬓已经有些斑白的他终于实现了自己孩童时期的梦想,至少是迈出
研究发现红外线疗法可能有助于改善痴呆症患者的生活据外媒报道,研究人员称,红外光疗法可能有可能帮助痴呆症患者。由英国杜伦大学的PaulChazot博士和Maculume有限公司的GordonDougal博士领导的一项试点研究发现,新研究揭示天王星和海王星等这样冰巨星的形成条件据外媒报道,一层ldquo热rdquo导电冰可能是产生天王星和海王星这样的冰巨行星的磁场的原因。来自卡内基大学和芝加哥大学高级辐射源中心的新研究工作揭示了这两个超离子冰的形成条件。新冠疫情期间孩子与自然更多互动可以增加幸福感一项新的研究表明,来自不太富裕家庭的儿童很可能发现COVID19禁闭对他们的心理健康更具挑战性,因为他们与自然的联系比富裕的同龄人少。由剑桥大学和苏塞克斯大学的研究人员进行的这项研天文学家首次观测到白矮星亮度突然开启和关闭天文学家利用一颗行星猎取卫星首次看到了白矮星亮度突然开启和关闭。由英国达勒姆大学领导的研究人员利用美国宇航局的凌日系外行星探测卫星(TESS)来观察这一独特现象。白矮星是大多数恒星研究人员开发了新的纳米线结构提高了小型化程度EPFL研究员ValerioPiazza在半导体材料实验室工作,主要研究纳米级的半导体。他特别关注纳米线和使用半导体材料构建的纳米结构,研究的目标是将晶体管改进到超过当前的饱和点。NASA新发射的露西号航天器出现一个太阳能电池板问题据外媒报道,NASA最新发射的一个探索木星周围小行星群的机器人航天器在其太空旅行中可能遇到了一些小麻烦。这个名为ldquo露西号(Lucy)rdquo的太空探测器的两个主要太阳能电研究人员开发出一种不需要针头的葡萄糖传感器阻碍糖尿病患者常规监测其血糖水平的最常见因素之一是大多数现代机器需要针头和少量的血液。然而,宾夕法尼亚州立大学的研究人员已经开发出一种新的葡萄糖监测系统,不需要针头就能获得准确的读科学家正开发像人类一样会思考的人工智能创造类似人类的人工智能不仅仅是模仿人类的行为技术也必须能够像人类一样处理信息,或思考,如果它要被完全依赖的话。由格拉斯哥大学心理学和神经科学学院领导的发表在模式杂志上的新研究,使用我国研发月壤制氧技术尽快制造出中国人在月面第一口氧气在月球探索上,我国已经实施了三期嫦娥工程,做到了从月球取样返回,未来中国还将探索在月球建设基地的可能,其中一个前提就是在月球上大规模制造氧气。最新报告显示国内已经开展了月壤制氧技术科学家正在跟踪几颗不会对地球构成真正威胁的近地小行星美国宇航局(NASA)和世界各地的其他空间机构为发现和追踪所有近地小行星付出了相当大的努力。ldquo近地rdquo这个名字让很多人觉得这些小行星离我们的星球非常近,但它们通常在数研究发现太阳系原行星盘中存有一个神秘空隙据外媒报道,宇宙边界,或许是由年轻的木星或新兴的风造成,它很可能塑造了新生行星的组成。在早期的太阳系中,一个由尘埃和气体组成的ldquo原行星盘rdquo围绕着太阳旋转并最终凝聚成