范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

清华大学发布首个课程学习开源库CurML

  来源:机器之心
  本文 约2000字  ,建议阅读 5分钟
  清华大学朱文武团队发布全球首个课程学习开源库 CurML,提供课程学习算法的支持平台。
  如何应用课程学习策略指导机器学习模型的训练?清华大学朱文武团队发布全球首个课程学习开源库 CurML,提供课程学习算法的支持平台。
  在机器学习的发展过程中,人类的学习方式常常会对各种算法的设计产生启发。而作为人类学习的一个重要范式,通过课程进行学习,已经被借鉴到机器学习中形成了名为课程学习(Curriculum Learning)的研究方向。
  普遍而言,人类的教育是通过高度组织化的课程来完成的。每一门课或是每一个学科,都会从简单的内容开始,逐步向学生呈现更复杂的概念。例如,在大学接受微积分的概念之前,一名学生应当先在小学学习算术,在初中学习函数,在高中学习导数。然而与人类教育不同的是,传统机器学习模型的训练都是将数据样本随机输入模型,忽略了数据样本之间不同的复杂性以及模型当前的学习状态。因此,课程学习在机器学习领域的提出,正是为了模仿人类由易到难的学习方式,为模型提供更好的训练策略,从而提升模型的表现。
  课程学习概念图
  目前课程学习已经广泛应用在机器学习的各个任务中,包括图片分类、目标检测、语义分割、机器翻译、音频识别、音频增强、视频问答等等,同时也在有监督、无监督和半监督学习以及强化学习等场景下受到大量关注和研究。
  随着课程学习的应用和场景日益丰富,特别需要对这一领域进行细致的梳理和归纳,从而推动研究者的深入探索、提升使用者的应用体验。
  因此,清华大学朱文武教授所带领的媒体与网络大数据实验室在发表了多篇课程学习学术论文的积累和基础上,实验室成员王鑫在 IEEE TPAMI 发表了关于课程学习的综述论文,实验室进一步发布了全球首个课程学习开源库 CurML (Curriculum Machine Leanring)。
  朱文武教授与王鑫助理研究员的课程学习研究工作包括应用于城市兴趣地点推荐的课程元学习方法、基于带噪多反馈信息的课程解耦商品推荐、基于课程学习的共享参数神经架构搜索、以及基于课程难度自适应的组合优化问题求解等等。研究成果发表于 SIGKDD、NeurIPS、ACM MM 等高水平国际机器学习会议上。
  部分研究成果框架图
  课程学习综述论文则全面回顾了课程学习的产生、定义、理论和应用等各个方面,设计了统一的课程学习框架,并根据框架内的核心组成将课程学习算法分为两个大类和多个小类,区分了课程学习与其他机器学习概念之间的不同和关联,指出了这一领域所面临的挑战和未来可能的研究方向。
  课程学习方法分类
  课程学习开源库 CurML 是课程学习算法的支持平台,已经集成十多种课程学习算法,同时支持带噪和非带噪两种应用场景,便于研究者和使用者复现、评估、比较以及选择课程学习算法。
  CurML 的主体模块是 CL Trainer,它由两个子模块 Model Trainer 和 CL Algorithm 组成,两者间通过五个接口函数进行交互,从而实现课程学习指导的机器学习过程。
  CurML 框架图
  主体模块:CL Trainer
  这一模块是整个开源库的主体部分。通过调用这一模块,使用者仅需几行代码即可实现课程学习算法。在给定数据集、模型和超参数后,模块将进行一定时间的训练,并输出训练后的模型参数和任务的测试结果。这一模块的设计主要是为了满足易用性的要求,因此进行了高度的封装,提供给想要使用课程学习算法但并不在意具体实现细节的使用者。
  子模块 1:Model Trainer
  这一模块用于完成一般的机器学习过程,例如训练一个图片分类器或是一个语言模型。同时,它预留了五个接口函数的位置,用于和第二个子模块 CL Algorithm 进行交互,也支持自定义的输入函数。
  子模块 2:CL Algorithm
  这一模块封装了 CurML 所支持的全部课程学习算法,如下表所示:
  模块的实现是通过五个接口函数,分别用于从机器学习过程中获取数据和模型信息,以及指导模型的学习策略,如下图所示。
  CurML 流程图
  接口函数:data_prepare
  这一函数用于从 Model Trainer 模块向 CL Algorithm 模块提供数据集信息。很多课程学习算法需要对数据集有一个整体的了解,才能更好地判断数据样本难度,因此这一接口函数是很有必要的。
  接口函数:model_prepare
  这一函数与 data_prepare 很类似,区别在于传递的不是数据集信息而是模型训练的相关信息,例如模型架构、参数优化器、学习率调整器等等,很多课程学习算法通过调节这些要素指导机器学习。
  接口函数:data_curriculum
  这一函数用于计算数据样本难度,并根据数据难度和当前模型状态为模型提供合适的数据,大部分的课程学习都具有类似的思想。
  接口函数:model_curriculum
  这一函数用于更新模型,调节模型从数据样本中获取的信息量,间接指导模型的学习,目前这类算法的数量还较少,但 CurML 也同样支持这类算法的实现。
  接口函数:loss_curriculum
  这一函数用于对损失函数值进行重加权,间接调整不同数据对于模型的影响,这类算法在课程学习中较为常见,因为损失值的加权在本质上是一种对数据的软采样。
  通过对于十多种近年来课程学习方法的总结,采用上述的模块和接口参数可以统一化实现不同类型的课程学习算法,从而能在公平的场景和任务下对课程学习算法进行评估、比较和选择。
  未来展望
  CurML 的研发团队表示,在未来他们将不断更新这一开源库,为课程学习的发展和应用提供进一步的支持。
  相关链接:
  CurML 开源代码库链接:  https://github.com/THUMNLab/CurML  CurML 开源软件论文链接:  https://dl.acm.org/doi/pdf/10.1145/3503161.3548549  课程学习综述论文链接:  https://ieeexplore.ieee.org/abstract/document/9392296/  课程元学习论文链接:  https://dl.acm.org/doi/abs/10.1145/3447548.3467132  课程解耦学习论文链接:  https://proceedings.neurips.cc/paper/2021/file/e242660df1b69b74dcc7fde711f924ff-Paper.pdf  课程神经架构搜索论文链接:  https://dl.acm.org/doi/abs/10.1145/3503161.3548271  课程难度自适应论文链接:  https://ojs.aaai.org/index.php/AAAI/article/download/20899/version/19196/20658

人生就是养老虎今天写篇学习体会吧,题目本来是南怀谨老师的文章,我学的不好,今天重温一下。南老师文章其实就是他讲课的实录,看着很随意,也很轻松,但每一句也是很深刻的。他首先讲养虎之法重要性,说女孩妈妈安排的相亲对象有多离谱?有种廉价感,是父母给的精读君通识词典已上线19602000词条今天是精读君陪伴你终身成长的第3241天01hr前几天,90后博主二毛坨子发了一个视频,分享自己一个高中女同学的奇葩相亲经历。女同学的妈妈,房产证不论写谁的名字,都不再起关键性作用,4项新规需了解引言更可怕的是现在大家对于房产的依赖性越来越强,很多家庭也都将房产视为结婚的前提因素,没有房子则意味着没有家,这可能直接影响自己的婚姻工作以及孩子教育和日后养老等问题,正因为如此,上汽集团上半年净利润69。1亿元同比下降48。1上汽集团上半年净利润69。1亿元同比下降48。1财联社8月25日电,上汽集团发布半年报,上半年实现营业收入3050。18亿元,同比下降14。47归母净利润69。1亿元,同比下降48第二季度营收利润双下滑,小米手机库存积压受关注来源广州日报客户端近日,小米集团(下称小米)发布2022年二季度业绩。财报显示,今年第二季度营收701。7亿元,同比下滑20。1,环比下滑4。3经调整净利润20。8亿元,同比大降6湘雅医院医生刘翔峰事件向我们揭开了医疗行业的阴暗面头号周刊据湖南卫健委26号发布的一则消息,湖南省卫健委中南大学通报,针对网民反映的中南大学湘雅二医院副主任医师刘翔峰有关问题,湖南省卫健委中南大学已经成立联合调查组,并通过湖南省医全国油价调整信息8月28日调整后9295号汽油价格国际油价周五小幅上涨,布油收破100美元每桶。国内油价第17轮周期统计已开启,预测原油变化率连续3个工作日上涨超5,折算后上涨幅度为218元吨,每升逼近2毛。本轮油价以涨势开局,当公信力,谁在践踏有关行业的公信力,公信力与教育有关吗湘雅二院刘翔峰被查中纪委彻查公信力,是指使公众信任的力量。公信力,指社会对某个行业组织的认可及信任程度,它通过法律约束和自律规范来体现。职业操守是医生公信力的基础(基石)。槟榔树很刘德华线上演唱会突破3。5亿人次观看,虽然轰动可是也有两大槽点昨晚刘德华线上演唱会在某平台举行,由于提前几天大肆宣传,昨晚的直播观看人数突破3。5亿人次之多。这次的演唱会人气非常高,显然作为网络演唱会是很成功的,3。5亿次的观看量恐怕在网络平沉浸式交互式体验!记者探访服贸会元宇宙体验馆十年间,我国服务贸易综合竞争力得到稳步提升。2021年,我国知识密集型服务进出口占服务贸易总额比重达43。9,比2012年提升10。3个百分点,其中电信计算机和信息服务增长3。2倍拼多多暴涨,马云和刘强东慌了?拼多多业绩的超预期,背后是无数家庭消费降级的超预期?01hr拼多多逆势暴涨这一年多以来,混得最惨的股票,大多有一个共同的名字中概股。(海外上市的中国公司)2020年疫情发生,中国率
2022年河北承接京津转入单位4395家图为新闻发布会现场。河北省统计局供图中新网石家庄1月19日电(赵丹媚)河北省政府新闻办19日召开新闻发布会通报称,2022年,河北加快京津产业转移承接,全年承接京津转入单位4395记上海企事业单位优秀班组上海中福会养老院护理班组翻开护理员手记,字里行间写满了各种老年护理实践的心得体会。这本手记,俨然已是护理员之间最炙手可热的为老服务百宝书。然而,这部百宝书却非大师所著,它出自上海企事业单位优秀班组上海中福罪犯互动教学系统启用!这个单位的节前教育用这个系统做直播啦!1月18日,福建省未成年犯管教所政委饶兴权在省未管所五楼会议中心用罪犯互动教学系统向全所罪犯致新春贺词,这是我省罪犯教育专网建成后的第一次现场直播,全体罪犯在监区楼层活动室就能收到23家单位联动!龙岩举行文化科技卫生三下乡集中服务活动1月17日,2023年龙岩市永定区文化科技卫生三下乡集中服务活动,在永定区金砂镇举行,来自龙岩市永定区的23家单位通过丰富多彩的文艺汇演活动贴近群众的科技卫生服务聚人气惠民生暖民心红糖米酒南瓜丸,随手一煮,香甜软糯,全家都爱吃,太香啦随着疫情的全面开放,很多人都阳了,阳了的人大部分出现浑身酸疼,发烧,嗓子干痒,反复咳嗽,吞咽疼痛等症状,来势汹汹的病毒,打的我们措手不及。第一波感染的高峰期已经基本结束了,钟南山院年夜饭上要吃鱼,吃哪种鱼,寓意最好?最美味好吃?大厨就这4种年夜饭上要吃鱼,吃哪种鱼,寓意最好?最美味好吃?大厨就这4种。亲爱的好朋友们,大家好,我是大厨江一舟,今天又到了给大家分享美食的时刻了,你们准备好了吗?咱们都知道,年夜饭上是要吃鱼苹果战略性放弃HomePod?临近春节,苹果带来的惊喜也是接连不断,前天夜里官网悄悄上架了新款Macmini和MacBookPro,搭载全新的M2Pro和M2Max,不少网友表示压岁钱还没到手就已经没了。昨天夜苹果AppleWatchUltra无法真正关机IT之家1月20日消息,从初代到Series4,苹果的AppleWatch无法像普通手表那样始终显示时间。自AppleWatchSeries5开始,苹果通过引入息屏常显功能来解决了苹果新MacBook专利曝光可提供触觉反馈的力敏键盘等多种交互IT之家1月20日消息,苹果正在推进固态按钮的改造工程,继触控板之后未来MacBookProMacBookAir也将会采用触觉反馈的力敏触敏键盘。相比较传统的键盘,带触觉反馈的力敏贵州黔东南苗族侗族自治州近代人物简介乐嘉藻(1867年1944年),字彩澄。贵州黄平人,光绪举人。1895年曾参加公车上书。旋自费渡日本考察教育。归国后,1899年设学会于贵阳,讲求新学,倾向革命。1904年与士绅于韩国如此歧视性政策,为啥依然有大量国人赴韩旅游?据外媒报道,据韩国机场公社19日发布的数据,除仁川国际机场外,全国14座机场的春节假期旅客总吞吐量将破百万关口,但日均客流量同比下降6。3。数据显示,本月20日至24日,金浦机场等