专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

清华大学孙茂松教授提出全新微调框架CPT准确率提升17。3

  来源:arXiv
  编辑:LRS【新智元导读】预训练模型在计算机视觉和语言上都取得了显著成果,但这些语言模型有一个大问题就是训练过程和推理过程不匹配。清华大学孙茂松团队提出了一个全新的微调框架CPT,用颜色来遮蔽、融合图像和语言,准确率提升17。3,标准差降低73。8!
  预先训练的视觉语言模型(PreTrainedVisionLanguageModels,VLPTM)能够同时处理语言和视觉上的信息,也是完成各种多模态任务的基础模型。
  但模型的预训练和微调之间存在着巨大的差距,在预训练期间,大多数VLPTM都是基于masklanguagemodeling目标进行优化的,主要任务就是在屏蔽的词中从跨模态上下文中恢复。
  然而,在微调过程中,下游任务通常是通过将未屏蔽token的表示分类到语义标签来完成的,在语义标签中通常会引入特定任务的参数。这种差别阻碍了VLPTM对下游任务的适应性,因此需要大量的标记数据来优化VLPTM对下游任务的视觉基础能力。
  针对这个问题,清华大学的研究人员提出了一个新模型跨模态提示调节(CrossModalPromptTuning,CPT),也可以称为ColorfulPromptTuning。CPT是一种调整VLPTM参数的新范式,关键点在于通过在图像和文本中添加基于颜色的共同参照标记,视觉基础可以重新形成填补空白的问题,最大限度地减少预训练和微调之间的差距。
  为了在图像数据中使用自然语言表达式,CPT由两个组件组成:(1)一个视觉子提示(visualsubprompt),用颜色块唯一地标记图像区域;(2)一个文本子提示(textualsubprompt),将查询文本放入基于颜色的查询模板中。然后,通过从查询模板中的屏蔽标记恢复相应的彩色文本,可以实现目标图像区域的显式定位。
  论文的作者是孙茂松教授,目前任清华大学人工智能研究院常务副院长、清华大学计算机学位评定分委员会主席、教育部在线教育研究中心副主任、清华大学大规模在线开放教育研究中心主任。曾任清华大学计算机系主任、党委书记。研究方向为自然语言理解、中文信息处理、Web智能、社会计算和计算教育学等。
  配备CPT后,VLPTMs可以在没有任何标记数据的情况下执行zeroshotvisualgrouding,因为VLPTMs在训练前已经很好地学习了颜色的跨模态表示及其与其他概念(例如,对象、属性和关系)的组合。
  当有几个或全部标记的实例可用时,CPT可以根据基于熵的目标函数对VLPTM进行进一步调整。
  虽然通过基于颜色的提示将图像和文本连接起来看着很好用,但研究人员仍然发现了其中两个关键问题:(1)如何确定颜色集C的配置;(2)如何使用有限的预训练颜色处理图像区域的数量。
  解决方法有跨模式提示搜索(CrossmodalPromptSearch)。以前在文本提示调优方面的工作表明,提示配置(例如,文本模板)对性能有重大影响。这篇文章也是对搜索跨模态提示配置(即颜色集C)进行的首次研究。
  直观地说,C应该由VLPTM最敏感的颜色组成。为了获得颜色,一种简单的方法是采用预训练文本中最常见的颜色文本,其标准RGB作为civ。但该解决方案是次优的,因为这种方法在确定彩色文本时不考虑其视觉外观,并且真实图像中颜色的视觉外观通常与其标准RGB不同。
  所以在跨模式提示搜索中,首先确定一个全彩色文本的候选集。对于RGB空间中的每个可能颜色,将纯色块与文本子提示连接到VLPTMs中:〔CLS〕aphotoin〔MASK〕color。〔SEP〕。然后为每个候选颜色文本获得记录分数。
  记录得分越大,表明cv和cw之间的相关性越高,并且删除了在任何颜色视觉外观中都没有排名靠前的颜色文本。最后对于每个剩余的彩色文本,其视觉外观由最大色彩确定,并且实验结果显示得到的颜色配置明显优于原始的颜色配置。
  图像区域批处理(ImageRegionBatching)。在视觉基础中,图像中区域建议的数量通常超过颜色集合C的大小(10)。此外,严重重叠的色块会阻碍视觉基础,因此需要将图像区域分为多个批次,每个批次包含少量中度重叠的图像区域,并分别使用视觉子提示标记每个批次。为了处理不包含目标区域的批,在解码词汇表中进一步引入了一个新的候选文本none,表示批中没有目标区域。
  实验结果表明,提示微调后的VLPTM的性能大大优于微调后的PTM,
  1、CPT在zeroshot和fewshot设置下比随机基线和强微调基线有很大的优势(例如,在RefCOCO评估中,oneshot的绝对准确度平均提高17。3)。不同的数据集和不同的训练次数之间的改进是一致的。这表明CPT可以有效地提高VLPTM调谐的数据效率,并刺激VLPTM的视觉接地能力。
  2、值得注意的是,与微调相比,CPT实现的标准偏差要小得多(例如,在RefCOCO评估中,一次试验平均降低73。8的相对标准偏差)。这表明,来自预训练的连贯的调节方法可以导致更稳定的fewshot训练,这也是评估少镜头学习模型的关键因素。
  3、可以注意到,在RefCOCO评估中,CPT的微调性能稍逊于16shots。原因是RefCOCO有更多基于颜色的表达(例如,穿着红衬衫和蓝帽子的人),这可能会干扰基于颜色的CPT。然而,在完全监督的场景中,通过更多的调优实例可以缓解这个问题,模型可以学习更好地区分查询文本和提示模板中的颜色。
  4、在完全监督的设置下,CPT实现了与强微调VLPTM相当的性能。结果表明,即使在完全监督的情况下,CPT也是VLPTM的一种竞争性调优方法。总之,与普通的微调方法相比,CPT在zeroshot、fewshot和完全监督的视觉方面实现了优越可比且更稳定的性能。
  参考资料:
  https:arxiv。orgabs2109。11797?

末日孤舰为什么火不起来?最好看的海战片,没有之一。之所以没有火,因为第三季里存在着反华情绪,所以并没有被宣传过大,而不是剧情过于简单。不信可以看看第四季第五季,跌宕起伏的情节,以及相当燃血的打斗场面。这部余秀华说她的诗是中学生必读课,反对她就是反对教育,您怎么看?这几天我抽时间看头条上有些文章,我觉得头条上有一种怪现象,总爱抓出名的人的诗或文章来说事。有的人好像专业评审团,到处猎奇,先说郦波教授,既然已经退出了头条。在其它地方写了二首诗,也李现自曝家庭群聊天记录,群名称忘记打码,群内成员人数成亮点李现自曝家庭群聊天记录,群名称忘记打码,群内成员人数成亮点娱乐圈内一些比较出名的明星,不管是参加活动还是私下出行,都是备受网友关注的。近期就有网友发现李现就在社交平台发布了一件有意田亮女儿现状太过于完美,12岁身高近1米七,美貌与才华共存娱乐圈最近传出了不少好消息。热依扎通过在甄嬛传中扮演叶澜依这个角色被观众们所喜爱。最近她在微博上发了一张和女儿的合照。照片中,她抱着女儿脸上洋溢着幸福的笑容。不知网友们是否期待孩子网爆!林志玲患子宫癌住院近日,有网友透露林志玲患上子宫癌住院治疗的消息,有消息称,这段时间的黑泽良平心情十分低落,也替妻子难过。黑泽良平和林志玲因合作主演舞台剧赤壁爱而相识。此后,她们一直保持着友好的情谊破纪录!五一档总票房突破15。27亿新京报讯(记者周慧晓婉)据灯塔专业版数据显示,截至5月5日中午12点25分,今年五一档总票房突破15。27亿,总人次4034。22万,总场次225。31万。打破五一档票房人次场次三不老男神的迷之言论上热搜,不会说话的尴尬,三招教你破解图片源于网络前阵子林志颖因为迷之言论上热搜了,再次因为不会说话而被大众质疑。这位不老男神在微博发文,把他开工动土的金铲子放在床底有助于生孩子。作为有影响力的明星,这样迷惑言论内容因郭碧婷带娃出行,俩保姆一保镖护驾,向华强抱孙女溜滑梯童心未泯郭碧婷于去年10月生下女儿向芷(小奶皇)后,大部分时间留在台北照顾女儿。直至日前,郭碧婷终于产后复出现身活动,被发现双下巴明显,似乎还没修身成功。郭碧婷之所以这么快就复出,相信是获为什么说明星当中黄晓明和baby的婚礼是最累的黄晓明和baby的世纪婚礼可谓在当年轰动整个娱乐圈和婚庆界。当日在上海展览中心席开200桌,来现场祝贺的嘉宾足有3000多人,据说当时在娱乐圈混的有头有脸的人都来了,还有商业界广告41岁董璇维权获赔10万元,离婚后与前夫高云翔事业两极分化近日,董璇起诉某化妆品侵犯肖像权和姓名权终于有了结果,好消息传来,一审判决,董璇获赔10万元。董璇据悉,董璇维权案件中,某化妆品有限公司在并未在征得董璇同意下竟然将董璇作为形象代言现代明星们的婚姻为什么不是长久的?离婚是为了热搜或流量?公众号幸福的世界近日,赵丽颖离婚了,这件事直接上了热搜,我都惊呆了!这也太突然了吧,而且一点动静都没有就直接?????我还会偶然看到一些明星们离婚假新闻,但这次我看到了真实的,赵丽
已积攒3部待播剧后,baby又接新剧,得知男主身份熬夜也要追对于很多的明星而言,除了能有机会代言之外,大家最盼望的就是可以拍戏,因为很多当红的明星,都是靠着一部精彩的电视剧,才有了如今的热度和流量。身在娱乐圈,如果连部代表作都没有的话,肯定网传跑男10全新阵容,2位元老回归,小鲜肉皆退出引子跑男在大众心目中,一直是一代天花板,虽然节目是从韩国引进的,但国内的演员,也有极强的综艺效果,只是节目换人之后,少了一些当年的味道。跑男前四季是yyds,当时大家以为,只要老嘉郭德纲选拔钢男孩,称岳云鹏当不了队长,理由超搞笑引子相声是一门非常传统的艺术,小时候我们看相声,都是在春节联欢晚会上,长大后所有的内容,几乎都是德云社带给大家的。德云社能发展到现在,郭德纲的功劳真不小,他出名的时候,年纪已经不小兄弟堂真是卧虎藏龙,李亚鹏刚发文澄清,又有2位明星被扒引子自从林生斌翻车后,有关他的任何秘密,被网友接连扒出。虽然没有实际证据,但大家都很清楚,当年的纵火案,一定有没查清楚的疑点。自从妻子和孩子去世之后,林生斌生活仿佛按了归零键,没有因吃个桃桃被集体举报,风小逸被迫退网,他做错了什么?引子随着明星接连翻车,网红圈也频繁出现问题,人有钱就会变坏吗,还是人性本恶,只是在金钱的作用下,欲望被无限放大了?从吴亦凡被刑拘开始,霍尊因私生活不检点退圈,张哲瀚被全网封杀,钱枫曝林生斌和现任的孩子,已交给外婆照顾,宋祖德他的时间不多了引子林生斌和任真真,是这个夏天最令人的愤怒的人物,他们两个结婚之后,仍然利用朱小贞和孩子赚钱,其行为简直令人发指。朱小贞去世的那年,林生斌在网上最活跃,他卖掉了跟妻子一起打拼的公司心动4男一告白女四,遭14万cp粉围攻,网友你删得完?引子心动的信号4终于大结局了,之前的所有不确定,都已经知道了答案,这个时候最难过的,应该就是一直在嗑的cp粉了。虽然我们一直说,嗑cp不能太偏激,喜欢谁是嘉宾的事,可自己的cp被拆兜儿让小猪先生绑西瓜,体验十月怀胎,网友他比你懂引子网红在当今社会,已经成为社会一大毒瘤,原本是分享视频的平台,却成为这些人炒作赚钱的武器。随着直播带货的出现,很多网红购买低成本产品,用高价格卖出去,还骗网友是回馈粉丝,给大家发林生斌事件新进展,宋祖德称其已不能用手机,正义就要来了引子4年前的那场纵火案,牵扯出林生斌背后的故事,一个有出轨和家暴历史的男人,为什么能瞒过众人,被大众心疼甚至支持呢?当年火灾案发生后,林生斌调动全网网友,帮他一起发生,甚至喊话热门心动4男一女四晒亲密照,3处细节暗示,两人早已越界引子心动的信号4已经大结局,男一意外牵手女四,在理想型和兴趣型之间,他终于还是选择了后者。爱情总是令人患得患失,男一在两个女孩之间徘徊,让大家都非常不开心,直到节目最后一刻,女二都余生播出安排泄露,一周更新12集,等了2年两周就能看完?引子一部好的作品,除了演技和制作之外,还需要有好的宣传,如果宣传不到位,很有可能功亏一篑,得不到预期中的效果。一部作品的制作周期,在一年到一年半之间,再长成本就无法控制了。其实大部
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网