范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

训练CV模型新思路来了用NLP大火的Prompt替代微调,性能全面提升

  Prompt tuning,作为 NLP 领域中的一个"新宠",甚至曾被学者誉为 NLP 预训练新范式。那么,它能否借鉴到 CV 领域并产生同样的成绩呢?
  现在,来自康奈尔大学和 Meta AI 等机构,通过 Prompt 来调整基于 Transformer 的视觉模型,结果发现:完全可以!
  比起全面微调,Prompt 性能提升显著。无论模型的规模和训练数据怎么变,24 种情况中有 20 种都完全胜出。
  与此同时,它还能大幅降低每项任务所需的存储成本。
  只使用不到 1% 的模型参数
  大家一贯使用的全面微调(full fine-tuning),需要为每个下游任务存储和部署单独的主干参数副本,成本太高,尤其是现在基于 Transformer 的模型越来越大,已经超过 CNN 架构。
  所谓 Prompt,最初指的是在输入文本中预编语言指令,以便预培训的语言模型后续可以直接理解各种下游任务。它曾让 GPT-3 即使在少样本或零样本的情况下表现出很强的泛化能力。
  最近一些成果则表明,Prompt 与完全微调的性能相当,参数存储量还减少了 1000 倍。NLP 中的高超性能让不少人开始在 CV 领域中探索 Prompt 的魔力,不过都只局限于跨模态任务中文本编码器的输入。
  在本文中,作者将他们所提出的 Visual Prompt Tuning 方法,简称为 VPT。这是首次有人将 Prompt 应用到视觉模型主干(backbone),并做出成果。具体来说,比起全面微调,VPT 受最新大型 NLP 模型调整方法的启发,只在输入空间中引入少量可特定某任务训练的参数(不到模型参数的 1%),同时在训练下游任务期间冻结(freeze)预训练模型的主干。
  在实操中,这些附加参数只用预先加入到每个 Transformer 层的输入序列中,并在微调期间与线性 head 一起学习。
  他们一共探索出两种变体:
  VPT-Deep 变体为 Transformer 编码器每层的输入预先设置一组可学习的参数;
  VPT-Shallow 变体则仅将提示参数插入第一层的输入。
  两者在下游任务的训练过程中,只有特定于任务的提示和线性头的参数会更新,而整个 Transformer 编码器被冻结。
  接下来,是骡子是马?拉出来溜溜~20/24 的优胜率
  实验涉及两种在 ImageNet-21k 上预训练好的主干,一个来自 Vision Transformer,一个来自 Swin Transformer。
  进行对比的微调方法有三大种,7 小种,包括:
  (1)完全微调:更新所有主干和分类头(classification head)参数
  (2)以分类头为重点的微调,包括 Linear、Partial-k 和 Mlp-k 三种;
  (3)以及在微调过程中更新一个主干子集参数或向主干添加新的可训练参数的方法,分为 Sidetune、Bias 和 Adapter 三种。
  实验的数据集有两组,一共涉及 24 个跨不同领域的下游识别任务,包括:
  (1)由 5 个基准细粒度视觉分类任务组成的 FGVC;
  (2)由 19 个不同视觉分类集合组成的 VTAB-1k,细分为使用标准相机拍摄的自然图像任务(Natural)、用专用设备(如卫星图像)捕获的图像任务(Specialized)以及需要几何理解的任务(Structured),比如物体计数。
  测得每项任务上的平均准确度后,得出的主要结果如下:
  VPT-Deep 在 24 个任务中有 20 个的表现都优于全面微调,同时使用的总模型参数显著减少(1.18× vs. 24.02×);
  要知道,在 NLP 领域中 Prompt 再厉害,性能也不会超过全面微调。这说明 Prompt 很适用于视觉 Transformer 模型。和其他微调方法相比(b、c 组),VPT-Deep 的性能则全部胜出。
  此外,选择不同主干参数规模和模型规模的 ViT(ViT-B、ViT-L 和 ViT-H)进行测试还发现,VPT 方法不会受影响,依然基本保持性能领先。
  而在 Swin Transformer 中,全面微调法的平均准确度虽然更高,但也付出了巨大的参数代价。其他微调方法则全部不敌 VPT。
  作者介绍
  一作贾梦霖,康奈尔大学信息科学(Information Science)博士生,主要研究方向为视觉和文本信息的细粒度识别,截至目前共发表过 4 篇顶会。
  共同一作为唐路明,也是康奈尔大学的一位计算机博士在读学生,本科毕业于清华大学数学与物理专业。
  他的主要研究方向为机器学习和计算机视觉的交叉领域。
  论文地址:
  https://arxiv.org/abs/2203.12119

腾讯回应合并搜狗看点招聘及搜狗合并均正常进行IT之家9月22日消息针对媒体报道的腾讯或将于本周正式宣布合并搜狗,腾讯看点将吸收绝大部分搜狗业务和员工传闻,腾讯方面对新京报回应称,看点的招聘以及与搜狗团队的合并都在正常进行。I腾讯公司申请微信一脸通等多款商标IT之家9月17日消息企查查App显示,近日,腾讯科技(深圳)有限公司申请注册多个微信支付刷脸通微信人脸通微信一脸通等相关商标,国际分类涉及餐饮住宿设计研究等,当前商标状态均为申请腾讯宣布微信外链规范调整坚持用户为本,将更多选择权交给用户,今日起开放一对一场景访问限制IT之家9月17日消息近期,工信部对外链管理提出了专项指导意见。微信现宣布,将落实以安全为底线的互联互通,为确保高质量的平台内容和良好的用户体验,整体遵循如下外链开放原则1防止出现电动车太危险,北京市交通委拟明确乘客不得带电动车等进地铁IT之家9月3日消息据北京日报,由于近期来一直受到社会高度关注,再加上乘客投诉建议禁止电动车等进入地铁。北京市交通委拟对北京市轨道交通乘客守则第六条第十四条等相关内容进行修改,明确告别全员换乘,北京地铁1号线八通线合二为一感谢IT之家网友打工轨道人的线索投递!IT之家8月30日消息感谢IT之家网友打工轨道人的线索投递,据北京地铁消息,8月29日首班车起,北京地铁1号线八通线两条线路将正式合二为一,开工信部发布新一期免征购置税新能源车型目录比亚迪海豚华为智选SF5等在列IT之家7月13日消息工信部现发布免征车辆购置税的新能源汽车车型目录(第四十四批),理想ONE小鹏P5N5等在列。IT之家了解到,这一批名单中还包括哪吒多款车型比亚迪海豚比亚迪EA上海计划三年内新建电动汽车充电桩超过5万个智能快件箱1。2万组IT之家7月11日消息昨日,2021世界人工智能大会正式落幕。上海市城市数字化转型工作领导小组办公室发布了推进上海生活数字化转型构建高品质数字生活行动方案(20212023年)。其马斯克今日出庭,为收购其堂弟创立的全美最大太阳能发电公司SolarCity作辩护北京时间7月12日晚间消息,据报道,特斯拉CEO埃隆马斯克(ElonMusk)预计今日将出席一场庭审,为特斯拉在2016年收购太阳能电池板公司SolarCity交易进行辩护。这场庭马斯克遭特斯拉股东起诉,被指以权谋私收购SolarCity一群特斯拉股东认为电动汽车制造商特斯拉收购太阳能板制造商SolarCity存在违规操作,并以此向法庭提起诉讼。本周一案件将在特拉华州威尔明顿的衡平法院(CourtOfChancer马斯克终将Twitter拥入怀中,发布推文Yesss!!!表达喜悦北京时间4月26日早间消息,据报道,Twitter周一宣布,该公司董事会已接受亿万富翁埃隆马斯克(ElonMusk)440亿美元收购并将其私有化的提议。马斯克以每股54。20美元的马斯克440亿美元收购终于如愿以偿,但买下Twitter后还有这些问题要解决新北京时间4月26日早间消息,据报道,Twitter董事会今日同意了特斯拉首席执行官马斯克提出的440亿美元的收购要约。事件有了重大进展,但是接下来,这位全世界最富有的人将会对他最
三星夏普重修旧好,下半年重新采购约300万片电视面板IT之家4月8日消息由于三星显示(SamsungDisplay)此前宣布将于2020年12月底关闭LCD生产线,终止所有LCD产品的供应,此举带来涟漪效应。据DigiTimes报道雀巢中国与小米战略合作发布雀巢健康管家Nesfinity1月20日消息,今天,雀巢中国宣布与小米达成战略合作,并正式发布了双方共同打造的雀巢健康管家Nesfinity。据介绍,雀巢健康管家是一个智能互联时代的生态体系,覆盖雀巢旗下全品牌米聊十年,黯然退场昨日,张小龙和雷军,一边欢喜一边惆怅。在微信公开课PRO上,张小龙意气风发,用视频号开启微信下一个十年。而诞生在微信之前的即时通讯工具米聊,却黯然退场。昨日下午,小米旗下米聊发布公发力企业端英特尔宣布成为亚马逊AWS高性能计算能力合作伙伴IT之家3月2日消息今日,英特尔宣布已达到亚马逊网络服务(AWS)高性能计算(HPC)能力条件。该认证认可英特尔是可信赖的合作伙伴,可通过AWS的弹性和可扩展云基础架构为其客户提供TrendForce英特尔将Corei3外包给台积电5nm制程IT之家1月21日消息市场研究公司TrendForce近日发布的一份报告表示,台积电(TSMC)将在今年下半年开始采用5nm工艺生产英特尔的Corei3芯片。在此之前,英特尔充分证国产芯片再突破全球首款RISCVAI单板PC发布IT之家1月13日消息今日,RISCV处理器供应商赛昉科技发布了2021年首款重磅产品星光AI单板计算机(BeagleV),这是全球首款基于Linux操作系统的RISCVAI单板计高通正式推出骁龙8705G移动平台摩托罗拉小米OPPOiQOO一加新机即将发布IT之家1月19日消息,高通今日晚间正式宣布推出高通骁龙8705G移动平台,即为此前传言已久的骁龙865Plus移动平台的再升级产品。该芯片采用了增强的高通Kryo585CPU核心赵明荣耀目前有8000多名员工,未来将走向中高端IT之家1月22日消息目前荣耀V40发布会正在举行,这也是脱离华为之后,荣耀的第一场新品发布会。荣耀终端有限公司CEO赵明在发布会上表示,独立后的荣耀目前有8000多名员工,50以AMD苏姿丰索尼微软游戏主机芯片需求超出预期,AMD与两方合作都很好IT之家1月20日消息AMDCEO苏姿丰在CES2021期间举办了演讲,发布了多款新品,此后她接受了外媒VentureBeat采访。在采访中,她表示震惊于PS5XboxSeries华为申请NOVAWatch商标,暗示华为有望推出Nova系新品感谢IT之家网友肖战割割的线索投递!IT之家1月18日消息感谢IT之家网友热心线索投递,华为在1月11日申请了一个NOVAWatch商标,现处于申请中状态。华为Nova是华为科技有宁德时代网招称年终订单暴涨不回家过年一线工人月收入将达13100元IT之家1月12日消息据财联社报道,在某招聘网站上发现,宁德时代工人招聘中心官方账号发布多条与生产制造相关的岗位招聘信息。职位描述称因年终订单暴涨,为鼓励大家春节继续留守加班工作,