范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

MetaAI推出杂食者模型,搞定图像视频和3D三大分类任务

  1 月 24 日消息,最近,Meta AI 推出了这样一个"杂食者"(Omnivore)模型,可以对不同视觉模态的数据进行分类,包括图像、视频和 3D 数据 。
  比如面对最左边的图像,它可以从深度图、单视觉 3D 图和视频数据集中搜集出与之最匹配的结果。
  这在之前,都要分用不同的模型来实现;现在一个模型就搞定了 。
  而且 Omnivore 易于训练,使用现成的标准数据集,就能让其性能达到与对应单模型相当甚至更高的水平。
  实验结果显示,Omnivore 在图像分类数据集 ImageNet 上能达到 86.0% 的精度,在用于动作识别的 Kinetics 数据集上能达 84.1%,在用于单视图 3D 场景分类的 SUN RGB-D 也获得了 67.1%。
  另外,Omnivore 在实现一切跨模态识别时,都无需访问模态之间的对应关系。不同视觉模态都能通吃的"杂食者"
  Omnivore 基于 Transformer 体系结构,具备该架构特有的灵活性,并针对不同模态的分类任务进行联合训练。
  模型架构如下:
  Omnivore 会将输入的图像、视频和单视图 3D 图像转换为 embedding,并馈送到 Transformer 中 。
  虽然它可以使用任何 vision transformer 架构来处理 patch embedding,但鉴于 Swin transformer 在图像和视频任务上的强大性能,这里就使用该架构作为基础模型。
  具体来说,Omnivore 将图像转为 patch,视频转为时空 tube(spatio-temporal tube),单视图 3D 图像转为 RGB patch 和深度 patch。
  然后使用线性层将 patches 映射到到 embedding 中 。其中对 RGB patch 使用同一线性层,对深度 patch 使用单独的。
  总的来说,就是通过 embedding 将所有视觉模式转换为通用格式 ,然后使用一系列时空注意力(attention)操作来构建不同视觉模式的统一表示。
  研究人员在 ImageNet-1K 数据集、Kinetics-400 数据集和 SUN RGB-D 数据集上联合训练出各种 Omnivore 模型。
  这种方法类似于多任务学习和跨模态对齐,但有 2 点重要区别:
  1、不假设输入观测值对齐(即不假设图像、视频和 3D 数据之间的对应关系);
  2、也不假设这些数据集共享相同的标签空间(label space)。性能超 SOTA
  实验方面,首先将 Omnivore 与各视觉模态对应的特定模型(下表中指 Specific)进行比较。
  一共有三种不同的模型尺寸:T、S 和 B。
  预训练模型在七个下游任务上都进行了微调。
  图像特定模型在 IN1K 上预训练。视频特定模型和单视图 3D 特定模型均使用预训练图像特定模型的 inflation 进行初始化,并分别在 K400 和 SUN RGB-D 上进行微调。
  结果发现,Omnivore 在几乎所有的下游任务上的性能都相当于或优于各特定模型。
  其中尺寸最大的 Swin-B 实现了全部任务上的 SOTA。
  将 Omnivore 与具有相同模型架构和参数数量的特定模型比较也是相同的结果。
  其中 Omnivore 在 IN1K、K400 和 SUN 数据集上从头开始联合训练,而特定模态的模型针对每个数据集专门训练:
  ImageSwin 模型从零开始训练,VideoSwin 和 DepthSwin 模型则从 ImageSwin 模型上进行微调。
  接下来将 Omnivore 与图像、视频和 3D 数据分类任务上的 SOTA 模型进行比较。
  结果仍然不错,Omnivore 在所有预训练任务中都表现出了优于 SOTA 模型的性能 (下图从上至下分别为图像、视频和 3D 数据)。
  此外,在 ImageNet-1K 数据集上检索给定 RGB 图像的深度图也发现,尽管 Omnivore 没有接受过关于 1K 深度图的训练,但它也能够给出语义相似的正确答案。
  最后,作者表示,尽管这个"杂食者"比传统的特定模式模型有了很多进步,但它有一些局限性。
  比如目前它仅适用于单视图 3D 图像,不适用于其他 3D 表示 ,如体素图(voxels)、点云图等。
  论文地址:点击打开
  代码已开源:点击打开

百度发布小度智能音箱大金刚199元,可看电视IT之家7月3日消息2019年百度AI开发者大会今日举行,百度副总裁百度智能生活事业群组(SLG)总经理景鲲在现场发布了小度新品小度智能音箱大金刚,售价199元。据悉,大金刚为全球最高直降250元,石头扫地机器人年货节全网最全购买攻略IT之家1月11日消息最为2019年第一波超级大促,年货节旗舰,石头扫地机器人推出了最高直降250元直减活动,力度持平双12。小编总结了一份石头扫地机器人年货节全网最全购买攻略,有为啥IT男偏爱开发女性机器人?难道是异性相吸?随着科技的进步,AI机器人越来越多地出现我们的视线中。细心的你可能会发现,各国研发的人工智能机器人大都是女性形象,甚至有些国家的科研人员制作出了带有本国特色的美女机器人。日本真人C美媒DeepMind终极目标是通用AI,Alphabet无控制权据9to5Google报道,Alphabet旗下人工智能研究部门DeepMind宣称是人工智能研究的世界领先者,但其最终目标是通用人工智能(AGI)。而且,如果DeepMind能够新型苹果AppleWatch充电板附带可拆卸式USBC线缆IT之家12月20日消息配件制造商Satechi今天推出了一种新的AppleWatch充电板,该充电板带有可拆卸的USBC电缆,使其功能更加丰富。充电板配有USBC连接器,可以将其MIT最新AI研究,让机器人利用触觉感知物体麻省理工学院计算机科学及人工智能实验室(CSAIL)的研究人员表示,在不久的将来,机器人将能够通过触觉来感知物体。一篇最新的相关论文将于下周在加利福尼亚长滩市的计算机视觉与模式识别谷歌首席决策科学家AI难免犯错,唯有人类可以悬崖勒马CassieKozyrkov在过去五年里在谷歌担任过各种各样的技术职务,但她现在担任着首席决策科学家这个有点奇怪的职位。决策科学是数据和行为科学的交叉学科,涉及统计学机器学习心理学不止iPhone可折叠,苹果要让AppleWatch的屏幕变表带2月19日下午消息,世界专利局展示了苹果公司一项新专利,该专利用于AppleWatch,利用柔性屏幕让手表的表盘和表带都可以作为显示屏。柔性屏幕延伸到表带这项专利描述的是如何将柔性2000亿次训练,只为能让AI自学新游戏据外媒报道,OpenEndedLearningTeam(开放式学习小组)在Deepmind的Blog上发表了一篇关于训练一个无需与人类交互数据就能玩不同游戏的AI智能体(AIage原日本LINE集团员工入职小冰公司目标为创造AI虚拟员工原标题打工人得努力了呀!AI虚拟人都要入职了7月28日消息,万万没想到,一名员工入职的目的竟然会是创造另一位员工。入职为了造同事他叫中村浩树,之前在日本LINE集团担任AI负责人。中国高校竟有两个智能专业人工智能与智能科学与技术有何不同2021年,全国已经有215所高校开设了人工智能本科专业,可谓是盛况空前。今年高考之后,有很多读者询问我们AI专业的志愿填报院校选择和就业前景等等问题。其中有这样一个问题,不少朋友
鸿蒙手表来了,华为宣布重启旗舰系列WATCH3归来IT之家5月27日消息今日早间,华为官方宣布,华为WATCH3旗舰归来。并称万物皆鸿蒙。腕上智慧,一表万象。IT之家了解到,这也是将于6月2日召开的发布会中首款官宣的鸿蒙新品。此前小米电视上的小爱同学粤语功能正式上线IT之家2月5日消息小米电视官微今日宣布,小米电视上的小爱同学粤语功能正式上线。IT之家了解到,电视版小爱粤语方言功能支持粤语识别与粤语回复,超过20000句符合粤语文化的常用话语小米公开智能家电互联相关专利可避免各商家之间存在争议IT之家6月9日消息据企查查App显示,小米公司在6月8日公开了智能家电设备接入多个服务器的方法装置及系统专利,公开号为CN112929247A。专利摘要显示,本公开属于智能设备领IT之家开箱魅族全智能手表MEIZUWatch图赏一体式无断点设计IT之家5月31日消息今日下午,在魅族的智能生活发布会上,魅族全智能手表MEIZUWatch正式发布,搭载基于安卓独立开发的FlymeforWatch,采用高通骁龙Wear4100一文看懂魅族的智能生活发布会MEIZUWatch亮相,Lipro正式开始接入华为生态IT之家5月31日消息今日下午,魅族召开智能生活发布会,正式发布了全智能手表MEIZUWatch与LiproLED智能吸顶灯等新品。魅族全智能手表MEIZUWatchMEIZUWa魅族LiproLED智能吸顶灯发布Ra97显色超薄设计,499元起IT之家5月31日消息魅族智能生活发布会今日下午召开,魅族MEIZUWatch智能手表正式发布。除了这款产品,魅族智能家居品牌Lipro也发布了多款灯具新品,包含筒灯智能吸顶灯开关1499元,魅族全智能手表MEIZUWatch正式发布全系标配eSIM,搭载FlymeforWatchIT之家5月31日消息今日下午,在魅族的智能生活发布会上,魅族全智能手表MEIZUWatch正式发布,搭载基于安卓独立开发的FlymeforWatch,采用高通骁龙Wear4100萤石RK2儿童陪护机器人发布36项语音交互,1499元起IT之家2月28日消息在今日下午召开的发布会上,萤石发布了RK2儿童陪护机器人。这款产品面向49岁儿童,能够进行丰富的娱乐效果绘本阅读以及视频通话。机器人采用履带行进,头部手臂可运萤石今日召开新品发布会,将推出扫地机器人等多款产品IT之家2月28日消息今日下午1400,萤石将召开2021萤石智能机器人新品发布会。届时,萤石智能云视觉扫地机器人萤石儿童陪护机器人RK2萤石儿童可视手表KW2等产品将正式发布。资Spot机器人背上彩弹枪惹怒波士顿动力这是挑衅性使用,再这样做将不给保修2月25日消息,据报道,近期,波士顿动力的四足机器人Spot被加上彩弹枪,用在美国一家虚拟美术馆的艺术装置中。然而,波士顿动力对这样的设计表示批评,称这是对Spot机器人的挑衅性使三星一大波电视新品上线技术革新,设计前卫,大秀肌肉3月22日,三星面向国内市场发布了旗下MicroLEDNeoQLED和Lifestyle三个系列的电视新品,这些产品此前在CES2021上已经亮相,本次发布意味着他们进入国内市场。