范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

首次超越人类读图会意这件事,AI比你眼睛更毒辣

  在超越人类这件事上,AI 又拿下一分。
  就在最近,国际权威机器视觉问答榜单 VQA Leaderboard,更新了一项数据:
  AI 在"读图会意"任务中,准确率达到了 81.26%。
  要知道,我们人类在这个任务中的基准线,也才 80.83%。
  而解锁这一成就的,是来自阿里巴巴达摩院团队的 AliceMind-MMU。
  而此举也就意味着,AI 于 2015 年、2018 年分别在视觉识别和文本理解超越人类之后,在多模态技术方面也取得了突破!AI 比你更会看图
  这个 AI 有多会看图?
  来看下面几个例子就知道了。
  当你问 AI:"这些玩具用来做什么的?"
  它就会根据小熊穿的礼服,回答道:
  婚礼。
  给 AI 再提一个问题:"男人的橄榄球帽代表哪只球队?"
  它会根据帽子中的"B"字母回答:
  波士顿球队。
  加大挑战难度再来一个。
  "图中玩具人的 IP 出自哪部电影?"
  这时候,AI 就会根据图中的玩具,还有战斗场景等信息,做一个推理。
  不过最后还是精准的给出了答案:
  星球大战。
  再例如下面这些例子中,AI 都会捕捉图片中的细节信息,来精准回答提出的问题。
  嗯,可以说是细致入微了。怎么做到的?
  可能上面的这些案例,对于人类来说并不是很困难。
  但对于 AI 来说,可不是件容易的事情。
  一个核心难点就是:
  需要在单模态精准理解的基础上,整合多模态的信息进行联合推理认知,最终实现跨模态理解。
  怎么破?
  阿里达摩院的做法是,对 AI 视觉-文本推理体系进行了系统性的设计,融合了大量的创新算法。
  具体来看,大致可以分为四个内容:
  多样性的视觉特征表示:从各方面刻画图片的局部和全局语义信息,同时使用 Region,Grid,Patch 等视觉特征表示,可以更精准地进行单模态理解;
  基于海量图文数据和多粒度视觉特征的多模态预训练:用于更好地进行多模态信息融合和语义映射,提出了 SemVLP、Grid-VLP、E2E-VLP 和 Fusion-VLP 等预训练模型。
  自适应的跨模态语义融合和对齐技术:在多模态预训练模型中加入 Learning to Attend 机制,来进行跨模态信息地高效深度融合。
  Mixture of Experts (MOE)技术:进行知识驱动的多技能 AI 集成。
  据了解,模型中涉及技术还得到了专业的认可。
  例如多模态预训练模型 E2E-VLP,已经被国际顶级会议 ACL2021 接受。
  关于 VQA
  VQA,可以说是 AI 领域难度最高的挑战之一。
  而对于单一 AI 模型来说,VQA 考卷难度堪称"变态"。
  在测试中,AI 需要根据给定图片及自然语言问题,生成正确的自然语言回答。
  这意味着单个 AI 模型,需要融合复杂的计算机视觉及自然语言技术:
  首先对所有图像信息进行扫描。
  再结合对文本问题的理解,利用多模态技术学习图文的关联性、精准定位相关图像信息。
  最后根据常识及推理回答问题。
  但解决 VQA 的挑战,对研发通用人工智能具有重要意义。
  因此,全球计算机视觉顶会 CVPR 从 2015 年起连续 6 年举办 VQA 挑战赛。
  吸引了包括微软、Facebook、斯坦福大学、阿里巴巴、百度等众多顶尖机构参与。
  同时,也形成了国际上规模最大、认可度最高的 VQA 数据集,其包含超 20 万张真实照片、110 万道考题。
  据了解,今年 6 月,阿里达摩院在 VQA 2021 Challenge 的 55 支提交队伍中夺冠,成绩领先第二名约 1 个百分点、去年冠军 3.4 个百分点。
  而仅仅在 2 个月后的今天,达摩院再次以 81.26% 的准确率创造 VQA Leaderboard 全球纪录。
  达摩院对此评价道:
  这一结果意味着,AI 在封闭数据集内的 VQA 表现已媲美人类。

小米米家智能插座WIFI版发布支持小爱同学IT之家12月10日消息近日,小米发布了一款小米米家智能插座WiFi版,售价为49元(在上一代基础上直降10元),将于12月12日0点在小米商城有小米有品小米天猫旗舰店同步开售。米小米手表Color现已支持自主设置抬腕亮屏灵敏度感谢IT之家网友渊衡的线索投递!IT之家1月22日消息据IT之家网友分享,小米手表Color现已推送V1。2。220固件更新,新增抬腕亮屏设置,用户可自主选择抬腕亮屏灵敏度。小米手天猫精灵糖粉计划,初尝糖和粉共创的甜智能音箱智能语音助手音箱?智能音箱普遍认为是未来物联网时代智能家居的中枢,现阶段,这样定义智能音箱似乎也没什么不妥,毕竟眼下貌似大多数智能音箱设备还是这种思路下的产物。而在上周(4天猫精灵新品将至,Connect和Care背后不止AIoT日前,IT之家收到了一封发布会邀请函,来自阿里巴巴人工智能实验室,而这场发布会是天猫精灵2019春季新品发布会,主题为ConnectampCare。有意思的是,这次天猫精灵2019三星GalaxyFit上架美国官网,售价99。99美元IT之家6月15日消息今日,三星智能手环GalaxyFit已悄然上架美国官网,采用0。95英寸AMOLED全彩色显示屏,120x240分辨率,配备大猩猩玻璃保护显示屏,售价99。9华为预热新品563。X,1月24日见IT之家1月23日消息今日,华为智选官方微博放出一张海报,配文563。X?是新品的味道!2019年1月24日,为你揭晓!从海报上给出的信息,我们可以做个合理的推测,当然官方没有给出AI不是科幻电影里的洪水猛兽,而是被慢慢变革的生活方式清晨温柔的阳光伴着手机里闹腾的波尔卡舞曲将小编从睡梦中拉醒,透过惺忪的双眼,小编发现今天手机闹铃比以往迟响了15分钟,但小编并不慌,因为前一天晚上小编已经看到了手机主动推送的预测今谷歌和微软的人工智能实力哪家强?微软和谷歌母公司Alphabet均在机器学习这一前沿软件领域扮演重要角色。但谷歌手握着当下最流行的机器学习框架TensorFlow,让其在与微软的竞争中占据了优势。微软和Alpha谷歌提交智能手表专利申请可仅在用户佩戴时显示私人信息IT之家7月29日消息通过基于生物特征的锁定系统,智能手机的丢失已经不容易导致敏感信息泄露。但如今可穿戴设备还无法达到类似的保护程度。据外媒MSPoweruser报道,谷歌近期提交招聘全靠AI?公司不倒才怪2014年,亚马逊推出了一项新的招聘算法,以帮助它找到最佳的求职者。实验一年后,公司发现该工具对女性存在偏见,于是悄悄地关闭了这个项目。去年10月,当路透社爆料此事时,领英人才解决新AI技术能够预测人将来衰老后的样子据快公司(FastCompany)网站报道,一篇有关机器学习的最新论文显示,人工智能(AI)可以让我们提前看到将来自己衰老后的样子。衰老是我们所有人的自然成长过程。但有了人工智能,
苹果AppleWatch7屏幕盖板将更薄,支持UWB超宽带技术IT之家6月14日消息苹果将于今年推出AppleWatchSeries7,根据彭博社消息,有爆料者透露这款手表将会采用不同的外观设计,使用更薄的蓝宝石屏幕盖板,使得显示屏更接近表层苹果watchOS8正式发布睡眠呼吸频率监测,聊天可发GIF动图IT之家6月8日消息在今晚召开的WWDC2021大会,苹果正式发布专为AppleWatch智能手表设计的新系统watchOS8。新系统将多个内置应用进行增强,此外新增了睡眠呼吸频率Facebook推出VR广告后,Oculus软件开发商临阵脱逃IT之家6月22日消息上周,Facebook宣布将开始测试在其Oculus虚拟现实设备的系统中投放广告。在未来几周内,广告将开始出现在ResolutionGames工作室推出的VR杭州上线宠物鼻纹身份证,有望成为国内首个数字养宠城市IT之家1月26日消息据中央广播电视总台中国之声新闻晚高峰报道,杭州已经正式上线宠物鼻纹身份证。城管部门首次在犬证办理中引入宠物鼻纹识别技术,试点区域内的市民只需在支付宝中上传狗狗199元,小米AI音箱第二代明日开售内置蓝牙Mesh网关,支持组合立体声IT之家4月15日消息最新发布的小米AI音箱第二代内置蓝牙Mesh网关,支持组合立体声,预售价199元,将于明日正式开售。IT之家了解到,小米AI音箱第二代内置蓝牙Mesh网关,能一加手表通过印度BIS认证,将有两种型号IT之家1月25日消息据外媒gsmarena报道,一加手表已经通过了印度BIS认证。从图中可以看出,一加手表共分为两种型号W501GB和W301GB,外媒预测分别为WiFi版本和L挖洞机器人登Science子刊封面,秀超强喷气遁地术6月17日消息,据美国每日科学(ScienceDaily)报道,极端环境下的机器人研究又有新进展。最新一期科学机器人杂志封面刊登,加利福尼亚大学圣塔芭芭拉分校和佐治亚理工学院研究人麻省理工新研究机器人挑战杂技,神似站立机器狗6月10日消息,据美国科技媒体IEEESpectrum报道,近日,麻省理工SangbaeKim实验室的研究人员最新设计了一款名为MITHumanoid的人形机器人,这种机器人形似迷三星新增四款手机和平板获谷歌ARCore认证可保证流畅运行增强现实应用IT之家6月22日消息据外媒SamMobile报道,三星在过去的几个月里推出了几十款新的手机和平板,但并不是所有的设备都支持谷歌的ARCore,三星计划逐步将ARCore扩展到其所智能家居新战局华为冲锋,百度呐喊,恒大碧桂园不服智能家居市场正在进入新一轮角逐时刻,火拼的焦点是全屋智能。2021年开年以来,以碧桂园恒大高科为代表的房地产商,以海尔格力为代表的家电厂商,以百度华为为代表的互联网及通信巨头纷纷加深圳大学和特拉维夫大学最新成果,AI编辑人脸终于告别P一处而毁全图Attentionisallyouneed!这句名言又在新的领域得到了印证。来自深圳大学和特拉维夫大学的最新成果,通过在GAN中引入注意力机制,成功解决了编辑人脸时会产生的一些手抖