范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

首次超越人类读图会意这件事,AI比你眼睛更毒辣

  在超越人类这件事上,AI 又拿下一分。
  就在最近,国际权威机器视觉问答榜单 VQA Leaderboard,更新了一项数据:
  AI 在"读图会意"任务中,准确率达到了 81.26%。
  要知道,我们人类在这个任务中的基准线,也才 80.83%。
  而解锁这一成就的,是来自阿里巴巴达摩院团队的 AliceMind-MMU。
  而此举也就意味着,AI 于 2015 年、2018 年分别在视觉识别和文本理解超越人类之后,在多模态技术方面也取得了突破!AI 比你更会看图
  这个 AI 有多会看图?
  来看下面几个例子就知道了。
  当你问 AI:"这些玩具用来做什么的?"
  它就会根据小熊穿的礼服,回答道:
  婚礼。
  给 AI 再提一个问题:"男人的橄榄球帽代表哪只球队?"
  它会根据帽子中的"B"字母回答:
  波士顿球队。
  加大挑战难度再来一个。
  "图中玩具人的 IP 出自哪部电影?"
  这时候,AI 就会根据图中的玩具,还有战斗场景等信息,做一个推理。
  不过最后还是精准的给出了答案:
  星球大战。
  再例如下面这些例子中,AI 都会捕捉图片中的细节信息,来精准回答提出的问题。
  嗯,可以说是细致入微了。怎么做到的?
  可能上面的这些案例,对于人类来说并不是很困难。
  但对于 AI 来说,可不是件容易的事情。
  一个核心难点就是:
  需要在单模态精准理解的基础上,整合多模态的信息进行联合推理认知,最终实现跨模态理解。
  怎么破?
  阿里达摩院的做法是,对 AI 视觉-文本推理体系进行了系统性的设计,融合了大量的创新算法。
  具体来看,大致可以分为四个内容:
  多样性的视觉特征表示:从各方面刻画图片的局部和全局语义信息,同时使用 Region,Grid,Patch 等视觉特征表示,可以更精准地进行单模态理解;
  基于海量图文数据和多粒度视觉特征的多模态预训练:用于更好地进行多模态信息融合和语义映射,提出了 SemVLP、Grid-VLP、E2E-VLP 和 Fusion-VLP 等预训练模型。
  自适应的跨模态语义融合和对齐技术:在多模态预训练模型中加入 Learning to Attend 机制,来进行跨模态信息地高效深度融合。
  Mixture of Experts (MOE)技术:进行知识驱动的多技能 AI 集成。
  据了解,模型中涉及技术还得到了专业的认可。
  例如多模态预训练模型 E2E-VLP,已经被国际顶级会议 ACL2021 接受。
  关于 VQA
  VQA,可以说是 AI 领域难度最高的挑战之一。
  而对于单一 AI 模型来说,VQA 考卷难度堪称"变态"。
  在测试中,AI 需要根据给定图片及自然语言问题,生成正确的自然语言回答。
  这意味着单个 AI 模型,需要融合复杂的计算机视觉及自然语言技术:
  首先对所有图像信息进行扫描。
  再结合对文本问题的理解,利用多模态技术学习图文的关联性、精准定位相关图像信息。
  最后根据常识及推理回答问题。
  但解决 VQA 的挑战,对研发通用人工智能具有重要意义。
  因此,全球计算机视觉顶会 CVPR 从 2015 年起连续 6 年举办 VQA 挑战赛。
  吸引了包括微软、Facebook、斯坦福大学、阿里巴巴、百度等众多顶尖机构参与。
  同时,也形成了国际上规模最大、认可度最高的 VQA 数据集,其包含超 20 万张真实照片、110 万道考题。
  据了解,今年 6 月,阿里达摩院在 VQA 2021 Challenge 的 55 支提交队伍中夺冠,成绩领先第二名约 1 个百分点、去年冠军 3.4 个百分点。
  而仅仅在 2 个月后的今天,达摩院再次以 81.26% 的准确率创造 VQA Leaderboard 全球纪录。
  达摩院对此评价道:
  这一结果意味着,AI 在封闭数据集内的 VQA 表现已媲美人类。

三星为GalaxyWatch4推出环保表带,使用苹果皮制成IT之家9月11日消息三星宣布为GalaxyWatch4推出六款限量版表带,由可回收和环保材料制成,包括苹果皮。该系列是与SamiMir合作制作的,SamiMir是一位时装设计师,49元,小米电子温湿度计开启众筹支持磁吸,可存储温湿度数据IT之家9月22日消息今日,小米电子温湿度计在小米商城开启众筹,零售价59元,众筹价49元。小米电子温湿度计选用了35mm35mm的电子墨水屏作为显示屏,内置瑞士Sensirion手机智能语音助手为何离我们越来越远了你或许幻想过,拥有一个像电影钢铁侠贾维斯一样的AI管家,它可以进行独立思考,还能帮你处理各种生活事务。随着时间的推移,人工智能技术已经化身为手机语言助手出现在我们的生活中。我们熟悉中兴发布YouCare5G智慧T恤可监测多项体征指标IT之家6月29日消息在昨日举行的MWC2021世界移动通信大会的首日,中兴通讯与ACCYOURATE联合发布了YouCare5G智慧T恤。中兴智慧T恤的介绍视频IT之家了解到,这小米手环6官宣实现全面屏,将于29日发布会亮相IT之家3月27日消息小米将于3月29日晚1930举办发布会,预计会有小米11ProUltra小米MIX笔记本等产品亮相,官方表示可能是有史以来新品最多的一次发布会。今日小米智能生华为WatchGT2现已支持从iOS手机的运动健康应用下载更换新表盘感谢IT之家网友百慕大的冰的线索投递!IT之家4月30日消息据IT之家网友反馈,华为WatchGT2现已推送1。0。12。20版本固件,支持从iOS手机的运动健康应用下载更换新表盘脑机结合,你准备好成为超人了吗?脑机接口可以给人类带来什么呢?恢复失去的能力?超越过去的潜能?新纪录片我是人类记录了神经技术如何帮助人们恢复视力重新训练身体和治疗疾病然后让我们所有人都变得更加强大。一个下雨天,比红魔手表精钢版发布续航20天搭载GPS,599元IT之家5月27日消息红魔游戏手机于今日下午举办发布会,正式发布了腾讯红魔6R游戏手机。与此同时,红魔还带来了红魔手表的精钢版,质感升级,售价依旧维持在599元。这款产品配备了可调小米MIX4一指连伴侣将于8月20日在小米社区App开启0元众测IT之家8月10日消息今日晚间,小米举办2021雷军年度演讲,同时正式发布了全面屏手机小米MIX4。小米MIX4手机搭载了UWB一指连技术。据小米官方介绍,UWB频宽高达500MH郭明錤苹果AppleWatchS7外观大变,首次采用平边和窄边框设计,9月发布与量产IT之家9月10日消息今日下午,天风国际分析师郭明錤发布报告称,市场担忧AppleWatchS7因面临生产问题而无法如期在9月发布与量产,且因出货不足导致组装厂商立讯的AppleW揭秘奥运冲浪首金AI当教练,还筛选出最佳比赛地点8月3日消息,今年的东京奥运会中首次加入了冲浪这一比赛项目。上周二美国冲浪运动员CarissaMoore在女子冲浪比赛中夺冠,取得了奥运史上的首枚冲浪项目的金牌。据华尔街日报报道,
华米科技黄汪第三代可穿戴自研芯片将很快推出1月29日晚间消息,在今日的极客公园创新大会2021上,华米科技创始人董事长兼CEO黄汪透露,华米科技自研的第三代可穿戴芯片将很快推出。华米科技是小米生态链企业,早期打造了小米手环华为公开人机对话相关专利可根据对话内容生成准确回复IT之家2月27日消息2月26日,华为技术有限公司公开一项名为一种人机对话的方法和装置的专利,公开号CN108319599B,申请日期为2017年1月。IT之家了解到,该方法应用于小米发布米家高速吹风机H700铝合金一体机身LCD彩屏,众筹价699元IT之家12月14日消息,今日上午,小米宣布推出米家高速吹风机H700,零售价799元,众筹价699元,将于12月15日上午1000开启众筹。设计方面,米家高速吹风机H700采用铝小米米家App7。0体验版新增全屋智能控制中心,所有模块均支持设备的显示和控制感谢IT之家网友软媒用户61330的线索投递!IT之家12月14日消息,小米米家App现已向部分用户推送7。0体验版更新,新增全屋智能控制中心,可在设置中开启。IT之家了解到,米家谷歌人工智能DeepMind,高中数学考了个不及格IT之家4月13日消息我们在许多新闻报道里见识过了人工智能(AI)的厉害。谷歌的AlphaGo曾先后击败了李世石柯洁两位顶尖棋手,拿下了围棋这个人类一直以来占据着优势的项目。图自PAI也会查百度了,OpenAI新成果让GPT3回答开放式问题12月17日消息,本周四,OpenAI基于AI模型GPT3发布了WebGPT,该模型可在线搜索问题组织答案,并添加引用来源,更准确地回答开放式问题。在回答问题时,WebGPT可以通皮克斯技术指导辞职读博研究AI设计怪物,从游戏王卡牌开始让AI画人脸见得多了,要是让AI画个幻想中的怪物又如何?来看几个,先是人形的再来个兽形的还有诡异到说不出来属于什么型的你可能会问,这很难吗?毕竟现在用GAN生成人脸都能以假乱真,生报告全球各企业AI预算较去年大幅增长55,数据变得比算法更重要IT之家8月29日消息据外媒美通社报道,训练数据提供商AppenLimited在近日发布了第七份人工智能与机器学习现状年度报告。报告显示,全球各企业AI预算金额范围从50万美元至5失败者还是啦啦队长?AI能识别自拍照给人分类早在2009年,美国斯坦福大学和普林斯顿大学的科学家就曾提出设想,希望教授计算机识别世界上的任何物体。为了实现这个目标,他们需要很多图片,除了猫狗苹果叉子勺子等,还需要无数人类的图京东陶大程超级模型生态系统将引领新一轮产业变革7月8日消息,2021世界人工智能大会第八届中国产业互联网高峰论坛上,澳大利亚科学院院士京东探索研究院院长陶大程博士表示,超级模型生态系统引领新一轮产业变革。陶大程博士认为,通过构开发者确认苹果AppleWatchS7处理器与前代AppleWatchS6完全相同IT之家9月15日消息今日,苹果在秋季新品发布会上推出了全新AppleWatchSeries7。与前代AppleWatchSeries6相比,小号AppleWatchSeries7