范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

历经6年AI终于在读图会意上超越人类

  前不久,在中文语言理解权威评测基准CLUE中,阿里巴巴的AI模型在新闻文本上超越了人类识别精确度。现在“读图会意”上,阿里巴巴达摩院在VQA上也超越了人类,这是榜单设立6年来的首次。
  8月12日,国际权威机器视觉问答榜单VQA Leaderboard出现关键突破:   阿里巴巴达摩院以81.26%的准确率创造了新纪录,让AI在“读图会意”上首次超越人类基准。
  继2015年、2018年AI分别在视觉识别及文本理解领域超越人类分数后,人工智能在多模态技术领域也迎来一大进展。
  达摩院AliceMind在VQA Leaderboard上创造首次超越人类的纪录
  “诗是无形画,画是有形诗。”宋代诗人张舜民曾描绘语言与视觉的相通之处。“读图会意”,即通过视觉理解信息,是人类的一项基础能力,但对AI来说却是要求极高的认知任务。
  解决该挑战,对研发通用人工智能有重要意义。近10年来,AI在下棋、视觉、文本理解等单模态技能上突飞猛进,但在涉及视觉-文本跨模态理解的高阶认知任务上,AI过去始终未达到人类水平。
  为攻克这一难题而设立的挑战赛VQA Challenge,自2015年起先后于全球计算机视觉顶会ICCV及CVPR举办,吸引了包括微软、Facebook、斯坦福大学、阿里巴巴、百度等众多顶尖机构踊跃参与,并形成了国际上规模最大、认可度最高的VQA(Visual Question Answering)数据集,其包含超20万张真实照片、110万道考题。
  VQA是AI领域难度最高的挑战之一。在测试中,AI需根据给定图片及自然语言问题生成正确的自然语言回答。
  这意味着单个AI模型需融合复杂的计算机视觉及自然语言技术:  首先对所有图像信息进行扫描,再结合对文本问题的理解,利用多模态技术学习图文的关联性、精准定位相关图像信息,最后根据常识及推理回答问题。
  VQA技术自2015年的进展
  今年6月,阿里达摩院在VQA 2021 Challenge的55支提交队伍中夺冠,成绩领先第二名约1个百分点、去年冠军3.4个百分点。两个月后,达摩院再次以81.26%的准确率创造VQA Leaderboard全球纪录,首次超越人类基准线80.83%。
  VQA的核心难点在于对多模态信息进行联合推理认知,即在统一模型里做不同模态的语义映射和对齐。
  据了解,  达摩院NLP及视觉团队对AI视觉-文本推理体系进行了系统性的设计,融合了大量算法创新,包括多样性的视觉特征表示、多模态预训练模型、自适应的跨模态语义融合和对齐技术、知识驱动的多技能AI集成等,让AI“读图会意”水平上了一个新台阶。
  VQA技术拥有广阔的应用场景,可用于图文阅读、跨模态搜索、盲人视觉问答、医疗问诊、智能驾驶等领域,或将变革人机交互方式。
  报道显示,这不是阿里达摩院第一次在AI关键领域超越人类基准。2018年,达摩院曾在斯坦福SQuAD挑战赛中历史性地让机器阅读理解首次超越人类,引发海外媒体关注。
  今年以来,达摩院在AI底层技术领域动作频频,先后发布了中国科技公司中首个超大规模多模态预训练模型M6及首个超大规模中文语言模型PLUG,并开源了历经3年打造的深度语言模型体系AliceMind( https://github.com/alibaba/AliceMind ),其曾登顶 GLUE等六大国际权威NLP榜单。
  【来源:快科技】【作者:宪瑞】

全新QQ9。0正式发布界面完全变了经过一个多月的内测,腾讯刚刚正式发布了PCQQ9。0正式版,而新版的变化对得起这个版本号,从里到外都焕然一新。QQ9。0的口号是ldquo从心出发趣无止境rdquo,界面全新改版,百度两款App能监听电话?官方正式回应1月5日,江苏省消保委对外通报,就侵害个人信息安全对百度提起消费民事公益诉讼。江苏省消保委表示,手机百度和百度浏览器两款手机APP安装前,在未取得用户同意的情况下,获取了ldquo支付宝强大美国这家店中文比英文还多根据国外统计机构的数据,2016中国移动支付市场的规模达到9万亿美元,美国的移动支付市场规模为1120亿美元。按此计算,中国移动支付市场规模几乎是美国的90倍。不过支付宝微信也在抓PS5主机放上条几后都快跟电视一般高了在索尼公布PS5主机的完整参数后,其三围数据引起了玩家关注,经测算,宽高长分别390mm104mm和260mm,意味着体积超过了10L。当时就有用户担忧,体积翻番后,塞电视柜会不会育碧建模师索尼PS5主机性能强大PS5主机牵动着不少游戏爱好者的心,在7月刊的PlayStation官方杂志中,育碧多伦多(负责开发孤岛惊魂5星链阿特拉斯之战等IP)人物建模师MarcoBarrettara透露,索尼要复活23年前神物!粉丝们燃爆如果你知道NESClassicSNESClassic是如何热卖,可能就会理解索尼要出PSClassic这样的设备了。在本周的媒体活动中,索尼PlayStation业务主管小寺刚(TWindows10RS5新版17627推送3月22日早间消息,微软面向SkipAhead跃前通道的会员推送了Build17627系统更新,隶属于RedStone5。事实上,隶属于RS4的Windows10春季创意者更新正式魔兽世界怀旧服上线时光徽章涨到90元3月25日,魔兽世界官方宣布自3月26日起,魔兽世界怀旧服也将上线ldquo时光徽章rdquo道具,不过价格也从75元调整到了90元。上线之后,玩家将可以在魔兽世界经典怀旧服的拍卖360守护国产OS安全!完全自主产权统信软件今天宣布,360安全卫士软件已于近日完成与统一操作系统UOS的兼容性适配工作,支持龙芯飞腾鲲鹏兆芯海光等国产主流CPU平台,可以稳定高效运行。据介绍,360安全卫士Linu虚幻4版剑灵4将于2月26日上线2013年在国服上线后,曾经有一段时间剑灵时国内人气最高的MMORPG游戏,当时网吧里面的电脑,不是剑灵就是LOL。时隔7年之后,这款游戏虽然不像以往那样火爆,但是依然还有相当多的小娜偷跑Win10五月更新正式版推送日期本周四开始准备了1年时间,测试了半年时间,Windows10五月更新正式版(Build19041。264,v2004,20H1)就将与大家正式见面了。虽然ISO镜像已经抵达MSDN,但受众渠
淘宝可以改账号名了网友感谢给我重新做人机会当年刚刚开始淘宝网购时,很多网友都是用当时的网名作为用户名,年少时追求炫酷霸气,用户名也是各种奇葩都有,如今人到中年,那些听着很中二的淘宝用户名也成了麻烦,好消息是淘宝终于支持改名Meta宣布今年暂停举办F8开发者大会Meta产品与合作伙伴总监DiegoDuarteMoreira在一篇博客文章中表示mdashmdash该公司将ldquo暂停rdquo举办本年度的F8开发者大会,并将把重心放到元宇帕萨特终生对手蒙迪欧停产曾是史上研发最贵车型日前,有海外媒体报道,福特蒙迪欧结束了在欧洲市场的生产。最后一辆蒙迪欧在瓦伦西亚工厂下线,该车代号为CD391,与已经停产的Fusion共享。不过这只是蒙迪欧告别欧洲市场,中国市场鸿蒙OS帝瓦雷音频华为首款便携智能音箱SoundJoy首发899元今天(3月24日零点)起,华为首款便携智能音箱SoundJoy正式开卖,售价999元,首发优惠100元,到手只要899元。华为SoundJoy采用圆筒形设计,顶部配有灯环,表面覆盖首搭HarmonyOS座舱重新定义智能汽车体验在碳达峰碳中和以及油价越发高涨,全面推广纯电乘用车并未成熟的大环境下,车企们不约而同都选择了ldquo混动rdquo技术路线。比亚迪DMi超级混动长城汽车DHT柠檬混动长安的iDD华为Mate50Pro手机贴膜曝光刘海屏这次要反向回归?春节过后的这一个多月,数码圈可以说热闹非凡,各大品牌的顶级旗舰新机层出不穷,让人眼花缭乱。不过由于众所周知的原因,华为这边却非常安静。往年在8月左右便推出的华为Mate系列,此前一曝华为MateX3发布会已在准备中麒麟90004G加持前不久,一款型号为PALAL00的华为新机入网,仅支持4G,预装鸿蒙OS,消息称,该机很有可能就是华为新一代折叠手机MateX3。据博主旺仔百事通爆料,华为MateX3(具体名称存Framework主板开卖,可升级模块化笔记本电脑配置去年Framework公司推出了模块化可升级笔记本电脑,有漂亮的设计和用户可更换的内存SSD和端口。今天,Framework公司开始单独销售Framework笔记本电脑的核心mdaAppleWatch配件Wristcam更新支持类FaceTime视频通话功能AppleWatch配件Wristcam今天获得更新,将提供类似于FaceTime的视频通话功能。Wristcam是一款AppleWatch表带,在你的手腕上增加了一个800万像素GCC12展示新的C功能引入更多面向C23的实现GCC12。1将在下周左右发布,红帽公司的MarekPolacek本周发表了一篇新的博文,概述了在这个主要的GNU编译器集合更新中出现的许多C语言改进。GCC12默认为C17(即G中兴Axon40Ultra屏下技术公布搭载自研前摄灵透算法3。0日前中兴官方宣布,将于5月9日举办新品发布会,正式推出全新的屏下摄像头旗舰mdashmdash中兴Axon40系列,将带来全新的屏下摄像头技术和更加震撼的视觉沉浸感。随着发布时间的