范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

横扫六大权威榜单,达摩院自家深度语言模型体系AliceMind开源了

  机器之心发布
  机器之心编辑部
  阿里巴巴达摩院宣布正式开源 AliceMind,助推语言 AI 进入大工业时代。
  自然语言处理(NLP)被誉为 AI 皇冠上的明珠,传统 NLP 模型制作复杂,耗时耗力,且用途单一,难以复用,犹如手工作坊。而近几年兴起的预训练语言模型,正在改变局面,有望让语言 AI 走向可规模化复制的工业时代。因此,「预训练 + 精调」已成为 NLP 任务的新范式。
  阿里巴巴达摩院作为最早投入预训练语言模型研究的团队之一,历经三年研发出深度语言模型体系 AliceMind, 在通用语言模型 StructBERT 的基础上,拓展到多语言、生成式、多模态、结构化、知识驱动等方向,能力全面。其中的模型先后登顶 GLUE、CLUE、XTREME、VQA Challenge、DocVQA、MS MARCO 在内的自然语言处理领域六大权威榜单,领先业界,相关工作论文被 AI/NLP 顶会接收,并在 6 月入选 2021 世界人工智能大会最高奖 SAIL 奖 TOP30 榜单。
  上周 AliceMind 再次登顶多模态权威榜单 VQA Challenge 2021 视觉问答挑战赛,战胜了微软、Facebook 等几十家国际顶尖团队,超越第二名 1 个点,将纪录从去年第一名的 76.36% 显著提升到 79.78%,接近人类水平(80.78%)。
  就在近日,阿里巴巴达摩院宣布正式开源 AliceMind。达摩院相关负责人表示,希望通过开源来降低业界研究和创新应用的门槛,助推语言 AI 进入大工业时代。
  据介绍,达摩院深度语言模型体系 AliceMind,包括通用语言模型 StructBERT、多语言 VECO、生成式 PALM、多模态 StructVBERT、结构化 StructuralLM、知识驱动 LatticeBERT、机器阅读理解 UED、超大模型 PLUG 等,此次大部分已开源。此外,AliceMind 之后将围绕「预训练 + 精调」语言模型持续进行生态性的技术开源。
  AliceMind 开源地址:https://github.com/alibaba/AliceMind
  AliceMind 体验入口:https://nlp.aliyun.com/portal#/alice
  AliceMind 的创新之处
  1、通用语言模型 StructBERT
  Google 于 2018 年底推出的 BERT 模型是业界广泛使用的自然语言预训练模型,达摩院团队在 BERT 的基础上提出优化模型 StructBERT,让机器更好地掌握人类语法,理解自然语言,2020 年多次在自然语言处理领域顶级赛事 GLUE Benchmark 上夺冠。
  StructBERT 通过在句子级别和词级别引入两个新的目标函数,好比给机器内置一个「语法识别器」,使机器在面对语序错乱或不符合语法习惯的词句时,仍能准确理解并给出正确的表达和回应,大大提高机器对词语、句子以及语言整体的理解力。相关论文被 ICLR2020 接收。
  2、多语言语言模型 VECO
  跨语言预训练初衷是为多种语言建立起一个统一联合的语义表示,AliceMind 体系内的跨语言预训练模型 VECO 一经提出,便在国际权威多语言榜单 XTREME 排名第一,远超 Facebook、Microsoft 等业界代表性模型。VECO 目前支持 100 种语言的理解和生成任务。
  VECO 效果亮眼,主要是因为两项创新:一是其可以更加「显式」地进行跨语言信息的建模(图 1);二是 VECO 在预训练的过程充分学习用于语言理解(NLU)和生成(NLG)任务,并让二者互相学习提高彼此(图 2)。因此,VECO 模型成为了多语言领域内的第一个同时在多语言理解(NLU)和语言生成(NLG)任务上均取得业内最佳效果的模型,相关论文被顶会 ACL 2021 接收。
  图 1
  图 2
  3、生成式语言模型 PALM
  PALM 采用了与之前的生成模型不同的预训练方式,将预测后续文本作为其预训练目标,而非重构输入文本。PALM 在一个模型中使用自编码方式来编码输入文本,同时使用自回归方式来生成后续文本。这种预测后续文本的预训练促使该模型提高对输入文本的理解能力,从而在下游的各个语言生成(NLG)任务上取得更好的效果。
  PALM 在 MARCO NLG 自然语言生成公开评测上取得了排行榜第一,同时在摘要生成标准数据集 CNN/DailyMail 和 Gigaword 上也超过了现有的各个预训练生成语言模型。PALM 可被用于问答生成、文本复述、回复生成、文本摘要、Data-to-Text 等生成应用上。相关文章已被顶会 ACL2020 录用。
  4、多模态语言模型 StructVBERT
  StructVBERT 是在通用的 StructBERT 模型基础上,同时引入文本和图像模态,在统一的多模态语义空间进行联合建模,在单流架构的基础上同时引入图像 - 文本描述数据和图像问答数据进行多任务预训练,并在多尺度的图像特征上进行分阶段预训练。此外,模型利用 attention mask 矩阵控制实现双流架构,从而提升跨模态双流建模能力,结合单流、双流结构的优点进一步提升模型对文本和图像两个模态的理解能力。相关文章已被顶会 ACL2021 录用。
  5、结构化语言模型 StructuralLM
  StructuralLM 在语言模型 StructBERT 的基础上扩展到结构化语言模型,充分利用图片文档数据的 2D 位置信息,并引入 box 位置预测的预训练任务,帮助模型感知图片不同位置之间词语的关系,这对于理解真实场景中的图片文档十分重要。Structural LM 模型在 DocVQA 榜单上排名第一,同时在表单理解 FUNSD 数据集和文档图片分类 RVL-CDIP 数据集上也超过现有的所有预训练模型。相关文章已被顶会 ACL2021 录用。
  6、机器阅读理解模型 UED
  自最开始声名大噪的 SQuAD 榜单起,阿里围绕着机器阅读理解发展路线:单段落抽取 -> 多文档抽取 / 检索 -> 多文档生成 -> 开放式阅读理解,拿下了一系列的榜单冠军:2018 年在单段落机器阅读理解领域顶级赛事 SQuAD 上首次超出人类回答精准率;2018 年在多文档机器阅读理解权威比赛 TriviaQA 和 DuReader 上双双刷新纪录,取得第一名;2019 年在信息检索国际顶级评测 TREC 2019 Deep Learning Track 上的段落检索和文档检索任务上均取得第一名;2019 年在机器阅读理解顶级赛事 MS MARCO 的段落排序、多文档答案抽取以及多文档答案生成 3 个任务均取得第一名,并在多文档答案抽取任务上首次超越人类水平。
  相关论文已被 AAAI2021 接收。
  7、超大规模中文理解和生成统一模型 PLUG
  PLUG 是目前中文社区已开放 API 的最大规模的纯文本预训练语言模型,集语言理解与生成能力于一身。PLUG 可为目标任务做针对性优化,通过利用下游训练数据精调模型使其在该特定任务上生成质量达到最优,弥补之前其它大规模生成模型 few-shot 推理的生成效果不足,适于应用在实际生成任务。同时,PLUG 采用 encoder-decoder 的双向建模方式,因此,在传统的 zero-shot 生成的表现上,无论是生成的多样性,领域的广泛程度,还是生成长文本的表现,较此前的模型均有明显的优势。
  8. 知识驱动的语言模型 LatticeBERT
  LatticeBERT 在预训练模型中训练中有效地融合了词典等知识,从而能够同时建模字和词的结构,来线性化地表示这种混合粒度的输入。第一步是将涵盖多粒度字词信息的中文文本用词格(Lattice)表示起来,再把这个词格线性化作为 BERT 的输入。LatticeBERT 在 2020 年 9 月达到中文语义理解评估基准 CLUE 榜单的 base 模型中的第一名。
  霸榜背后,是 AliceMind 持续创新和进化。达摩院团队在 BERT 基础上提出优化模型 StructBERT,2020 年多次在 NLP 顶级赛事 GLUE Benchmark 上夺冠。该模型通过在句子和词级别引入两个新的目标函数,好比给 AI 装上「语法识别器」,在面对语法错乱时,AI 依然能准确理解并给出正确回应,大大提高机器对语言的整体理解力,相关文章被 NAACL2021 录用。
  而此次在 VQA Challenge 2021 登顶的多模态模型 StrucVBERT,融合了通用模型 StructBERT 和结构化模型 StructuralLM,同时引入文本和图像模态,利用更高效的视觉特征和创新的注意力机制在统一的多模态语义空间进行联合建模。
  AliceMind 的应用情况
  AliceMind 具有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力,目前已成为阿里的语言技术底座,日均调用量超过 50 亿次,活跃场景超过 200 个,已在跨境电商、客服、广告等数十个核心业务应用落地。AliceMind 已上线到内部平台,开箱即用,目前支持训练、精调、蒸馏、测试、部署五大功能,只需简单操作即可完成语言模型从训练到部署的完整链路。
  在阿里之外,AliceMind 广泛运用于医疗、能源、金融等多个行业。其中,浙江电网公司以 AliceMind 为底座为员工构建智能化运维平台,应用于变压器检修、供电抢修等业务,已经开始在国家电网公司统一推广。
  阿里达摩院深度语言模型团队负责人黄松芳表示:「预训练语言模型已成为 NLP 领域的基石和原材料,AliceMind 开源将降低 NLP 领域研究和应用创新的门槛,助推行业从手工业时代走向大工业时代。」

单原子厚新型碳材料拥有金属特性科技日报北京5月23日电(记者刘霞)德国和芬兰科学家在最新一期科学杂志撰文称,他们合成出了一种独特的新型碳原子网络,新形式的碳像石墨烯一样,仅一个原子厚,但原子结构和电子特性与石墨人类对我们所在太阳系的探索与发现太阳系是质量很大的太阳,以及巨大的引力维持着周边行星卫星小行星和彗星绕其运转的天体系统。太阳位于距银河系中心约2。7万光年,距边缘2。3万光年的地方,而银河系直径约为十万光年,包含2024年落地!欧航局公布月球卫星导航和通信网络计划,打造未来第八大洲欧洲航天局(ESA)启动了一项雄心勃勃的新项目,在绕月轨道上建立一个卫星导航和通信卫星网络。有朝一日,随着人类在月球表面建造城市,这种新的基础设施可能会把我们的天然卫星变成第八大洲月全食,超级月亮5月26日不见不散年度天文盛宴月全食即将来袭此次月全食横跨太平洋,我国的中东部地区均可以看见带食月出的美景。根据天文台预报,此次月全食的具体时间为初亏17时45分食既19时09分食甚19时19分生光直播预告追星进行时,相约天文馆之超级月食5月26日上午,月亮走到了距离地球最近的地方。这天的月亮会比其他时候更大更亮,有人把它称为超级月亮。5月26日傍晚,月亮走进了地球的阴影之内,一次月全食将要发生。躲避在地影之内的月颠覆银河系中心的超大质量黑洞真的是黑洞吗我们理所当然地认为在银河系的中心有一个超大质量的黑洞,但是我们无法去那里查看一番。如果在那混乱的区域中心潜伏着其它东西呢?我们从名为人马座A(SgrA)的超大质量黑洞对其他天体的引2020。01。17你还记得发生了什么吗前几天翻朋友圈,偶然看到去年一月份发的一个朋友圈,(17,荧惑守心),当时也没怎么在意,现在突然想起来,真是细思极恐啊。可能这只是巧合,但古人的智慧有时确实可以值得思考啊!火星作为中俄罕见不再登月了?宇航员究竟在月球上看到了什么?图为对月探测器最近,据媒体报道,俄罗斯方面传出一个惊人的消息,在人类航天越走越远的今天,中俄罕见不再登月了,对于这一消息不断有留言称是月球有秘密存在,中俄这是怕了的表现,而事实上宇我国发现迄今最早远古森林新疆发现距今约有3。71亿年的远古森林森林是以木本植物为主体的生物群落,有多种多样的功能。而近日,在我国发现了迄今最早的远古森林!是在哪里被发现的?都有哪些植物呢?一我国发现迄今最早远古森林!新疆发现了一个距今约有3。天文图文汇总本月最酷周一知古通今周二牧夫专栏周三太空探索周四观测指南周五深空探索周六茶余星话周日视频天象翻译马啸然校对牧夫天文校对组后期库特莉亚芙卡李子琦徐坤胡永葳责任编辑毛明远原文发布于space。制作一个祝融号探测火星的场景模型场景模型制作祝融号在火星大家好,这里是NCA做模型。就在前几天天问一号成功着陆火星,所以我决定做一个微缩场景来纪念一下这个重要的航天时刻。这次制作的模型一共有两个部分,包括火星探测
综述高性能锂离子电池用增强离子传输型电解质及电极的设计第一作者BuketBoz通讯作者JenniferL。Schaefer通讯单位意大利布雷西亚大学美国圣母大学研究背景下一代电池系统发展目标是更高的功率和能量密度,以及更低的成本,以实ACSEnergyLetters利用堆叠压力来研究锂固态电解质界面的演变第一作者ChanheeLee通讯作者MatthewT。McDowell通讯单位美国佐治亚理工学院研究背景由于使用锂(Li)金属作为负极的潜力,固态电池(SSB)吸引了越来越多研究者胡锡进再度呼吁扩核中国要充分布局,做好南海终将有一战的准备拜登总统上台以来,美国新一届政府围绕中国议题可以说是操碎了心。任何一个有可能用来攻击中国的借口,他们都会在各种国际场合上不断宣讲,哪怕听者寥寥,他们依旧乐此不疲。据美国国务院近日发中国干脆利落反击,通知立陶宛大使离境,立外长快请回中国大使拜登政府上台以来,一直竭尽全力在全世界各个地区挑拨中国与该地区之间的关系,但除了日本这个坚定的小兄弟,以及澳大利亚加拿大等靠卖自然资源为生的国家之外,美国并没有多少实质性的收获。不靓丽风景线在西方上演!40万人走上街头示威,高喊要独立不要统一自2019年年底爆发的新冠病毒疫情已经持续了快两年时间,对全球的现有秩序构成严重挑战。疫情重击之下的美国印度等国选择往中国身上泼脏水,来转移国内民众的视线,而一些原本被掩盖着的地区曾做空香港铩羽而归,索罗斯叫嚣投资中国是悲剧,美企用业绩打脸当前中美经贸关系极度紧张,执迷于做空中国的美国金融大鳄索罗斯又来火上浇油,撕咬中国。当地时间9月7日,针对全球规模最大的美国资产管理集团贝莱德公司在中国成立首个外商独资公募基金一事澳洲将获8艘核潜艇,环时若军事冒进,不排除第一批在南海丧命当地时间9月15日,美国媒体政治报援引白宫一位知情人士的消息称,当天美国总统拜登与英国和澳大利亚两国领导人签署了一份先进军事技术交流的协议,内容涉及人工智能网络技术水下系统以及远程美国就死了这条心!俄罗斯把话挑明,不反华也不同意拉上中国军控拜登政府上台以来,美国在围堵中国给中国找麻烦的道路上越走越远,手段也是五花八门。据美联社9月6日报道,北约秘书长斯托尔滕贝格敦促中国加入美俄核军控谈判。而根据俄罗斯外交部副部长里亚美舰闯美济礁12海里,胡锡进呼吁中国军舰去夏威夷,打击美方气焰最近几年时间里,南海地区一直都没有平静过。这倒不是因为南海周边国家又给中国制造麻烦,而是美国及其西方盟友时不时就来南海骚扰一番,真正的利益相关者,如菲律宾越南等国家反倒出奇地平静。辞职声音四起,美防长乱了阵脚拒出席听证会,美参院不来或强制距离美国完成从阿富汗撤军工作已过去半个月的时间,但是美国国内对撤军行动的争论还在进行中。据美国媒体报道,当地时间9月13日,美国国会众议院和参议院外交事务委员会分别举行听证会,审查华人教授宣判无罪!美中国行动计划首案失利,美司法部失望据美国媒体华盛顿邮报报道,当地时间9月9日,备受外界关注的华人教授胡安明涉嫌技术间谍一案宣判,胡安明被宣判无罪。田纳西州联邦法院表示,经过长时间的调查,没有证据表明胡安明有意欺骗为