阿里达摩院大模型M6带头人杨红霞已离职个人选择,非行业原因
作者:李梅(AI科技评论)
编辑:AeneasDavid【新智元导读】阿里M6大模型带头人杨红霞,已从阿里巴巴达摩院智能计算实验室离职。
AI科技评论获悉,阿里M6大模型的原带头人杨红霞,已于9月初因个人家庭原因从阿里巴巴达摩院智能计算实验室离职。
杨红霞常年深耕在产业化大规模落地的人工智能相关技术,在任资深算法专家期间带领团队探索阿里在下一代人工智能突破性技术认知智能的技术发展与场景应用落地。
杨红霞,2007年本科毕业于南开大学,获统计学学士学位。其后她去往美国杜克大学统计科学系攻读博士学位,师从DavidDunson教授。
博士毕业后,杨红霞先入职IBM全球研发中心任Watson研究员,之后入职雅虎公司,担任首席数据科学家。
2016年,杨红霞结束她在美国近10年的留学及工作生涯回国,去往杭州加入阿里巴巴集团。
杨红霞领导的阿里巴巴达摩院M6团队致力于认知智能方向,目前研发了AliGraph、M6、洛犀等较为有影响力的人工智能开源平台和系统,发表顶级会议、期刊文章超过100篇,美国和中国专利超过30项。
她曾带领团队获2019世界人工智能大会最高奖卓越人工智能引领者(SuperAILeader,简称SAIL奖),2020年国家科学技术进步奖二等奖和2020年杭州市创新领军团队。2022年6月,杨红霞入选2022福布斯中国科技女性50榜。
大模型M6是杨红霞在任期间的最突出成就。据了解,她离职是因为个人家庭原因,而非行业问题。达摩院大模型M6团队的后续工作不受影响。
M6于2021年3月首次发布,是国内首个千亿参数多模态大模型。当时,OpenAI前政策主管JackClark曾赞扬道:这个模型的规模和设计都非常惊人。这看起来像是众多中国的AI研究组织逐渐发展壮大的一种表现。
作为通用性AI大模型,M6拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域都具有广泛应用前景。杨红霞曾在接受采访时表示:多模态预训练是下一代人工智能的基础,M6模型实现了训练效率和生成精度等多项突破,是当前众多中文多模态下游任务最优模型。
6月份,杨红霞团队又发布万亿参数的M6,仅使用480块GPU,就能实现万亿参数体量的智能运算。相比原来的百亿参数模型,功耗降低8成,效率提升11倍。
M6在当年10月再次突破极限,杨红霞团队使用512GPU,在10天内训练出10万亿模型。与大模型GPT3具有同等参数规模,但能耗仅为其1。
据了解,M6已经在阿里新制造平台犀牛制造中得到应用,它服务内部近50个部门,并在阿里云对外产品中投入使用,还被收录在MITTechReview2021年度中国AI突破技术报告。
参考资料:
https:baijiahao。baidu。coms?id1746369376161463935wfrspiderforpc
http:www2。stat。duke。eduhy35home。html
本文经授权转载自微信公众号AI科技评论(ID:aitechtalk)