专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

阿里贾扬清新一轮AI爆发的推动机制是工程化和开源MEET20

  羿阁整理自MEET2023
  量子位公众号QbitAI
  随着StableDiffusion、ChatGPT的爆火,AI在今年迎来了大爆发。
  这不禁让人想问,这些创新背后的推动机制究竟是什么?
  在MEET2023智能未来大会上,阿里巴巴集团副总裁、阿里云计算平台事业部负责人贾扬清给出了他的答案:AI工程化和开源。
  工程化,让开发、迭代到应用的路径变得更加高效;开源可以让工作开展更加迅速,实现市场共赢。
  在这个基础之上,贾扬清还进一步指出了AI产业落地的四大明显趋势:AI工程化平台、异构计算、智能产品和算法开源。
  为了完整体现贾扬清的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。
  关于MEET智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。今年共有数十家主流媒体及直播平台报道直播了MEET2023大会,吸引了超过300万行业用户线上参会,全网总曝光量累积超过2000万。演讲要点工程化和开源是AI普惠最重要的支撑。目前AI产业应用有四个趋势:云原生的AI工程化平台、端到端优化的异构计算体系、通过系统组合打造贴近用户的智能产品,以及算法的开源助力AI在垂直产业的广泛应用。随着模型变得越来越大、训练门槛越来越高,我们可以清晰地看见,业界的需求从代码开源往前一步,到了模型的开源。
  (以下为贾扬清演讲全文)AIGC大爆发
  今天我们讲AI,绕不过去的一个话题就是AIGC的大爆发,像StableDiffusion、ChatGPT等等。
  如果我们溯源可以发现,用统计和AI方法实现内容的创作和生成,已经经历了很长的演进过程。
  往回数到1999年,也就是二十多年前的时候,AlexeiA。Efros教授提出的基本逻辑是用一个简单的计算机视觉统计方式,就可以通过一个非常小的图片来学习纹理,并生成更大的内容,这可以说是AIGC的雏形。
  2015年前后,神经风格迁移开始风靡,它能够从画作当中学习绘画风格,把原始图片合成为特定风格的作品,比如这幅梵高的《星空》。
  从1999年的纹理生成,到2015年的神经风格迁移,再到今天更强语意的AI创作,都在不断地催生我们探索更有意思的领域。
  同时,我们也在思考,这些创新推动的机制是怎么样的?背后有哪些的支撑?AI惠普的土壤:工程化开源
  我们得出的结论是,AI普惠的两个重要支撑,一个是AI的工程化,另外一个是开源。
  从工程化角度,2019年著名教授RichardSutton曾经说过,前面70年的AI研究,我们所得到的最大的经验和教训是通过标准化的方式来使用大规模的计算。
  那么怎么样才能实现大规模计算呢?
  无论是通过云原生方式,还是通过更加高效的分布式计算等,都让今天从开发到迭代的路径变得更加简单,这都是我们前面几年所看到的AI大规模发展(如大模型、AIGC)背后的工作。
  另外一个方面,开源让工作变得更加迅速。
  从最早的时候我们耳熟能详的深度学习框架,到今天我们所见到的各种模型,无论是基础模型还是应用模型,开源和开放都让各行各业的应用开发者更加容易触达AI算法,并寻找一些需求的匹配。
  同时,对于算法的工作要求。StackOverflow的创始人JoelSpolsky曾经写过一个关于开源软件经济学的技术blog。
  他提到,技术公司都希望让产品的互补品变得更加容易获得,开源让整个市场变得更大,也能够让大家实现共赢的结果。
  在此基础上,AI产业落地有四个非常明显的趋势。
  第一是云原生的AI工程化平台;第二是大规模端到端的异构计算体系;第三是把前面这些工程产生的算法系统组合后,实现的更加智能、贴近用户需求的产品;以及通过算法的开源,助力AI在产业垂直化落地。
  这四个趋势可能是将来我们无论是从供给角度还是需求角度,推动AI进一步往前走的方向。
  所以我想从这四个角度给大家简单介绍一下我们现在所看到一些细节和所做的事情。AI工程化平台
  今天我们看到AI开发有一个非常清晰的范式,可以分两个部分,前半段是开发、数据到模型,后半段从模型、迭代到最后的应用。
  具体地说,首先,算法工程师会通过数据平台做数据采集、清理、标注。在开发的时候,一个开源的、耳熟能详的环境已经成为业界标准,能够让算法工程师进行开发、迭代。
  今天大多数的模型都需要用到分布式计算,这些技术已经成为标准底座,让我们更加高效地做分布式训练、调度和部署。
  产出最开始这些模型之后,我们就需要让业务工程师和深度学习的算法工程师一块在实际当中做模型选型、验证等等,再通过前面提到的开发、迭代、训练这些平台,来获得一个适合线上服务的模型。
  有一个很有意思的点,大家在实际做一个业务应用的时候,有很多事情都要考虑。
  AI以前想得比较少,但今天一旦开始把AI算法部署到应用当中去,很多需求就都已经出来了,像蓝绿部署等等,因此服务本身也在开始变得更加标准化、原生化。
  今天在阿里云,我们就把这些开发范式标准化以后,建设这样一个平台,支撑我们从零开始做模型的全新服务。
  大家经常问工程化可以实现怎么样的效果?
  每个科研院所、公司大家多多少少都在经历这样一个过程:怎样把AI从科研到普惠的鸿沟填上,用高性能、高可用、低成本的方式把这个沟跨过去。
  跟大家分享一个小故事,今年达摩院和阿里云一起做了一件事情,就是重新审视我们在AI算法协同当中怎么样把达摩院超过90的应用,不论是训练还是推理服务的应用,都用云原生方式来实现。
  通过这样的方式,我们所见到的是:
  从需求的角度,资源更加可用、更容易获得,无论是拉起一个训练还是推理,都比以前更加容易,更快;
  从工程细节上,算法工程师不再需要进行像存储、管理机器、调优带宽等等这些具体的事情;
  从供给角度、AI系统管理角度来说,无论是利用率、训练效率,还是服务成本都变得更好了。
  这是我们在第一个趋势AI工程化这块所看见的正向效果,就是专业人做专业的事,以达到一个更好的效果。异构计算
  AI工程化平台之后,第二个趋势是端到端的异构计算与优化。
  今天讲框架讲得比较少,传统的AI框架这一层,无论是最早的还是今天的框架,方向已经变得很成熟了。
  同时,在框架上游和框架的下游,我们都开始逐渐地需要来建设更加丰富的软件栈。
  包括上层怎么样让算法科学家做分布式建模,调动异构资源进行训练;在框架下层怎么样通过AI技术做软硬件协同设计和优化,最后我们怎么样建立这样一个存储、网络完整的优化解决方案。
  和大家分享几个我们所做的工作。
  第一在分布式建模这一块,我们开源了一个框架EPL,使得算法工程师建模时能够更加容易地自动化生成分布式训练模型,而不需要自己手工地处理GPU之间怎么样通讯。
  在优化领域,我们的框架PAIBlade,能够帮助算法工程师在面对底层硬件时不需要去担心,比如CPU、GPU、非常多的创新建设出来的国产芯片等等,我们可以用这种方式更有效地提升算法效率。
  这个领域最有意思的一点是,我们发现AI计算和传统科学计算的需求有很强的共性,无论是蛋白质分子折叠的研究,还是其他物理、化学等领域,AIforScience这个趋势都很明显。
  我们需要做的工作包括大规模基于矩阵的计算,以及需要处理海量的领域数据,而AI系统、数据系统所积累下来的异构计算的能力正好符合这个需求。
  同时,一定程度上说,这些能力最早也是从HPC这些领域,比如气象模拟孵化出来的。
  就像郑院士刚才提到的AIIReduce并行的范式,这个范式最早也是在HPC领域有了非常好的理解,在我们看起来是一个AIforScience和ScienceforAI互相迭代的过程。
  这些框架上和框架下的优化,最终还是需要把所有的组件协同起来,带来一个更加完整、更加成熟的,我们称作智算的一个完整解决方案,这些解决方案能够达到软硬件协同、算法应用协同等效果。
  举个例子,在自动驾驶这方面,我们和小鹏汽车建设了一系列自动驾驶所需要的海量AI计算能力技术。
  每个单点技术看起来都比较标准,但是端到端连起来的时候,我们也碰到一个挑战,就是怎么样把存储、计算、AI组件更加完整组合在一起,这里面有很多细致入微的挑战。
  就像刚才郑院士提到的检查点怎么样做读写,怎么样把存储带宽提上来,虽然乍一听是很细节的事,但是非常精准地提到了我们系统所需要解决的问题,就是确保一个木桶没有短板,unblock整个开发训练的流程。智能产品
  我们所见到第三个趋势,往往会涉及到多种模型、多种算法的组合。
  各种单点AI算法越来越成熟之后,我们可以更容易地组合一个贴近客户的智能产品,这也是很多用户实际需要的一个AI中台,因为我们并不需要一个单体模型,我们需要解决问题。
  拿听悟智能会议助理举例,这是达摩院语音实验室把语音、自然语言处理和其他的算法组合起来后建设而成,因为会议的原因,我在会前录了一个非常简短的实际使用的Demo,请大家来感受一下。算法开源
  最后我觉得还有一个非常强的趋势就是模型开源。
  像听悟这样一个产品,背后有非常非常多的模型,我们今天说AI工程化、异构计算等等,最后就是基于模型来落地。
  这里我重复一下李笛老师刚刚提到的AIbeing的概念,将来也许每一个人、每一个公司都多多少少需要有AIbeing的能力。
  那么问题来了,模型变得越来越大,门槛越来越高后,是不是每个公司都要投入很多的资金和人力?是不是都要先通过训练再做其他的事情?
  我们的回答是no,今天代码开源已经非常深入人心了,我们可以清晰地看见,业界的需求从代码的开源往前一步,到了模型的开源。
  今年达摩院和业界很多伙伴一起推出了ModelScope,我觉得它跟以前所见到的学术模型不一样,我们更进一步的地方是我们将实际业务当中所见到的、训练的、沉淀下来的实际场景化的模型都贡献了出来,今天大家可以在魔搭上面找到300多个成熟的模型。
  举个例子,比如像语音可以找到不同方言的、中英混杂的,这种通用的学术模型可能不太关注,但是在应用当中很需要的模型。
  最新的像StableDiffusion这些模型,你也可以在上面实现浏览、尝试下载开发、二次开发等等。
  这样一个社区能够让我们在供应和需求两个方面都更进一步。
  从供给角度来说,我们希望能够提供一个场子,这个场子让更多算法开发者能够更方便地把模型开源出来、共享出来,就像是把代码放在一个平台上一样,让大家更容易分享模型,更容易搭建一个模型的Demo,把这个秩序轮转起来。
  第二从需求角度,我们希望能够给对AI感兴趣的群体找到一个更容易的方式体验模型、思考需求,通过这样把很多的想法迭代起来,就是到底这个模型能做什么,如何把这些产品做得更加丰富。
  我们希望这个平台成为一个连接两边需求,把两边更好结合起来,迸发创新的应用。
  总结一下,在开源和工程化这样的大背景下,我们看见AI产业有四大很明显的趋势:云原生的AI工程化平台、大规模端到端的异构计算体系、智能产品,以及最后算法开源崛起。因为时间关系,每一点可能没法更详细展开。
  今天,非常多的专家、企业、开发者们在建设着上层的AI算法;而在AI底层,如何让工具变得更加易用、更加普惠,这正是我们在做的事情。
  从去年开始,我就在做阿里灵杰,无论从数据管理、数据治理、算法开发,到完整的AI智算解决方案,目的是能够提供一个用户友好、高性能、高弹性的产品和能力。
  非常感谢大家今天能够花15分钟时间听我的分享,疫情现在放开了,希望有机会能够在线下见面,或者通过线上进行技术上或业务上的一些交流,再次谢谢大家!
  完
  量子位QbitAI头条号签约
  关注我们,第一时间获知前沿科技动态

品牌榜云南发布2022年企业100强榜单1月6日,2022云南企业100强新闻发布会在云南昆明召开。云南省企业联合会云南省企业家协会公开发布云南企业100强榜单云南制造业企业50强云南服务业企业50强榜单云南民营企业80为什么特斯拉降价,中国新能源品牌却涨价呢?央广网北京1月11日消息(记者王展)1月6日,特斯拉在官方网站更新了旗下几款车型的指导价格,最大降幅达到4。8万元。与此同时,中国新能源品牌纷纷宣布在2023年1月1日涨价,据不完刷短视频也能随手发弹幕?抖音上线弹幕功能快来试试CNMO新闻随着互联网的快速发展,越来越多的人喜欢看视频的时候互动。如今看视频,很多时候看的不止是视频的内容,还有配合视频一起出现的弹幕。近年来,弹幕文化兴起,不少人表示自己看视频积雪草vs油橄榄的成分解析近年来受敏感肌困扰的人越来越多,有流行病学研究表明,女性敏感皮肤的患病率6070,男性占50601。敏感皮肤是指表现出高反应性和低耐受性的皮肤,通常认为是一种亚稳状态的皮肤。护肤品奥利奥与微软联名推出Xbox主题饼干,可解锁游戏特殊皮肤IT之家1月9日消息,微软再次与奥利奥合作,推出了以Xbox为主题的奥利奥饼干,总共有六种外观设计,其中一种带有Xbox标志性的Logo,另外几种上面有手柄按键的标志。这些饼干是基武则天迎来小典藏皮肤?堪比貂蝉典藏,玩家强烈反对大家好,这里是阿呆的峡谷日记,将会给你带来王者荣耀最新的爆料内容。最近关于王者荣耀的新皮肤爆料,迎来了几件大事情,首先就是貂蝉的荣耀典藏皮肤正式曝光,对于这款皮肤绝大多数玩家给出了超兴奋!英雄联盟设计师说了啥?新皮肤,新英雄,还有排位新改动2023新赛季已经正式上线了,相信很多LOL玩家也已经体验了近期更新的季前赛版本,而随着新赛季的到来,关于2023年英雄联盟的计划也有了一些新的消息。就在1月9日晚,英雄联盟官方发阳过之后皮肤变差了?提醒发烧别用冰镇面膜北京日报客户端记者汪丹最近,不少到皮肤科就诊的患者都有相同的感受阳过之后皮肤变差了。这是患者在发烧之后,脸上的水分丢失,又没有及时护肤造成的皮肤干燥脱屑等问题。北京市第六医院皮肤科武则天新皮肤获取方式遭抵制,王者荣耀或启用全新皮肤品质标签你好,我是小酒。看到昨天全网抵制武则天新皮肤的获取方式,依旧一脸懵。明明武则天新皮肤任何消息都没有曝光出来,为什么会得到那么多人的抵制呢?难道是有内部人员在故意探玩家的口风?如果真首个青蒿油团体标准即将实施,这个王牌中国成分有何过人之处美妆头条新媒体敏感肌市场趋势白皮书显示,2022年我国敏感肌护肤市场规模预计超过290亿元,20202022年复合增长率高达27。随着敏感肌人群逐渐增多,消费者对于温和有效的舒敏成皮肤缺水怎么办?这篇文章告诉你我们总是说皮肤处于缺水状态时会引起各类皮肤问题例如起皮脱屑细纹或者是色斑等等问题,如果做细分的话,我们皮肤不同的层次缺水,最后产生的肌肤问题是不一样的就是最近很多姐妹都会跟我说到皮
马斯克下令Twitter删除自杀预防功能引发广泛担忧新浪科技讯北京时间12月26日早间消息,据报道,知情人士透露,根据埃隆马斯克(ElonMusk)的命令,Twitter过去几天删除了一项在用户查看特定内容时,向其推荐自杀预防热线及鲸准日报柏睿数据完成亿元及以上人民币D轮融资12。2325交易事件12。2312。25共发生交易事件44起,其中国内17起海外27起。国内聚焦行业为医疗健康(3起)生产制造(3起),聚焦轮次为战略投资(7起)。海外聚焦行业为俄伊着力打造新洲际贸易路线据俄罗斯独立报网站12月23日报道,莫斯科和德黑兰将开辟通往亚洲的替代路线。当地时间2022年8月31日,俄罗斯莫斯科,俄罗斯外长拉夫罗夫与伊朗外长阿卜杜拉希扬举行会晤。(视觉中国上海黄金交易所公布元旦期间休市安排中新网12月26日电上海黄金交易所12月26日发布通知称,根据交易所节假日休市安排公告,交易所于12月31日(星期六)至1月2日(星期一)休市,1月3日(星期二)起照常开市,12月超7亿美元合作内容!原标题乌兹别克斯坦和阿塞拜疆计划实施价值超7亿美元的项目据乌兹别克斯坦投资和外贸部消息,塔什干和巴库正仔细研究实施价值超7亿美元的五个大型项目财务和技术方面的工作。24日,阿塞拜疆A股反常必有妖,今天的上涨很可能是空头的陷阱大家要知道在股市里讲究的就是对技术的深刻研究,要能根据走势的细小变化,捕捉到一些有用的东西,在股市里想要获得胜利,就必须明白一件事情,就是功夫不负有心人,只要努力就一定会有收获。还探索研发无人区,一个技术型企业的中国样本事实上,国内乳品行业曾经历至暗时刻。2008年风雪中,国货奶粉品牌一地狼藉,行业暴雷后重新洗牌,外资围困和信任缺失的双重夹击之下,国产品牌元气大伤,很长时间里,市场一度被外资品牌占丰田汽车11月全球产销超去年同期,销量同比增3。7新京报贝壳财经讯(记者王琳琳)12月26日,新京报贝壳财经记者从丰田汽车官方获悉,今年11月全球汽车产量增长1。5,达到833104辆的新纪录11月全球汽车销量为884112辆,同真正的炒股高手炒股只需要弄懂如何低位敢买,如何高位能卖股市中最大的智慧就是如何低位敢买,如何高位能卖,但要达到此点困难重重。更多时候我们总在进行错买错卖,与此相反追高杀入低位割肉。所以我们经常懊悔和苦恼,要学会低进高出,方能盈利。今天2023年房企想赢,该如何应对?同策观察防疫政策放宽后,明年上海楼市却可能更糟上海房地产形势严峻新房积分持续探底2023年,上海房企的危机有多大?难以想象。市场下行阶段,上海房地产市场形势已经非常严峻,一波波项目乌鲁木齐高新区(新市区)今年净增53家高新技术企业天山网讯(记者赵悦报道)今年,乌鲁木齐高新技术产业开发区(新市区)93家企业通过国家级高新技术企业认定,净增高企53家,同比增长33,创下历史新高,这意味着该区科技创新能力更强了。
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网