专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

IntelHabana中国区业务总监于明扬大模型带动AI新发

  2023年1月6日,由稀土掘金技术社区与Intel联合发起的第一届掘金未来大会在北京成功举行。
  大会上,IntelHabana中国区业务总监于明扬带来了Intel助力AI大模型浪潮下,如何帮助企业进行数字化创新和变革。他提到,AI大模型是最具想象力的科技发展方向之一,模型不止于大,通用、开放、高效、善良,是AI大模型的理想标准。目前,大模型生态已经达到了一个比较完善的地步,可以方便很多的开发者去进行研究和分析,甚至开始进行部署。但随着模型参数与数据集规模不断增大,无形中带来了许多问题和挑战,其中,开源是大模型未来发展中的一个非常重要的手段。
  于明扬预测,大模型是AI领域里一个新的科技创新,AI大模型有可能带来下一轮人工智能的发展浪潮。合作、开源将会给大模型的发展带来更大的动力。随着大模型的发展,在数据安全、伦理道德、模型易用性以及模型友好程度等各个方面,通过大家的探讨能够去更加完善,保证大模型在未来的使用当中能够真正地帮助和解决实际问题,而不会去造成更多的困扰。
  大模型的训练,需要大数据大算力强算法,英特尔基于这三个方面提出相关的解决方案,来帮助客户去克服目前大模型部署和使用中的问题。目前英特尔SPRHabanaXeOpenAPI的完整平台已经在一些行业中得到验证,利用并行异构系统解决数据获取、处理、计算和存储,实现大模型的高效训练与推理。
  以下为IntelHabana中国区业务总监于明扬演讲全文:
  今天我给大家带来是,Intel助力AI大模型浪潮下,如何帮助企业进行数字化创新和变革。
  大家都了解,英特尔主要的产品是基础的计算平台,同时英特尔也向很多客户提供各种各样的软件的中间解决方案。在未来一段时间里,尤其是在人工智能的发展阶段中,越来越多的大模型应用场景出现。在大模型这一新业态下如何建立完整的生态环境,这是很多企业必须要考虑事情。在此情况下,我们带来了一些新的想法,借助这个机会跟大家交流,倾听大家的一些意见,不断去地改进整个生态。
  今天的介绍主要围绕几个方面:
  简单回顾一下大模型的发展历史,以及目前大模型在整个行业中的使用情况;
  针对大模型在很多行业中普遍出现的一些问题,英特尔尝试提供的一些解决方案,供大家参考;
  从英特尔的角度,对大模型未来的发展评估和分析。
  大模型生态已经初具规模
  2017年,Transformer结构的提出,使深度学习模型参数达到了上亿的规模。到了2019年,Google率先发布了第一个大规模的语言模型Bert,其参数首次超过3亿规模。但很快在2020年,OpenAI推出了更大规模的语言训练模型GPT3,其参数达到了1750亿。仅一年时间,整个模型的规模就从亿级突破到了上千亿。但这种高速的发展并没有结束,在今年又出现了一些新的常规业态大模型,比如StabilityAI,它发布的文字到图像的创新模型Diffusion。去年年底刚刚出现了ChatGPT,以及OpenAI今年即将发布的GPT4,预期它们带来的模型参数会有更快速的增长。
  大模型的参数和数据规模的增长,会带来什么样的变化?首先,大模型集成了各种不同模态下的数据,从传统的有限的AI扩展到更多的应用场景;其次,大模型通过预训练以及针对下游业务进行的预调整,可以适用于各种各样的细分应用场景。它可以把各种结构化数据和非结构化数据结合起来,帮助更多的行业完成人工智能部署的要求;随着大模型的参数和数据量不断增加,大模型的整体训练精度也得到了不断地提高。现在的自然语言处理的精度已经非常接近于人的处理水平,这也是大模型带来的巨大变化。
  另外,大模型通过一些自监督的学习方法,很大程度上解决了传统人工智能中对于数据标注的高成本、长周期和精确度的问题。大模型的业务发展越来越快。过去,大模型主要针对语言模型的发展;现在,大模型已经突破了传统的自然语言处理,发展到对图像的处理,以及一些自动模式识别等等,所以大模型的业务场景已经突破了传统且最早的定义限制。
  再看大模型生态。大模型生态是比较完善的,虽然一些传统的人工智能训练框架,比如Pytorch和Tensorflow,对于运行一些大模型的训练还是有局限性,但是在行业内,越来越多的厂家已经参与到大模型框架的开发中,比如,微软基于Pytorch开发了DeepSpeed,以及国内的一些厂家,百度、阿里、华为等等,都推出了一些针对大模型的改良框架,很好地支持了目前很多通用的大模型训练。因此,大模型生态已经初具规模。
  其次,从大模型开源生态讲,已经有很多厂家提供了大模型开源环境,比如,Huggingface、StabilityAI、Meta开源的的OPT等,他们都提供了深度开源的代码,供大家进行二次开发。所以大模型生态已经达到了一个比较完善的地步,可以方便很多的开发者去进行研究和分析,甚至开始进行部署。
  模型参数与数据集规模不断增大
  在整个大模型的发展中,很多大模型的业务已经开始落地,比如,智源实验室推出悟道大模型已经用于冬奥会上手语播报数字人;华为采用盘古CV大模型平台,在无人机电力巡检中获得了一些实际效果。
  大模型看似发展已经很好了,为什么我们在生活中对大模型的感受并不是很强烈?对比最早的人工智能的应用,我们会感觉到大模型好像离我们很远,这并不是说大模型不适合日常应用场景,而是大模型的使用有一定的门槛,这种门槛造成了大模型在很多应用场景下的部署以及使用的瓶颈。
  首先,大模型的数据量很大,其次它的整个模型参数也是一个非常高的数量级,并且随着大模型的演变和发展,参数规模与数据集规模不断地呈指数级增加。
  举一个例子,GPT3最大的模型参数量达到了1750亿,训练数据超过了45TB,如果要完成一次GPT3完整的训练过程,大约需要3。14EFLOPS的算力。这意味着什么?全世界最高效的HPC集群的理论计算峰值才刚刚达到这个数字,我们不可能建立如此大的集群来训练一个模型,这无形之中造成了大模型发展的最大瓶颈,就是如何解决训练中的算力要求。除此之外,大模型还对平台的部署提出了很多新的要求,比如,在分布式并行的场景下,如何提高整个系统的使用效率?如何解决在大模型中很多核心算法的利用率问题?这些问题对于很多中小企业和普通开发者造成了很大障碍。
  大模型在行业中之所以很难广泛应用,是因为它的算力,以及对整个开发环境的要求,使整个生态还是有一定的困难和门槛。如何解决这个问题,就是Intel一直在尝试和努力探索的方向。Intel已经与行业内很多合作伙伴去建立了开源合作基础。开源是大模型未来发展中的一个非常重要的手段。
  首先,开源可以集中各个方面的能力和资源解决模型当中的优化问题,同时,利用开源可以把很多计算资源集中起来完成对大模型的训练。另外,开源还可以解决很多大模型未来部署实施中的一些顾虑,提出解决方法。因此,开源是解决大模型未来发展的一个最重要的手段。其次,一些企业开始尝试把一些大模型拆分成针对于特殊应用场景的小规模训练集,保证一些模型在特定场景下也可以部署和使用,这是一种解决方案。同时,各地政府和一些研究机构也在部署自己的算力集群,通过社会层面去解决算力需求的问题。
  还有一个趋势是加速大模型的使用。对于模型的训练来说并不见得是有非常强的要求,很多普通用户更多的是希望在业务中去部署大模型,这种大模型的部署需要推理的能力。如何解决高效、低成本、环保的推理解决方案,这也是大模型部署当中需要考虑的一个问题。现在,Intel已经和第三方厂家去共同努力给客户提供一个更好的调优以及进行二次开发的环境,帮助很多客户解决他们在未来大模型使用和部署当中遇到的一些问题。
  大模型中最核心的三个点:大数据、大算力、强算法
  和开源的大模型相比,现在很多非开源模型还是有整体优势的。在整体训练的精确度上,它和开源相比还是有一定的优势,它的一些场景要领先于开源。大模型中最核心的三个点:大数据:大算力、强算法。根据这三个点,Intel提出了解决方案,帮助客户解决大模型部署和使用中所出现的一些问题。
  在大数据方面,需要更多的行业参与者去提供各种数据格式的数据资源,把这些数据整合到一起就有可能去做一个数据层面的突破。在算力方面,Intel为客户提供高效的算力解决方案。Intel也提供一个开源的、友善的以及非常灵活的大数据的框架,就是基于Intel的SapphireRapids新一代的至强处理器,IntelHabana高性价比AI加速设备、Intel最新的GPU的Xe处理设备,以及我们在一直在行业内大力推广的oneAPI的开源框架。
  Intel通过这样一个完整的平台去帮助客户解决大模型训练、推理以及部署当中的问题,并且已经在一些行业中获得了验证。图中是Intel在全球多个地点和客户共同配合去提供的一个完整的大模型训练和推理部署的解决方案。在这个方案中,可以满足客户数据获取、数据预处理,以及在整个模型训练和推理中对计算和存储的要求。目前,国内一些地方已经开始部署这个平台,未来Intel还会把平台上的算力资源、集成的Intel软件,以及Intel和合作伙伴共同开发的一些应用提供给大家进行试用。
  在Habana平台中,Intel选择了微软的DeepSpeed,之所以选择DeepSpeed这一非开源平台,是因为非开源的大规模框架平台有一定的优势,一方面,它在计算精度上比开源模型有更高的标准,另一方面,它在整个生态中提供了比较好的API的接口,便于客户进行更多的二次开发和研究。
  Intel最核心考虑的一点就是内存的利用率。在大模型使用过程中,内存资源的占用是非常耗费平台整体资源,比如,在训练过程中,很多参数的内容需要保存在AI训练加速设备当中,这种资源的占用带来两个的因素,第一是随着占用设备内存的增加,计算规模肯定要扩大;第二是数据内容要不断地进行反复加载、反复集中,这样对整个集群的通讯效率造成很大的压力。
  因此,Intel尝试去做一些简单的优化和处理。Intel选择DeepSpeed提供的一个零冗余的内存优化方案解决在内存分配中所遇到的一些资源上的浪费,通过高效网络带宽解决并行处理的参数分发以及参数集中。现有的网络通讯包含两个方案:一种是交换式解决方案,如英伟达NVLink集群化的解决方案;一种是点到点全连通的解决方案。不是说这两种解决方案哪一种更优,Intel也在不断地尝试不同的通讯协议对于大模型的训练带来的价值。
  另外,考虑到在模型的训练过程当中,模型状态的保存带来的资源消耗。Intel利用了DeepSpeed里边的ZeRO1、ZeRO2,甚至ZeRO3整个的模型参数的分发原则,通过不同的模型参数资源的分配可以把整个模型对于内存资源的占用呈指数级的下降,通过最高级别的内存优化可以做到内存的资源耗费大约只占原来标准模型的116。这对于一个大规模的模型部署来讲,是一个非常有价值的尝试,而且这种尝试可以看到它的效率、性价比还是非常有优势的。另外,如何去利用不同精度的混合计算去解决计算的资源,以及最后计算结果的精度的问题,这也是一个非常有意思的尝试。
  目前,在很多的加速设备中,大家都能支持BF16,也能支持FP32。在BF16的使用场景中,很大程度上节省资源的占用的问题,但无形当中会带来一些很大的准确性隐患。在反向计算中可能会丧失一些信息,会引入一些误差,降低整个模型最后训练的精度,那么结合FP32就可以很好的解决这个问题。Intel选择了一个比较灵活的模式,对整个架构做了一些探索,这种探索是有一定的收获,也愿意把这些经验分享给大家。在IntelHabana网站上,就有非常详细的技术实现方案,包括技术的原理以及整个参考代码,大家可以体验一下优化所带来的效果。
  AI大模型有可能带动新一轮的人工智能发展浪潮
  从Intel角度来讲,对于未来大模型是持一个什么样的看法?首先,在最近一段时间内,大模型是AI领域里一个新的科技创新,AI大模型有可能带来下一轮人工智能发展浪潮。这几年人工智能的发展已经达到了一个巅峰,尤其是在图像识别领域,它基本上超过人的识别能力,但在自然语言的处理方面,机器学习、深度学习一直落后于人的处理能力,所以大模型的出现弥补了这个方面不足。
  其次,大模型的应用场景。传统的AI模型都是碎片化、专业化的场景,往往针对视频监控、人脸识别以及一些特定的场景,但大模型的使用会把应用场景扩展到更大,不仅是AIGC这种内容生成,还会对很多细分领域带来新的创新。所以未来大模型有可能会成为人工智能里一个比较集成化的解决方案,对于很多的用户来说,未来的使用大模型可能会带来更多的灵活性和易用性。
  再者,合作、开源将会给大模型的发展带来更大的动力。开源是未来大模型发展当中的一个重要的环节,在开源中如何帮助大模型去完善解决开源和非开源大模型中的精度误差,也是要探讨的一个问题。
  系统厂家也不断通过硬件性能的提升和架构优化解决大模型训练和推理的效率。无论是硬件厂家,还是框架和平台厂家,在这几年在大模型的调优上都花费了很大的精力,虽然大模型的数据和算力要求在不断的增长,但是像Intel这样的硬件厂家也不断地在硬件设备上提供能力的补充,尽管跟模型的需求有一定的差异,但是这种差异相信在未来会不断地缩小。
  随着大模型的发展,在数据安全、伦理道德、模型易用性以及模型友好程度等各个方面,通过大家的探讨去进一步完善,保证大模型在未来的使用当中能够真正地解决大家的实际问题,而不会去造成更多的困扰。
  同时,国内的很多研究机构花费了很大的精力建立了自己的专有训练集群,他们去开发自己的大模型,但在落地和应用中还是有一定的欠缺。希望有更多的厂家企业参与到未来大模型的生态环境当中,提供更多的应用场景,帮助机构把大模型落实到实际业务中,去解决社会面临的实际问题。谢谢大家!

北师版小学数学(上册)常见问题答疑(7)一年级上册怎样看待左右相对性?在一年级的教学中这个问题老师们讨论得比较多,关于左右的相对性一般有两种困惑一是参照物的变化引起位置的相对性。如在桌面上左边放铅笔,右边放橡皮,所以说铅回答最后一个提问,外交部副部长提到了这部电影10月20日上午,党的二十大新闻中心举办第四场记者招待会。在回答最后一个提问时,外交部党委委员副部长马朝旭说,海外同胞的万里归途,就是中国外交的万里征途。新华社记者张玉薇摄今年国庆黄金五问让你备足养老金视频加载中今天和大家来聊一聊关于养老这个话题,现实生活当中我们大家都应该感受到今天老龄化社会正在扑面而来但很多人其实只是在假装看不见而已,那未来谁给我们的晚年负责任呢?其实你可以请秋天是养阴黄金期,建议常吃3黑2红,滋阴益气好入冬在经过大半年的活跃之后,人们在秋季也要开始对自己的身体进行适当的休养调整,而为了遵循老辈人秋冬养阴的原则,人们也会适当吃些滋养食物来及时给身体补充养分和能量。针对秋天养阴,生活中有大爆冷!国乒头号强敌男队全军覆没,女单夺冠热门惜败华裔名将2022年国际乒联WTT澳门冠军赛继续展开首轮比赛争夺,国乒球员表现有喜有忧,新科世乒赛女单冠军赛会3号种子王曼昱在与华裔名将袁佳楠的比赛中状态起伏不定,她在大比分21领先时被对手说好的素质呢?国乒主力赛场行为惹争议,球迷此前传闻或为真目前,受到全世界乒乓球迷关注的WTT澳门冠军赛正在火热进行中。本届赛事的含金量很高,有球迷甚至还表示可能高过世锦赛。看看参赛阵容就清楚,世界排名前30的选手基本上都参赛,而国乒参加刘国梁管管吧!战胜林高远后,梁靖崑现不雅庆祝动作,曾脚踩球台头条创作挑战赛10月19日,2022莫按摩WTT世界乒乓球职业大联盟澳门冠军赛如期开打,首个比赛日的首轮对决,咱们国乒队内的梁靖崑与林高远展开了激烈的争夺。两人为球迷们奉献精彩的比敏感肌功效赛道群狼战功效新锐院线医美围攻薇诺娜编者按今年4月,春雷社率先提出敏感肌功效可能是下一个风口。半年过去,这一说法正在逐渐被验证越来越多的品牌开始推出敏感肌进阶功效产品天猫敏感肌美容护肤市场数据亦显示,敏感肌的修护舒缓内娱15岁Gucci和17岁Dior男模不得不说古驰和迪奥的眼光真是不错,两个还都只是学生,颜值超高,身材超好,还有一双大长腿,任谁看一眼都会心动的吧。接下来就让我们看看这两个男模吧刘耀文刘耀文刘耀文刘耀文刘耀文刘耀文刘三巨头74分!鹈鹕大胜篮网,KD32分,西帝首秀6犯离场,欧文狂铁NBA常规赛的比赛继续进行,篮网对阵鹈鹕,新赛季两支球队的首场比赛,三巨头与三巨头之间的对决,篮网杜兰特,欧文,西蒙斯,鹈鹕锡安,英格拉姆,CJ麦科勒姆,本场比赛也注定是一场精彩对特斯拉2022Q3财报数据解读净利润88。7亿美金不求打赏,求关注点赞分享)注单位均为亿美金。1收入分版块收入季度前三季度Q3季度收入达到历史新高,同比增长55。9前三季度总收入571亿美金(约合4100亿人民币),同比增长58。
13000年前的隧道,高2m宽4米,科学家研究后提出建造者不是人类综述自然界有一些景观构造因为过于精巧,常常被误认为是人工的结果,但实际上它们的形成确实没有人力的参与,只是各种自然力量偶然的成就,比如中国国内就有不少这样的例子,几乎接近于垂直的华AITO问界M5EV看点密集,最大亮点当属车载小艺9月6日,粉丝们期待已久的华为Mate50系列及全场景新品秋季发布会如约而至!其中最激动人心的就要数AITO问界M5EV的发布了。此次AITO问界M5EV全面升级,看点满满。特别是被特斯拉放弃蔚来1年亏40亿,换电模式还能成功吗?头条创作挑战赛说起换电模式的电动车,很多人第一印象,就是蔚来。但其实,在换电模式上,蔚来并不是第一个吃螃蟹的。早在2013年,特斯拉就进行了换电模式的尝试,到2015年,特斯拉更是iphone14就要发布了,新机到手后必须要完成这5个设置iphone14就快要发布了,新iphone到手之后,一定要完成这四个设置。第一,如果你的iphone不是从官网购买的,最好是在拆封激活之前,查询一下序列号,检查一下机器是不是全新成交三连涨二手房走出至暗时刻?5月份,受疫情影响,北京二手房成交跌入谷底。在此之后,以降低贷款利率为主的优化政策开始出台,6月至8月,二手房市场成交迎来了一波三连涨。据统计,8月北京二手房网签13920套,环比新一波起名热潮再次掀起,子涵已成为过去时,老师表示不理解起个好名字并不是一件简单的事情。孩子的诞生为家庭带来了无尽的喜悦,父母更是希望将所有的爱都给予孩子。名字更是饱含深意,同时也体现着时代的特点,独一无二更是成为了时下追捧的对象。子涵王震将军年近30岁仍是单身,贺老总亲自出马,熟悉一周后完成了婚礼今天的西北强省新疆虽然地处祖国的最西边,但是新疆却在发展上表现得尤为出色,不仅有着特色农业,还在工业化上发展得非常出色。而新疆能拥有如此出色的成绩,这就不得不提到一个人物,这就是王血糖不降,多是脾虚,中医名方补脾降糖,脾胃舒坦了今天这篇文章,我想跟你们聊一聊关于高血糖的一些问题。前几天再跟患者沟通的时候,发现一个问题,就是很多三高人群,在用药后,其他方面都有改善,唯独血糖比较难降下来。我下面就给大家分享一女性机器人以假乱真,她能够带来怎样的服务?自从全球进入5G时代,各国科学家都开始创造智能机器人,希望能打造更多性能齐全的机器人,为人类服务,从而解放生产力。(此处已添加小程序,请到今日头条客户端查看)而今天我们介绍的,是日女性机器人功能外形很逼真,却引发争议,网友又不能生娃随着科技的不断发展,机器人的研发定位也有了分支,目前比较受欢迎的机器人为仿真机器人,尤其是仿真伴侣机器人。(此处已添加小程序,请到今日头条客户端查看)比如日本研发出来的女性机器人,51岁李亚鹏带女性回家玩游戏!开心喝酒气氛好,女方曾是王菲情敌51岁李亚鹏带女性回家聚会8月份,一女网友在社媒上,分享出了她在知名男星李亚鹏家中聚餐的动态。动态中,李亚鹏身穿裤衩,与朋友们在家中开心玩游戏,开心喝酒聊天,气氛相当融洽,引起了网
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网