童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

AI的大模型时代只有大模型的AI时代

10月22日 发如雪投稿
  什么样的技术能经历时间洗礼还历久弥新?
  答案或许可以归总为一个“三部曲”般的规律兴起、发展和大规模应用,外加这个过程再一次演进式的迭代。
  以史为鉴,引领第一次工业革命的是蒸汽机,当它演进成为内燃机并开始普及时,第二次工业革命的颠覆者电能本身以及与它相关的各种设备正处于初创期,而在电力设备走向微电子的迭代革新时,各种燃油引擎还在持续改良和普及中。
  从这个规律来看,大语言模型(简称LLM)出现后虽然霸占了所有与AI相关的关键词,吸引了所有人的注意力,但这并不代表“LLM之前无AI”。
  在大模型出尽风头的同时,此前以决策为特长的老一代机器学习应用,以及侧重感知能力的“传统”深度学习应用也没闲着,它们正走过喧嚣的青春期,步入稳扎稳打的实战阶段。
  何以为证?
  某芯片大厂就推出了一连串的AI实战手册,分别锁定制造与能源、医药、金融、交通与物流,以及教育行业的AI实践。
  在今年更新的物流交通和医疗健康AI实战手册中,就记录了很多已经或正在落地的AI应用,及如何将它们顺利部署和充分释放其性能加速潜力,当然还有它们在一些耳熟能详的头部企业深入一线的应用实例。
  所以,AI不是只有大模型。AI的大模型时代也只有大模型的AI时代。
  成熟的AI,早就已经上岗了
  或许你还不敢相信,现在哪怕小小的快递背后,都已经有AI技术在加持了。
  没错,而且近乎涉足了物流全流程:下单、发货、分拣、转运、配送AI现在统统都要“管一管”。
  以经典的OCR(光学字符识别)技术为例,它在物流“技术界”的地位可谓是举足轻重,大幅提高了工作效率。
  比如发货时的寄件人填报地址、身份信息,电商仓库核对出货的货品信息,都可以借助OCR,“啪地一下”,实现一键录入。
  随着AI技术的愈发完善和应用的加深,这种速度做到了“没有最快只有更快”。
  我们熟知的韵达快递就是如此,在三段码OCR识别过程中,它原本希望AI能将OCR识别的准确率达到95。
  结果现在的AI却给韵达“上了一课”,不仅准确率直接飙到接近98,甚至时间也给“打了下去”:从130ms降至114ms。
  性能测试结果基于韵达于2022年10月进行的测试
  而且OCR识别还仅仅是AI涉足物流行业的小小一隅,一张图来看感受下它现在所起到的power:
  嗯,AI如此allin,怪不得国内物流的速度都要起飞了呢。
  不过朋友,这还仅仅是AI加速千行百业的一个案例,其实我们现在每天的出行,同样也是充斥着AI的“味道”。
  例如AI视频分析技术,可以针对高速公路上的路况做到实时地分析。
  不论是车流流量监控、车辆车牌识别,亦或是事故预警等等,AI可谓是将一切尽收眼底。
  如此一来,便可以有效且精准地对路面状况做到把控。
  再如机场,在AI技术加持下的摄像头,也可以细粒度识别航空器、车辆、人员,以及违边等情况,这样便对飞行区域的安全提供了一定的保障。
  从以上几个小小用例中不难看出,“成熟”的AI,或者说几年前那些当红明星类的AI应用看似风光不在,但它们实则已深入到我们生活中的方方面面,并且主打的就是一个“节支增效”。
  那么如此“节支增效”背后,到底是怎么做到的?
  不卖关子,直接上答案
  提供帮助的正是英特尔的平台,特别是至强可扩展处理器。同样,我们前文所指的某芯片大厂也是英特尔,给出多个行业AI实战手册的还是它。
  但解锁如此能力的,可不仅仅是一颗CPU这么简单,而是有英特尔软件层面上的优化加成;换言之,就是“软硬一体”后的结果。
  简单归结:至强可扩展处理器及其内置的AI加速器,以及OpenVINO,oneAPI等一系列AI框架和优化软件打辅助。
  当前影响AI应用性能的要素无非两个:算力和数据访问速度。
  目前最新的第四代至强可扩展处理器的单颗CPU核数已经增长到最高60核。而在数据访问速度上,各级缓存大小、内存通道数、内存访问速度等都有一定程度的优化,另外在CPUMax系列中还集成了HBM高带宽内存技术。
  此外,在CPU指令集上也做了优化,内置了英特尔高级矩阵扩展(英特尔AMX)等硬件加速器,负责矩阵计算,加速深度学习工作负载,堪称CPU加速AI应用的C位。
  它有点类似于GPU里的张量核心(TensorCore)。
  AMX由两部分组成,一部分是1kb大小的2D寄存器文件,另一部分是TMUL模块,用来执行矩阵乘法指令。它可同时支持INT8和BF16数据类型,且BF16相较于FP32计算性能更优。
  有了AMX指令集加持,性能比前一代至强可扩展处理器内置的矢量神经网络指令集VNNI提升达8倍,甚至更高。
  除了核心硬件平台外,实际情况中帮助这些行业实战AI应用落地的,还有一系列英特尔“亲生”但不“私享”的AI软件工具。
  例如前面提到的OCR加速就离不开OpenVINO的优化,它删减了很多训练部分所需的冗余计算,主要支持推理部分。
  而且也是专门针对英特尔硬件打造的优化框架,只需5行代码就可以完成原有框架的替换。
  用户可以针对不同业务场景,来优化OpenVINO运行参数。
  这样一套软硬件组合拳打下来,英特尔不仅充分释放了CPU计算潜力,而且在实际的推理场景中也实现了近乎GPU的性能,同时还有成本低、门槛低、易上手等附加优势。
  然而,这些仅仅是已经成熟上岗的AI技术在英特尔平台得到的优化,英特尔的能力还远不止如此。
  这就要说回大模型了。
  当红大模型,也在被加速
  目前大语言模型正被全球各大科技公司竞相追逐,毕竟现在科技圈都将它视为未来发展的趋势所在。
  虽然相比那些成熟的AI技术和应用,它距大规模落地还有段距离,但其技术领先性不容置疑,乃至“老一辈”的AI应用也有望在与它结合,或被它改造后重焕新生。
  英特尔作为基础算力输出者和应用性能加速器,同样在这场你追我赶的竞技场中未雨绸缪,早有布局。
  首先,大模型再先进,也需要有更多人用上它,才可充分变现其价值。要想“玩转”它,在其庞大的体量面前,成本便是一个老大难的问题。
  因此,英特尔就祭出了一款增强型的“减(量)重(化)神(工)器(具)”,可以让一个十亿参数的大语言模型瘦身34,增强其准确性,还能有效地提升大模型在英特尔平台上的推理性能。
  具体而言,所用到的是SmoothQuant技术,英特尔将其适配到自己的平台,并实现其增强。此方法已经整合至英特尔NeuralCompressor。这是一个包含量化、剪枝(稀疏性)、蒸馏(知识提炼)和神经架构搜索等多种常用模型压缩技术的开源Python库,它已经支持多款英特尔架构的硬件,并且已经兼容TensorFlow、PyTorch、ONNXRuntime和MXNet等主流框架。
  其次,在硬件层面上,英特尔也有所发力。
  例如最近大火的ChatGLM6B,其借助第四代至强可扩展处理器内置的英特尔AMX,让模型微调计算速度得以大幅提升;利用至强CPUMax系列处理器集成的HBM,满足大模型微调所需的大内存带宽。
  英特尔AMX技术架构
  除了CPU,英特尔还有专用的深度学习加速芯片HabanaGaudi2,其能在单个服务器内部署8张加速卡(称为Habana处理单元,即HabanaProcessingUnit,简称为HPU),每张卡内存高达96GB,可提供足够的空间来容纳大模型。
  因此即使是BLOOMZ这样拥有1760亿参数的千亿级大语言模型,经英特尔优化后也能将性能时延控制在3。7秒。对于参数量为70亿的较小模型BLOOMZ7B,在Gaudi2的单设备时延约为第一代Gaudi的37。21;而当设备数量都增加为8后,这一百分比进一步下降至约24。33。
  BLOOMZ在Gaudi2和第一代Gaudi上的推理时延测试结果
  而后在软件层面上,针对像ChatGLM这样大受欢迎的大语言模型,英特尔还可以通过为其创建OpenVINOstateful模型来实现优化:压缩权重以降低内存带宽使用率,提升推理速度。
  这便是英特尔“软硬一体”打法在大模型应用上的直接体现了。而且硬件还不再仅限于CPU,更是有可在训练和推理性能上都可与GPU比肩,在性价比上馋哭大家的Gaudi。
  最后在安全方面,英特尔也是做到了“鱼与熊掌兼得”:基于英特尔SGXTDX的可信执行环境(TEE)可为大模型提供更安全的运行环境,还不需要拿性能做交换。
  这便是英特尔在AI大模型时代中的“加速之道”了。
  还会带来怎样的变革?
  纵观AI技术的发展之路,不难发现英特尔在其中履行着一条非常清晰的准则用起来才是硬道理。甚至只在数据中心和边缘中用都不够,最好每个人的每台电脑,每个信息终端设备都有独立加速AI应用的能力才能“芯”满意足。
  因此英特尔已将创新使命调整为:在各种硬件产品中加入AI能力,并通过开放、多架构的软件解决方案,推动AI应用的普及,促进“芯经济”的崛起。
  英特尔的“加速之道”不仅是让技术更快落地和普及,更是要以用促用,以用促新,以用促变,为下一世代的技术变革埋下伏笔。
  那么英特尔这条路上是否有一个终极目标?
  或许正如IntelInnovation2023上不断重复和强调的:
  (举报)
投诉 评论

做播客,肯定亏钱啊。2023年7月5号,腾讯旗下的企鹅FM宣布下线,并于9月6日正式停止运营。一边是大厂关停旗下的音频产品,一边是国内收听音频在线人数的不断攀升。而这几年,我们朋友圈里……世界第一ERP厂商SAP,推出类ChatGPT产品Joule9月27日,世界排名第一ERP厂商SAP在官网宣布,推出生成式AI助手Joule,并将其集成在采购、供应链、销售、人力资源、营销、数据分析等产品矩阵中,帮助客户实现降本增效。……当AI成为“逆子”:人类该抽丫俩逼兜,还是给它一个拥抱?(零)内容小提要科学家把AI称为“人类之子”。在我看来,这个比喻意味深长,因为它背后有一串追问:这些问题,在几年前看来根本是杞人忧天的笑话;但在AI大模型出世……精分的美国人,一边在TikTok“葛优躺”,一边把自律App在刚刚过去的这个夏天,“bedrotting”“美版葛优躺”似乎成为了一种潮流。以TikTok美区为起点,“bedrotting”的热度不断爬升,扩散到全网,甚至“惊动”了不少……GPT4太烧钱,微软想甩掉OpenAI?曝出PlanB:千块GPT4太吃算力,微软被爆内部制定了PlanB,训练更小、成本更低的模型,进而摆脱OpenAI。GPT4太吃算力,连微软也顶不住了!今年,无数场微软AI大会上,CE……AI的大模型时代只有大模型的AI时代什么样的技术能经历时间洗礼还历久弥新?答案或许可以归总为一个“三部曲”般的规律兴起、发展和大规模应用,外加这个过程再一次演进式的迭代。以史为鉴,引领第一次工业革命的……还在一问一答?一文读懂GPT4的超级Prompt你是否还在与GPT4进行一问一答回答的互动?如果是,那么你可能还没有体验到GPT4的全力。今天,我要和你深入探讨“超级Prompt”的神奇功能,这个功能就像是你与GPT4沟通的……北美爆火的“狼人”短剧,来自中国APP国产剧出海历史久远,早在上世纪90年代开始,以四大名著翻拍剧为代表的剧集就在东南亚掀起热潮。2019年,随着国内长视频平台“优爱腾”(优酷、爱奇艺、腾讯)出海,在东南亚多……打破次元壁的数字人,出现在了今年口碑最好的漫改剧里《异人之下》播至结局,豆瓣评分稳定在了8。1,已成为今年口碑最好的漫改剧。围绕剧情、表演的讨论从开播起就未停息,直到今日剧粉仍保持高涨的热情。改编这样一部国民级漫画作品的……36款游戏上半年流水曝光:14款流水过亿,3款花上亿买量没想到越来越卷的SLG还有不小的上升空间,这是我观察上半年游戏流水后的第一个想法。随着上市游戏公司的半年报陆续发布,部分公司也公布了旗下主要游戏的流水数据。游戏新知整理出……让大模型触手可及,言犀AI开发计算平台上线大模型爆火的一年中,生成式AI行业最重要的发展瓶颈出现在算力侧。9月20日,红杉美国在文章《生成式AI的第二幕》提到,许多生成式人工智能公司在过去一年中很快发现,自身的发展瓶颈……降本提效促成交,抖音电商商品卡实时免佣这么做就对了!抖音电商深耕全域生意,于今年3月推出商品卡免佣政策助力商家开辟生意新阵地,运行半年多,已有超百万商家收获可观免佣收益。9月1日起,商品卡免佣政策升级为实时免佣,佣金实时返还、金……
曾靠瓶身营销摘得世界级大奖的可口可乐,今夏又玩儿出了什么新花可口可乐的平身营销往往让用户耳目一新,那么今夏可口可乐的新花样又是什么?其背后的逻辑何在,文章为你解读。蝉鸣无止无休,温度三十五六下午两点,后颈胶着在凉席上,电风扇……为何各类互金平台都打造投资管理分析工具?本文作者将与大家分享各类互金平台都打造投资管理分析工具的原因。enjoy互联网金融在国内经过近十年的发展,行业格局雏形已现,行业分化明显,两类头部公司继续高歌猛进,拉大中……重新审视设计和商业的联系,这是我的一点思考平时我们大家都在谈产品、谈用户体验、谈同理心等等,尤其是产品经理更会考虑产品的盈利模式和推广落地;然而大家谈论的产品落地和盈利模式却是柳冠中教授特别反对的事情。我们先来了……在创办今日头条的过程中,张一鸣先生的团队管理心得以人为核心的公司,怎么可能不成功?题图:今日头条创始人兼CEO、战略投资人张一鸣先生过去11年,张一鸣先生先后参与创办酷讯、饭否、九九房,虽然屡战屡败,但他不以为意……三大对比看共享汽车:寒冬漫长,春天尚远在共享经济的浪潮中,共享汽车究竟是会溺水,还是能踏浪而行?近日,一条“开共享汽车上高速,在服务区上洗手间出来发现车被扫走了”的朋友圈火了。而在此之前,“沈阳惊现1500辆……“三低一高”特征凸显的猎头市场,其实你我素人都有机会当下的猎头市场,正在发生新的变化,在服务方(猎头机构)与需求方(用人单位)之间呈现出了双向发展势态;二者最为核心的特点可以概括为“低龄化、低薪化、低成本化和高效化”这“三低一高……百家风控公司揭秘系列3京东系ZRobot公司及产品调研报告调研了上百家从事风控数据业务的公司,有行业大牛也有各种低调开展业务的,在不会泄露各公司太敏感信息的前提,本着客观的角度及学习的态度,逐一揭秘各家公司的征信风控产品及数据源特色。……掌握正确的喝水方式,轻松排毒减肥摘要:水是生命之源,人一天至少应该补充八杯水的水分。另外除了促进正常稳健的新陈代谢血液循环,正确的喝水方法还能起到排毒养颜减肥瘦身的效果。“喝水减肥”估计很多朋友都听说过,所没……产品经理日报第1037期饿了么收购百度外卖后,美团外卖表示:哈喽,你我相约七点半,你来了么产品经理日报继续为您带来今日最新的资讯:8月24日,饿了么创始人张旭豪的公开信显示,饿了么终于正式宣布收购百度外卖;对此,美团外卖官方发表声明,称……新榜创始人徐达内:第一性原理给我带来了怎样的颠覆性思考?一个企业最大的短板是CEO本人,CEO决定着整个企业发展的天花板。在混沌创业营上了两次课,一共六个整天,对我震撼颇大,特别是那句“不要靠直觉,要有哲科思维,要刻意练习”,……回归产品基因,聊聊后直播时代的陌陌经济学未来,陌陌的股价主要靠视频社交的故事来支撑。视频社交的口号能否落地、基于社交的视频内容生态能否搭建,也许决定了陌陌能跑多快、跑多久。巨头盘踞在熟人社交的山头难以被撼动,通……个人思考丨心理学专业知识在用户研究中的一些应用心理学是研究心理现象的科学,这一定义突出了其科学性的地位,也表明所有的结论来源都应该有其追根溯源性。本文将结合自身经历,谈谈心理学在用户研究工作中的应用。观点仅供参考。随……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界