保健励志美文体育育儿作文
投稿投诉
作文动态
热点娱乐
育儿情感
教程科技
体育养生
教案探索
美文旅游
财经日志
励志范文
论文时尚
保健游戏
护肤业界

英伟达CUDA太难OpenAI出手要取代它,新语言性能相当但

  用CUDA为GPU编程实在太难了。
  为了让没有CUDA编程经验的人写出和专家效率相当的GPU代码,现在OpenAI推出了一种新的语言和编译器Triton。
  它的难度比CUDA低,但是性能却可与之相媲美。
  OpenAI声称:
  Triton只要25行代码,就能在FP16矩阵乘法上达到与cuBLAS相当的性能。
  OpenAI的研究人员已经使用Triton,来生成比同等Torch效率高出1倍的内核。
  Triton项目的负责人PhilippeTillet说:我们的目标是使Triton成为深度学习CUDA的可行替代方案。25行代码实现最佳性能
  Triton起源于Tillet在2019年学术会议MLPF上的一篇论文,当时他还是哈佛大学的一名研究生。
  Tillet解决的问题是如何开发一种cuDNN更具表现力的语言,既能够处理神经网络中涉及的矩阵的各种操作,同时兼具可移植性且以及和cuDNN相媲美的性能。
  现代GPU大致分为三个主要组件DRAM、SRAM、ALU,对这些资源进行调度管理十分复杂,即便是熟悉CUDA的程序员。
  Triton可以将这些优化过程完全自动化,让开发者可以更好地专注于并行代码的高级逻辑。
  以矩阵乘法为例,能够为逐元素运算和归约编写融合内核很重要,但考虑到神经网络中矩阵乘法任务的重要性,这还不够。
  Triton非常适合这些应用,只需约25行Python代码即可实现最佳性能。
  而另一方面,在CUDA中实现类似的过程需要花费更多的精力,甚至可能会降低性能。
  手写矩阵乘法内核的一个重要优点是它们可以根据需要进行定制,以适应其输入和输出的融合变换。
  如果没有Triton,对于没有特殊GPU编程经验的开发者来说,矩阵乘法内核的修改是非常困难的。
  Triton背后的原理
  Triton的良好性能,来自于以TritonIR为中心的模块化系统架构,这是一种基于LLVM的中间表示。
  triton。jitdecorator通过遍历提供Python函数的抽象语法树(AST),产生的TritonIR使用通用SSA构建算法上的动态。
  生成的IR代码随后由编译器后端进行简化、优化和自动并行化,然后转换为高质量的LLVMIR(最终转换为PTX)。
  研究人员发现,数据可以通过查看计算密集型块级操作(例如tl。dot)的操作数自动存储到共享内存中,并使用标准活性分析技术进行分配同步。
  另一方面,Triton程序可以通过同时执行不同的内核实例跨SM进行高效和自动并行化,以及通过分析每个块级操作的迭代空间,并在不同的SIMD中进行充分分区将SM内单元并行化。
  目前Triton仅适用于英伟达GPU,但官方表示AMDGPU以及CPU的版本正在开发中。
  开源地址:
  https:github。comopenaitriton
  论文:
  https:dl。acm。orgdoiabs10。11453315508。3329973

瑞芯微发布RV1126智慧视觉应用开发板899元,支持4K3IT之家7月7日消息根据瑞芯微电子官方消息,该公司出品的ToybrickTBRV1126智慧视觉应用开发板今日正式发售,售价899元人民币。这款开发板的核心是瑞芯微推出的高性能……西瓜视频上线无障碍影院,为视障人士提供30余部无障碍电影7月1日消息,近日,西瓜视频PC端和移动端同时上线无障碍影院频道,为视障人士提供包括《一出好戏》《邪不压正》在内的30余部无障碍电影,并将保持每月10部以上专供影片的更新服务。……不是方便你打工摸鱼,抖音上线网页版究竟想干啥因为上线网页版,抖音产品更新又引发一波讨论。有人欢呼上班摸鱼又多了一个利器,也有人吐槽网页版抖音,从设计到功能体验都过于简陋了,用起来不如App爽。这个网页版目前还……社团邀请函汇总8篇邀请函是商务礼仪与世俗礼仪的其中一部分。在不断进步的时代,我们偶尔会使用上邀请函,相信很多朋友都对拟邀请函感到非常苦恼吧,下面是小编为大家整理的社团邀请函8篇,仅供参考,大家一……腾讯云滨海5G边缘计算中心启用支持快速部署和交付10月14日晚间消息,腾讯云宣布首个5G边缘计算中心正式启用。该中心的部署旨在解决长期困扰实时高清音视频、智慧社区、智慧医疗、工业互联网等场景下算力不足和网络时延等问题。……腾讯云DNS方案DoH和DoT开始公测感谢IT之家网友Hakonh的线索投递!IT之家7月27日消息腾讯云DNSPod近期表示,DNS传输协议方案DoTDoH开始公测了。DoT全称是DNSoverTLS……寒假社会实践报告4000字三篇篇一20xx年的寒假又来临了,我们一大批学生将会在假期选择社会实践。实践的目的很简单,走入社会,锻炼自己,同时,减轻家庭负担,赚取较少数额的生活费。通过这次社会实践……建筑劳务合同补充协议样本一直以来,建筑业发展都很迅速,但是对于建筑劳务方面的管理工作却比较落后。那么对于建筑劳务合同补充协议你又是怎样理解的呢?以下是在品学网小编为大家整理的建筑劳务合同补充协议范文,……教师节表彰方案为了弘扬尊师重教的良好风尚,鼓励全县广大教师、教育工作者爱岗敬业、刻苦钻研、教书育人、为人师表的积极性,促进教育事业的健康发展,今年教师节将表彰一百名为我县教育事业做出突出贡献……B站哔哩哔哩6亿元全资收购有妖气原创漫画平台IT之家11月19日消息,据奥飞娱乐发布的深交所公告披露,哔哩哔哩已全资收购奥飞娱乐旗下的有妖气原创漫画平台。本次收购价格为人民币6亿元。公告称,有妖气的主营业务包括有妖气原创……B站将于11月20日举办20212022B站国创动画发布会IT之家11月15日消息,据B站官网,B站将于2021年11月20日18:00举办20212022B站国创动画发布会。据介绍,bilibili国创动画作品发布会于2018……重庆职工带薪年休假条例欢迎来到品学网,重庆的职工年休假如何呢?下面就由小编带大家看看重庆的职工带薪年休假条例。重庆职工带薪年休假条例第一条为了维护职工休息休假权利,调动职工工作积极性,根……
特斯拉被多重打击加身,拖累股价今年以来连续下跌6月3日消息,由于受4月份其全球电动汽车市场份额下降等多重不利因素影响,电动汽车制造商特斯拉公司股价今年以来连续下跌,尤其是在过去三周里出现大幅下跌。特斯拉股价近几个月以……回国两年,准90后总裁带领realme晋级主流品牌在巨头林立的中国市场,将一个全新的手机品牌带领进入主流市场,需要多久?徐起给出的答案是两年。作为realme中国区的掌舵人,他5月20日在微博上宣布,realme中……宁德时代回应磷酸铁锂电池提价10消息不实IT之家5月18日消息据财联社报道,针对磷酸铁锂(LFP)电池报价将调涨的消息,宁德时代方面表示,消息并不属实。今日,台媒援引业内人士消息称,宁德时代磷酸铁锂电池报价将提……搬运工幼儿园亲子游戏教案和孩子玩一玩亲子游戏,了解下孩子的幼儿园学习状况,是真正实现家园共教的好方法,所以,当孩子的幼儿园发出家长邀请的时候,家长们一定要积极配合。游戏目的:锻炼孩子的平衡……富士康与国巨成立合资公司国瀚半导体,初期锁定2美元以下小IC5月6日消息,据国外媒体报道,年初始于汽车领域的全球性芯片短缺,已波及到了智能手机、家电等诸多领域,芯片代工商也在提高产能,力积电新的12英寸晶圆厂,在3月底就已动工,联华电子……阅读月亮是个会撒谎的孩子回答问题附答案月亮是个会撒谎的孩子(17分)那个微凉的午后,我正在家里准备着第二天的出差行李,门铃突然响了,邮递员将一封普通的信件递至我手中,然后转身离去。拆开信封一看,里面有两……台积电2月份营收37。6亿美元,同比增长14但环比有大幅下滑3月10日消息,据国外媒体报道,芯片代工商台积电今日下午公布了2月份的营收,同比依据保持高速增长,但环比却出现了大幅下滑。台积电官网的信息显示,在今年2月份,他们的营收为……台积电回应拟在欧洲设厂不排除任何可能性,但未有赴欧计划IT之家3月9日消息此前有外媒称台积电除了在美国建设先进制程的的芯片生产厂外,还可能会在欧洲建设芯片生产工厂。此外,还有消息称欧盟将通过2030年高端芯片在欧洲达到20在当地生……腾讯的2020港股冠军的光环和反垄断的阴影在过去的52周,腾讯的最低股价为324。29港元,最高为633港元。按照最高股价计算,腾讯的总市值在过去一年创造了历史新高突破6万亿港元。在2018年的930改革后,经历……微信支付页上线出行服务,提供驾车服务和公交地铁等功能感谢IT之家网友淚还是戾的线索投递!IT之家12月29日消息早些时候,微信支付页中的腾讯服务在深圳、北京、广州地区上线了一种全新的出行服务,聚合了包含车主服务、公交出行等……济南地铁2号线开通运营穿过中心城区,四大场站首次实现无缝换乘IT之家3月26日消息根据齐鲁晚报消息,济南地铁2号线今日正式初步运营。该线路横向串联起1号线和3号线,形成H型交通网,标志着济南地铁正式进入换乘时代。该线路穿过中心城区,经过……中国中车太原地铁2号线车辆全部发运,可满足全自动无人驾驶运营IT之家3月25日消息从中国中车获悉,3月22日,最后1列太原地铁2号线车辆包装起运,24列太原地铁车辆在中车大连公司旅顺新厂区的生产、调试、交验工作全部完成。图源:中国……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网