专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

深度学习GPU选购指南

  作者丨MikeClayton
  来源丨DeepHubIMBA
  编辑丨极市平台
  在进行机器学习项目时,特别是在处理深度学习和神经网络时,最好使用GPU而不是CPU来处理,因为在神经网络方面,即使是一个非常基本的GPU也会胜过CPU。
  但是你应该买哪种GPU呢?本文将总结需要考虑的相关因素,以便可以根据预算和特定的建模要求做出明智的选择。为什么GPU比CPU更适合机器学习?
  CPU(中央处理器)是计算机的主力,它非常灵活,不仅需要处理来自各种程序和硬件的指令,并且处理速度也有一定的要求。为了在这种多任务环境中表现出色,CPU具有少量且灵活快速的处理单元(也称为核)。
  GPU(图形处理单元)GPU在多任务处理方面不那么灵活。但它可以并行执行大量复杂的数学计算。这是通过拥有更多数量的简单核心(数千个到上万)来实现的,这样可以同时处理许多简单的计算。
  并行执行多个计算的要求非常适合于:图形渲染移动的图形对象需要不断地计算它们的轨迹,这需要大量不断重复的并行数学计算。机器和深度学习大量的矩阵张量计算,GPU可以并行处理。任何类型的数学计算,可以拆分为并行运行。
  在Nvidia自己的博客上已经总结了CPU和GPU的主要区别:张量处理单元(TPU)
  随着人工智能和机器深度学习的发展,现在已经有了更专门的处理核心,称为张量核(Tensorcores)。在执行张量矩阵计算时,它们更快更有效。因为我们在机器深度学习中所处理的数据类型就是张量。
  虽然有专用的tpu,但一些最新的GPU也包括许多张量核,我们会在后面总结。NvidiavsAMD
  这将是一个相当短的部分,因为这个问题的答案肯定是Nvidia
  虽然可以使用AMD的gpu进行机器深度学习,但在写本文时,Nvidia的GPU具有更高的兼容性,并且通常更好地集成到TensorFlow和PyTorch等工具中(比如目前PyTorch的AMDGPU的支持还只能在Linux上使用)。
  使用AMDGPU需要使用额外的工具(ROCm),这个会有一些额外的工作,并且版本可能也不会更新的很快。这种情况将来可能会有所改善,但是现在为止,最好还是使用Nvidia。GPU选择的主要属性
  选择一个够完成机器学习任务并且符合预算的GPU,基本上归结为四个主要因素的平衡:GPU有多少内存?GPU有多少个CUDA和或张量核?卡使用什么芯片架构?功耗要求是多少(如果有)?
  下面将逐一探讨这些方面,希望能让你更好地理解什么对你来说是重要的。GPU内存
  答案是,越多越好!
  这实际上取决于你的任务,以及这些模型有多大。例如,如果你正在处理图像、视频或音频,那么根据定义,你将处理相当大量的数据,GPURAM将是一个非常重要的考虑因素。
  总有办法解决内存不足的问题(例如减少批处理大小)。但是这将会浪费训练的时间,因此需要很好地平衡需求。
  根据经验,我的建议如下:
  4GB:我认为这是绝对的最小值,只要你不是在处理过于复杂的模型,或者大的图像、视频或音频,这个在大多数情况下能工作,但是达不到日常使用的需要。如果你刚刚起步,想尝试一下又不想全力投入,那么可以从它开始
  8GB:这是一个日常学习很好的开始,可以在不超过RAM限制的情况下完成大多数任务,但在使用更复杂的图像、视频或音频模型时会遇到问题。
  12GB:我认为这是科研最基本的的要求。可以处理大多数较大的模型,甚至是那些处理图像、视频或音频的模型。
  12GB:越多越好,你将能够处理更大的数据集和更大的批处理大小。超过12GB才是价格真正开始上涨的开始。
  一般来说,如果成本相同的话,选择速度较慢但内存较大的卡会更好。请记住,GPU的优势是高吞吐量,这在很大程度上依赖于可用的RAM来通过GPU传输数据。CUDA核心和Tensor核心
  这其实很简单,越多越好。
  首先考虑RAM,然后就是CUDA。对于机器深度学习来说,Tensor核比CUDA核更好(更快,更有效)。这是因为它们是为机器深度学习领域所需的计算而精确设计的。
  但是这并不重要,因为CUDA内核已经足够快了。如果你能得到一张包含Tensor核的卡,这是一个很好的加分点,只是不要太纠结于它。
  后面你会看到CUDA被提到很多次,我们先总结一下它:
  CUDA核心这些是显卡上的物理处理器,通常有数千个,4090已经1万6了。
  CUDA11数字可能会改变,但这是指安装的软件驱动程序,以允许显卡正常的工作。NV会定期发布新版本,它可以像任何其他软件一样安装和更新。
  CUDA代数(或计算能力)这描述了显卡卡在它的更新迭代的代号。这在硬件上是固定的,因此只能通过升级到新卡来改变。它由数字和一个代号来区分。例子:3。x〔Kepler〕,5。x〔Maxwell〕,6。x〔Pascal〕,7。x〔Turing〕和8。x(Ampere)。芯片架构
  这实际上比你想象的更重要。我们这里不讨论AMD,我的眼里只有老黄。
  上面我们已经说了,30系列的卡就是Ampere架构,最新的40系列是AdaLovelace。一般老黄都会使用一个著名科学家和数学家来对架构命名,这次选择的是著名英国诗人拜伦之女,建立了循环和子程序概念的女数学家、计算机程序创始人AdaLovelace来命名。
  了解对于卡的计算能力,我们要了解2个方面:
  显着的功能改进
  这里一个重要的功能就是,混合精度训练:
  使用精度低于32位浮点数的数字格式有很多好处。首先它们需要更少的内存,从而能够训练和部署更大的神经网络。其次它们需要更少的内存带宽,从而加快数据传输操作。第三数学运算在精度降低的情况下运行得更快,尤其是在具有TensorCore的GPU上。混合精度训练实现了所有这些好处,同时确保与完全精度训练相比不会丢失特定于任务的准确性。它通过识别需要完全精度的步骤并仅对这些步骤使用32位浮点而在其他任何地方使用16位浮点来实现这一点。
  这里是Nvidia官方文档,有兴趣的可以看看:
  https:docs。nvidia。comdeeplearningperformancemixedprecisiontrainingindex。html
  如果您的GPU具有7。x(Turing)或更高的架构,才有可能使用混合精确训练。也就是说桌面的RTX20系列或高版本,或服务器上的T或A系列。
  混合精度训练具有如此优势的主要原因是它降低了RAM使用率,TensorCore的GPU会加速混精度训练,如果没有的话使用FP16也会节省显存,可以训练更大的批大小,间接提升训练速度。
  是否会被弃用
  如果你对RAM有特别高的要求,但又没有足够的钱买高端卡,那么你可能会选择二手市场上的老款GPU。这有一个相当大的缺点这张卡的寿命结束了。
  一个典型的例子就是TeslaK80,它有4992个CUDA核心和24GB的RAM。2014年,它零售价约为7000美元。现在的价格从150到170美元不等!(咸鱼的价格600700左右)这么小的价格却有这么大的内存,你一定很兴奋。
  但是这有一个非常大的问题。K80的计算架构是3。7(Kepler),CUDA11起已经不支持(当前CUDA版本为11。7)。这意味着这张卡已经废了,所以它才卖的这么便宜。
  所以在选择2手卡时一定要看清楚是否支持最新版本的驱动和CUDA,这是最重要的。高端游戏卡VS工作站服务器卡
  老黄基本上把卡分成了两部分。消费类显卡和工作站服务器的显卡(即专业显卡)。
  这两个部分之间有明显的区别,对于相同的规格(RAM,CUDA内核,架构),消费类显卡通常会更便宜。但是专业卡通常会有更好的质量,和较低的能源消耗(其实涡轮的噪音挺大的,放机房还可以,放家里或者试验室有点吵)。
  高端(非常昂贵)的专业卡,你可能会注意到它们有很大的RAM(例如RTXA6000有48GB,A100有80GB!)。这是因为它们通常直接针对3D建模、渲染和机器深度学习专业市场,这些市场需要高水平的RAM。再说一次,如果你有钱,买A100就对了!(H100是A100的新版,目前无法评价)
  但是我个人认为,我们还是选择消费者的高端游戏卡,因为如果你不差钱,你也不会看这篇文章,对吧选择建议
  所以在最后我根据预算和需求提出一些建议。我将其分为三个部分:低预算中等预算高预算
  高预算不考虑任何超出高端消费显卡。还是那句话如果你有钱:A100,H100随便买。
  本文中会包含在二手市场买到的卡片。这主要是因为我认为在低预算的情况下,二手是可以考虑的。这里还包括了专业桌面系列卡(T600、A2000和A4000),因为它的一些配置比同类消费类显卡稍差,但功耗明显更好。
  低预算
  中等预算
  高预算
  在线云服务
  如果你决定花钱买显卡不适合你,你可以利用谷歌Colab,它可以让你免费使用GPU。
  但这是有时间限制的,如果你使用GPU太长时间,他们会把你踢出去,然后回到CPU上。如果GPU处于非活动状态太长时间,可能是在你写代码的时候,它也会把GPU拿回来。GPU也是自动分配的,所以你不能选择你想要的确切的GPU(你也可以每月9。9刀弄个ColabPro,我个人觉得要比低预算好很多,但是要求有梯子,49。99的ColabPro有点贵,不建议)。
  在写本文时,通过Colab可以获得以下GPU:
  在前面也提到了,K80有24GB的RAM和4992个CUDA核心,它基本上是两个K40卡连在一起。这意味着当你在Colab中使用K80时,你实际上可以访问一半的卡,所以也就是只有12GB和2496个CUDA内核。总结
  最后现在4090还是处于耍猴的状态,基本上要抢购或者加价找黄牛但是16384CUDA24GB,对比3090的10496CUDA,真的很香。
  而408016G的9728CUDA如果价格能到7000内,应该是一个性价比很高的选择。12G的4080就别考虑了,它配不上这个名字。
  对于AMD的7900XTX应该也是一个很好的选择,但是兼容性是个大问题,如果有人测试的话可以留言。
  40系列老黄一直在耍猴,所以如果不着急的话还再等等把:你不买,我不买,明天还能降两百

中石油和中石化,在哪个地方工作薪水高?感谢邀请,本人在中石化一线钻井队工作了十几年了,每个油田的待遇都是不一样的。主要根据产量来划分,胜利油田作为中石化的老大哥待遇是最高的。09年在四川的时候我的岗位是钻井队技术员,一军校文凭与地方211大学文凭,谁含金量高?军校文凭与地方211大学文凭,哪个含金量高?我认为要从两方面来看1,技术类军事院校军校分很多种,比如军医大学就有海军军医大学空军军医大学陆军军医大学之分比如解放军通信指挥学院解放军连续几天没有收入了,今后的日子里该怎么过活呀?我今天刚刚帮一个孤儿申请民政孤儿助学金。前几天,她发微信给我,表达了想死的念头。我急忙微信问她,到底怎么回事?她说,现在她正在读职高,读到二年级了,成绩很好,正在准备报考高职高专,粮食涨价太疯狂,小麦突破1。8元,农村种植的春天要来了吗?很多人都有一种误解,觉得农民穷是因为粮食价格低。而实际上,中国农民穷的根源,在于人多地少。人口太多了,平均到每个人拥有的土地太少,所以富裕不起来。而粮食疯狂涨价,小麦突破1。8元,80年的,失业了,还身体不好,我该怎么办呢?离退休还20年呢?80年出生,才42岁,正值人生黄金年龄段,失业可以再就业,现在到处在招工。年纪轻轻,身体不好,应该赶快治疗,不能久拖不治。人生在世,一切全靠自己,即使有別人帮你也是暂时的,应该自强沙漠里遍地是西瓜为何无人敢吃?首先,沙漠遍地是西瓜?这个肯定有点夸张。不过沙漠里的确有一种类似于西瓜的植物,真的很可能会给那些沙漠里极度缺水快要丧失意识的人们带来一丝希望。这种类似西瓜的植物叫药葫芦就像武侠小说3。21空难垂直坠落时,你会认同遇难同胞集中飞机机头部位吗?3。21空难失事飞机的遇难同胞应该不会集中在航班飞行员所在的驾驶舱部位。依据创伤心理学家祝卓宏的表述,如果不能得到适当的心理干预,对很多人来讲,亲人突然遇难造成的心理创伤可能是持久三门峡市有哪些大学?题主你好2018年高考越来越近了,从问题来看,题主可能是三门峡人,想要留在自己的家乡继续学习,也可能是来自河南省其他地方,想去三门峡继续自己的学习历程,但是,很遗憾的告诉题主,根据每月有退休金3000元,存款10万元,在县城能满足生活吗?生活上的满足其实很简单,无论哪一方面,唯生活为先,吃饱吃好为满足,清淡粗粮为满足,大鱼大肉也为满足,花天酒地也是满足,满足的界限太宽太多,真正能否满足的是自己说了算。如果你不吃酒吸大家觉得应不应该在东航失事点建立墓碑?应该,安抚亡魂。祭奠逝者,安慰亡灵家属。东航的MU5735航班在3月21日从昆明飞往广州时,于14点22分坠毁在广西梧州藤县的一个山区丛林里,机上132名乘客和机组人员无一幸免,国现在开个BBA,别人会高看你一眼吗?现在开BBA,别人是否高看我不知道我是2012年国庆节,在深圳仁孚买的奔驰E300L落地58万,我说说自己的感受呐当时开着去外面吃饭,反正保安都会跑过来帮忙找个位子给你,然后我后面
三星将在1月18日推出三星GalaxyA34GalaxyA54两款机型继三星GalaxyS23系列确定定档日期之后,三星再次预告A系列两款新机的发布日期。新机资讯1月8日消息,三星于今日预热GalaxyA34和A54系列新机,这两款新机将于1月18日武汉一楼盘停工,业主抱团停贷这份近日在网络热传的武汉时代新城全体业主强制停贷告知书(以下简称告知书)显示,武汉市汉南时代新城项目逾期交房数月,业主多次现场维权仍无实质进展,数千户业主(已售房源且未结清贷款)决宣布破产的斯里兰卡后续会怎么样斯里兰卡这个国家彻底乱套了,进入七月份,先是人宣布了国家破产了,紧接着六号总统宣布辞职,九号爆发了这个国家史无前例的示威游行,上万人走上街头,冲进总统府。这个国家用最极端的方式向全王庆来进城后你尾巴上天了,还能不能好好过日子了幸福和王庆来还在村里的时候,庆来顶多就是老实了一点,怂了一点,但自打进城后,这一波一波的脾气真是没少涨啊。庆来供弟弟庆志读书,但这跟亚妮爸爸什么事,想想亚妮第一次去庆志家时,他父母这3种酒让人防不胜防,已被列入假酒名单,添加剂太多别再喝绝大多数人喝酒,是为了快乐,是为了助兴。一旦遇到酒,管它三七二十一,先喝爽再说。因此,他们却忽略了酒质,以及安全系数。尤其是在选购白酒时,总有一种贪小便宜的心理,认为哪种酒便宜,同公务员遴选排除非全日制?别搞一票否决日前,多家媒体注意到,山东德州一网友在人民网领导留言板建议公务员遴选时放宽学历限制。官方回应称,遴选机关不再对学历性质限制为全日制。上述网友的建议被媒体曝光后,很快便得到不少网民的光绪死因被揭开,是寿终正寝还是被谋害?真的是慈禧动的手吗?你敢相信吗,历史上竟然有两天内皇帝和太后相继去世的奇闻?这事的主角不是别人,正是大名鼎鼎的慈禧太后和她的养子光绪皇帝。这种事情,翻遍整个中国历史也算是十分罕见了。那这两个人的死亡有韩综多离谱?拍早孕生子的高中生,思想太开放,还是根本没脑子?众所周知,韩国人一向以敢拍敢说闻名,电影是超现实翻拍,韩综也以开得起玩笑而火爆。但尺度太大也会有翻车的时候,比如前段时间出的一部有关高中生父母的综艺,就引来了观众的一篇骂声。在继假1948年,国军将领妻子被6人玷污,施暴者下场如何?以下图片均来自于网络,用于模拟场景。文影中纪实编辑影中纪实前言1948年,这时正值国共双方战争最激烈的时候,在人民解放军的强大攻势下,国民党各部早已风雨飘摇人心惶惶。在这乱世之下,熬夜后补觉真的有用吗熬夜有害健康,有人认为这可以靠好好睡几觉补救回来,但事实真是如此吗?补觉对于缓解精神和身体疲劳有一定的作用,但是对于身体的损伤是很难修复的。补觉时一般都是通过白天晚起而完成的。但是市场震荡现在还能上车吗沉寂了4个月后,A股5月以来回暖显著,一度重新站上3400点。(数据来源WIND,截至2022年7月1日)阶段性回暖之后投资者是否还能进场?要回答这个问题,我们不妨来看看这两组数据
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网