范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

CPU和GPU的区别是什么?

  1.2CPU和GPU的设计区别
  CPU和GPU之所以大不相同,是由于其设计目标的不同,它们分别针对了两种不同的应用场景。CPU需要很强的通用性来处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理。这些都使得CPU的内部结构异常复杂。而GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。
  于是CPU和GPU就呈现出非常不同的架构(示意图):
  图片来自nVidia CUDA文档。其中绿色的是计算单元,橙红色的是存储单元,橙黄色的是控制单元。
  GPU采用了数量众多的计算单元和超长的流水线,但只有非常简单的控制逻辑并省去了Cache。而CPU不仅被Cache占据了大量空间,而且还有有复杂的控制逻辑和诸多优化电路,相比之下计算能力只是CPU很小的一部分
  从上图可以看出:
  Cache, local memory: CPU > GPU
  Threads(线程数): GPU > CPU
  Registers: GPU > CPU 多寄存器可以支持非常多的Thread,thread需要用到register,thread数目大,register也必须得跟着很大才行。
  SIMD Unit(单指令多数据流,以同步方式,在同一时间内执行同一条指令): GPU > CPU。
  CPU 基于低延时的设计:
  CPU有强大的ALU(算术运算单元),它可以在很少的时钟周期内完成算术计算。
  当今的CPU可以达到64bit 双精度。执行双精度浮点源算的加法和乘法只需要1~3个时钟周期。
  CPU的时钟周期的频率是非常高的,达到1.532~3gigahertz(千兆HZ, 10的9次方).
  大的缓存也可以降低延时。保存很多的数据放在缓存里面,当需要访问的这些数据,只要在之前访问过的,如今直接在缓存里面取即可。
  复杂的逻辑控制单元。当程序含有多个分支的时候,它通过提供分支预测的能力来降低延时。
  数据转发。 当一些指令依赖前面的指令结果时,数据转发的逻辑控制单元决定这些指令在pipeline中的位置并且尽可能快的转发一个指令的结果给后续的指令。这些动作需要很多的对比电路单元和转发电路单元。
  GPU是基于大的吞吐量设计。
  GPU的特点是有很多的ALU和很少的cache. 缓存的目的不是保存后面需要访问的数据的,这点和CPU不同,而是为thread提高服务的。如果有很多线程需要访问同一个相同的数据,缓存会合并这些访问,然后再去访问dram(因为需要访问的数据保存在dram中而不是cache里面),获取数据后cache会转发这个数据给对应的线程,这个时候是数据转发的角色。但是由于需要访问dram,自然会带来延时的问题。
  GPU的控制单元(左边黄色区域块)可以把多个的访问合并成少的访问。
  GPU的虽然有dram延时,却有非常多的ALU和非常多的thread. 为啦平衡内存延时的问题,我们可以中充分利用多的ALU的特性达到一个非常大的吞吐量的效果。尽可能多的分配多的Threads.通常来看GPU ALU会有非常重的pipeline就是因为这样。
  所以与CPU擅长逻辑控制,串行的运算。和通用类型数据运算不同,GPU擅长的是大规模并发计算,这也正是密码破解等所需要的。所以GPU除了图像处理,也越来越多的参与到计算当中来。
  GPU的工作大部分就是这样,计算量大,但没什么技术含量,而且要重复很多很多次。就像你有个工作需要算几亿次一百以内加减乘除一样,最好的办法就是雇上几十个小学生一起算,一人算一部分,反正这些计算也没什么技术含量,纯粹体力活而已。而CPU就像老教授,积分微分都会算,就是工资高,一个老教授资顶二十个小学生,你要是富士康你雇哪个?GPU就是这样,用很多简单的计算单元去完成大量的计算任务,纯粹的人海战术。这种策略基于一个前提,就是小学生A和小学生B的工作没有什么依赖性,是互相独立的。很多涉及到大量计算的问题基本都有这种特性,比如你说的破解密码,挖矿和很多图形学的计算。这些计算可以分解为多个相同的简单小任务,每个任务就可以分给一个小学生去做。但还有一些任务涉及到"流"的问题。比如你去相亲,双方看着顺眼才能继续发展。总不能你这边还没见面呢,那边找人把证都给领了。这种比较复杂的问题都是CPU来做的。
  总而言之,CPU和GPU因为最初用来处理的任务就不同,所以设计上有不小的区别。而某些任务和GPU最初用来解决的问题比较相似,所以用GPU来算了。GPU的运算速度取决于雇了多少小学生,CPU的运算速度取决于请了多么厉害的教授。教授处理复杂任务的能力是碾压小学生的,但是对于没那么复杂的任务,还是顶不住人多。当然现在的GPU也能做一些稍微复杂的工作了,相当于升级成初中生高中生的水平。但还需要CPU来把数据喂到嘴边才能开始干活,究竟还是靠CPU来管的。
  什么类型的程序适合在GPU上运行?
  (1)计算密集型的程序。所谓计算密集型(Compute-intensive)的程序,就是其大部分运行时间花在了寄存器运算上,寄存器的速度和处理器的速度相当,从寄存器读写数据几乎没有延时。可以做一下对比,读内存的延迟大概是几百个时钟周期;读硬盘的速度就不说了,即便是SSD, 也实在是太慢了。
  (2)易于并行的程序。GPU其实是一种SIMD(Single Instruction Multiple Data)架构, 他有成百上千个核,每一个核在同一时间最好能做同样的事情。
  引用自来自David Patterson 的书:《Computer Organization and Design: The Hardware/Software Interface, RISC-V Edition》(引用部分已经过个人翻译)
  GPU和CPU的区别:GPU是一个加速器,是一个对CPU的补充,它的目的就是尽可能的加速图形处理速度。也就是说,对于GPU来说,可能处理某些任务的性能会非常差,甚至有些任务根本就没法在GPU上运行。但是这都不要紧,因为这些任务可以交给CPU做。对于GPU来说,计算问题的体量一般由几百MB到数GB之间,不需要考虑数TB的数据体量的问题。(书以2013年为例,这个论断在2019年已经不适用了)最大的不同是GPU并不依赖多级Cache来降低对内存访问的延迟。相反,GPU通过大量的多线程来规避了内存延迟对性能的影响。具体来说,在GPU等待内存数据到来的时候,GPU会运行几百到几千个与之前数据不相关的线程。与CPU内存系统相反,GPU的内存系统因此更加面向大的带宽而不是低延迟,而且GPU的内存大小通常要小于CPU。因为大量的并行线程带来了很好的处理带宽,GPU包含了数个平行处理核心并且每个处理核心都可以运行大量的平行线程。因此,GPU的并行运行能力比普通的CPU要大得多。

中国版常春藤,整合12所顶尖大学,参研未来科学计划中美科技战正式拉响,我国此前由于在许多关键技术上被卡了脖子,所以一直处于比较被动的状态。不过近日传来了一个振奋人心,国家正式开始整合国内的教育资源和人才资源,成立中国的常春藤,迎接攻壳机动队生化人有可能成真?钢铁侠马斯克建新公司目标于此备受动漫迷引领期待真人版攻壳机动队已经上映了。这部改编自日本漫画家士郎正宗作品及大师级动漫导演押井守同名作品的电影,打从筹拍期间就受到高度关切,再加上片中的女主是由性感美艳的斯嘉丽从登月到登陆火星!中国不到10年取得惊人成功,下一个目标已确定5月15日,天问一号探测器成功降落在火星预选着陆区,标志着中国首次火星探测着陆任务取得成功,中国就此成为第二个实现探测器着陆火星的国家。意大利科学家认为中国在火星探测领域的进步非常新发现的幼童头骨表明,尼安特人已经会用葬礼,表达对亲人的思念这个尼安德特人的头盖骨和下颚骨,与一个被埋儿童的骨架,发现于法国多尔多涅地区的拉费拉西岩洞不管有多少相反的证据,人们都会觉得我们的祖先智人,是最文明的。事实上,我们经常谈论曾经共享苏东坡是诗人,也是美食家北宋文学家苏东坡(10371101),多才多艺,不仅诗词散文造诣极深,绘画书法也极负盛名,而且,还是一位名副其实的美食家。苏东坡(10371101)宋代文学家(图片选自网上)他以老杜甫决然退礼唐广德二年(764),杜甫在他的好友成都尹兼剑南节度使严武身边当参谋。有人送他一件名为织成褥的珍贵毛毯。据广雅记载,织成产于天竺(印度)。就是说,这是一件进口的高级毛毯。唐代诗人杜纪念中乌关系雕塑跨越时空凝聚两大诗人纪念中国伟大诗人杜甫和乌克兰诗人塔拉斯舍甫琴科的最新雕塑周五在乌克兰驻华大使馆揭幕,作为庆祝中乌战略伙伴关系十周年的一部分。中国美术馆馆长艺术家吴为山的灵魂之门是原件的复制品,现在一份思念,一份寄托一份思念,一份寄托清明时节雨纷纷,路上行人欲断魂。又是一年的清明时节,与诗句中描写的不一样之处是北京的这个清明节没有下雨,雨纷纷也没有。即使没有那雨纷纷,我们依然感受了欲断魂的悲伤多款建党百年花坛亮相北京长安街多款建党百年花坛亮相北京长安街随着七一建党日的临近,各地的庆祝活动场景装扮也都在紧锣密鼓地进行中,就拿北京的长安街来说,最近可是十分吸引人,以不忘初心牢记使命为主题,以小小红船到巍O3bmPOWER获得第一个云客户,COVID19问题迫在眉睫,也有望完工微软正从SES的下一代O3bmPOWER宽带星座的合作伙伴转变为客户,SES表示,尽管COVID19持续威胁供应链中断,但该星座仍按计划进行。SES之前与微软的Azure云业务以及全线发力高值耗材,这家骨科龙头在下什么棋?骨科植入高值耗材是我国医疗器械产业中最重要的市场之一,2019年我国骨科植入物医疗器械市场销售收入达到308亿元,20152019年的年复合增长率达到17。3。同时,骨科也是一个竞
史上最大地震3800年前摧毁智利北部,巨大海啸冲击新西兰据最新一期科学进展刊发的论文,英国南安普顿大学的研究人员发现,历史上最大的地震在3800年前袭击了智利北部,并引起巨大的海啸,冲击了5000多英里外的新西兰。据悉,这次地震的震级约未来三年20222025,科技领域即将发生以下十件大事未来三年,科技领域即将发生以下十件大事,将改变我们的生活与认知。中国空间站建成,人类开始载人火星之旅,人脑修复技术突破,全电动商业客机投入商用,中国将突破芯片技术与核医疗卡脖子问题系外天空研究人员描述系外行星的大气层太阳系外的行星是什么样的?研究人员使用配备NVIDIAGPU的超级计算机,从哈勃望远镜的数据中发现了25颗行星的趋势。4月25日发表的一篇论文对遥远行星的大气层进行了迄今为止最为详美太空军计划将巡逻范围扩至月球美国空军研究实验室最近发布视频宣布,美军计划把巡逻的太空领域增加到目前的千倍以上。也就是说,这项计划要把巡逻的领空范围扩展到月球那么远的距离。3月初发布的视频说在此之前,美军巡逻的始鸭嘴龙鸭嘴龙类恐龙的始祖,长有数百颗牙齿的恐龙在地球上已知的恐龙当中,始鸭嘴龙是最原始的鸭嘴龙类恐龙,可以说是所有鸭嘴龙类恐龙的始祖,始鸭嘴龙体长仅有6米左右,与现代大象的体型差不多,这种恐龙的嘴中长有数百颗牙齿,与鸭子极为相带着细菌去旅行啦据外媒NewAtlas报道,一项将细菌置于国际空间站(ISS)外部的新实验发现,微生物可以在太空中生存数年,甚至数十年。这项研究为生命可以在行星之间旅行的想法提供了依据。细菌是顽强宇宙中最冷的地方是哪里?科学家在5000光年处,找到了答案说起冷热的概念,大家肯定会联想到温度,在日常生活中,我们既可以通知皮肤的感受,也可以通过温度计的读数,来衡量周围环境温度的高低。其实,温度是人们用于衡量物体冷热程度的一个标量,从物火星我们在红色星球上的未来5月15日,天问一号成功着陆于火星乌托邦平原南部预选着陆区,我国首次火星探测任务着陆火星取得圆满成功。天问一号任务实现了我国首次地外行星着陆,是中国航天事业发展中又一具有重大意义的18亿像素,距离地球5500万公里的火星真实照片,环境比想象中荒凉现在你看到的地方并不是地球,而是来自距离地球5500万公里的火星真实图像,它由NASA的好奇号拍摄到的火星地表迄今为止最为清晰的全景图。这张图像的像素高达18亿,由好奇号历时两年多火星上是否曾存在生命?间接发现的有机盐或许是破题关键美国宇航局对火星的研究已经有很长时间了,也向这颗红色星球派出了很多漫游车,发现了很多有趣的东西。但至今有个问题仍未得到明确的答案火星上是否曾存在生命?而回答这个问题的关键就是有机分NASA捕获木星上独特的克莱德斑的迷幻新视角据外媒CNET报道,2020年,业余天文学家克莱德福斯特在木星上发现了一个椭圆形的风暴,徘徊在著名的大红斑附近。当时美国宇航局(NASA)的朱诺号航天器掠过,仔细观察了这个被昵称为