美国硅谷创企CerebrasSystems推出了其新的WaferScaleEngine2(WSE2)处理器,该处理器为超级计算任务而构建,具有破纪录的2。6万亿个晶体管(市场上最大的GPU只有540亿个晶体管)和85万颗AI优化内核,大小类似餐盘,采用台积电的7nm工艺。 这是Cerebras第二次使用整个300mm晶圆制造单颗芯片。这么大的晶圆一般会被切割成数百个独立芯片,Cerebras却将其制成一个芯片。在庞大的体积之下,这种芯片相比同等算力的GPU集群,功耗和所占空间更小。 WSE2与最大的GPU尺寸对比一、Cerebras估值约24亿美元,创始人斯坦福出身 CerebrasSystems位于美国加利福尼亚州,创建于2016年。该公司专注于深度学习的计算机系统。目前该公司在硅谷、多伦多和东京都有办事处,2019年11月获得了4。75亿美元的E轮融。融资后,CerebrasSystems估值约为24亿美元。 安德鲁费尔德曼(AndrewFeldman)是Cerebras的联合创始人兼首席执行官,他具有斯坦福大学学士学位和工商管理硕士学位,曾经创办了专注于超高密度计算机服务器业务的Seammicro公司。Seammicro在2012年被AMD以3。57亿美元价格收购。 Cerebras联合创始人兼首席执行官AndrewFeldman 2019年,Cerebras曾发布第一代WSE芯片,这款芯片具有40万个内核和1。2万亿个晶体管,使用台积电16nm工艺制程。二、WSE2性能参数超竞品几个数量级,良率更高 WSE2仍由台积电代工,但采用更加先进的7nm工艺。与第一代芯片相比,WSE2的晶体管数、内核数、内存、内存带宽和结构带宽等性能特征增加了一倍以上。由于WSE2采用了7nm工艺制程,电路之间的宽度仅有七十亿分之一米。 如此庞大的芯片尺寸带来了WSE2的大幅性能提升,该芯片的各类性能参数超出竞品几个数量级,能够极大地缩减AI训练时间。 相比竞品GPU,WSE2芯片的内核数量是其123倍,芯片内存是竞品的1000倍以上,内存带宽是12000倍,结构带宽也增加了45000倍。 WSE、WSE2和英伟达A100GPU性能参数对比 Feldman指出,通过将芯片放大互连,就可以在芯片上保留大量数据。WSE2相对普通GPU集群,延迟和能耗都会比较低。普通GPU集群在提供相同的算力时,将会需要数十个机架,花费数个月进行配置和编程,功率将高达数百瓦。 WSE2相对GPU还有很多核心冗余,如果有内核发生故障,单独的故障内核并不影响芯片使用。而在台积电这样的晶圆代工厂中,很少出现连续的内核缺陷,因此WSE2的良率较高。三、Cerebras拥有多位重量级客户 国际调研机构MoorInsightsStrategy的分析师PatrickMoorhead认为,WSE2内核数量带来的性能确实对英伟达的GPU产生了一定挑战。但是英伟达的解决方案更加灵活,几乎可以安装在任何服务器机箱中。 TiriasResearch首席分析师JimMcGregor在一封电子邮件中写道,虽然对于数以百万的AI算法来说,Cerebras不像英伟达一样全面,但是Cerebras的解决方案显然已经吸引到了许多客户。 从2019年交付WSE芯片起,在过去的一年里,已经有很多重量级用户使用了Cerebras的产品。 比如美国阿贡国家实验室、劳伦斯利弗莫尔国家实验室、匹兹堡超级计算中心、爱丁堡大学的超级计算中心、葛兰素史克、东京电子器件等。 全球制药巨头葛兰素史克的高级副总裁KimBranson称赞到,Cerebras增加了编码器模型的复杂性,将训练时间减少到之前的180。 在美国最大的科学与工程研究室阿贡国家实验室,CS1芯片被用于癌症研究,将癌症模型的实验周转时间减少到1300还少。 Feldman说,Cerebras将在明年公布产品在重型制造、制药、生物技术和军事等领域取得的成就。WSE2将被集成到CS2超算系统中,在今年第三季度上市。结语:Cerebras另辟蹊径展现巨型芯片前景 虽然相比英伟达,Cerebras没有那么全面,但是WSE系列芯片并非单纯的放大。在芯片尺寸如此巨大后,互连技术、芯片封装、散热等问题都会发生很大变化。 Cerebras解决了这些问题,用WSE2的优点向我们展示了芯片尺寸并非只能越做越小,巨型芯片也存在广泛的应用前景。