LK分享为什么车厂纷纷自研自动驾驶芯片?
2016年,特斯拉招募AMD的芯片架构师和高管团队,开启了特斯拉自研自动驾驶芯片之路,到2019年4月,特斯拉所有的新车型都用的是自研的FSD芯片。
2017年11月,领跑汽车与浙江芯昇电子(原浙江大华技术芯片部门)联合研发自动驾驶芯片,名为凌芯01,在2020年10月正式发布该芯片,并搭载于C11车型上。
2020年4月,丰田与电装成立合资公司MIRISE Technologies开发自动驾驶芯片。
2020年10月,吉利旗下亿咖通与ARM成立自动驾驶芯片设计公司芯擎科技。
关于蔚来也有传言要自研自动驾驶芯片,小鹏则已确认涉足芯片自研,并且有望在今年年底或明年年初初流片。
最近大众剧团首席执行官HerbertDiess在接受采访时表示,大众计划自主设计和开发高性能芯片以及所需的软件。
从固有的认知来看,芯片设计通常是一件大投入、长周期、高风险的事。我们来看看华为和小米的芯片研发历程就一目了然。
1991年,华为成立集成电路设计中心,致力于设计生产ASIC;
2004年,华为决定自己做手机芯片,于是将集成电路设计中心改制为海思半导体有限公司;
2009年,海思推出首款移动处理器K3V1,主要面向中低端市场;
2012年,海思推出首款四核处理K3V2,这款芯片采用了1.5GHz主频四核Cortex-A9架构,集成GC4000的GPU,并且使用了40nm的工艺制程。首次用在自家旗舰产品上;
2014年,海思芯片首次采用"麒麟"命名,并推出麒麟910,制程为28nm,GPU换成了Mali450MP4,弥补了前代的短板,另基带采用华为自己的Balong 710,解决了功耗、兼容性等问题。搭载的手机也获得了市场的认可。
至此,华为麒麟芯片走过10年后,才终于成功。
2014年10月,小米与联芯创办了松果电子,采用28nm制程的手机芯片澎湃S1开始立项;
2017年2月,小米正式发布了澎湃S1芯片,并搭载于小米5C手机,市场反响一般;
2021年4月,小米发布ISP芯片澎湃C1,并搭载在最新的折叠屏MIX FOLD手机上。
至此,小米自研手机芯片已经历经7年,但是革命尚未成功。
看完以上的消息,不知道大家会不会有同样的疑问——汽车厂商为什么要纷纷涉足自研芯片呢?
首先来看看特斯拉自研的FSD芯片,为了降低风险和加快开发进度,其中大部分的逻辑,包括CPU(12个A72)、GPU、各种接口、片上网络等都使用经过行业验证的标准IP,仅有神经网络加速器(NPU)由特斯拉的硬件团队完全定制开发的,如图1所示。
另外如特斯拉自动驾驶芯片负责人Pete Bannon所说:他们的芯片只有一个客户——特斯拉,这就很大程度上降低了芯片需求的复杂性。
图1 FSD的 NPU
关于npu,不得不先简单说一下MAC的概念,MCA是英文Multiply Accumulate的缩写,中译为乘积累加运算。MAC运算是将乘法的乘积结果和累加器a的值相加,再存入累加器:
如果没有MAC指令,上述程序可能需要两条指令完成,而MAC只需要一条指令完成。
FSD的NPU的架构如图2所示,相较于CPU,其架构比较简单,主要由计算单元组成,所以设计难度也相应的降低。
图2 NPU架构
影响NPU算力的因素主要有MAC单元数量、运行频率、内存。通常最有效的方法是增加MAC单元的数量。例如FSD中每个NPU有个96x96的MAC矩阵,工作频率为2GHz,32MB SRAM。所以一个NPU的处理能力为96x96x2x2(GHz) = 36.864TOPS,单芯片为72TOPS。而从内存来说主要是内存大小和读取速度会影响算力。
从图1可以看出,NPU占整个芯片的面积很大,也就是说如果需要进一步为了增加算力而增加MAC单元的数量,芯片制程需要进一步升级,增加单位面积的MAC数量。
特斯拉软件在NPU上执行的所有操作的98.1%为卷积,反卷积为1.6%,为了提高性能,NPU合并输出通道中X与Y维度的输出像素,并且多个输出通道采用并行处理,这样可以并行处理96个通道。
为了简化设计并降低功耗,NPU的MAC由8bit的整数乘法和32bit的整数加法组成。另外Pete Bannon认为ICache、Register File、Control逻辑消耗的能量要远比运算消耗的大,所以NPU的设计尽量简化控制逻辑,只做运算相关的,指令集非常简单,相比其他指令集,例如SSE指令集包括了70条指令,NPU只有8条指令:DMA Read、DMA Write、Convolution、Deconvolution、Inner-product、Scale、Eltwidth、Stop,编程模型也非常简单,完成一次运算只需配置4个信息。
通过对特斯拉自研自动驾驶FSD芯片的描述,我们可以整理一下为什么一众车厂 为什么纷纷自研自动驾驶芯片: 首先汽车厂商自研自动驾驶芯片,其实主要是自研 NPU,其他 CPU、GPU、接口、片内通信等都是采购标准 IP,另外正如特斯拉自动驾驶芯片负责人 Pete Bannon 所说:他们的芯片只有特斯拉一个客户,这就很大程度上降低了芯片需求的复杂性,所以自研自动驾驶芯片的开发难度相较较小,
自研自动驾驶芯片,可以针对自己的算法中计算量的大小,优化硬件,实现软硬件结合的方法提高性能,例如特斯拉采用的 X 和 Y 维度的整合,输出并行处理等;
当前自动驾驶算法对算力的需求可能因为某些功能的增加出现极大的增加,但是芯片产商的厂商的芯片为了满足通用性,开发周期通常比较长,难以满足需求,而自己开发的话,开发周期可以自主把握,算力需求可以自行设计,无关的通用性接口或者单元可以舍弃,灵活性很高,开发周期更短,功耗也更低。另外由于芯片设计的通用性考虑,势必导致芯片的功耗增加,例如 FSD 芯片中神经网络处理器部分功耗为 15W,而 Autopilot2.5 版上自动驾驶数据处理单元的功耗为 57W;
如第三点提到的,由于不考虑通用性,设计相对更简单,成本也更低,Autopilot3.0 的成本比 Autopilot2.5 降低了 20%,从而产品竞争力也会增强;
在当前缺芯的环境下,长城和蔚来都爆出因缺芯而导致工厂减产或者停产,自主设计自动驾驶芯片可以解决该领域的芯片自给自足问题;
一众厂商纷纷宣布自己造芯计划,也可以提高公司的高科技形象,对公司股价、融资应该也有利好。
利好虽然很多,但是芯片量产难,车厂需要生产的芯片量相较于芯片厂商太小,另外当前产能紧张,找不到代工。这可能也是特斯拉在最新的自动驾驶芯片上找博通合作的原因,才能找到台积电代工生成最新一代自动驾驶芯片。 文章来源于汽车ECU开发 ,作者eng2mot
iOS12。4正式版体验分享今天早些时候,苹果发布了iOS12。4正式版,整个更新包大小为2。6G,版本号为12。4(16G77)本次体验设备为iPhoneXiPhone6plusiPhone7plusiPh
iOS13。3测试版来袭,苹果针对后台问题进行优化iOS13。3beta版体验分享今天凌晨苹果向开发者推送了iOS13。3的第一个beta版。版本号13。3(17C5032d)体验设备iPhone11ProMaxiPhoneXiP
iOS13。1。2正式版体验分享,看看苹果这次又更新了些什么iOS13。1。2正式版体验分享今天凌晨苹果在推送了iOS13。1。2正式版,没错你没有看错。苹果又一次更新系统了,而且还是正式版,本次更新应该是非常匆忙,连更新内容都没有汉化。本
iOS12。4b3体验分享,再聊聊iOS13beta版今天凌晨苹果向开发者推送了iOS12。4第三个beta版,版本号为12。4(16G5038d)体验设备为iPhone7PlusiPhoneXiPhone6Plus一更新内容与存在的
旧地重游,风情园里的新风情时隔几年,这次再去黑河的中俄民族风情园,发现变化还是挺大的。园子重修了大门和停车场,一进大门就是遍地的鲜花,不但地面有花圃,园内还有各种造型的立体花坛,还新建观光塔,也增加一些儿童
iOS13。3beta4体验分享时隔一周多苹果向开发者推送了iOS13。3开发者预览版第四个预览版,版本号为13。3(17C5053a)体验设备iPhone11ProMaxiPhoneXriPhoneXiPhon
iOS13。3beta2体验分享iOS13。3beta2体验分享昨天凌晨苹果向开发者推送了iOS13。3的第二个测试版,版本号为13。0(17C5038)。本次体验设备为iPhone11ProMaxiPhoneX
iOS13。2。2紧急修复后台意外退出的问题iOS13。2。2正式版体验分享今天凌晨苹果正式发布了iOS13。2。2正式版,本次更新修复了iOS13。2正式版中后台保留异常的问题。版本号13。2。2(17B102)本次体验设
iOS15。0。2正式版发布,修复多项Bug最近,苹果方面发布了目前iOS系统中最新的版本iOS15。0。2版本,该版本也是整个iOS15版本中第二个子版本(上一个版本为iOS15。0。1)。距离上一个。0。1正式版本发布也
苹果新品来了大家好,咱们又见面了,苹果这次发布了几款产品AirPordsPro,HomePod新配色,MacBookPro,接下来就来看看这次的AirPods三代耳机价格居然比Pro版本低了,
山东小伙研发火锅味香薰,闻着想吐为何月销几千单?这味儿正宗。文郑亚文编辑范婷婷刚吃完火锅的沈茂,在造物节现场邂逅了刘雨辰的火锅香薰,顿时鼻子一紧,眼睛一亮。她兴冲冲地跑进店,凑近展示台上的火锅香薰,挨个闻过去。嘴里的感叹从经典国