寒武纪孙晓云：高算力芯片决胜自动驾驶

时间: 2021-09-28 22:46 来源: 汽车总站网作者: Spring

[汽车总站网 www.chianautoms.com欢迎你]

2021年9月25日，2021世界智能网联汽车大会在北京隆重开幕。大会由北京市人民政府、工业和信息化部、公安部、交通运输部、中国科学技术协会共同主办，工业和信息化部装备工业发展中心、北京市经济和信息化局、中国电子信息产业发展研究院、北京市顺义区人民政府、中国国际贸易促进委员会机械行业分会、中国电工技术学会共同承办。本届大会主题为“引新荟智绿创未来”。

在2021年9月26日上午的汽车企业专场：中国一汽生态伙伴合作大会上，寒武纪行歌公司的副总裁孙晓云发表了“自动驾驶芯片的趋势与挑战”演讲。

以下为演讲全文：

大家好，我是寒武纪行歌的孙晓云，行歌是寒武纪的全职子公司，专门做芯片相关的芯片，我今天演讲的题目是自动驾驶芯片以及挑战。

人工智能的快速发展推动汽车智能化，自动驾驶，现代神经网络已经用到目标检测，结合多传感器融合和高精度定位，提供自动驾驶和辅助驾驶功能，我们引入了驾驶员监控系统，通过AI的面部识别对驾驶员是否疲劳进行判断，进行报警。

AI在车路协同上发挥作用，路侧单元可以通过智能监控交通的状况，将相关的信息提供给车，帮助自动驾驶，并且可以对交通控制进行优化，减少事故及拥堵。

这张图展示的是汽车电子电气架构的演进趋势，左边是传统的架构，有很多的ECU组成，ECU控制附近的电子系统，ECU通过低速的总线相连，有大量的线速，线速的成本比较高，并且系统的维护会比较复杂。

为了降低系统的复杂度，现在已经演进到域控制器架构，这是整个电子电气架构分为几个域，有自动驾驶域，还有座舱域，有动力和车身域，每个域控制器控制自己附近的ECU，域控制器之间通过高速的以太网相连，可以传输大量的数据，这个架构大大简化了线速，降低了系统维护复杂性。

未来电子电气的发展方向是中央化架构，就是中央处理器，车载嵌入式高性能计算机，可以提供很强的计算能力，给自动驾驶和座舱使用，中央处理器通过高性能的承载以太网和传感器，以及其他的电子电气件相连，智能汽车对算力提出越来越高的要求，这张图现实目前几家主流的智能汽车新势力传感器配置，这里有摄像头，毫米波雷达，超声波雷达和激光，大家可以看摄像头基本达到了至少12颗，包括3颗前视，4颗侧视，4颗环视，其中前置摄像头由于看清高速公路小的障碍物，分辨率达到8兆，侧视和后视摄像头可以达到很高的分辨率。

由于固态激光雷达的成本不断的降低，现在激光雷达上了乘用车，所以这越来越多的传感器，越来越高的分辨率使得智能汽车需要以更复杂的算法，处理大量的数据，对于算力的要求将成几何级上升。

这张图展示了目前主流的自动驾驶芯片，在2018年的时候25T的算力，最近是24T的算力，未来推出120T算力的IQ6，中间绿颜色的，今天推出200T的，会被大量车型使用。上面是特斯拉，特斯拉2019年推出了由2颗芯片拼出140T算力的，最近推出几百T算力的高算力芯片，高通的平台是由几颗芯片组合，也是达到几百T的算力。

从这张图我们可以看到，芯片是有两个路线，一个路线是算法和硬件强耦合，在L1，L2时代处理量比较小，可以通过算法强耦合，小算力达到不错的结果，受制于主机厂能力的制约和新车型快速量产的需要，不少主机厂选择了软硬件一体的封闭解决方案，但是OEM拥有数据逐渐建立算法能力后，希望有OTA方案，软件一体的封闭解决方案开放性差，无法支撑新算法开发和升级。

在L3+时代，传感器数量和分辨率增加，算法模型更加的复杂，需要的算力大大的提升，迫切需要大算力芯片，OTA开始加速普及，需要通用开放的软件平台，这个时候出现了一个路线，提供通用开放式大算力芯片，使得OTA算法升级，更加的方便。

主机厂拥抱专注算力芯片的公司，更完善的AI软件生态和大算力芯片成为决胜要素，目前神经网络类型和结构规模呈现多样性，目前神经网络已经有几十种，这个图展示的几种网络，几个例子，左上是循环神经网络，循环神经网络就是神经元它的目前状态是由输入潜意识的状态决定，右上液体状态机，有大量的神经元，神经元之间是随机连接的，神经元的激活进行控制，左边是普通的深度卷积，中间是隐藏神经元可以表达物体移动和光照的特征。

这个有点像自编码器了，右边是稀疏自编码器，和普通不同的一点是整个神经元的数量，神经元占的空间是大于输出的，可以反映一些小的特征。

神经网络算子呈现多样性，这张图有几类算子，NO算子还有激活等，中间是限量算子，还有各种操作，比如说加，减，还有目标检测网络用到的一些非NN的算子，右边是一些循环网络的算子，比如说STM，RN等。

碱基盒呈现多样性，有普通3×3的碱基，5×5的碱基，还有碱基盒不是紧密排列的，是呈现稀疏方式排列的，这样可以得到更大的感受。

新的算子不断的涌现，比如说这个例子，这种没有固定的形状，通过训练决定每个点的位置，使AI处理器的通用式设计带来很大的挑战，AI处理器设计优化是依赖于抓取这些计算的特征，比如说抓取他们的规律性和重复性。我们现在有各种各样的网络，各种卷积，AI处理器必须在各种网络上达到比较好的性能。

自动驾驶算法还在不断的演进，还是有新的算法和新的算子不断用在自动驾驶算法中，最近大家知道特斯拉AI展示的新算法，他们引入了传感器融合，用RN处理时域。新的算法产生得益于芯片算力不断的提升，算法的演进和算力不断提升他们是相互促进的，算法越来越复杂，它对算力的有需求，算力的不断提升使得更复杂，更高精度的算法成为可能。

综上所述，我们认为自动驾驶芯片的趋势是大算力和通用，大算力要应对越来越多的传感器，更高的分辨率和更复杂的算法，自动驾驶芯片从一两年前的20-30T，到现在的200T，今后我们会看到500-1000T的芯片，通用式为了应对各种各样的网络，各种各样的算子。

我们认为自动驾驶算法还是在不断演进，有各种各样的目标检测网络，RN用在预测规划，特斯拉用在传感器融合上，所以AI处理器需要做成通用，在各种网络上都要达到很好的性能。

大算力通用给自动驾驶芯片带来如下几个挑战：

第一，对芯片系统架构的挑战。200T以上大算力的芯片类似于现在的云端的服务器芯片，它对存储能力要求很高，需要支持超高带宽和满足QOS的要求，系统也应对高带宽，有好位宽256位宽的DDR，对应200G的带宽，目前对应40-50G的带宽。

第二，通用软件站的挑战。自动驾驶算法迅速演变，激光点映算法和多传感器融合算法不断的发展，不断变化的算法需求和OTA模式需要通用的硬件架构和软件站，前面说的各种网络形形色色的算子，为AI处理器和软件的通用化带来挑战。

第三，先进工艺。大算力需要集成很多的晶体管，需要7纳米，5纳闷的先进工艺。只有先进工艺才能做到更高的集成，类似于手机芯片，自动驾驶芯片需要仅仅跟随工艺演进的步伐。

第四，大算力芯片需要集成数百亿颗晶体管，7纳米情况下面积可以达到几百封装，在热设计，量产成本上有比较大的挑战。

针对前面的挑战，寒武纪行歌在第一代自动驾驶芯片布局，首先我们有200T以上的算力，寒武纪已经有成熟的服务器芯片的产品线，在这方面有比较深的积累，最大的服务器芯片512T。

还有7纳米的先进工艺，寒武纪已经有几款的芯片量产，现在做5纳米的芯片，要支持车规，这是寒武纪以前没有做过的，需要做的，要有公路安全，可靠性满足AECQ100的需求，有独立的安全对公路安全进行监控。

软件上寒武纪AI已经有成熟通用的软件站了，现在做的是车相关的SPK。

我的演讲就是这些，谢谢大家。

[汽车总站网 www.chianautoms.com欢迎你]

上一篇：华为崔爱国：未来车如何满足千人千面的需求？

下一篇：东软毕东鸣：智能座舱——用户交互第一对象

热点新闻

更多>>

美团夏华夏：无人配送安全如何保障？

在2021年9月26日下午的顺义专场城市复杂场景自动驾驶应用，美团副总裁夏… [详情]

特别策划

更多>>

未热先“内卷”，燃料电池系统重演动

一面是宏观政策和地方政府的“高热”，一面是示范城市群名单“难产”… [详情]

观点

更多>>