创新 • 创优 • 创见
搜索
当前位置:主页 > 新闻资讯 >

寒武纪孙晓云:高算力芯片决胜自动驾驶

时间:  2021-09-28 22:46   来源:  汽车总站网    作者:  Spring

[汽车总站网 www.chianautoms.com欢迎你]
2021年9月25日,2021世界智能网联汽车大会在北京隆重开幕。大会由北京市人民政府、工业和信息化部、公安部、交通运输部、中国科学技术协会共同主办,工业和信息化部装备工业发展中心、北京市经济和信息化局、中国电子信息产业发展研究院、北京市顺义区人民政府、中国国际贸易促进委员会机械行业分会、中国电工技术学会共同承办。本届大会主题为“引新荟智 绿创未来”。
在2021年9月26日上午的汽车企业专场:中国一汽生态伙伴合作大会上,寒武纪行歌公司的副总裁孙晓云发表了“自动驾驶芯片的趋势与挑战”演讲。
寒武纪孙晓云:高算力芯片决胜自动驾驶
以下为演讲全文:
大家好,我是寒武纪行歌的孙晓云,行歌是寒武纪的全职子公司,专门做芯片相关的芯片,我今天演讲的题目是自动驾驶芯片以及挑战。
人工智能的快速发展推动汽车智能化,自动驾驶,现代神经网络已经用到目标检测,结合多传感器融合和高精度定位,提供自动驾驶和辅助驾驶功能,我们引入了驾驶员监控系统,通过AI的面部识别对驾驶员是否疲劳进行判断,进行报警。
AI在车路协同上发挥作用,路侧单元可以通过智能监控交通的状况,将相关的信息提供给车,帮助自动驾驶,并且可以对交通控制进行优化,减少事故及拥堵。
这张图展示的是汽车电子电气架构的演进趋势,左边是传统的架构,有很多的ECU组成,ECU控制附近的电子系统,ECU通过低速的总线相连,有大量的线速,线速的成本比较高,并且系统的维护会比较复杂。
为了降低系统的复杂度,现在已经演进到域控制器架构,这是整个电子电气架构分为几个域,有自动驾驶域,还有座舱域,有动力和车身域,每个域控制器控制自己附近的ECU,域控制器之间通过高速的以太网相连,可以传输大量的数据,这个架构大大简化了线速,降低了系统维护复杂性。
未来电子电气的发展方向是中央化架构,就是中央处理器,车载嵌入式高性能计算机,可以提供很强的计算能力,给自动驾驶和座舱使用,中央处理器通过高性能的承载以太网和传感器,以及其他的电子电气件相连,智能汽车对算力提出越来越高的要求,这张图现实目前几家主流的智能汽车新势力传感器配置,这里有摄像头,毫米波雷达,超声波雷达和激光,大家可以看摄像头基本达到了至少12颗,包括3颗前视,4颗侧视,4颗环视,其中前置摄像头由于看清高速公路小的障碍物,分辨率达到8兆,侧视和后视摄像头可以达到很高的分辨率。
由于固态激光雷达的成本不断的降低,现在激光雷达上了乘用车,所以这越来越多的传感器,越来越高的分辨率使得智能汽车需要以更复杂的算法,处理大量的数据,对于算力的要求将成几何级上升。
这张图展示了目前主流的自动驾驶芯片,在2018年的时候25T的算力,最近是24T的算力,未来推出120T算力的IQ6,中间绿颜色的,今天推出200T的,会被大量车型使用。上面是特斯拉,特斯拉2019年推出了由2颗芯片拼出140T算力的,最近推出几百T算力的高算力芯片,高通的平台是由几颗芯片组合,也是达到几百T的算力。
从这张图我们可以看到,芯片是有两个路线,一个路线是算法和硬件强耦合,在L1,L2时代处理量比较小,可以通过算法强耦合,小算力达到不错的结果,受制于主机厂能力的制约和新车型快速量产的需要,不少主机厂选择了软硬件一体的封闭解决方案,但是OEM拥有数据逐渐建立算法能力后,希望有OTA方案,软件一体的封闭解决方案开放性差,无法支撑新算法开发和升级。
在L3+时代,传感器数量和分辨率增加,算法模型更加的复杂,需要的算力大大的提升,迫切需要大算力芯片,OTA开始加速普及,需要通用开放的软件平台,这个时候出现了一个路线,提供通用开放式大算力芯片,使得OTA算法升级,更加的方便。
主机厂拥抱专注算力芯片的公司,更完善的AI软件生态和大算力芯片成为决胜要素,目前神经网络类型和结构规模呈现多样性,目前神经网络已经有几十种,这个图展示的几种网络,几个例子,左上是循环神经网络,循环神经网络就是神经元它的目前状态是由输入潜意识的状态决定,右上液体状态机,有大量的神经元,神经元之间是随机连接的,神经元的激活进行控制,左边是普通的深度卷积,中间是隐藏神经元可以表达物体移动和光照的特征。
这个有点像自编码器了,右边是稀疏自编码器,和普通不同的一点是整个神经元的数量,神经元占的空间是大于输出的,可以反映一些小的特征。
神经网络算子呈现多样性,这张图有几类算子,NO算子还有激活等,中间是限量算子,还有各种操作,比如说加,减,还有目标检测网络用到的一些非NN的算子,右边是一些循环网络的算子,比如说STM,RN等。
碱基盒呈现多样性,有普通3×3的碱基,5×5的碱基,还有碱基盒不是紧密排列的,是呈现稀疏方式排列的,这样可以得到更大的感受。
新的算子不断的涌现,比如说这个例子,这种没有固定的形状,通过训练决定每个点的位置,使AI处理器的通用式设计带来很大的挑战,AI处理器设计优化是依赖于抓取这些计算的特征,比如说抓取他们的规律性和重复性。我们现在有各种各样的网络,各种卷积,AI处理器必须在各种网络上达到比较好的性能。
自动驾驶算法还在不断的演进,还是有新的算法和新的算子不断用在自动驾驶算法中,最近大家知道特斯拉AI展示的新算法,他们引入了传感器融合,用RN处理时域。新的算法产生得益于芯片算力不断的提升,算法的演进和算力不断提升他们是相互促进的,算法越来越复杂,它对算力的有需求,算力的不断提升使得更复杂,更高精度的算法成为可能。
综上所述,我们认为自动驾驶芯片的趋势是大算力和通用,大算力要应对越来越多的传感器,更高的分辨率和更复杂的算法,自动驾驶芯片从一两年前的20-30T,到现在的200T,今后我们会看到500-1000T的芯片,通用式为了应对各种各样的网络,各种各样的算子。
我们认为自动驾驶算法还是在不断演进,有各种各样的目标检测网络,RN用在预测规划,特斯拉用在传感器融合上,所以AI处理器需要做成通用,在各种网络上都要达到很好的性能。
大算力通用给自动驾驶芯片带来如下几个挑战:
第一,对芯片系统架构的挑战。200T以上大算力的芯片类似于现在的云端的服务器芯片,它对存储能力要求很高,需要支持超高带宽和满足QOS的要求,系统也应对高带宽,有好位宽256位宽的DDR,对应200G的带宽,目前对应40-50G的带宽。
第二,通用软件站的挑战。自动驾驶算法迅速演变,激光点映算法和多传感器融合算法不断的发展,不断变化的算法需求和OTA模式需要通用的硬件架构和软件站,前面说的各种网络形形色色的算子,为AI处理器和软件的通用化带来挑战。
第三,先进工艺。大算力需要集成很多的晶体管,需要7纳米,5纳闷的先进工艺。只有先进工艺才能做到更高的集成,类似于手机芯片,自动驾驶芯片需要仅仅跟随工艺演进的步伐。
第四,大算力芯片需要集成数百亿颗晶体管,7纳米情况下面积可以达到几百封装,在热设计,量产成本上有比较大的挑战。
针对前面的挑战,寒武纪行歌在第一代自动驾驶芯片布局,首先我们有200T以上的算力,寒武纪已经有成熟的服务器芯片的产品线,在这方面有比较深的积累,最大的服务器芯片512T。
还有7纳米的先进工艺,寒武纪已经有几款的芯片量产,现在做5纳米的芯片,要支持车规,这是寒武纪以前没有做过的,需要做的,要有公路安全,可靠性满足AECQ100的需求,有独立的安全对公路安全进行监控。
软件上寒武纪AI已经有成熟通用的软件站了,现在做的是车相关的SPK。
我的演讲就是这些,谢谢大家。
[汽车总站网 www.chianautoms.com欢迎你]
读者留言
看不清?点击更换

汽车总站网

  • www.chinaautoms.com/由北京茂胜文化传媒有限公司版权所有@2019

    京ICP备18056018号

    合作QQ: 305140880

    地址:北京市朝阳区清河营国际城乐想汇3号楼1612室