

内容目录 芯片是软件定义汽车生态发展的基石 5 汽车处理芯片由 MCU 向 AI 芯片方向发展 7 汽车数据处理芯片运算由控制指令向 AI 运算方向发展 7 ARM 内核提供芯片控制指令运算能力 9 AI 处理器提供芯片智能运算能力 10 车规级芯片条件苛刻 11 MCU 引领汽车由机械化时代走向电气化时代 13 MCU 承担汽车执行 ECU 的运算大脑 13 预计 2025 年我国汽车 MCU 市场达 32.9 亿美元,CAGR 7.7% 14 汽车 MCU 行业加快整合集中度提升 16 软件定义汽车时代来临,域控制 AI 芯片是重要一环 18 AI 芯片是智能汽车时代实现域控制的核心 18 预计 2025 年我国汽车 AI 芯片市场超 91 亿美元,CAGR46.2% 19 集成更多 AI 单元是智能芯片技术路径发展的大趋势 20 域控制器 AI 芯片呈现三强多极竞争格局 23 特斯拉:自研 FSD 芯片,引领产业发展 25 NVIDIA:全球通用 AI 芯片龙头,构建生态王国 27 Mobileye:背靠英特尔,全球自动驾驶 AI 芯片龙头 32 华为:依托芯片,欲打造最强生态体系 36 地平线:对标 Mobileye,AI 芯片率先搭载 UNI-T 座舱域 39 寒武纪:源于中科院,面向云边端全领域 42 域控制器 AI 芯片潜在进入者 44 受益标的 46 风险提示 46 图表目录 图 1:博世 E/E 架构升级进程 5 图 2:由控制指令运算为主的分布式 ECU 向 AI 运算的中央计算平台发展 6 图 3:汽车半导体分类 7 图 4:MCU 芯片结构 8 图 5:SOC 芯片结构 8 图 6:ARM Cortex 处理器家族分为 A/R/M 三大系列 10 图 7:智能芯片分为云边端三大类 11 图 8:人工智能算法的概念分类 11 图 9:MCU 的工作过程 13 图 10:BOSCH 的 ECU 实物图 13 图 11:不同位数 MCU 的应用类型 13 图 12:发动机管理系统 ECU 功能应用逐渐复杂化 14 2 / 47 图 13:2018 年传统汽车 MCU 单车价值 78 美元 15 图 14:2018 年纯电动汽车 MCU 单车价值 77 美元 15 图 15:全球通用 MCU(汽车、工业、消费电子等)竞争格局 16 图 16:2017 年全球汽车 MCU 市场份额 17 图 17:自动驾驶信息传递环节 18 图 18:CPU 结构 20 图 19:GPU 结构 20 图 20:FPGA 结构 21 图 21:N-SOC 结构(华为达芬奇架构) 21 图 22:Autopilot 硬件 1.0 25 图 23:Autopilot 硬件 2.0 25 图 24:Autopilot 硬件 2.5 26 图 25:Autopilot 硬件 3.0 26 图 26:特斯拉 FSD 芯片结构 27 图 27:NVIDIA 在 GPU 市场是 AI 芯片龙头 28 图 28:英伟达的 K1 芯片嵌入奥迪 A8 的 zFAS 系统中 29 图 29:NVIDIA PX2 系列产品 30 图 30:NVIDIA 系列产品 30 图 31:Mobileye 是全球自动驾驶芯片龙头 33 图 32:2014-2019 年 EyeQ 芯片出货量 CAGR 45% 33 图 33:2014-2019 年 Mobileye 收入 CAGR 43.7% 33 图 34:EyeQ3 芯片 35 图 35:EyeQ4 芯片 35 图 36:EyeQ5 芯片 35 图 37:华为 MDC 计算平台 37 图 38:达芬奇架构(单核) 38 图 39:MDC300 计算平台 38 图 40:华为“八爪鱼”自动驾驶云服务 39 图 41:地平线芯片的 BPU 架构 40 图 42:地平线的征程二代 SOC 芯片 40 图 43:地平线 年征程二代芯片首次量产搭载在长安 UNI-T 上 42 图 45:寒武纪 MLU290 云端 AI 芯片 43 图 46:寒武纪基于 MLU290 的 AI 加速卡 43 图 47:寒武纪 MLU220 边缘端 AI 芯片 44 图 48:寒武纪基于 MLU220 的 AI 加速卡 44 表 1:SOC 较 MCU 芯片功能更复杂 9 表 2:汽车芯片标准远高于消费级 11 表 3:功能安全标准对故障等级要求苛刻 12 表 4:2030 年我国汽车 MCU 市场规模达 47.6 亿美元 15 表 5:全球主要汽车 MCU 公司概况 17 表 6:2030 年我国汽车 AI 芯片市场规模达 177 亿美元,十年 GAGR 28.1% 19 3 / 47 表 7:AI 芯片的主要技术路径 21 表 8:汽车主要 AI 芯片对比 23 表 9:特斯拉自动驾驶系统方案 26 表 10:NVIDIA 自动驾驶系列产品 29 表 11:NVIDIA 全球车企合作情况 31 表 12:NVIDIA 全球共与六家一级供应商展开合作 32 表 13:Mobileye EyeQ 系列芯片 34 表 14:地平线:地平线:寒武纪云端/边缘/终端系列产品 42 表 17:边缘端芯片产品公司(均 N-SOC 芯片) 44 表 18:云端芯片产品公司(除英伟达 GPU 外,其余均 N-SOC 芯片) 45 4 / 47 芯片是软件定义汽车生态发展的基石 在智能网联汽车产业大变革背景下,软件定义汽车理念已成为共识。传统汽车采用的分布式E/E 架构因计算能力不足、通讯带宽不足、不便于软件升级等瓶颈,不能满足现阶段汽车发展的需求,E/E 架构升级已成为智能网联汽车发展的关键。 汽车 E/E 架构升级主要体现在:1)硬件架构升级。由分布式 ECU 向域控制/中央集中架构方向发展。好处在于:提升算力利用率,减少算力设计总需求;数据统一交互, 实现整车功能协同;缩短线束,降低故障率,减轻凯云官网质量。2)软件架构升级。通过 AutoSAR 等软件架构提供标准的接口定义,模块化设计,促使软硬件解耦分层,实现软硬件设计分离;Classic AutoSAR 架构逐步向Classic AutoSAR 和 Adaptive AutoSAR 混合式架构方 向发展。好处在于:可实现软件/固件 OTA 升级、软件架构的软实时、操作系统可移植; 采集数据信息多功能应用,有效减少硬件需求量,线)通信架构升级。车载网络骨干由 LIN/CAN 总线向以太网方向发展。好处在于:满足高速传输、高通量、低延迟等性能需求,同时也可减少安装、测试成本。 从博世对 E/E 架构定义来看,硬件架构的升级路径表现为分布式(模块化→集成化)、域集中(域控制集中→跨域融合)、中央集中式(车载电脑→车-云计算)。即为分布式ECU(每个功能对应一个 ECU)逐渐模块化、集成向域控制器(一般按照动力域、底盘域、车身域、信息娱乐域和 ADAS 域等),然后部分域开始跨域融合发展(如底盘和动力域功能安全、信息安全相似),并发展整合为中央计算平台(即一个电脑),最后向云计算和车端计算(中央计算平台)发展。其中车端计算主要用于车内部的实时处理, 而云计算作为车端计算的补充,为智能汽车提供非实时性(如座舱部分场景可允许微秒级别的延迟)的数据交互和运算处理。 图 1:博世 E/E 架构升级进程 数据来源:博世,绘制 5 / 47 硬件架构升级驱动芯片算力需求呈现指数级提升趋势。传统汽车功能简单,与外界 交互较少,常为分布式 ECU,主要为控制指令运算(约为百万条指令每秒)、无 AI 运算能力、存储较小;智能网联汽车,不仅需要与人交互,也需要大量与外界环境甚至云数据中心交互,未来将面临海量的非结构化数据需要处理,车端中央计算平台将需要 500+ 百万条指令/秒的控制指令运算能力、300+TOPS(即为 300*1012 次每秒)的AI 算力。 图 2:由控制指令运算为主的分布式 ECU 向 AI 运算的中央计算平台发展 数据来源:博世,佐思车研, 智能网联汽车四大核心技术:芯片、操作系统、算法、数据共同形成生态闭环,芯片是智能网联汽车生态发展的基石。类比手机产业链,我们认为芯片/操作系统或成为寡头垄断格局,而从当下行业发展看,芯片或格局相对较为稳定,且处在产业核心位置。 6 / 47 汽车处理芯片由 MCU 向 AI 芯片方向发展 半导体可分为模拟芯片、数字芯片、OSD 三大类。模拟电路是指处理模拟信号的电子电路。模拟信号具有连续性,信号传播的信息包含在幅度、频率、相位的变化上,常应用于放大信号,信号源两方面。数字电路是指处理数字信号的电子电路。数字信号以二进制逻辑代数为基础,实现简单,系统可靠,具有算数运算和逻辑运算的功能。OSD 包括光电器件、传感器、分立器件三个细分类型。 图 3:汽车半导体分类 数据来源:绘制 汽车数据处理芯片运算由控制指令向 AI 运算方向发展 现阶段,汽车芯片市场上对汽车数据处理芯片分类有按三类:1)智能运算为主的AI 芯片;2)算力较强的主 CPU;3)算力较弱的 MCU(仍可视为 CPU)。也有按两类: 1)智能运算为主的 AI 芯片;2)CPU 运算为主的MCU。为了便于理解,主 CPU 和 MCU 的主要玩家都是同一类,而且 CPU 与 MCU 本质均为控制指令运算,因此我们采用第二种分类方法。 汽车芯片由以控制指令运算为主的 MCU 向智能运算为主的 AI 芯片方向发展。1) 控制指令运算可执行如等待指令、停机指令、空操作指令、中断指令等,其运算单位为 DMIPS:即 Dhrystone MIPS 测试下,计算能力为百万条指令/秒,一般通用芯片常用其表示,如传统汽车电子的 MCU 等,代表厂商如英飞凌、瑞萨、恩智浦等。2)AI 矩阵运算常指对矩阵运算做加速的能力,对应用于图像、视频等非结构化数据的运算处理的 情况下,单位功耗将更低,计算速度更快,其运算单位为 TOPS、Tflops,均指每秒运算1012 次。TOPS:指数据类型为整数型,常用于自动驾驶等领域,代表产品如华为昇腾系列芯片、地平线征程系列芯片、寒武纪的 MLU 系列芯片等。Tflops:指数据类型为单精 7 / 47 度浮点数,较整数型数据精度更高,通用 AI 芯片常用它表示,常用凯云官网于如核实验室运算、分子动力学运算等,代表产品如英伟达的 GPU 芯片。 在智能网联汽车领域,Int8 数据类型精度即可满足现阶段 AI 运算要求。Int 8 和FP32 分为定点数和浮点数,小数点的位置是固定的,则为定点数,小数点的位置是浮动的,则为浮点数。Int8 代表 8 个字节,此外,还有 int4,int16 等字节数越高,计算精度会提升,但占用存储增多,会降低计算速度,所以为保证满足数据精度和运算速度,常用 Int8 数据类型,单位为TOPS(即 1012 次/秒)。 汽车芯片结构形式由 MCU 向 SOC 异构芯片方向发展。汽车数据处理芯片按应用可分为 MCU(微控制器)、SoC(System on Chip 系统级芯片)。MCU 结构简单,可视为简化版本的 CPU,其将 CPU 的频率和规格适当缩减,并将内存、计数器、IO 接口、 I/D 转换等结构都整合到单一芯片,形成芯片级的计算机,主要用于汽车执行端 ECU 中进行控制指令运算。SoC 是一颗系统级芯片,常由 CPU+GPU+DSP+NPU+各种外设接口、存储类型等电子元件组成,现阶段主要应用于座舱 IVI、域控制等较复杂的领域。 SOC 较 MCU 集成程度更高,常集成 AI 处理单元,功能更复杂。SOC 芯片:1) 硬件集成规模更为庞大,提升资源利用效率。常额外集成音频处理 DSP/图像处理GPU/ 深度学习加速单元 NPU 等,单颗芯片上集成更多的配套电路,减小了面积,提升资源利用率,片上互联利于集成电路之间的高速互通互联。2)芯片上软件配套更大,提升处理效率。SOC 芯片上有丰富的软件配套(工具链、编译器等),提升了处理效率。3)可支持多任务的复杂系统。但并非所有的 SOC 芯片均为 AI 芯片,需集成一定规模的时间网络单元才是 AI 芯片,如华为昇腾芯片、地平线征程芯片、寒武纪 MLU 芯片、特斯 拉 FSD 均为此类芯片。 图 4:MCU 芯片结构 图 5:SOC 芯片结构 数据来源:绘制 数据来源:绘制 8 / 47 表 1:SOC 较 MCU 芯片功能更复杂 MCU SOC 定义 芯片级芯片,常用于执行端 系统级芯片,常用于 ADAS、座舱 IVI、域控制等 典型组成 CPU+存储(RAM,ROM)+接口(IO Pin) CPU+存储(RAM、ROM)+较复杂的外设+音频处理 DSP/图 像处理 GPU/神经网络处理器 NPU 等 带宽 多为 8bit、16bit、32bit 多为 32bit,64bit 主频 MHz 级别 MHz-GHz RAM(主存) MB 级别 MB-GB 额外存储 KB-MB(Flash,EEPROM) MB-TB(SSD,Flash,HDD) 单片成本价格 便宜(0.1-15 美元/个) 较贵(座舱 IVI:10 美元左右,ADAS 域芯片超 100 美元) 常见厂商 瑞萨、意法半导体、爱特梅尔、英飞凌、美 英特尔、英伟达、特斯拉(FSD)、华为、地平线、寒武 国微芯等 纪、全志科技(座舱)等 复杂度 低 高 运行系统 较简单,一般不支持运行多任务的复杂系统 支持运行多任务的复杂系统(如 Linux 等) 数据来源:维基百科,整理 ARM 内核提供芯片控制指令运算能力 CPU 架构可分为 X86 为代表的复杂指令集架构,和 ARM 为代表的精简指令集架构。汽车 CPU 架构主要为 ARM 架构,在 MCU 和 SOC 中担任控制指令运算。CPU 架构可分为CISC(复杂指令集)架构和 RISC(精简指令集)架构。1)复杂指令集指令可 变格式,包括 8、16、32、64 位,其特点是单指令功能强大且复杂,指令执行周期长, 可以直接操作内存,常见的复杂指令集如 X86,代表企业intel、AMD。2)精简指令集的特点是单指令功能简单、执行速度快,编译效率高,不能直接操作内存,常见的精简指令集有 ARM、MIPS、OpenRISC 以及 RSIC-V 等,代表企业:ARM。ARM 处理器内 核广泛用于嵌入式系统,具有执行效率高,低成本等优点。 ARM Cortex 系列主要分为 A、R、M 三类。1)Cortex-A 系列:常集成于 SOC 中, 面向性能密集型系统的应用处理器内核,带宽多为 64/32 位,主频可达 GHz 级别 (1GHz=103MHz),当主频达到 1GHz 时,其单核控制指令算力为几千 DMIPS(DMIPS即为百万条指令每秒),多用于汽车座舱娱乐信息系统或 ADAS 领域;2)Cortex-M 系列:常集成于 MCU 中,主要面向各类嵌入式应用的微控制器内核,主频为几十-几百 MHz 级别,其单核控制指令算力为几十至几百 DMIPS,多用于汽车执行端控制领域; Cortex-R 系列面向实时应用的高性能内核,介于A 与 M 之间。 9 / 47 图 6:ARM Cortex 处理器家族分为 A/R/M 三大系列 数据来源:CNSD,绘制 AI 处理器提供芯片智能运算能力 AI 处理器可分为云端处理器、边缘端处理器、终端处理器。1)云端 AI 处理器, 支持 Int8 定点运算或 FP16、FP32 浮点运算,支持深度学习推理/训练要求,主要应用于政府、企业数据中心的服务器中,如服务金融业、航空航天、气象预报、宇宙演化模拟以及抗震分析等领域计算。此外在未来 5G 应用,更多的汽车数据会传送到车企数据中心用来训练模型,实现软件、算法的优化。2)边缘端 AI 处理器,Int8 定点运算,支持深度学习推理要求,主要应用于工控机、安防摄像头、机器人、汽车车端等领域,由于所搭载设备的电力资源有限,能效比高(算力/功耗,值越高越经济)、接口丰富等是关键。3)终端 AI 处理器主要支持深度学习推理功能,主要应用于手机等移动终端,如华为麒麟系列芯片。未来云边端三类处理器并非竞争关系,而是未来会进一步协同发展, 云端训练模型实现算法软件的优化,并提供给边缘/终端进行本地化 AI 运算。 车端 AI 处理器现阶段主要负责深度学习的推理任务。智能算法范围由大至小依次为:人工智能、机器学习、深度学习、神经网络。应用场景越少,对应需要的实现的算法越少,就越适用于专用芯片,可通过精简处理器软硬件模块,使处理器计算效率、能效比更高。 10 / 47 图 7:智能芯片分为云边端三大类 图 8:人工智能算法的概念分类 数据来源:绘制 数据来源:绘制 车规级芯片条件苛刻 车规级芯片标准远高于消费级,认证流程长。1)工作环境更为恶劣:相比于消费芯片及一般工业芯片,汽车芯片的工作环境温度范围宽(-40 至 155 摄氏度)、高振动、多粉尘、多电磁干扰。2)可靠性安全性要求高:一般的汽车设计寿命都在 15 年或 20 万公里左右,远大于消费电子产品寿命要求。在相同的可靠性要求下,系统组成的部件和环节越多,对组成的部件的可靠性要求就越高。3)车规级芯片认证流程长。一款芯片一般需要 2 年左右时间完成车规级认证,进入车企供应链后一般拥有 5-10 年的供货周期。 表 2:汽车芯片标准远高于消费级 参数要求 消费级 工业级 汽车级 温度 0-40℃ 零下 10~70℃ 零下 40~155℃ 湿度 低 根据使用环境而定 0-100% 验证 JESD47(Chips) ISO16750(Modules) JESD47(Chips) ISO16750(Modules) AEC-Q100(Chips) ISO16750(Modules) 出错率 3% 1% 0 使用时间 1-3 年 5-10 年 15 年 数据来源:CNSD, 汽车标准需认证可靠性标准 AEC-Q 系列、质量管理标准 ISO/TS16949 其中之一, 此外需要通过功能安全标准 ISO 26262 ASIL B(D)。ISO 26262 在 2011 年 11 月 15 日正式发布,主要包括四个等级,分别为 ASIL A/B/C/D。ISO 26262 安全是汽车电子元件稳 定性优劣的评判依据之一,通过该等级代表其产品稳定性合格,耐用,但不代表其算力、能效比高。此外,还需要通过零失效的供应链质量管理标准 TS16949/ISO 9000 国际认证体系下的汽车行业分支的标准认证;另一个是 AEC-Q 认证,由克莱斯勒、通用、福特 11 / 47 制定的汽车电子元件安全性检测标准。 表 3:功能安全标准对故障等级要求苛刻 单点故障等级 潜在故障等级 ASIL A NA NA ASIL B 90% 60% ASIL C 97% 80% ASIL D 99% 90% 数据来源:ISO26262 标准, 12 / 47 MCU 引领汽车由机械化时代走向电气化时代 MCU 承担汽车执行 ECU 的运算大脑 汽车发展初期,控制功能较少,一般新增一个功能便新增一个 ECU(Electronic Control Unit,即电子控制单元),即为典型的分布式电子电气架构。因此,一般汽车中包括多个 ECU,每个 ECU 管理不同的功能,而 MCU 芯片嵌入在 ECU 中作为运算大脑。MCU 的工作过程:传感器输入信号,输入处理器对信号进行模数转换、放大等处理后,传递给 MCU 进行运算处理,然后输出处理器对信号进行功率放大、数模转换等, 使其驱动如电池阀、电动机、开关等被控元件工作。MCU 主要有 8 位、16 位、32 位, 位数越多越复杂,处理能力越强,可实现的功能越多。 图 9:MCU 的工作过程 图 10:BOSCH 的 ECU 实物图 数据来源:汽车电子,绘制 数据来源:博世, 图 11:不同位数 MCU 的应用类型 数据来源:汽车电子,整理 MCU 单车价值量提升的核心逻辑在于:1)芯片用量提升,应用领域由传统底盘延 13 / 47 伸至整车。随着汽车电子化发展,ECU 逐渐占领整个汽车,从防抱死制动系统、四轮驱动系统、电控自动变速器、主动悬架系统,到现在逐渐延伸到了车身各类安全、网络、娱乐控制系统等领域。2)芯片集成复杂化,单价提升。以发动机管理系统 ECU(MCU 为其核心芯片)为例,汽车电子发展的初期,ECU 最早仅应用于发动机的控制,如汽车发动机的排气管(氧传感器)、气缸(爆震传感器)、水温传感器等核心部件才会放置传感器,数量少。之后随着国三至国五标准的提升,在油耗控制、信号输出控制等方面需要芯片处理的能力增强,推动 MCU 芯片集成度提升,产品升级带来价值提升。 图 12:发动机管理系统 ECU 功能应用逐渐复杂化 数据来源:凌电变频,盖世汽车,绘制 预计 2025 年我国汽车 MCU 市场达 32.9 亿美元,CAGR 7.7% 2018 年汽车单车 MCU 价值量约为 78 美元。参考 Stratety Analytics 数据分析,现阶段不论是在燃油车还是纯电动车中,单车MCU 价值量大体相当。2018 年传统燃油车、纯电动车单车半导体价值量分别为 338 美元、704 美元,MCU 价值量占比分别为 23%、 11%,即 MCU 单车价值量分别为 78 美元、77 美元。主要原因在于现阶段电动车发展刚起步,多为经济型车,仅新增如电源管理系统等 MCU,但是也减少了如发动机管理系统等 MCU。随着电动化、智能化、网联化进程加快,无论是电控系统还是信息娱乐系统、网络系统等也需要更多的 MCU,MCU 单车价值量将持续快速提升。 14 / 47 1904938777功率半导体 MCU 传感器图 13:2018 年传统汽车 MCU 单车价值 78 美元 图 14:2018 年纯电动汽车 190 49 387 77 功率半导体 MCU 传感器 7114578 71 145 78 44 功率半导体 MCU 传感器 其他 其他 数据来源:Stratety Analytics, 数据来源:Stratety Analytics, 假设:1)汽车市场容量预测。根据中汽协数据,2019 年我国汽车产量为 2572 万辆,借鉴海外发达国家发展经验,我们预计 2019-2030 年国内汽车复合增速为 2%。 数量预测。随着智能化进程加速,汽车控制功能逐年增多,单车平均 MCU 个数由 2018 年的 50 个将达到 2030 年的 62 个。分类别来看,2018 年 MCU 8 位、16 位、32位个数分别为 20、20、10。现阶段,随着智能化对算力要求增加,相关的技术逐渐成熟, 32 位 MCU 用量将会快速提升,而 8 位 MCU 因体积小、成本低等优势单车使用数量仍将保持稳定,而 16 位 MCU 市场将逐渐被 32 位和 8 位 MCU 挤压,至 2030 年 8 位、16位、32 位个数分别为 20、14、28。 单车价值预测。单车 MCU 价值由 2018 年的 78 美元提升至 2030 年的 149 美元。我们重点参照 NXP 市场数据,MCU 单价:8 位一般为 1 美元以下,16 位为 1-3 美元, 32 位为 3 美元以上。而随着技术逐渐成熟,16 位与 8 位单价正在逐年下降,32 位随着功能更加丰富和复杂化,更多高单价的产品正在被开发出来。预计 8 位、16 位 MCU 均价由 2018 年的 0.4 美元、1.8 美元分别下降至 2030 年的 0.35 美元、1.52 美元,32 位 MCU 均价由 2018 年的 3.4 美元提升至 2030 年的 4.31 美元。 2025 年我国汽车 MCU 市场规模达 32.9 亿美元,未来 6 年 CAGR 为 7.7%。经测算,2019 年我国汽车 MCU 市场规模为 21.1 亿美元,同比-2.7%,随着汽车智能化加速, 更多的功能将会被整车搭载,大量执行元件需要被 MCU 所控制,到 2025 年MCU 市场规模达 32.9 亿美元,CAGR 为 7.7%,到 2030 年将达 47.6 亿美元。 表 4:2030 年我国汽车 MCU 市场规模达 47.6 亿美元 2018 2019 2020E 2021E 2022E 2023E 2024E 2025E 2030E 个数 8 位 20.0 20.0 20.0 20.0 20.0 20.0 20.0 20.0 20.0 16 位 20.0 19.5 19.0 18.5 18.0 17.5 17.0 16.5 14.0 32 位 10.0 11.5 13.0 14.5 16.0 17.5 19.0 20.5 28.0 15 / 47 合计 50.0 51.0 52.0 53.0 54.0 55.0 56.0 57.0 62.0 8 位 0.40 0.40 0.39 0.39 0.38 0.38 0.38 0.37 0.35 单价 16 位 1.80 1.76 1.73 1.69 1.66 1.63 1.61 1.59 1.52 32 位 3.40 3.47 3.54 3.61 3.68 3.75 3.83 3.91 4.31 单车价值量(美元) 78.0 82.1 86.6 91.3 96.4 101.7 107.6 113.8 149.0 MCU 市场规模(亿美元) 21.7 21.1 22.7 24.4 26.3 28.3 30.6 32.9 47.6 同比 -2.7% 7.6% 7.6% 7.6% 7.6% 7.9% 7.8% 数据来源:NXP,中汽协, 注:1)因集成化或导致芯片单价提升,个数减少,但整体单车价值仍提升; 此外市场部分观点把域控制器内部集成的 CPU/MCU 称之为主芯片,本测算也包含在此 MCU 市场中。 汽车 MCU 行业加快整合集中度提升 全球 MCU 通用市场并购加速。我们重点参考 MCU 通用领域(汽车、工业、消费电子等)市场,MCU 厂商为争夺市场份额,近年来发生了数起大规模并购。NXP 在 2015 年以 118 亿美元收购飞思卡尔,完成了在汽车电子领域的布局,排名也一举从第六上升至第一;Cypress 在 2015 年以 40 亿美元收购spansion;Microchip 在 2016 年完成对Atmel的收购,成为全球第二大 MCU 厂商。我们判断,汽车 MCU 市场也将随通用市场的加快整合,实现集中度的提升。 图 15:全球通用 MCU(汽车、工业、消费电子等)竞争格局 数据来源:IHS,绘制 欧美日前五大汽车 MCU 供应商占据全球 82.7%市场份额,头部集中效应显著。根据 Stratety Analytics 分析数据,全球汽车 MCU 市场前 5 占 82.7%的市场份额,前五大MCU 供应商分别为日本瑞萨电子,欧洲:NXP、英飞凌,美国:德州仪器、微芯科技。 全球前八大厂商也同样占据我国汽车 MCU 93%的市场份额。仍由欧美日传统汽车 16 / 47 电子厂商占据绝大部分市场份额,我们重点参考 IHS 数据分析,目前中国 MCU 市场, 前八大 MCU 厂商的市场占有率达到 93%。国产化率不足 5%,替代空间大。国内企业技术较为薄弱,企业规模与前八大厂商差距较大,现阶段主要为工业控制、仪器仪表、消费电子、物联网等通用领域供货。随着国内企业技术逐渐成熟,国内厂商凭借价格和服务优势,正逐步抢夺低端 MCU 市场,进口替代趋势逐渐明显。但由于车规级标准较高,技术和市场发展均晚于一般工业和消费级芯片。 公司 中文 成立时间 国家 公司 中文 成立时间 国家 主营产品 应用领域 介绍 8、16、32 位 智能卡、汽 前身为飞利浦集团的半导体部门,于 2006 年 MCU 车电子 独立 8、16、32 位 汽车电子、 前身为西门子集团的半导体部门,于 1999 年 MCU 工业控制 独立 汽车电子、 由日立制作所半导体和三菱电机半导体部门合 Renesas 瑞萨电子 2003 日本 32 位 MCU 通信设备 并设立 NXP 恩智浦 2006 荷兰 Infineon 英飞凌 1999 德国 ST 意法半导体 1988 瑞士 32 位 MCU 电机控制、物联网 由意大利 SGS 半导体公司和法国汤姆逊半导体公司合并设立 尔,后者于 2015 年被恩智浦收购8、32 位MCU工业控制、汽车电子 尔,后者于 2015 年被恩智浦收购 8、32 位 MCU 工业控制、 汽车电子 Toshiba 东芝 1875 日本 / / 由东京电气株式会社和芝浦制作所合并而成 摩托罗拉半导体部门拆分为安森美和飞思卡 工业控制、 最初为其母公司地球物理业务公司(GSI)的汽车电子 晶体管部门 工业控制、 最初为其母公司地球物理业务公司(GSI)的 汽车电子 晶体管部门 8、32 位 MCU 美国 1947 德州仪器 TI Microchip 微芯 1989 美国 数据来源:各公司官网,整理 图 16:2017 年全球汽车 MCU 市场份额 17.3? 17.3? 31.2? 5.8? 8.5? 9.4? 27.8? Renesas NXP TI Infineon Microchip other 数据来源:Stratety Analytics,Infineon, 17 / 47 软件定义汽车时代来临,域控制 AI 芯片是重要一环 AI 芯片是智能汽车时代实现域控制的核心 汽车由分布式架构向域控制/中央集中式架构方向发展。传统分布式硬件架构面临 智能汽车时代多维感知需求和海量非结构化数据处理的需求,一般每新增一个应用功能, 便新增对应的感知传感器、决策、执行层。随着智能网联汽车时代的到来,以特斯拉为 代表的汽车电子电气架构改革先锋率先采用中央集中式架构,即用一个电脑控制整车。全球范围内各大主机厂均已认识到软件定义汽车的大趋势,纷纷升级自身的电子电气架 构,虽不同主机厂采用几个电脑控制整车的方案不同,但架构域控制/集中化方向相同。域控制器逐渐集成前期的传感器处理器、数据融合、路径规划、决策等诸多运算处理器 功能,因此对域控制器芯片算力需求大幅提升。 非结构化数据导致传统 MCU 不能满足需求,AI 作为协处理器逐渐成为智能时代的核心。随着芯片需要处理传感器传来的大量汽车内外部环境信息,而且也要处理大量图片、视频等非结构化数据,面向控制指令运算的 MCU 不能满足需求。AI 处理器作为智能时代的协处理器,成为智能汽车时代的核心。一般待处理数据信息会先传递给CPU(等同于 MCU),CPU 发现有大规模的非结构化数据,自身无法处理,便将其传输给AI 处理器运算,而 CPU 便暂停运算,等待 AI 处理器运算结束后,再进行下一步操作, 所以AI 处理器是人工智能时代的协处理器,是现阶段智能汽车时代运算的核心。 图 17:自动驾驶信息传递环节 数据来源:NXP,绘制 18 / 47 预计 2025 年我国汽车 AI 芯片市场超 91 亿美元,CAGR46.2% 假设:1)汽车市场容量预测。如前文 MCU 测算假设一致,我国汽车产量 2019-2025 年复合增速为 2%。 各级别自动驾驶渗透率预测。L3、L4 级分别于 2020 年、2023 年规模量产,每年并以 3-4%渗透率提升。根据工信部发布的《汽车中长期发展规划》指出,我国 2020 年自动驾驶渗透率达 50%,2025 年渗透率达 80%。L3 级于 2020 年开始量产并规模投放市场,渗透率快速提升,随着 L4 级车于 2023 年开始量产,低级别渗透率陆续到达渗透率峰值后又缓慢下降。 各级别自动驾驶 AI 芯片单车价值预测。2020 年L1-L3 级 AI 芯片单车价值分别为 50 美元、150 美元、500 美元,随着技术逐渐成熟,2030 年下降到 41 美元、111 美 元、315 美元。我们预计到 2023 年 L4 级高级自动驾驶出现,AI 芯片单车价值约为 1500 美元,到 2030 年下降到 931 美元。 2025 年我国 AI 芯片市场超 91 亿美元,未来 6 年复合增速达 46.4%。经测算,2020 年我国汽车 AI 芯片市场规模为 15 亿美元,同比增长 59.4%,随着汽车 EE 架构加速升级,域控制器/中央计算平台被广泛使用,到 2025 年 AI 芯片市场规模达 91 亿美元, CAGR 为 45.9%,到 2030 年将达 177 亿美元,十年复合增速 28.1%。 表 6:2030 年我国汽车 AI 芯片市场规模达 177 亿美元,十年 GAGR 28.1% 2019 2020E 2021E 2022E 2023E 2024E 2025E 2026E 2027E 2028E 2029E 2030E L1/L0 20% 25% 28% 28% 25% 20% 16% 13% 10% 8% 6% 4% L2 17% 23% 27% 30% 29% 27% 24% 22% 20% 18% 16% 14% 渗透率 L3 2% 7% 13% 19% 23% 26% 28% 26% 24% 22% 20% L4/L5 3% 9% 14% 19% 27% 35% 43% 51% 合计 37% 50% 62% 71% 76% 79% 80% 82% 83% 85% 87% 89% L1/L051 L1/L0 51 50 49 48 47 46 45 44 43 43 42 41 ASP L2 155 150 146 141 137 133 129 125 121 118 114 111 (美元) L3 500 475 451 429 407 387 371 357 342 329 315 L4/L5 1500 1350 1242 1143 1086 1031 980 931 市场规 L1/L0 L2 3 7 3 9 4 11 4 12 3 11 3 10 2 9 2 8 1 7 1 7 1 6 1 5 模(亿 L3 3 9 16 23 27 29 31 28 25 23 20 L4/L5 13 35 50 64 88 111 132 152 AI 芯片/亿美元 9 15 23 31 50 74 91 105 125 144 161 177 YOY 33.2% 59.4% 54.4% 35.3% 58.6% 49.2% 22.5% 15.6% 19.3% 15.1% 12.2% 10.0% 域控制器/亿美元 19 30 46 62 99 148 181 209 250 287 322 355 19 / 47 数据来源:中国汽车工业协会,预测 集成更多 AI 单元是智能芯片技术路径发展的大趋势 CPU,又称中央处理器,擅长逻辑控制和通用类型数据运算,具有不可替代性。CPU 有很强的通用性,可处理不同的数据类型,主要负责顺序控制、操作控制、时间控制、数据加工等操作,因此在任何一个电脑或嵌入式的计算中都有 CPU 或其裁剪版本。CPU 由控制器(Control),寄存器(Cache、DRAM)和逻辑单元(ALU)构成,其中控制器和寄存器占比较大,而处理数据的逻辑单元占比较小,因此对于专用领域数据处理能力较弱。代表厂商即为 X86 处理器的英特尔和嵌入式处理器的ARM。 GPU,又称图形处理器,俗称显卡,擅长大规模并行计算。GPU 拥有计算单元数量众多和超长的流水线,处理的数据类型通常为高度统一的、相互无依赖,省去了大量 CPU 的不必要控制指令计算模块,并行计算能力较 CPU 强。随着人工智能的发展,GPU 不断被应用于数值模拟、机器学习、视觉处理、语音识别等领域,厂商代表即为英伟达。 图 18:CPU 结构 图 19:GPU 结构 数据来源:CSDN, 数据来源:CSDN, FPGA 全称是 Field Programmable Gate Array:又称可编程逻辑门阵列,算力较高,适合小规模定制化开发测试。用户可通过烧入配置文件来定义其内部结构的连线, 从而达到定制电路的目的。FPGA 的芯片量产成本较高,能效比较差,不如 ASIC 专用芯片。适用于科研、企业开发阶段,一旦方案确定,其成本优势就不再突出。代表厂商: 赛灵思、阿尔特拉(被英特尔收购)、深鉴科技。 ASIC 全称是 Application-Specific Integrated Circuit:是一种为专门目的而设计的集成电路,具有算力最高,能效比优等特点。ASIC 面向特定用户的需求,适合较为单一的大规模应用场景,运行速度在同等条件下比 FPGA 快。但在架构层面对特定智能算法作硬化支持,指令集简单或指令完全固化,若场景一旦发生变化,该类 AI 芯片便不 20 / 47 再适用,需要跟新换代。面对现阶段,AI 算法日新月异,每年都有大量的算法被开发出来,对于自动驾驶领域适用性不强。所以现阶段并没有真正意义上的ASIC 芯片。 N-SOC,(即添加神经网络单元的系统级芯片)是指在芯片中集成更多的神经网络单元,以实现快速的 CNN(卷积神经网络)运算。N-SOC 是现阶段市场的新名词,主要系随着 AI 芯片的发展,传统定义方法并不完全适用,N-SOC 区别于 ASIC 的智能算法被硬化,但其并不是一颗完全通用芯片,仅支持少量的算法。典型的代表企业:英特尔旗下的 Mobileye、华为(达芬奇架构Ascend 系列)、寒武纪(MLU 系列)、百度(昆仑云)、阿里平头哥、Google(TPU)等。 图 20:FPGA 结构 图 21:N-SOC 结构(华为达芬奇架构) 数据来源:CSDN, 数据来源:华为, 由通用向专用排序依次:CPU、GPU、FPGA、ASIC;数据处理成本经济性(由优至差):ASIC、FPGA、GPU、CPU。1)CPU 最通用,算力差,能效比最差,但除了运 算,还包括控制指令,不可被替代;2)GPU 为较为通用的芯片,算力高,架构较为开放,可允许主机厂基于底层硬件架构开发自己的专门算法,但能效比较差;3)FPGA, 算力一般,可根据客户需求用配置文件更改芯片结构的连线,实现定制电路,适用于实验室科研、前期开发等小批量应用;4)ASIC 为专用芯片,算力高、能效比优,节约不必要开发资源,规模量产成本最低,但支持算法不够灵活。 表 7:AI 芯片的主要技术路径 CPU GPU FPGA ASIC 定义 定义 中央处理器 图像处理器 现场可编程逻辑门阵列 专用处理器 架构区别 70%晶体管用来构建Cache,还有部分控制单 元,计算单元少,适合运算复杂,逻辑复杂,但量少的场景,具有不可替代性 晶体管大部分构建计算单元,运算复杂度低,适合大规模并行计算。支持各种编程框架,较 FPGA 和ASIC 更通用 可编程逻辑,计算效率 高,更接近底层 IO,通过冗余晶体管和连线实现逻辑可编程 晶体管根据算法定制,功耗低、计算效能高、计算效率高。为特定需求专门定制的芯片,编程框架固定,更换算法需重新设计 21 / 47 计算能力和 效率 算力最低,能效比差 算力高,能效比中 算力中,能效比优 算力高,能效比优 上市速度 快,产品成熟 快,产品成熟 快 上市速度慢,开发周期长 用于数据处理时,单价成 用于数据处理时,单价成 成本高,可复制,量产规 成本 较低的试错成本 本最高 本高 模生产后成本可有效降低 性能 最通用(控制指令+运 算) 数据处理通用性强 数据处理能力较强,专用 AI 算力最强,最专用 广泛应用于各种图形处 适用成本要求较低的场 主要满足场景单一的消费 适用场景 广泛应用于各种领域 理、数值模拟、机器学习 景,如军事、实验室、科 电子等高算力需求领域 算法领域 研等 数据来源:CSDN,整理 AI 芯片通过添加神经网络单元实现 AI 运算的更高效。目前市场对未来汽车 AI 芯 片采用通用 GPU、FPGA、ASIC 芯片方案仍有较大争议,我们认为汽车数据处理芯片不断异构化,通过不断添加神经网络单元实现 AI 运算是未来发展的主要方向。除了华为、地平线、寒武纪等 AI 芯片不断增加神经网络单元外,而作为通用 GPU 的代表供应商英伟达的自动驾驶系列芯片,也通过添加神经网络单元,以实现对 AI 处理越来越高效。但总体而言 GPU 仍功耗较高,丰富的通用模块可实现对各种场景的适用性,但也带来了成本过高,功耗过高的问题。而新出现的 N-SOC 虽不是 ASIC 固定算法,具有成本/ 功耗较低等优点,但其针对各种场景的适应性仍较弱。在汽车领域,未来两者未来性能、成本等方面会有相互靠近的趋势。 22 / 47 域控制器 AI 芯片呈现三强多极竞争格局 结论:特斯拉 FSD 芯片自研自用,引领产业发展,属于独立一级;全球 GPU 领域AI 龙头英伟达和背靠英特尔的汽车 AI 芯片龙头 Mobileye 属于第一阵列;华为技术强劲自建生态体系属于 1.5 阵列,有望快速突围进入第一阵列;国内智能驾驶 AI 芯片新锐地平线、云边端全领域覆盖 AI 新兴寒武纪等处于第二阵列;传统汽车电子厂商及其他潜在进入者处于第三阵列。 表 8:汽车主要 AI 芯片对比 特斯拉 英伟达 Mobileye 华为 地平线 芯片名称 FSD Orin(2022 Xavier 量产) EyeQ5 Ascend 310 征程 2 代 J5(2023 量产) 功能安全 / ASIL-D / ASIL-D ASIL-D / ASIL B(D) 工艺 14 nm 12nm 7nm 7nm 12nm 28nm 7nm AI 算力 2*36TOPS 30TOPS 200TOPS 2*12TOPS 16TOPS 4 TOPS 96TOPS 功耗 36W 30W 75W 2*5W 8W 2 W 15W 能效比 2TOPS/W 约 1TOPS/W 3TOPS/W 2.4TOPS/W 2TOPS/W 2TOPS/W 6.4TOPS/W Model S\X\3 全球六家 Tier 绝大部分主机 UNI-T 座舱域, 对应市场 应用 / 和小鹏等 厂、Tier 1 供应 商 适配中 / ADAS 适配中 专用化算力 总结 高,能耗低 生态丰富;GPU 高功耗(未来下降空间有限) L2 及以下市场; 黑盒难定制开发 国内优选; 华为生态 生态有待提升 / 数据来源:各公司官网,整理 特斯拉自研 FSD 方案属于另一极。主要优势:由于其自研自用,根据需求研发专用芯片,减少不必要的软硬件模块,1)缩短研发周期,减少研发设计工作量;2)提升能效比;3)用户数据驱动研发优化。主要劣势:1)生态较为封闭,仅内部开发和使用, 无法建立完善的生态体系。2)若使用量有限,芯片研发需要投入大量资金,软硬件开发 的成本难以通过大规模使用均摊成本。 Mobileye 与英伟达属于第 1 阵列。在 L3 级到来以前,两公司产品几乎不会处于正面竞争,随着自动驾驶进程加速发展,竞争会逐渐加剧。短期来看,Mobileye 面向 L3 级以下市场,产品更加成熟,会更占优势。中长期来看,英伟达面向 L3 级以上预研市场在AI 领域实力深厚,后发有力,优势会更加突出。 NIVIDA 属于第 1 阵列,作为通用 AI 芯片龙头,占据 L3 级及以上市场,对外提供芯片级产品,而非芯片+算法的解决方案,是合资品牌的优选。主要优势:1)中立第三方,最丰富的生态体系。定位 Tier 2 芯片供应商,提供芯片或开发平台,具备最完善 23 / 47 的软件工具链和应用生态;2)算力高(但利用率仍有待提升),Xaier 芯片的 30TOPS 高于 Eye Q4 的 2.5TOPS,Orin 芯片的 200TOPS 高于Eye Q5 的 24TOPS;3)支持各类传感器数据融合,可提供摄像头+雷达等各类传感器数据融合处理;4)提供云服务,有望获取数据实现优化。主要劣势:主要系 GPU 通用芯片,有大量的非必要软硬件模块, 成本价格较贵,浪费资源,后续有望规模量产后实现快速下降;2)能效比差,后续产品开发加入更多的 DLA 深度学习加速器模块,能效比有望改善。 Mobileye 属于第 1 阵列,背靠英特尔,占据 L2 级及以下市场,芯片+算法绑定的一体式解决方案。主要优势:1)经验丰富质量可靠,产品已经有众多量产车搭载,质量和适配过关;2)客户资源最丰富,国内外绝大多数主机厂和 Tier1 级供应商均为其客户;3)价格较为合理。主要劣势:1)算力提升明显低于其他厂商,最新 EyeQ5 算力峰 值仅 24TOPS,而市场认为 L3 级算力需求 30TOPS 以上,后期芯片仅靠提升VMP 等手段,算力提升或难以为继,又或者因为高度定制化针对视觉领域,减少不必要的软硬件 资源,算力不高但性能仍满足需求;2)黑盒子模式限制用户创新,算法和芯片捆绑销 售,或与厂商规模较小,为客户提供定制化服务,在主机厂软件开发能力较差的初期阶段受广泛欢迎,但随着开发能力提升,一体销售的灵活度较差,客户难以做出差异性产品。根据规划Eye Q5 或将开放融合算法,但感知算法并未提及。 华为属于第 1.5 阵列,凭借强劲的技术实力有望快速进入第一阵列,主要针对 L2+ 及以上市场,模式与 NVIDIA 类似,现阶段对外提供平台类产品(开发平台),而非解决方案,是国产品牌的优选。主要优势:1)算力高,能效优,计算平台可提供 64~350TOPS,端到端 1TOPS/W(芯片级 2TOPS/W);2)支持各种传感器融合处理;3)华为整体技术雄厚,生态体系有望迅速完善,依托华为从底层芯片、操作系统、应用算法、5G、云计算服务等迅速建立丰富生态体系;4)提供云服务,有望获取数据实现优化。主要劣势: 1)无量产车,缺乏相关的经验积累,暂时无数据优化软件算法,搭载量产车或到 2021 年底左右;2)现阶段生态体系仍弱于英伟达,所以目前华为广交朋友圈,依靠众多领域的优势构建庞大生态体系;3)客户对其“不造车”尚持怀疑,或影响合作。 地平线 阵列,模式与 Mobileye 类似,对外主要提供解决方案类产品 (芯片+算法),未捆绑销售,AI 芯片于 2020 年已搭载在长安 UNI-T 座舱域。自动驾驶域芯片尚未搭载量产车,现阶段主要针对 L2 级及以下市场,对外提供芯片+算法方案。主要优势:1)作为中立第三方,芯片和算法可分开销售或一体式解决方案,受客户 信任;2)国产芯片,国内优选。主要劣势:1)现阶段算力较低,无丰富生态,创企等; 尚未通过功能安全认证,无自动驾驶芯片量产车。 寒武纪属于第 2 阵列,或从车路协同、云服务(数据中心)等领域实现快速切入。主要优势:1)云边端三类产品可从各种商业模式供应给智能车产业领域,云端产品可供应车企/Tier 1 数据中心或提供给云服务供应商;边缘端产品供应给政府类客户用于车路协同设备使用;边缘/终端产品供应给主机厂等。2)国产芯片,国内优选、中立第三 24 / 47 方。主要劣势:1)与车企合作较少,无丰富生态,创企等;2)尚未通过功能安全认证。 特斯拉:自研 FSD 芯片,引领产业发展 总结:特斯拉自研 FSD 方案属于另一极。主要优势:由于其自研自用,根据需求研发专用芯片,减少不必要的软硬件模块。1)缩短研发周期,减少研发设计工作量;2) 提升能效比;3)用户数据驱动研发优化。主要劣势:1)生态较为封闭,仅内部开发和使用,无法建立完善的生态体系。2)若使用量有限,芯片研发需要投入大量资金,软硬件开发的成本难以通过小规模使用均摊成本。 Autopilot 1.0 系统因 Mobileye EyeQ3 算力低、算法和芯片捆绑销售限制创新被弃用。2014 年特斯拉发布Autopilot 1.0,视觉芯片采用 Mobileye EyeQ3,数据融合芯片采用英伟达 Tegra 3。搭载 1 个前置摄像头、1 个后置倒车摄像头(不参与辅助驾驶)、1 个 前置雷达、12 个超声波传感器。特斯拉弃用主要原因在于:EyeQ3 算力仅 0.256TOPS, 而且视觉感知算法和芯片捆绑销售,影响产品创新。 Autopilot 2.0 系统因 NVIDIA PX2 方案能效比差,成本较高被弃用。2.0 系统较上一代提升 40 倍性能,系统由 1.0 系统的雷达引导为主,转变为以摄像头为主,雷达作为辅助。硬件方案采用 NVIDIA 的 1 颗Tegra Parker 芯片和 1 颗Pascal 架构芯片方案;支持 8 个摄像头、12 个超声波雷达和 1 个前置毫米波雷达。2.5 系统仍是 NIVIDIA 方案的延续。特斯拉弃用 NVIDIA 方案主要原因在于:NVIDIA PX2 方案 GPU 芯片仍有较多的软硬件资源浪费,能效比(算力/功耗)较差,成本较高。 特斯拉 Autopilot 3.0 系统自研 FSD+算法。3.0 系统采用了自研的 FSD 芯片方案, 2 颗 FSD 芯片实现冗余设计,共 2*72TOPS/72W,针对自身应用算法和场景专门设计FSD,可减少不必要的软硬件模块,实现资源的最大化利用。Autopilot 3.0 实际应用性能 相比 2.5 版本提升 21 倍,功耗仅高 25%,其成本却只有 2.5 版本的 80%。两颗芯片将运算结果互相比对,若结果正确则执行操作,若错误则返回重算,而且若某颗芯片出现故障,自动驾驶系统仍不受影响。 图 22:Autopilot 硬 件 1.0 图 23:Autopilot 硬 件 2.0 数据来源:CSDN, 数据来源:CSDN, 25 / 47 图 24:Autopilot 硬 件 2.5 图 25:Autopilot 硬 件 3.0 数据来源:CSDN, 数据来源:CSDN, 表 9:特斯拉自动驾驶系统方案 方案 推出时间 自动驾驶等级 工艺 功耗(W) 算力 传感器方案 1*Tegra3+1*Ey 1*Tegra3+1*Ey Autopilot 1.0 e Q3 2014 年 9 月 至 2016 年 10 月,量产车搭载 L2 / / 0.256TOPS 1*前置摄像头+12* 超声波传感器+1* 前置雷达+1*后置倒车摄像头 Autopilot 2.0 1*Tegra Parker+1*Pasca l 架构 GPU 2016 年 10 月后量产车搭载 支 持 L3/L4 16nm 57W 24TOPS 8*摄像头+12*超声波传感器+1*前置雷达+1*后置倒车摄像头 产车搭载同上 产车搭载 同上 2.0 48TOPS 2*57W 16nm L3/L4 2017 年 7 月 后量 支 持 2*Tegra Parker+1*Pasca l 架构 Autopilot 2.5 2*FSD 2019 年 3 月量产车搭载 FSD 芯片 支 持 L3/L4 三星 14 nm 72W 2*72TOPS(冗 余设计) 同上 2.0 数据来源:特斯拉,整理 FSD 芯片是一颗 CPU+GPU+ISP+2*NPU 的异构芯片。芯片异构化是总体发展方 向,让专用处理单元运算对应的操作。1)CPU 是 1 个 12 核心ARM A72 架构的 64 位处理器,运行频率为 2.2GHz;2)GPU 能够提供 0.6TFLOPS 计算能力,运行频率为 1GHz; 3)2 颗NPU(神经网络单元)运行在 2.2GHz 频率下能提供 2*36TOPS 的处理能力。为了提升神经网络处理器的内存存取速度以提升计算能力,每颗 FSD 芯片内部还集成了32MB 高速缓存。 26 / 47 FSD 芯片针对自身需求专门开发,是特斯拉芯片性能高和功耗优的重大法宝。发布 Autopilot 3.0 时,特斯拉宣称 FSD 芯片算力为 72TOPS,系统整体算力 2*72TOPS,而NVIDIA Xavier 芯片仅为 21TOPS。尽管之后 NVIDIA 公布 Xavier 理论计算能力为30TOPS,但依然不及FSD 芯片。而NVIDIA DRIVE AGX Pegasus 计算平台,基于2*Xavier和 2*TensorCore GPU,算力达到 320TOPS,功耗为 320W,高于 Autopilot 3.0 系统的72W。主要系 FSD 芯片作为特斯拉专用芯片,较GPU 的通用芯片可减少不必要的软硬件模块,实现资源的最大化利用。 图 26:特斯拉 FSD 芯片结构 数据来源:特斯拉, NVIDIA:全球通用 AI 芯片龙头,构建生态王国 结论:NIVIDA 属于第 1 阵列,作为通用 AI 芯片龙头,占据 L3 级及以上市场,对外提供芯片级产品,而非芯片+算法的解决方案,是合资品牌的优选。主要优势:1)中立第三方,最丰富的生态体系。定位Tier 2 芯片供应商,提供芯片或开发平台,具备最完善的软件工具链和应用生态;2)算力高(但利用率仍有待提升),Xaier 芯片的 30TOPS高于Eye Q4 的 2.5TOPS,Orin 芯片的 200TOPS 高于 Eye Q5 的 24TOPS;3)支持各类传感器数据融合,可提供摄像头+雷达等各类传感器数据融合处理;4)提供云服务,有望获取数据实现优化。主要劣势:主要系 GPU 通用芯片,有大量的非必要软硬件模块, 1)成本价格较贵,浪费资源,后续有望规模量产后实现快速下降;2)能效比差,后续产品开发加入更多的 DLA 深度学习加速器模块,能效比有望改善。 NVIDIA 凭借通用 GPU,占领游戏、数据中心等 AI 应用多项霸主。为研发可加快游戏行业 3D 图像的渲染速度的专用芯片,黄仁勋等三人于 1993 年联合创立 NVIDIA, 于 1999 年推出世界首款GPU(图形处理器),为此后迅速抢占游戏市场成为霸主打好坚实基础,当年实现营收 1.5 亿美元,并成功在纳斯达克上市。在 2006 年英伟达推出使GPU 通用化的 CUDA 技术,助推 GPU 成为应用最广的 AI 硬件。随着深度学习和大数 27 / 47 据技术的快速发展,NVIDIA 基于通用 CUDA 的 GPU,逐步延伸到视觉处理、数据中心、智能驾驶等领域,打造完善的 AI 生态体系,并引领人工智能时代的发展。在 GPU 芯片市场,英伟达的 AI 芯片在全球市占率高达 70%。在人工智能时代的快速演进下, NVIDIA 作为人工智能的引领者,市值不断取得新高,截止目前已超 2000 亿美金。 图 27:NVIDIA 在 GPU 市场是 AI 芯片龙头 数据来源:NVIDIA, 英伟达作为人工智能时代引领者,近年来加速角逐智能驾驶领域。2014 年公司正式发布基于 Kepler 架构的 Tegra K1 移动处理器,正式进军智能驾驶领域,此后陆续发布 Drive 系列的产品。核心GPU 架构也由 Kepler- Maxwell-Parker- Volta 架构不断提升,算力也由 2.3TFlops(浮点运算,FP32)提升到了 Xavier 芯片的 30TOPS(定点运算,int 8, 约为 30*1012 次/秒),能效比(算力/功耗)逐代优化。2015 年发布首款自动驾驶平台 DRIVE PX 算力便达到 2.3TFlops,便可支持 L2/L3 级智能驾驶,截止目前已发布系列产品算力可支持 L2-L5 级自动驾驶领域。 由于 NVIDIA 芯片从通用领域跨入自动驾驶专用领域,产品正不断进化:1)浮点运算(FP32)向定点运算(int8)。浮点运算虽然精度更高,但占用位数更多,同样条件下运算速度更慢,智能驾驶领域为深度学习推理领域,int 8 满足需求。2)芯片异构化。Xavier 系统级芯片内置 ISP(图像信号处理器)+VPU(视频处理单元)+PVA(可编程视觉加速器)+DLA(深度学习加速器)+CUDA GPU+CPU,实现近 40 万亿次运算/秒, 仅深度学习就高达 30 万亿次/秒。NVIDIA 的销售模式采用芯片+对应的软件支持的模式,其配套软件主要负责调用其芯片资源,而客户可自行开发软件算法以调用 NVIDIA 芯片的算子库等,实现深度学习处理运算。 28 / 47 表 10:NVIDIA 自动驾驶系列产品 发布 CPU 架构 GPU 架构 等级 工艺 功耗(W) 算力 Drive PX 2015 年 4* Cortex A57 2*Tegra X1(Maxwell) L2/L3 28nm 150 2.3 TFlop 4* Cortex A53 (FP32) Drive PX 2 2016 年 4*Denver2 1*Tegra X2 (Parker) L2/L3 16nm 125 4 TFlops(FP32) (AutoCruise) 8* Cortex A57 Drive PX 2 (AutoChauffeur) 2016 年 4*Denver2 8* Cortex A57 2*Tegra X2 (Parker) +2* Pascal GPU L3/L4 16nm 250 8TFlops(FP32) 24 TOPS Drive AGX Xavier 2017 年 8* ARM64 1*Tegra Xavier L3/L4 12nm 30 30TOPS Drive AGX Pegasus 2017 年 16* ARM64 2*Tegra Xavier L5 12nm 500 320TOPS +2*Turing GPU DRIVE AGX Orin 2019 年 12 月 Arm Hercules 下一代 GPU 架构 L5 或为 75 200 TOPS 7nm 数据来源:NVIDIA,(注:发布时间不代表上车量产时间,由于需要适配测试,一般滞后 2-3 年) 2015 年英伟达的 K1 芯片嵌入于奥迪 A8 的 zFAS 系统中。奥迪发布中央驾驶辅助系统控制单元(zFAS),支持 L3 级别,主要包括有 4 个核心元件:1)英伟达的 K1(采用Kepler 架构GPU,算力约为 350GFlops,负责驾驶员状态检测,360 度全景;2)Mobileye (英特尔旗下)的 EyeQ3 负责交通信号识别,行人检测,碰撞报警,光线)Altera(英特尔旗下)的 Cyclone V(FPGA)负责目标识别融合,地图融合, 自动泊车,预刹车,激光雷达传感器数据处理;4)英飞凌的 Aurix TC297T 负责监测系 统运行状态,使整个系统达到ASIL-D 的标准,同时还负责矩阵大灯。 图 28:英伟达的 K1 芯片嵌入奥迪 A8 的 zFAS 系统中 数据来源:CSDN, 29 / 47 2016 年,Drive PX 2 方案的芯片量产搭载于特斯拉。2016 年英伟达发布DRIVE PX 2 方案,算力 24TOPS/250W。其有多个版本,分别是配备单 GPU 和单摄像头、雷达输入端口的Drive PX2 Autocruise(自动巡航);配备双 GPU 多个摄像头、雷达输入端口的 Drive PX2 AutoChauffeur(自动私人司机);配备多个 GPU 多个摄像头、雷达输入端口的 Drive PX2 Fully Autonomous Driving(全自动驾驶)。特斯拉 Autopilot 2.0 硬件方案采用了英伟达的 1 颗 Tegra Parker 架构芯片和 1 颗 Pascal 架构芯片方案,2016 年 10 月至2019 年 3 月阶段搭载在特斯拉Model S\ Model X 上。 图 29:NVIDIA PX2 系列产品 数据来源:NVIDIA, Xavier 助力中国造车新势力小鹏汽车L3 级车量产。2017 年 1 月发布Xavier 芯片, 采用 Volta 架构GPU,深度学习处理能力至多可达 30TOPS/30W,到 2020 年已通过车规 级 ASIL-D。此外还发布了 DRIVE Pegasus 平台:将搭载 2 块Xavier Soc 和 2 颗下一代架构的 GPU,可以同时处理 10 多个摄像头、6 个激光雷达和其他传感器的数据,实现算力/功耗 320TOPS/320W。2018 年小鹏汽车与英伟达签署战略合作协议,采用 Xavier 芯片研发适配中国交通环境和驾驶场景的 L3 级自动驾驶技术,2020 年 4 月,首款搭载Xavier 平台的量产车型小鹏 P7 正式上市。2019 年 12 月发布 Orin 系统级芯片,采用全新的 GPU 及 12 核 ARM CPU,200TFLOPS 的性能是上代 Xavier 的 7 倍,功耗仅 60- 70W,NVIDIA 预计将于 2022 年量产。 图 30:NVIDIA 系列产品 数据来源:NVIDIA, 30 / 47 截止目前,根据我们不完全统计,NIVIDIA 已与众多车企展开实质性合作,全球巨头方面包括丰田、大众、奥迪、奔驰、沃尔沃、戴姆勒等,国内车企包括小鹏、奇瑞、奇点、一汽集团等。其中 Xavier 芯片于 2020 年搭载在量产车型小鹏 P7 上。此外,大众 MEB 平台 ID3 也将搭载英伟达产品。 表 11:NVIDIA 全球车企合作情况 车企 详细情况 丰田 丰田 AGX Xavier\Pegasus 车载计算平台、Constellation 模拟计算平台、数据中心计算基础设施 大众 2018 年宣布在 DRIVE IX 智能驾驶舱解决方案方面展开合作 奥迪 奥迪 Tegra K1 处理器、DRIVE PX 2\AGX Xavier 车载计算平台、DriveWorks SDK(软件开发工具包) 奔驰 Tegra K2(Parker)处理器、NVIDIA DRIVE AGX 车载计算平台 沃尔沃 沃尔沃 AutoPilot 自动驾驶系统、AGX Pegasus 车载计算平台、Constellation 模拟平台、Drive AV 软件栈 戴姆勒 AGX Xavier\Pegasus 车载计算平台、Constellation 模拟平台 小鹏 AGX Xavier 车载计算平台PACCAR 与博世一起提供基于 DRIVE PX 2 车载计算平台的自动驾驶方案奇瑞 内置 DRIVE PX 2 车载计算平台( 小鹏 AGX Xavier 车载计算平台 奇点 AGX Xavier 车载计算平台 一汽集团 一汽集团 DRIVE AGX Pegasus 车载计算平台 图森未来 DRIVE PX 2\AGX Xavier 车载计算平台 数据来源:各公司官网,NVIDIA, NVIDIA 目标并非制造自动驾驶汽车,而是为了降低行业进入门槛。NVIDIA 在全球与 370+合作伙伴一起,基于底层 AI 芯片共同打造自动驾驶生态系统。截止目前 NVIDIA 全球范围内共选择与六家Tier 1 供应商展开合作,包括博世、采埃孚、海拉、奥托立夫、大陆、德赛西威。NVIDIA 目标并非制造自动驾驶汽车,而是打造必要的芯片硬件架构和对应的支持软件(用于调用底层芯片资源),降低自动驾驶汽车进入门槛, 最终推动交通运输行业的变革。 31 / 47 表 12:NVIDIA 全球共与六家一级供应商展开合作 合作厂商 详细情况 博世 博世 2017 年宣布基于 Drive AGX Xavier\Pegasus 车载计算平台展开合作。 海拉 2017 年宣布基于 DRIVE PX2 车载计算平台展开合作。采埃孚 2017 海拉 2017 年宣布基于 DRIVE PX2 车载计算平台展开合作。 奥托立夫 2017 年沃尔沃与供应商奥托立夫成立合资公司 Zenuity,基于 Drive PX 车载计算平台展开合作。 大陆 大陆 2018 年宣布基于 AGX Xavier 车载计算平台、DRIVE OS 系统、 DRIVE AV 软件栈展开合作。 德赛西威 2018 年小鹏汽车与 NVIDIA、德赛西威基于 Xavier 展开合作。 数据来源:各公司官网,NVIDIA, Mobileye:背靠英特尔,全球自动驾驶 AI 芯片龙头 结论:Mobileye 属于第 1 阵列,背靠英特尔,占据 L2 级及以下市场,芯片+算法绑定的一体式解决方案。主要优势:1)经验丰富质量可靠,产品已经有众多量产车搭载,质量和适配过关;2)客户资源最丰富,国内外绝大多数主机厂和 Tier1 级供应商均为其客户;3)价格较为合理。主要劣势:1)算力提升明显低于其他厂商,最新 EyeQ5 算力峰值仅 24TOPS,而市场认为 L3 级算力需求 30TOPS 以上,后期芯片仅靠提升 VMP等手段,算力提升或难以为继,又或者因为高度定制化针对视觉领域,减少不必要的软 硬件资源,算力不高但性能仍满足需求;2)黑盒子模式限制用户创新,算法和芯片捆绑销售,或与厂商规模较小,为客户提供定制化服务,在主机厂软件开发能力较差的初期阶段受广泛欢迎,但随着开发能力提升,一体销售的灵活度较差,客户难以做出差异性产品。根据规划 Eye Q5 或将开放融合算法,但感知算法并未提及。 Mobileye 于 1999 年由以色列希伯来大学的 Amnon Shashua 教授和 Ziv Aviram 创立,直到 2007 年搭载 Mobileye 产品的量产车才上市。2014 年 7 月公司 IPO 上市,受到市场的广泛关注,便开始大批量向各大主机厂提供智能汽车安全设备,2017 年被英特尔以 153 亿美元收购,并将其原自动驾驶事业部 IDG 整合到 Mobileye 旗下。 近年来 Mobileye 背靠 Intel 全球巨头,加速进军中国市场。2018 年初 Mobileye 和 四维图新达成全面战略合作伙伴关系,双方将在中国开发和发布 Mobileye 的路网采集管理产品。2019 年 1 月与长城汽车合作,在未来 3~5 年内,Mobileye 向长城提供 L0~L2 级 ADAS 系统,还将共同开发中国独特路况的 L3+自动驾驶系统;10 月与紫光集团成立合资公司,紫光持股 51%、Mobileye 持股 49%;11 月与蔚来汽车宣布合作;2020 年1 月与上汽集团达成合作,推进 L2+自动驾驶系统等部署。 32 / 47 图 31:Mobileye 是全球自动驾驶芯片龙头 数据来源:Mobileye, 2014-2019 年芯片出货量持续快速提升。EYE Q 系列芯片出货量由 2014 年的 270 万 片提升至 2019 年的 1740 万片,年均复合增速 45.2%。截止 2020Q1,Mobileye 累计售出约 5400 万枚芯片,被搭载在全球超过 5000 万辆汽车上,前装市场收入占营收的 85% 以上,市场占有率约为 70%。 2014-2019 年 Mobileye 营收持续快速增长。Mobileye 从 2014 年的 1.4 亿美元提升 到 2019 年的 8.8 亿美元,年均复合增速 43.7%。其中,通用、日产、现代、宝马四大汽车产商约占收入一半以上。 图 32:2014-2019 年 EyeQ 芯片出货量 CAGR 45% 图 33:2014-2019 年 Mobileye 收入 CAGR 43.7% 17.4012.408.686.00 17.40 12.40 8.68 6.00 4.40 2.70 8.79 6.98 5.00 3.58 2.41 1.44 15 8 6 10 4 5 2 0 2014 2015 2016 2017 2018 2019 芯片出货量/百万套 0 2014 2015 2016 2017 2018 2019 总营收/亿美元 数据来源:Mobileye, 数据来源:Bloomberg, Mobileye 产品由视觉处理向多传感器数据融合方向发展,但芯片+算法绑定销售或限制客户创新。Mobileye 以视觉处理起家,所以前期产品主要专注于摄像头+视觉处理 33 / 47 芯片+算法等绑定一体式解决方案。由于自动驾驶发展初期,主机厂和 Tier 1 级供应商软件算法的开发能力很弱,采用绑定一体式解决方案可一站式搭载上车,该模式对主机厂软件开发能力要求很低,符合该阶段市场需求,因此 Mobileye 产品迅速占领全球市场。但随着主机厂和 Tier 1 级供应商的软件开发能力逐步提升,绑定一体式解决方案限制了主机厂新车型的算法应用创新。根据 Mobileye 规划的 EyeQ5 芯片,可实现多种传感器数据融合处理,且融合算法或将开放给主机厂自行开发,但视觉处理的感知算法是否开发并未提及。 表 13:Mobileye EyeQ 系列芯片 芯片 量产时间 自动驾驶等级 工艺 功耗 算力(TOPS) 价格 备注 EyeQ1 2008 Drive 280nm 2.5W 0.0044 / 首次实现 LDW、AHC、TSR Assistance EyeQ2 2010 Drive 90nm 2.5W 0.026 ~几十美元 首次实现 ACC and TJA Assistance EyeQ3 2014 L2 40nm 2.5W 0.256 ~几十美元 交通灯检测(美)等 EyeQ4 2018 L3 28nm 3W 2.5 / 支持 8 个传感器(7 个摄像头+1 个激光雷达) EyeQ5 2020 L4~L5 7nm 2*5W 2*12 / 20 个外部传感器(摄像头、雷 达或激光雷达) 数据来源:Mobileye,整理 EyeQ 芯片的神经网络处理单元是 VMP,主要通过 VMP 数量提升实现算力提升。 EyeQ 芯片由 Mobileye 和意法半导体合作研发设计,通过增加 VMP 的数量和提升VMP 的运行频率来提升算力、能效比。VMP 用来应对 ADAS 相关的图像处理任务,如:缩放和预处理、翘曲、跟踪、车道标记检测、道路几何检测、滤波和直方图等。 EyeQ3 整体算力/功耗仅 0.256TOPS/3W,只负责视觉处理。配置四个多线内核和四个矢量微码处理器(VMP)内核。EyeQ3 配置四个多线 内核和四个矢量微码处理器(VMP)内核。 2014 年发布第四代 ADAS 视觉处理器 EyeQ4,开始实现部分融合。由于产品发布到搭载量产车需要一段时间适配和测试,相关产品于 2018 年才应用于新上市车型。 EyeQ4 算力达到 2.5TOPS/3W,最多支持 8 个传感器(7 个摄像头+1 个激光雷达)数据处理,配置了 4 个CPU 内核和 6 个矢量微码处理器(VMP),频率由 500MHz 提升至 1GHz; 1GHZ 的工业级四核 MIPS 处理器,支持创新性的多线程技术能更好的进行数据的控制和管理;军工级 MIPS Warrior CPU 位于次级传输管理中心,用于处理片内片外的通用数据。EyeQ4 符合 ISO-26262 国标、欧洲 NCAP 和美国NHSTA 法规要求。 34 / 47 图 34:EyeQ3 芯片 图 35:EyeQ4 芯片 数据来源:Mobileye, 数据来源:Mobileye, EyeQ5 将实现多类传感器融合处理,据 Mobileye 规划融合算法将开放给用户开发。 2016 年 5 月 Mobileye 和意法半导体宣布将合作研发 Mobileye EyeQ5,Mobileye 预计2020 年实现量产全自动驾驶(FAD)汽车的处理器,并执行传感器融合程序。EyeQ5 算力/功耗 2*12TOPS/2*5W,可最多支持 20 个外部传感器(摄像头、雷达或激光雷达)数据处理。配置 8 个多线程CPU 核和下一代 18 核微码处理器(即 18 个VMP)。 图 36:EyeQ5 芯片 数据来源:Mobileye, 35 / 47 华为:依托芯片,欲打造最强生态体系 总结:华为属于第 1.5 阵
2、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
3、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
4、VIP文档为合作方或网友上传,每下载1。