SOC芯片行业深度研究:数字芯片皇冠,汽车欧博abgSOC芯片迎接大时代

文章正文
发布时间:2024-05-23 00:23

1 汽车电动化、智能化引领产业新趋势

1.1 汽车电动化、智能化引领产业变革,欧博abg关注“自动驾驶”及“智能座 舱”

汽车行业正在经历电动化、智能化革命,电动化主要改变汽车的动力和传动系统, 智能化则改变了人与车之间的关系。从 PC 时代的微软、智能手机时代的苹果, 以及到破万亿市值的特斯拉,属于智能电动车的新时代已经拉开帷幕,当下时点 为汽车行业新周期起点,电动及智能化革命将颠覆整个汽车产业链,也将孕育新 的产业生机,目前我们认为汽车行业正在经历三大趋势:

(1)新能源车迈入成长期,智能车引领新趋势:伴随着优质供给如特斯拉,比亚 迪入局,续航里程提升以及带给人的舒适的驾驶体验,需求端客户已经开始逐步 接受并选择购买新能源汽车,2021 年国内新能源汽车渗透率超过 10%,行业开始 迈入成长阶段。汽车行业下一阶段发展重点是智能汽车时代,指通过搭载先进传 感器,运用人工智能等新技术,从而让其具备自动驾驶以及人机交互功能,有望 成为下一代移动空间和智能应用终端。因此汽车智能化是抢占行业竞争制高点的 关键领域。

(2)汽车作为消费品,评价其核心竞争力将从“燃油车时代的马力”、“电动车时 代的电池续航能力”到“智能汽车时代的算力”:从 19 世纪 80 年代的传统燃油 车,2010 年的电动汽车,发展到 2020 年的智能汽车,我们评价汽车的性能以及 其核心竞争要素也在变化:a、燃油车评价性能好坏我们更多是看内燃机马力;b、 电动车我们更关注电池续航;c、智能车时代我们更关注在大算力平台下车外自动 驾驶技术的成熟度以及车内智能座舱所带来人机交互的智能化体验。

图片

(3)商业模式及汽车价值链重构:通过软件实现价值链向中后段转移。在汽车全 生命周期下,与传统燃油车销售的一锤子买卖不同,智能汽车后续通过“硬件预 埋、软件升级”的方式可以持续提升用户体验,增加用户粘性,届时主机厂可以 通过 OTA 升级实现软件可售、软件付费等新商业模式,获得较高附加值,整车架 构和商业模式被重新定义。

智能网联是汽车产业下一步变革的风暴中心。汽车要从根本上改变产品形态,从 移动工具转变成生活伙伴,需要智能化与网联化的发展来彻底解放人们的双手和 注意力,从而赋予汽车这一产品更丰富的想象空间。“新四化”的重心不可避免地 向智能化和网联化迁移,无论是需求端对产品定位和价值诉求的转变、供给端在 自动驾驶和车联网上的竞争与合作,都证明了“智能网联”在变革浪潮中核心驱 动力的地位,将成为汽车产业发展的长期趋势。 “自动驾驶”和“智能座舱”正在逐渐迈入大众的视野。“智能化”引领自动驾驶 自不必多言,但“网联化”也是其必不可少的重要支撑。尤其是对于智舱系统, 从娱乐的丰富性到系统的持续迭代升级,都离不开“网联化”这一重要前提。

1.2 汽车电动化、智能化带来“汽车半导体”蓬勃发展

手机领域的蓬勃发展是过去十年半导体产业快速增长的主要推动力,汽车电子化 和智能化有望成为半导体行业新增长级,产业变革下一定会催生新的科技厂商和 行业主导者。未来汽车会和手机、电脑一样,成为整个半导体行业的主要增长推 动力,主要系更高级的自动驾驶、智能座舱、车载以太网络以及车载信息系统等 都会催生新的半导体需求。地平线预测 2030 年全球汽车领域芯片市场规模约为 1000 亿美金,相比 2017 年全球汽车芯片 375 亿美金市场同比增长 190%。

图片

新能源汽车搭载芯片数量约为传统燃油车的 1.5 倍,预计 2028 年单车半导体含量 相比 2021 年翻一番。自动驾驶级别越高对传感器芯片数量要求越多,L3 级别自 动驾驶平均搭载 8 个传感器芯片,而 L5 级别自动驾驶所需传感器芯片数量提升 至 20 个。同样车辆所需处理与储存的信息量也与自动驾驶技术成熟度正相关,进 一步提升了控制类芯片和储存类芯片的搭载量。据统计至 2022 年,新能源汽车车 均芯片搭载量约 1459 个,而传统燃油车搭载芯片数量为 934 个。Strategy Analytics 预计每辆车的平均硅含量将从 2021 年 530 美元/车翻一番,到 2028 年超过 1000 美元,而高端制造汽车的硅含量可能超过 3000 美元。

汽车芯片主要有如下几个应用领域:

主控芯片用来生成汽车主要控制信号的计算和生成功能。主控芯片通过接受 各类传感器搜集到的信号,进行计算相对的处理措施,并将驱动信号发送给 对应的控制模块。因此主控芯片相当于汽车的“大脑”。

功率芯片是新能源汽车价值量提升最多的部分,需求端主要为 IGBT、 MOSFET 及多个 IGBT 集成的 IPM 模块等产品,核心用于大电流和大电压的 环境。

CMOS 芯片是将光子转换为电子进行数字处理,把图像信号转换为数字信号 的芯片,包括微透镜、光电二极管、处理芯片以及 IO 接口,是摄像头的关键 部件。随着自动驾驶等级提升,预计 L3 以上的辅助驾驶需要约 18 颗摄像头, 主要用在倒车后视,环视,前视,转弯盲区等领域。

射频接收器是无线通讯的重要器件,射频芯片是指能够将射频信号与数字信 号进行转换的芯片,它包括功率放大器 PA、滤波器、低噪声放大器 LNA、天 线开关、双工器、调谐器等。未来,射频芯片将像汽车的耳朵一样将助力 C-V2X 技术发展,将“人-车-路-云”等交通参与要素有机联系在一起,弥补了 单车智能的不足,推动协同式应用服务发展。

超声波/毫米波/激光雷达是感知车身传感器,智能汽车通过传感器获得大量数 据,L5 级别的汽车会携带传感器将达到 20 个以上。车载雷达主要包括超声 波雷达、毫米波雷达和激光雷达三种。其中,中国超声波雷达已发展的相对 成熟,技术壁垒不高;毫米波雷达技术壁垒较高,且是智能汽车的重要传感 器,目前处于快速发展的阶段;激光雷达技术壁垒高,是高级别自动驾驶的 重要传感器,但目前成本昂贵、过车规难、落地难。

存储芯片是智能汽车的“记忆“,自动驾驶技术升级带来车规存储的带宽持 续高增长是长期趋势,未来汽车存储将由 GB 级走向 TB 级别。

汽车面板呈多屏化趋势。汽车智能化、电动化提速将带动车均面板数量,车 载面板也开始走向标准化。从需求上看,显示屏在汽车上的应用越来越广, 需求数量强劲成长。车载显示主要包括中控显示屏、仪表显示屏、挡风玻璃 复合抬头显示屏、虚拟电子后视镜显示屏、后座娱乐显示屏等。随着车联网、 新能源车、无人驾驶等因素的推动,人们对具备导航、车辆状况、多媒体影 音等功能的车载面板的需求将持续扩大。

1.3 电子电气架构演进驱动汽车芯片供应链创新

汽车电子电气架构由分布式向集中式演进。传统功能汽车采用分布式电子电气架 构,离散化的 ECU 软硬件紧耦合且各 ECU 之间独立性较强,硬件资源无法共享 且形成数据孤岛,对用户新需求反馈的整体周期长达 20 个月以上,难以形成持续 快速迭代的软件开发模式。因此,软件定义汽车开发模式驱动整车电子电气架构 由分布式向中央集中式演进,其核心是车载计算的集中化发展,高集成化的域控 制器、车载中央计算平台是关键。电子电气架构演进的优缺点如下:

分布式电子电气架构: √优点:各模块间功能划分明确,独立性强,软硬件强耦合,各模块可独立开发。 √缺点:各模块间芯片算力无法协同,且相互冗余,分布式架构需要大量内部通 信,增加线束成本;功能更新需各模块供应商负责,研发与推送效率低,且供应 链管理难度极大。

(跨)域集中式电子电气架构: √优点:将分散的 ECU 集中到动力、底盘、座舱、驾驶、车身等几大域控制器中, 减少内部通信需求与线束成本;软硬件逐步解耦,硬件超前设计,软件自研,通 过 OTA 灵活更新。 √缺点:域分布式计算下大算力 SOC 芯片成本较高,算力存在冗余且单车算力存 在物理上限。

中央集中式电子电气架构: √优点:进一步简化电子电气架构,降低线束设计复杂度与成本,SOA 软件架构 支持软件功能的迭代与扩展,从车载中央计算发展为车云计算后,车内与云端架 构实现无缝结合,车端计算用于车内信息与数据的实时处理,云计算作为补充, 提供非实时的数据交互与计算。

图片

复盘过去 5 年汽车半导体行业,2016 年以来第一波结构性红利已基本结束,纯国 产替代为代表的显性机会窗口快速关闭;2021 年前后“电气化”和“智能网联化” 是汽车产业变革的新一波主浪潮:

国产替代主导小周期:2016~2021 年的行业拉升,主要来自传统电子电气架 构下的国产化替代,以半导体供应链危机正式拉开大幕为催化,国产替代的 大规模上车为高潮,如中低端 MCU、三电等领域。

汽车新架构主导大周期:从 2022 年起逐步开启的第二轮产业周期,很可能是 汽车产业变革的真正主浪潮。这一次,故事主线不仅仅是国产替代,而是高 度智能化、电气化的下一代汽车,以及全新电子电气架构下的增量功能、增 量技术、增量市场;红利体量,将从国产替代的千亿级,跃升至万亿级。

我们认为本轮新汽车周期对相关汽车半导体公司的业绩贡献在 2022~2025 年,核 心驱动因素有两个:第一,各大车厂基于全新一代电子电气架构推出的车型平台, 将在 2022 年底~2024 年分批上市,2025 年后基于全新平台的新车型将全面铺开。 第二,从细分领域来看,高压/高速汽车连接器、激光雷达、域控制器、汽车 SOC、 高端 MCU 等大算力芯片、传感器加速上车,将带来汽车半导体新一轮繁荣。

而其他领域如单功能 MCU、线束的市场规模在未来几年可能会下降:

域架构下,MCU 用量下降:特斯拉电子电气架构集成度高,主要是因为特斯 拉将众多小型 ECU 的功能全部集成到区域控制器中,因此 ECU 数量相比 ID.4/Mach E 少,从下表可以看出,Model Y、ID.4、Mach E 的 ECU 数量分别 为 26、52、51。特斯拉的 Model3 的 FBCM 既负责配电,还负责一些左前灯 控制、空调控制、热管理等功能,横跨了传统的车身、座舱、底盘及动力域。

图片

域架构下,降低线束成本:安波福测算使用域架构下可以降低 25%线束成本, 而伟世通则认为域架构可以节省 50%或更多的线束长度。特斯拉的架构更接 近于域控制架构,Model S 内部线束长度长达 3km,到 Model3 只有 1.5km, 进一步证明域架构下可以节约线束长度及重量。

2 汽车 SOC 是智能电动车功能实现的核心元件

2.1 汽车 SOC 主要负责数据处理,座舱/自动驾驶是主要市场

目前 MCU 是汽车芯片中占比第一的细分品类。IC Insights 发布的数据显示,2021 年全球汽车芯片从细分产品占比来看,前三分别微处理器、模拟芯片和传感器, 所占比重分别为 30%、29%和 17。MCU 芯片全称为微控制单元,又称为单片微型 计算机或者单片机。它是一个是把中央处理器的频率与规格做适当缩减,并将内 存、计数器、USB、A/D 转换、UART、PLC、DMA 等周边接口,甚至 LCD 驱动 电路都整合在单一芯片上形成芯片级的计算机。通常MCU只能完成较少的任务,例如开启智能雨刷,或是下车后自动落锁等等。因此在豪车中可能拥有数百个 MCU 来实现各种智能化功能。

人工智能时代诞生系统级芯片(SOC)。在人工智能时代计算架构从单一芯片模式 向融合异构多芯片模式发展,将 CPU 与 GPU、FPGA、ASIC 等通用/专用芯片异 构融合、集合 AI 加速器的系统级芯片(SOC)应运而生。

图片

大算力的汽车 SOC 主要应用在智能驾驶和智能座舱领域。广义而言汽车领域算 力稍强(2K DMIPS 以上)的 MCU 都可算是 SOC,Arteris 预测未来单车 SOC 数 量为 23 个,而大算力 SOC 在车载端主要面向两个领域,分别是智能座舱和智能 驾驶。

从 CPU→GPU→FPGA→ASIC(xPU),芯片专用性越来越强。CPU 负责逻辑运 算和任务调度;GPU 作为通用加速器,可承担 CNN 等神经网络计算与机器学习任务,将在较长时间内承担主要计算工作;FPGA 作为硬件加速器,具备可编程 的优点,在 RNN/LSTM/强化学习等顺序类机器学习中表现优异,在部分成熟算法 领域发挥着突出作用;而 ASIC 可以兼顾性能和功耗,作为全定制的方案将在自 动驾驶算法成熟后成为最终选择。

汽车 SOC 芯片持续追求先进制程。从芯片工艺制程来看,不同汽车芯片对工艺要 求存在较大差异。MCU 主要是依靠成熟制程,全球 70% MCU 生产来自台积电; 而座舱、自动驾驶 SOC 及 AI 芯片等主控芯片持续追求 7nm 及以下先进制程。

未来部分 MCU 功能会被整合到 SOC 芯片中,ECU 数量减少导致 MCU 的用量 下降。汽车 MCU 紧随汽车电子电气架构发展,SOC 芯片会集成部分低端 MCU 功 能,因此未来 MCU 单车使用量将会下降,分布式向域控制发展使用量将从当前 从 30-40 颗,逐步提升至 70-80 颗,但未来随着集中式架构落地,算力向整车计算 平台集中,汽车 MCU 的使用量又将逐步降低至 50-60 颗左右。

域控制架构下控制芯片将形成“MCU+SOC”态势。SOC芯片并不能替代所有MCU, 一方面不是所有 MCU 都有必要接入 SOC 芯片,比如“让转向灯闪耀的控制方式” 如果不用 MCU 方案,全部接入 SOC 芯片会形成一个星形网络,不仅导线数量会 增加,管理难度也会剧增。另外一方面也需要一部分 MCU 作为 SOC 芯片安全冗 余的备选方案。

图片

2.2 自动驾驶 SOC 和座舱 SOC 架构对比

拆分自动驾驶 SOC 结构,包括 CPU、GPU 和其他类型的定制芯片(如 NPU、深度 学习加速器(DLAs)和计算机视觉处理器(CVP))。除此之外,一个典型的自动驾驶 SOC 结构还包括以下部分:  至少一个微处理器(MPU)或数字信号处理器(DSP),但也可以有多个处理器内 核; 存储器可以是 RAM、ROM、EEPROM 和闪存中的一种或多种; 用于提供时间脉冲信号的振荡器和锁相环电路; 由计数器和计时器、电源电路组成的外设; 不同标准的连线接口,如 USB、火线、以太网、通用异步收发和序列周边接 口等; 电压调理电路及稳压器。

拆分座舱 SOC 架构,我们发现在多块高分辨率屏幕和流畅的系统背后,不仅仅比 拼的是车机芯片的算力、视频处理能力,更加看重 AI 能力等性能指标。比如高通 8155 芯片是高通第三代骁龙汽车数字座舱旗舰级平台,是一款异构架构的芯片, 包含 CPU、GPU、DSP、ISP 以及 AI 引擎等:

在 CPU 部分,8155 芯片采用 1+3+4 的 8 核心设计,核心为高通 Kryo485。 其中大核主频为 2.96GHz,三个高性能核心主频为 2.42GHz,四个低功耗小 核主频为 1.8GHz。 而 GPU 部分,8155 芯片与骁龙 855 都采用 Adreno640。同时,8155 芯片所 采用的 Hexagon690DSP、Spectra380ISP,相比高通骁龙 855 和 855+,名称上 也是一模一样。 此外与自动驾驶芯片不同的是,8155 芯片并没有独立的 NPU 内核,AI 计算 主要通过 DSP、CPU 和 GPU 组成的 AI 引擎完成。其中,Hexagon690 拥有 7TOPS 的 AI 算力,加上 CPU、GPU 的 AI 算力之和为 8TOPS。

3 自动驾驶:传感器配置“内卷”,“硬件预埋”成为车企主流策略

3.1 市场概况:L2+场景将持续较长时间,封闭场景 L4 开始落地

015 年以前辅助驾驶功能主要为 L1/L0 级,L1 级可实现加减速或转向控制, 驾驶员持续进行车辆横向和纵向的操作,代表功能为 LKA、AEB 等;

2016 年进入 L2 级时代,可同时实现车速和转向自动化。驾驶必须始终保持 掌控驾驶,在特定场景下系统进行横向和纵向操作,代表功能为 ACC、LKA、 APA 等,部分 ECU 开始集成式发展,但仍未有域的划分,目前 L2 及以下整 体单车配套价值在 1.5 万元左右。

到 2020 年将正式进入 L3 级导入期,为有条件自动驾驶,可解放双手。驾驶 员不必一直监控系统,但必须时刻保持警惕并在必要时进行干预,整车大约 分为 5~6 个域,控制器算力指数级提升,以太网开始出现,L3 及以下整体单 车配套价值约为 2.5 万元。但是由于目前 L3 级别自动驾驶技术仍不完善、法 规问题、责任认定、加之成本过高,短期内能够实现大规模量产的仍然以 L2 级别的 ADAS 为主。

展望未来我们认为 L2+辅助驾驶系统将快速普及并长期存在,另外在一些低速、 封闭场景下比如矿山,港口中 L4 自动驾驶开始落地,而基于法律法规以及技术 成熟度等问题,高速、开放场景下的 robotaxi/robotruck 落地需要较长时间,黑 芝麻智能单记章指出,从 L2 真正突破到 L3 级是一个漫长的过程,未来很长一段 时间内智能网联汽车仍将处于人机共驾的状态,这其中涉及到软件、硬件、数据 等技术的紧密配合和升级。尤其是大算力车规级芯片,将是高阶自动驾驶突破的 核心关键。

图片

3.2 硬件趋势:ASIC 方案+集成 ISP+大算力预埋

3.2.1 预计 CPU+ASIC 方案逐渐成为未来主流选择

CPU+ASIC 方案将是自动驾驶 SOC 主流架构。目前市面上主流的自动驾驶芯片 SOC 架构方案分为三种:CPU+GPU+ASIC,CPU+ASIC 及 CPU+FPGA。从发展 趋势来看,定制批量生产的低功耗、低成本的专用自动驾驶 AI 芯片(ASIC)将 逐渐取代高功耗的 GPU。 英伟达 Xaiver 芯片主要有四个模块,其中 GPU 占的面积最大,其次是 CPU, 辅以两个 ASIC。特斯拉 FSD 芯片架构主要有三个模块,即 GPU、CPU 和 NPU,其中 NPU 是架构重点。 MobileyeEQ5 的 CVP 是针对 Mobileye 自有的视觉算法设计的 ASIC,以此有 效降低功耗。地平线自主研发了基于灵活 BPU 架构的 ASIC 芯片。 谷歌 Waymo 采用“CPU+FPGA”方案,其计算平台采用英特尔 Xeon 的 12 核 以上的 CPU,搭配 Alter 的 Arria 系列的 FPGA。其 I/O Board 采用英飞凌的 Aurix 系列的 MCU 作为 CAN/Flex Ray 网络通信接口。在自动驾驶算法固化 后,FPGA 可能被 ASIC 替代。

3.2.2 SOC 芯片厂商集成 ISP,同时处理多传感器数据实现成本节降

ISP 参数配置是决定计算机视觉图像质量的关键因素。ISP(Image Signal Processing) 指图像信号处理器,主要作用是对前端图像传感器输出的信号做后期处理。简单 来说 ISP 是摄像头的 Photo Shop,欧博官网目的是提升图像质量。在传统的自动驾驶方案 中,ISP 和摄像头是一对一的对应关系,也就是说只要有一颗摄像头,就要有一颗 ISP。 车载 SOC 芯片集成高性能 ISP 是未来趋势。在车载端,SOC 内部集成 ISP 意味 着无需再为每个摄像头传感器提供 ISP,从而大幅降低感知硬件的成本。而在摄像 头端,取消 ISP 既可以解决高像素摄像头会带来严重的散热问题,也可以帮助车 载摄像头如何进一步缩小电路板尺寸和降低功耗。

目前市场上高级别自动驾驶 SOC 芯片中均集成 ISP。英伟达的 Xavier 和黑芝麻 智能 A1000 芯片中均集成了 ISP。根据英伟达官网,英伟达 Xavier 内置的 ISP 每 秒可处理是 15 亿像素,黑芝麻智能也将 ISP 集成在了 A1000 芯片中,每秒可以 处理 12 亿像素。

3.2.3 面向高级别自动驾驶,“算力预埋”是未来主要趋势

车载计算平台的算力上限决定车辆生命周期内可承载的软件服务升级上限,整车 厂将通过向 C 端收取软件授权和 OTA 更新服务费以完成商业模式闭环。当前面 向量产乘用车的智能驾驶系统整体处于 L3 及以下级别,但智能驾驶技术仍在持续迭代升级中,为保证车辆在全生命周期内的持续软件升级能力,主机厂在智能 驾驶上采取“硬件预置,软件升级”的策略,通过预置大算力芯片,为后续软件 与算法升级优化提供足够发展空间。 摄像头分辨率提升,激光雷达搭载数量提升以及传输数据量增长驱动汽车对算力 需求大幅提升。高级别自动驾驶对摄像头像素要求提高,预计未来 800 万像素相 机会取代 1-200 万像素相机的主流解决方案。假设一辆智能汽车配备 12 个 800 万 像素的摄像头,每秒 60 帧(FPS),隐含的数据输入速率可能达到 5.76 亿像素/秒。 叠加激光雷达的点云算法,预计智能汽车的计算能力将从目前支持 L2+/3 级自动 驾驶的神经网络处理器(NPU)的 100 多个 TOPS(每秒万亿次操作,计算能力的衡 量标准)和支持 2+/3 级自动驾驶的 CPU 的 80K DMIPS(每秒 Dhrystone 百万指令, 也是计算机性能的衡量标准),分别提高到 2030 年的 1000 多个 TOPS 和 500K DMIPS。

图片

“通用开放式”+“大算力”是智能驾驶芯片未来的主要趋势。伴随着 ADAS 辅 助驾驶功能在新车市场上渗透率的不断提升,新势力与领先自主品牌车企在智能 驾驶领域的厮杀日益激烈,智能驾驶传感器配置走向“内卷”,以蔚来、小鹏、极 狐为代表的车型更是率先宣布激光雷达量产上车,叠加高级别自动驾驶对摄像头 像素要求提高,对应自动驾驶芯片算力也持续提升。

3.3 软件趋势:AI 云端训练+OTA 升级

3.3.1 SOC 厂商加速布局自动驾驶 AI 数据训练

自动驾驶数据集对于训练深度学习模型和提升算法可靠性至关重要,SOC 厂商不 但推出了自研的 AI 训练芯片,还有云端超算平台。特斯拉推出了 AI 训练芯片 D1 和“Dojo”超算平台,将用于特斯拉自动驾驶神经网络的训练。不仅如此,训练 算法模型产品也愈发重要,包括 2D 标注、3D 点云标注、2D/3D 融合标注、语义 分割、目标跟踪等,如英伟达 Drive Sim 自动驾驶模拟平台、地平线“艾迪”数据 闭环训练平台等。

特斯拉推出了 Dojo 超算训练平台:采用特斯拉自研 7nm AI 训练芯片 D1, 依托庞大客户群来收集自动驾驶数据,从而实现对深度学习系统的模型训练。 从官方公开信息来看,特斯拉 Dojo AI 系统采用分布式架构,每个 Dojo 节点 都有自己的 CPU、内存和通信接口。而每个节点都有 1.25MB 的 SRAM(静 态随机存取存储器),然后每个节点都连接到一个 2D 网格。当前特斯拉 Autopilot 主要使用 2D 图像+标注的方式进行训练和算法迭代,通过 Dojo 超 算平台,可以使得 Autopilot 可以以 3D 图像+时间戳(4DAutopilot 系统)的 方式进行训练,4DAutopilot 系统将具备可预测性,标记道路物体的 3D 移动 轨迹,以加强自动驾驶功能的可靠性;

英伟达推出了自动驾驶模拟平台:DRIVE Sim 是一种基于 Omniverse 构建 的仿真工具,它可以利用平台的许多功能。DRIVE Sim 生成的数据用于训练 构成自动驾驶汽车感知系统的深度神经网络。DRIVE Sim 的传感器功能包括 路径追踪摄像头、雷达和激光雷达模型,可捕获现实世界的效果,如动态模 糊、LED 闪烁、滚动快门和多普勒效应。

地平线艾迪平台:艾迪 AI 开发工具平台是一个高效的软件 2.0 训练、测试、 管理的工具平台,包括半/全自动的标注工具,自动化模型训练,长尾场景管 理、软件自动集成、自动化回归测试,最后这整套模型通过 OTA 升级部署到 芯片上。

华为八爪鱼自动驾驶开放平台:“八爪鱼”是一个按需获取的全栈云平台,服 务覆盖自动驾驶数据、模型、训练、仿真、标注等全生命周期业务,向车企 及开发者,提供了包括数据服务、训练服务、仿真服务在内的 3 大服务。(1) 数据服务:处理车载硬件平台上输出的传感器数据,回放雷达、摄像头等不 同格式的数据;支持 PB 级海量存储、交互式大数据查询和海量数据治理。 (2)训练服务:管理和训练自动驾驶模型,不断在新的数据集和测试集上提 升模型的准确度,持续提升自动驾驶安全系数。平台提供软硬件加速,能大 幅缩短训练时间,提升训练效率。(3)仿真服务:提供仿真、场景库管理、 场景片段、评测系统等应用工具,确保自动驾驶模型合规、安全、可度量、 质量达标,快速集成到版本中。

3.3.2 通过 OTA 升级可以提高自动驾驶系统的精准度

OTA 技术最早应用在 PC 机上,后来广泛应用在移动手机行业,近几年才开始在 汽车行业里广泛应用。OTA 是空中下载技术,即通过网络从远程服务器下载新的 软件更新包对自身系统进行升级,包含固件升级和应用升级,从而满足终端厂商 的应用管理需求和运营商对入网终端的管理要求。通过 OTA 技术,车企可以进行 车辆的远程诊断、大数据等应用,快速修复系统故障,并增加新的功能等,可以 让汽车即便在已经离厂并且服役中的状态下,能透过互联网从远程进行系统升级, 以达到“功能更新、亦或是漏洞补救”的目的。

图片

SOA 架构是 OTA 落地前提。SOA 架构(Service-Oriented Architecture,面向服务 的架构)是将每个控制器所控制的不同的硬件和功能抽象成服务,并定义统一的 接口协议,应用开发者可以直接调取相应的服务来实现相关应用和功能,而无需 考虑底层硬件的差异。

不断演进的自动驾驶、点云融合、激光雷达等算法后续可通过 OTA 模式进行迭 代更新,进而提高辅助系统的精准度。截止到 2021 年 6 月,ADAS 算法中巡航类 相关的升级内容最多,为 42 项,其升级主要包括 ACC/ATC、主动循环、车速辅 助等;其次为预警功能新增或优化,包括碰撞预警、车门开门预警以及车道偏离 预警等,共有 23 项,另外泊车系统优化或新增也有 23 项,目标检测与识别相关 的有 17 项,主要包括对路面物体或动物识别优化、交通标志识别等,另外,环视 系统优化升级和车道保持系统升级优化分别升级了 14 项和 12 项。

OTA 升级改变整个汽车行业的商业模式,OEM 可以向 C 端客户发送“算法更新 包”从而实现汽车全生命周期收费,而不是传统汽车时代的“一锤子买卖”。过去 传统汽车行业长期以来依赖新车制造和销售获取利润,现在智能汽车时代可以通 过 OTA 按照“软件升级×汽车保有量”收费。

3.4 规模&增速:2025 年国内智驾 SOC 规模为 138 亿元,CAGR=25%

测算不同自动驾驶级别对应单 SOC 芯片价格:我们假设能支持 Level2 自动驾驶 的 SOC 的成本大约是 50 美元(与近年来 Mobileye 的价格一致)。L3 级别自动驾 驶芯片价格为 1500 人民币(拆分特斯拉 HW3.0 域控制器,其自动驾驶域的芯片成本约为 3000 元,对应 2 个 FSD 芯片)。假设 L4-L5 自动驾驶芯片单片价格为 400 美金(与英伟达 Orin 芯片价格一致)。

测算不同自动驾驶级别对应单 SOC 芯片数量:我们假设 L1 级别自动驾驶需要 1 颗 SOC 芯片,L2/L2+级别自动驾驶需要 2 颗 SOC 芯片(比如理想 one 搭载两颗 地平线 J3),L3 级别自动驾驶需要搭载 2 颗 SOC 芯片(比如特斯拉 HW3.0 需要 两颗 FSD 芯片),L4~L5 级别自动驾驶需要搭载 4 颗 SOC 芯片(比如威马 M7 搭 载 4 颗 Orin 芯片)。 测算汽车自动驾驶 SOC 芯片市场规模:随着汽车电动化、智能化的推进以及自动 驾驶渗透率的提升,自动驾驶芯片行业将维持较高速的增长。我们预计中国自动 驾驶芯片的市场规模将在 2025 年达到 138 亿元,到 2030 年达到 289 亿元,十年 复合增长率预计可达 25.1%。

4 智能座舱:感知、交互、场景应用升级,座舱芯片 向集成式方案演进

4.1 市场概况:智能座舱为“第三空间”载体,成为车企差异化竞争重 点

智能化逐渐成为消费者买车时更为关心的指标之一。汽车座舱的智能化发展由三 部分推动,分别为车内/外环境感知,视觉、听觉等多模态人机交互方案以及统筹 感知计算的车联网。汽车座舱智能化发展是通过配备智能化和网联化的车载产品 来实现与人、路、车的智能交互,是人车关系从工具向伙伴演进的重要纽带和关 键节点。

图片

汽车座舱正成为具有拟人化交互能力的驾驶伙伴。目前智能座舱系统主要包括内 饰、电子两大系统,像车内的座椅、空调、灯光、仪表盘、中控屏、车联网、语 音识别、手势识别等。智能座舱目前处于智能助理的初级阶段,在硬件方面,座 舱内部的实体按键被简化,大屏化、多屏化趋势显著;在软件方面,语音交互技 术被广泛应用,人脸识别技术和手势识别技术也被尝试,座舱所实现的功能趋于 多样化。

智能座舱渗透率将逐步提升,未来中国市场渗透率将远高于全球。目前全球及中 国智能座舱配置新车渗透率分别为 49.7%与 53.3%,当前中国汽车智能座舱普及 度已经过半,预计未来中国智能座舱产品渗透率的增长将领先全球市场。目前中 国智能座舱主要装备于中高端车型,低端车型装备率较低。

智能座舱兴起诞生新的硬件投资机会,催生大算力 SOC 芯片需求。与传统多芯 多屏方案相比,大算力单芯片解决方案极大降低系统成本,并能提供多屏互动的 智能互联体验,“一芯多屏”成为发展趋势,芯片本身也朝小型化,集成化、高性 能方向发展。座舱 SOC 芯片技术壁垒高,市场集中度高,在国产替代趋势下,国 产座舱 SOC 厂商有望迎来发展机会。

4.2 硬件趋势:“单芯单屏”到“跨域融合”,算力逐步提升

汽车 E/E 架构将沿着“分布式”→“域集中式”→“中央计算式”的方向演进。 与汽车 E/E 架构同步,座舱芯片方案也将相应地经历“单芯单屏”→“单芯多屏” →“融合发展”三大阶段的演进: (1)分布式架构下不同座舱电子设备由不同控制器控制,表现为“单芯单屏”, 但随着座舱功能的提升,“单芯单屏”形态的弊端逐渐显现:1)跨芯片信号传输 存在延迟;2)成本压力开始上升。 (2)集中域式方案即用一个系统级的主控芯片 SOC 来实现座舱内所有部件的控 制,不仅在软件层面上实现了软硬分离,也在硬件方面实现了集中化,座舱智能 化由“被动智能”迈向“主动智能”。随着座舱智能化提升,多屏人机交互,语音 等 AI 功能需求多样化个性化,以及 OEM 不断更新的 OTA 需求,对底层硬件要 求提升,在座舱内“单芯多屏”的 SOC 方案开始进入大众视野。

图片

主流座舱 SOC CPU 算力接近 100K DMIPS。目前座舱 SOC 以 CPU 为核心,CPU 算力从过去的数 K DMIPS 提升到如今的 100 多 K DMIPS 仅用了不到 7 年的时 间。座舱主控 SOC 不仅需要处理来自仪表、座舱屏、AR-HUD 等多屏场景需求, 还需要执行语音识别、车辆控制等操作,因此座舱系统的响应速度、启动时间、 连接速度等用户体验指标直接决定着汽车品牌的竞争力,智能汽车对座舱 SOC 的 性能、算力需求持续攀升。目前高通骁龙 SA8155P 的 CPU 算力约 105K DMIPS, SA8195P 的 CPU 算力约 150K DMIPS,高通第四代座舱 SOC 芯片 SA8295 甚至 达到 200K DMIPS 以上。国内厂商,华为麒麟 990 的 CPU 算力超过 75K DMIPS, 芯驰科技最新推出的座舱芯片 X9U 的 CPU 算力达到 100K DMIPS,瑞芯微最新 推出的智能座舱芯片 RK3588MCPU 算力也达到 100K DMIPS。 座舱 SOC 集成的 AI 算力也大幅跃升。其中三星已量产的 ExynosAutoV910 具备 约 1.9TOPS 的 AI 算力,三星规划 2025 年前后投放量产的 ExynosAutoV920 座舱 芯片的NPU 算力将达到约30TOPS;高通已量产的 SA8155P 芯片AI 算力约8TOPS, 其第四代座舱 SOC 集成的 NPU 算力高达 30TOPS,是目前已发布的 AI 算力最高 的座舱 SOC 产品,计划 2023 年投产。国产座舱 SOC 方面,芯驰科技的座舱产品 从中级产品到至尊级产品均嵌入 AI 算力,其 X9U 产品 AI 算力达 1.2TOPS;瑞芯 微最新发布的座舱 SOCRK3588M 其 AI 算力达到 6TOPS;吉利旗下芯擎科技的龍 鹰一号 AI 算力达到约 8TOPS。

从架构演进情况来看,过去座舱 SOC 芯片并没有单独的 NPU 单元,但随着 AI 算力需求提升座舱 SOC 内开始出现独立 NPU 单元。比如 8155 芯片并没有独立 的 NPU 内核,AI 计算主要通过 DSP、CPU 和 GPU 组成的 AI 引擎完成。其中, Hexagon690 拥有 7TOPS 的 AI 算力,加上 CPU、GPU 的 AI 算力之和为 8TOPS。 高通 8295 芯片算力达到 30TOPS,其 AI 算力是高通 8155 的 7.5 倍,为两个六角 张量 DSP。

4.3 软件趋势:软硬解耦,OEM 需要标准化、开放式的基础软件平台

“软件定义汽车”的核心本质是算法和应用的开发同计算平台的解耦,软件不再 是基于某一固定硬件开发,而是具备可移植、可迭代和可拓展的特性。随着人工 智能的框架和工具链越来越成熟,算法的精准度、成熟度更多依赖于数据量和标 注的质量,后期算法的迭代速度越来越快,但是硬件迭代速度没有那么快。因此 软件定义汽车,更多是利用算法或者软件快速迭代的特点,销售之后通过 OTA 扩 展汽车的功能、性能,提升驾驶的体验: 在芯片平台的硬件基础上,装载 Hypervisor、Linux 等内核系统,管理软硬件 资源、完成任务调度。 在 AUTOSAR 框架下开发拓展各项功能软件,调用处理传感器、执行器数据, 执行自动驾驶算法,实现感知融合、决策规划、控制执行、HMI 等各项应用 功能。

智能汽车座舱软硬解耦分离已基本成为共识。在基于 SOA 软件服务架构基础上, 将车辆底层进行软硬解耦和复用,实现软件功能快速迭代,通过与车主的个性化 OTA 交互,打造个性化和差异化的座舱产品体验。另外为了应对座舱软件需求迭 代多变的特性,在 SOA 服务架构的设计中,还需强调重用性和扩展性。目前智能 座舱软件平台如大陆 EB、中科创达、东软睿驰、华为、诚迈科技、斑马智行等多 家科技公司有所布局。 中科创达发布智能座舱平台 TurboX Auto 4.5,是基于 SOA 架构,实现场景和 服务的解耦,可快速完成场景服务的开发变更及升级迭代。 东软睿驰搭建起通用的标准化的软件架构和软件平台,可快速适配不同市场 主流 SOC 的硬件平台,实现高、中、低端多平台的智能座舱量产落地,以满 足不同车厂不同车型的定位和需求。

4.4 规模&增速:2025 年国内座舱 SOC 规模为 112 亿,CAGR=25%

单车搭载智能座舱 SOC 芯片数量:目前智能座舱的核心一般都是 1~2 颗 SOC 芯 片。目前座舱屏幕数量一般还都是一、两块,稍微多的一些车型会使用上三四块,但随着车辆屏幕数的增加,车内电子元器件(音响、监测等)的增加,单颗芯片 对于这些信息量的处理可能会变得吃力起来,此时有两种方式处理:(1)使用算 力更高的芯片。但是这种方式会导致采购和开发成本的提升,比如集度采用高通 8295,所对应的芯片价值量也会更高;(2)采用多 SOC 模式,对芯片进行分工。 虽然一芯多屏是可以实现的,但大量数据堆积在一起,需要配合较为复杂的算法。 比如目前的理想 ONE 就是采用了这种多颗智能座舱芯片的方式,理想 ONE 搭载 了一颗骁龙 820A 芯片+一颗德州仪器的 Jacinto6 芯片。其中骁龙 820A 芯片负责 驱动 16.2 英寸的中央大屏和 12.3 英寸的副驾驶娱乐屏使用的 Android Automotive 的底层系统,Jacinto6 芯片负责驱动液晶仪表盘和辅助驾驶显示服务使用的 Linux 系统。

单智能座舱 SOC 芯片价格:低端座舱芯片,比如 20 万以上售价的热销车型 比亚迪汉搭载老款高通 625 芯片(高通骁龙 625 是一款消费级芯片,曾主要 搭载于红米 Note4、坚果 Pro、小米 5X 等手机设备),成本价约 15 美元/颗 (折合人民币 100 元)。虽然高通骁龙 625 是一款老芯片,但胜在成本低,性 能较为稳定。高通 820A 的价格为 60 美元;高端高通骁龙 8155P SOC 的价格 约为 250 美元(折合人民币约 1688 元)。 测算 2025 年中国智能座舱 SOC 市场规模为 112 亿元:根据中国汽车工业协 会数据,2021 年中国乘用车销量 2148.2 万辆,假设未来按照 CAGR=3%增 长;假设单 SOC 价格 750 元测算,那么预计 2025 年国内座舱 SOC 市场规模 达到 112 亿元,CAGR 为 24%。

图片

5 汽车 SOC 高技术壁垒,国内厂商凭借差异化服务 切入自主品牌

5.1 设计/代工/车规认证为 SOC 芯片核心壁垒

大算力 SOC 芯片的设计和制造具有很高的门槛,要综合性能、功耗、成本、车规 安全多方面因素。

(1) 异构、多核 SOC 设计和优化能力直接决定了大算力芯片的性能、可靠性 和安全性等。这里面有两大技术难题,一方面要了解客户需求,即深入了 解 AI 算法,尤其背后使用的神经网络。因此需要前瞻性了解新的 AI 算 法,否则等芯片研发出来后发现算法与硬件架构兼容性差将会使芯片效率 大大降低。自动驾驶是高阶的人工智能,与人脸、语音识别以及大数据分 析等领域相比,对安全性和实时性要求更高,且由于驾驶是要和人类共同 参与的,因此需要更高的认知与推理能力。另外要足够了解供给,即 SOC 芯片内部比如 CPU、ISP、DSP 等核心可以通过 IP 授权的形式获得,只有 对各种 IP 深刻理解才能设计出好用的芯片。

(2) 性能/功率比为评价 AI 芯片的关键指标,并且作为创业公司要有足够资金 进行先进制程流片。各家新一代 SOC 中每瓦的峰值处理能力在逐步提高: 英伟达的 Drive Orin 能够达到 3.6TOPS/watt 的性能,较其老一代 Xavier 的 1.1TOPS/watt 有显著改进。Mobileye 的 EyeQ4 也可以从 0.83TOPS/watt 上升到 1.6TOPS/watt,并且在即将推出的 Ultra 版本中可能会超过 1.76TOPS/watt。特斯拉已经在 2019 年的 HW3.0 中实现了 2.0TOPS/watt, 并预计在下一代 HW4.0 平台中会有更实质性的改进。持续提高 AI 芯片性 能的方法有:a.持续优化 SOC 架构。如引入更强大的 ASIC 芯片——神经 网络加速器(NNAs)、NPU 或 DLAs;b.采用更先进的芯片制造技术可以有 效降低整体功耗。根据 IBS 的估计,开发一块芯片的成本,包括 IP 许可、 EDA(电子设计自动化)软件、研发、tape out(最终设计过程)、包装和测试 费用,对于 16nm 技术节点,总计流片费用为 1.06 亿美元;对于 7nm 技 术节点,总计流片费用为 2.98 亿美元;而对于 5nm 技术节点,流片费用 为 5.42 亿美元。因此是否有足够的资金进行先进制程流片以及能否拿到 先进制程的产能也是最终能否大规模量产的关键因素。

(3) 功能安全流程、车规可靠性认证、ASPICE 软件认证等一系列严苛车规认 证需要逐一攻破。从芯片功能定义到流片/封装测试完成,大约需要 2 年 时间,如果早期车规芯片不涉及功能安全,那么这个过程可以加速。但从 芯片测试完成→量产,大约需要 1 年半~2 年时间,这个环节时间必不可 少,因为涉及 AECQ100,ISO 26262 等功能安全认证,还有夏季冬季认证, 一级软件认证等。

5.2 国产 SOC 厂商在设计芯片之初需要兼顾多重因素

5.2.1 IP:各大自动驾驶 SOC 芯片厂商将自研“XPU”IP 作为竞争重点

各大自动驾驶 SOC 芯片厂商将自研“XPU”IP 作为竞争重点。SOC 芯片多为异 构设计,包含 GPU、CPU、加速核、NPU、DPU、ISP 等不同的计算单元,一般来 说芯片不能简单评估算力,还需兼顾芯片带宽、外设、内存,以及能效比、成本 等。同时,在芯片设计中,异构 IP 的配置非常重要,自动驾驶 SOC 芯片商均不 断加强核心 IP 研发以保持关键竞争力: 特斯拉:经历了早期使用黑盒方案的 Mobileye EyeQ3,到较为开放的 Nvidia Drive 平台,再到如今 NPU 芯片自研。特斯拉将芯片、算法紧耦合,尽管目前特斯拉芯 片算力不是最高,但其软硬一体的融合度效率高于其他 OEM 方案。 黑芝麻:黑芝麻智能先后打造 NeuralIQ ISP 图像信号处理器和 DyanmAI NN 引擎 两大核心 IP。前者让车“看得更清楚”,后者让车“拥有了更强的处理能力及更高 的效率”。

NeuralIQ ISP 图像信号处理器旨在让汽车“看得清”。通常而言,手机拍照多 为静态拍摄,可以通过运用传统的多帧降噪技术,在暗光环境中拍出纯净的 照片。但由于汽车行驶时处于高速运动状态,所以车规级图像处理技术更困 难。黑芝麻智能通过自研 ISP 处理系统,让摄像头在超低光和大逆光场景下 清晰成像,感知到的信息在后端计算中更均一化。

深度神经网络算法平台 DynamAI NN 引擎旨在让汽车“看得懂”。通过 NeuralIQ ISP 图像信号处理器处理后的图片,将传递到深度神经网络算法平 台 DyanmAI NN 引擎上。先将收集的新数据信息与计算平台存储的数据进行 对比,再进行推理和决策,预测出周围环境可能会发生的变化,从而保证汽 车“看得懂”。其后,通过与其他车、云、路互联协同,扩大有效感知范围, 让汽车“看得远”。

图片

5.2.2 芯片性能:“FPS/W”是综合评价芯片能力的指标

芯片算得快比算力大更有用。我们可以拿人和动物的神经元举例,比如大象有 2570 亿个神经元,人脑只有 860 亿个神经元,但其智商上限却仅相当于人类四五 岁的孩童。同样作为自动驾驶大脑的芯片,也绝不能只看硬件的堆砌,架构设计、 算法的运行方式都会影响芯片的最终实际效能。

FPS(每秒识别准确率)更能够反应 AI 芯片的真实计算性能,并且该指标已经开 始被头部自动驾驶厂商使用。马斯克在 2019 年提到,FSD 芯片算力是英伟达DrivePX2 算力 3 倍;在进行自动驾驶任务时,其 FPS 却为后者的 21 倍。而地平 线 J5 与英伟达 Orin 对比,虽然 128TOPS 的算力只有英伟达的一半,但是在进行 自动驾驶任务时,其 FPS 却做到了更胜一筹。更高的 FPS 可以做到更快速的感知, 更低的延迟,这意味着更高的安全性和更快的使用效率。

我们认为真正去评估一家 AI 处理芯片设计的好与坏,最合理的指标是“FPS/Watt & FPS/$,即为了达成 AI 处理目标所付出的功耗和芯片处理的成本”。具体拆解为 三个部分: 理论峰值计算效能(TOPS/Watt & TOPS/$):公司可以通过改进工艺制程和芯 片架构设计两方面提升该指标,其本质是一个硬件架构决定的指标。 芯片有效利用率(Utilization):该数值由软件架构决定。人工智能芯片如果把 硬件架构锁定,把算法也锁定,那软件架构可以通过编译器不断去编译、拆 解、重组、部署让芯片效能越来越好。 单位有效算力(FPS /TOPS):即算法处理速度,该数值由算法架构决定。算 法摩尔定律为通过算法不断的更新和演进,解决一个 AI 任务达到的相同准 确率所要求的计算次数在持续下降,即从语音识别,文本自然语言处理,计 算机视觉各个领域总结发现每 9-14 个月(每个领域可能略有不同)所完成的 AI 任务所需要的计算次数复杂度会降低一半。 地平线表示,在芯片流片之前应该关注如何让算法和软件更好的指导硬件架构, 因为算法是一个客观的大趋势,需要所有公司提前去学习、预判。所以在芯片定 义阶段的时候,应该关注“FPS/Watt & FPS/$”如何被“理论峰值计算效能”和“芯 片有效利用率”定义。在芯片流片出来之后,由硬件架构确定的“理论峰值计算 效能”已经确定了,而“单位有效算力”又是客观规律,此时各家自动驾驶 AI 芯 片公司核心要思考怎么去优化“芯片有效利用率”。

图片

5.2.3 生态&工具链:开放的生态和完整的工具链是满足主机厂需求的关键

Mobileye 是过去 20 年汽车 ADAS 技术的主要奠基者和引领者。截止到 2021 年 底,Mobileye 销售 2810 万枚 EYEQ 芯片(内含算法解决方案),在 L2+方案的市 场占有率约为 70%。Mobileye 致力于用单目视觉来解决三维立体环境中的测距问 题,自创立公司以来,Mobileye 获得了视觉辅助驾驶领域的多项第一并提供了包 括行人检测、车道保持和自适应巡航等辅助驾驶技术。 Mobileye 提供的“算法+芯片”封闭式解决方案,目前已经不能满足自动驾驶公 司和车企们的需求。在过去 20 年里,Mobileye 以视觉感知技术为基础,推出了算 法+EyeQ 系列芯片组成的一系列解决方案,可以帮助车企实现从 L0 级的碰撞预 警,到 L1 级的 AEB 紧急制动、ACC 自适应巡航,再到 L2 级的自车道保持、自 动刹车辅助和自动驻车等各种功能。但随着谷歌、苹果、百度、华为、滴滴、特 斯拉等科技巨头,还有一众自动驾驶创业公司开始用深度学习算法开发新一代的 L4 自动驾驶技术,量产车搭载的 L2 系统也越来越向着 L4 自动驾驶的技术架构 看齐。于是特斯拉用的 FSD 芯片取代了 Mobileye,理想从 EyeQ4 换装了地平线 征程 3。2022 年以及以后将上市的新款车型中,尤其是智能电动汽车,几乎清一 色的选择了英伟达、高通和华为这种科技巨头的自动驾驶芯片。目前全球已知使 用 Mobileye 最新一代 EyeQ5 芯片的车型,只有极氪 001 和宝马 iX 两款;并且宝 马曾作为 Mobileye 最大的客户宣布未来其他车型自动驾驶 SOC 方案会选择高通。

图片

除开放的生态外,算法工具链的成熟度从“能用→好用”也是下游 OEM 选择 SOC 厂商的关键因素。开放的生态是国内厂商追赶英伟达的第一步,但关键是要构建 好用的软件体系、工具链、以及能支撑持续演进迭代的用户生态。工具链在自动 驾驶软件生态中扮演重要地位,其成熟程度决定了整个系统开发的效率。头部SOC 芯片厂商通过与下游众多客户合作,逐步打磨、完善工具链,强化自身壁垒:

地平线提供整车智能开发平台,不仅包含 AI 芯片,还包括了软件栈、天工开 物 AI 工具链和艾迪 AI 开发平台。地平线提供端上的开发工具、以及在云端 的训练,包括数据管理以及仿真平台等工具,与天工开物形成完整的开发平 台,加速面向智能驾驶、智能交互、车内娱乐应用等各种各样的解决方案开 发。

华为坚持“不造车,聚焦 ICT 技术,帮助车企造好车”的战略,在芯片、云、 软硬件、工具链和高精地图等多方面发力。华为智能驾驶计算平台 MDC 集成了华为自研的 CPU、AI 芯片和其他控制芯片,并通过底层的软硬件一体化 调优,使整体性能方面达到业界领先水平。此外,华为 MDC 也有完整的测 试平台和工具链,为 MDC 的开发提供了全栈解决方案。

5.2.4 服务能力:芯片开始和主机厂进行紧密合作,服务能力成为比拼关键

2021 年以来,新冠疫情、俄乌冲突、美国高端 AI 芯片限令等因素导致汽车芯片 缺芯,一方面带给国产汽车芯片供应商机遇,另外一方面也让主机厂开始重视汽 车芯片在产业链中的地位。在过去产业链分工中,汽车芯片作为传统 Tier2 厂商 不直接和 OEM 对接;但受缺芯影响以及在各大车企为了加快智能化转型,汽车 芯片厂商开始直接和 OEM 合作进行配套研发,汽车芯片在产业链中话语权提升。 在这种新产业链模式下为芯片厂商提供前所未有的机遇,即可以跳过 Tier1 直接 服务 OEM,因此服务的态度与质量成为不同芯片供应商的竞争关键。服务态度 指的是 Tier-1 在与车企达成合作后,会以怎样的方式去执行合作,比如是否会派 遣一支工程团队驻场、是否有及时响应速度、是否能够提供差异化/定制化服务、 是否有能力/有资源/去做售后等。 国产芯片供应商“保姆式”服务带给 OEM 良好的使用体验,也是下游客户选择 国产芯片供应商的核心原因之一。比如地平线在与理想合作期间,不仅提供算力 5 TOPS 的征程 3 芯片,甚至还派驻了一支队伍提供保姆式服务,工程完结后还有 售后服务。周到的服务、及时的响应能力,是理想持续选择和地平线合作的重要 原因。

6 汽车 SOC 蓝海吸引多方入场,多因素驱动国产化浪潮

6.1 自动驾驶 SOC 格局:四大阵营参与 SOC 芯片竞争,地平线异军突 起

从各主流自动驾驶 SOC 厂商产品发布时间、制程演进、以及峰值算力来看,新发 布的 SOC 芯片的峰值算力越来越高,制程越来越先进。我们统计目前主流自动驾 驶 SOC 芯片厂商,包括 Mobileye、特斯拉、英伟达、高通、华为、地平线、黑芝 麻,并将他们发布的各款芯片产品放到二维象限中(横轴为芯片制程和预计发布 时间,纵轴为芯片峰值算力)。我们发现这些主流厂商未来发布 SOC 芯片逐步向 先 进 制 程 迈 进 ; Mobileye/ 地 平 线 / 黑 芝 麻 单 SOC 芯 片 峰 值 算 力 基 本 在 100~200TOPS 左右,而英伟达/高通/华为/特斯拉可以把单 SOC 峰值算力做到 200TOPS 以上。

从各主流自动驾驶 SOC 厂商面向下游应用市场来看,国内厂商目前定位在 ADAS/L2+领域。国内 ADAS/L2+领域厂商主要是地平线,黑芝麻;国外为 NXP、 TI、Mobileye;国内 L3 领域主要厂商是华为 MDC300(华为不卖单颗芯片,故取 整个计算平台解决方案作对比)、黑芝麻和地平线;国外为特斯拉、英伟达、高通; 面向 L4/L5 级别自动驾驶,国内为华为 MDC600,国外为高通、英伟达和特斯拉。 其中高通 Snapdragon Ride Flex 为 SOC 系列产品家族,包含 Mid/High/Premium 三 个级别,支持 L1~L4/L5;其中最高级 Ride Flex Premium SOC 再加上外挂的 AI 加 速器(可能是 NPU)组合起来,就可以实现 2000TOPS 的综合 AI 算力。

图片

从各主流自动驾驶 SOC 厂商阵营来看,主要分为“传统汽车芯片厂商”、“提供整 套解决方案厂商”、“通用型、提供平台型硬件+软件工具链厂商”以及“全栈自研厂 商”四大阵营: (1)传统汽车芯片厂商:对于像恩智浦、德州仪器或者瑞萨传统汽车芯片厂商来 说,他们的自动驾驶 SOC 芯片产品主要优势为:1.产品落地经验丰富;2.供应链 管理能力强,但缺点在于人工智能研发经验较少,因此主要面向 ADAS 等中低端 市场。 (2)提供整套解决方案厂商:主要代表厂商为 Mobileye。ADAS 时代的霸主,但 因其黑箱子解决方案较为局限,以及本土化服务能力较弱,逐步被头部车企抛弃。 Mobileye 系统最大优点是产品成本低,开发周期很短,开发费用极低,绝大部分 功能都经过验证,风险较低。而缺点是系统封闭,车企无法搞差异化功能。迭代 困难,出了问题较难改进或提升。对于传统车厂而言,Mobileye 基本是唯一选择, 对于总想与众不同的造车新势力来说可能无法适应。然而新兴造车企业毕竟还是 极少数,预计 Mobileye 在 ADAS 领域霸主地位至少五年内仍会相当稳固。

(3)通用型、提供平台型硬件+软件工具链厂商:主要包括高通、英伟达、华为、 地平线及黑芝麻:

英伟达:为面向 L3 级别及以上自动驾驶,中高端车型的首选方案,“平台化 芯片+完善的工具链+领先的人工智能研究经验”是英伟达自动驾驶 SOC 芯 片的主要优点。(1)硬件优势在于——GPU 架构兼顾效率与通用性:效率高于 CPU,通用性强于 ASIC;设计壁垒高,垄断性强;用户基数保证规模效 应:与其他业务平摊研发成本,版本迭代快,持续保证性能优势。(2)工具 链优势在于——开放平台模式:公司提供全套软件工具链(公司软件工程师 占比超过 70%)软件工具链丰富,客户可进行算法自研;并且还给用户提供 丰富的示例与教程,帮助用户快速上手使用。(3)在人工智能领域拥有近十 年的探索经验——英伟达将人工智能领域的优势拓展到智能驾驶领域。缺点 在于:由于 GPU 通用型较强,导致“有效算力”偏低;虽然英伟达提供对应开 发工具,但较高学习门槛和自研智能驾驶算法的花销可能会阻挡中小客户的 使用。

高通:发布了全新的自动驾驶平台 Snapdragon Ride。该平台采用了可扩展且 模块化的高性能异构多核 CPU、高能效的 AI 与计算机视觉引擎,以及 GPU。 同时包括 Snapdragon Ride 安全系统级芯片、Snapdragon Ride 安全加速器和 Snapdragon Ride 自动驾驶软件栈。高通 Snapdragon Ride 有三大优势:(1) 可扩展性。针对 L1-L3 自动驾驶,Snapdragon Ride 能够提供硬件+软件栈的 完整系统级解决方案,可以满足汽车制造商对于不同自动驾驶级别的可扩展 性需求。(2)经济性和高能效。与采用 X86 架构的自动驾驶平台高达 700 瓦 的功率相比,采用 ARM 架构的 Snapdragon Ride 平台具有巨大的能效优势。 目前来看,高通的整个驾驶芯片的成熟度要比英伟达低。长期看,包括高通、 华为、Mobileye 以及国内的其他芯片创业公司,走的是 ASIC 路线。从利用 率、功耗这些关键指标上来讲,高通可能会在三年之后,也就是预计在 2024 年 2025 年间会抢走很大一个市场。(3)智能座舱优势地位:高通 8155 基本 垄断全球所有高端/旗舰车型市场,因此高通将在座舱领域的汽车合作伙伴横 向拓展到自动驾驶领域路径具备可行性。缺点在于:人工智能经验研发较少。

华为:凭借 ICT 领域优势切入自动驾驶领域,技术上在国内属于第一梯队。 华为不单独卖自动驾驶芯片,更多是销售自动驾驶套件(MDC 系列)或者解 决方案,而这种捆绑销售的商业模式在自动驾驶领域,车企和第三方厂商之 间在合作之余也往往心存芥蒂。华为在自动驾驶 SOC 领域的优势为:华为有 丰富的算法和芯片设计能力;但华为自动驾驶方案大规模上车依然面临着几 个风险:(1)高端芯片无法代工,库存是否足够;(2)与华为合作的车企是 否愿意向华为开放数据;(3)如何赢得合作伙伴的信任。

地平线:地平线基本和国内所有自主品牌车型签下合作定点,定点数量 NO.1; 另外地平线在 2022 年 10 月又与大众旗下软件公司 CARIAD 携手地平线成立 合资公司,未来可以继续拿下合资厂订单。地平线优势:(1)地平线作为一 家创业公司,其自身就带有新势力的基因,所以响应客户需求的速度会更快; (2)与理想的合作证明,地平线能够给车企提供保姆式合作,派遣工程团队一同研发,工程完结后还有售后服务;(3)地平线曾在征程 5 发布会上称, 他们坚决不做封闭方案,同样不会做软件捆绑。地平线会向车企提供感知算 法及开发工具链,帮助车企更好地进行研发。

黑芝麻智能:黑芝麻智能在和国内车企定点数目上落后于地平线,但其在硬 件方面实力优于地平线。作为国内自动驾驶芯片为数不多可选方案,随着 A1000pro 流片成功,关注其未来和车企合作进展。

芯驰:自动驾驶 SOC 芯片目前没有和乘用车客户有明确合作,但已经在物流 车上应用,比如美团等。

寒武纪行歌:2021 年初成立,将覆盖 3 款智能驾驶 SOC 芯片,覆盖 L2~L4。 其最大优势在于此前具有智能芯片领域的技术积累和产品经验,是行业内少 数能为智能驾驶场景提供“云边端车”系列产品的企业。 软硬件全栈自研:主要代表厂商特斯拉。特斯拉颠覆了整个汽车行业,从自动驾 驶、智能座舱、域控架构、三电系统,甚至到车辆的制造与装配,发展出了一套 全新的方案。从自动驾驶角度来看,特斯拉是目前唯一实现软硬件全自研的公司, 且可能是唯一一个能够实现软硬件都自研的公司。特斯拉自研芯片的好处:(1) 芯片效率更高:从算法出发设计芯片架构,芯片的能耗比更优;(2)一体化带来 更快迭代速度:由于自动驾驶是个全新的领域,需要芯片、算法和车辆相互配合, 这些环节特斯拉均在公司内部流转,迭代速度高于合作模式。

复盘为什么地平线可以拿下这么多定点?为什么多家产业资本以及财务投资方选 择在 2020 年前后投资地平线?核心还是地平线在“缺芯”的大背景下推出了合适 的产品,凭借长安的背书,后续接连俘获众多 OEM 青睐。2020 年,当时主流 SOC 厂商主要包括:Mobileye、特斯拉、英伟达、地平线、黑芝麻、芯驰、华为;高通 此时还没进来;寒武纪行歌在 2021 年 1 月成立,2021 年 7 月开始布局汽车自动 驾驶 SOC。

图片

其他主机厂开始通过以自研、合资、投资、合作等方式与汽车芯片厂商直接合作。 在汽车智能化时代下,OEM 希望与芯片厂商建立更加直接、紧密的协作关系,以 提升自身供应链的稳定可控程度,主机厂希望通过布局汽车芯片以掌握更多研发 主导权,并通过提高软件与芯片结合效率,提高自身产品与技术优势。

自研芯片可充分结合主机厂算法需求特点,充分挖掘芯片能力,但需要一定技术 积累与大量资源投入,难度较大;在软件算法上具备领先优势的新势力车企有更 多自研意愿。除了特斯拉,更多主机厂也已开始了自己的造芯计划:

2020 年 11 月,零跑推出了首款自动驾驶芯片凌芯 01,这款芯片也是国内首 款拥有完全自主知识产权的自动驾驶芯片。凌芯 01 处理性能接近市场顶尖的 Mobileye 芯片,整体开放性则更强,既能支撑通用运算,又有特定的 AI 运算 逻辑,具有能耗比更低、安全可靠性更高的优势。

2021 年初,小鹏汽车已经在中美两地建立团队,同步启动了自研芯片项目, 目前小鹏的芯片团队目前已经有近 200 人,目标是开发对标特斯拉 FSD 的大 算力自动驾驶芯片;而蔚来也不甘落后,挖来前赛灵思亚太地区实验室主任 胡成臣,已经组建了近 300 人的芯片团队,研发包括自动驾驶芯片和激光雷 达芯片。

其他车企方面,德国大众集团已经在筹备自研芯片,并于 2019 年筹建了一支 5000 人团队开始打造操作系统。吉利汽车也要在中央计算平台&芯片、L4 自 动驾驶软件、ADDIS 数据平台和车联网平台&运营构建核心技术实力,已推 出 E01 和 E02 芯片信息娱乐 SOC 芯片,计划 2021 年推出 AI 语音芯片 V01; 2022 年推出全功能高性能数字座舱 SOC 芯片 SE1000;2023 年计划推出 256TOPS 的自动驾驶 SOC 芯片 AD1000。

车企造芯的缺点在于如果配套车型销量不大,很难分摊成本。车企造“芯”最难 的地方不是在于设计上,而是车企对于自动驾驶芯片的需求量并不会太大,代工 成本可能会较高。因此在除下场造“芯”的其他路径上,车企很可能会选择与其 他芯片厂商通过战略合作/成立合资公司/战略投资等方式参与自动驾驶芯片的合 作研发。

6.2 智能座舱 SOC 格局:高通处于领导者地位,国产厂商有望逐步渗 透

此前座舱芯片由传统汽车半导体公司主导,换代周期长达 5-6 年,并且通常情况 下是一颗芯片带一块屏,而且由于屏幕分辨率很低,所以对座舱芯片的算力要求 不高。在高通没有进入车规级芯片领域之前,车机芯片的销量冠军是日本瑞萨半 导体。2022 年瑞萨彻底没落,旗舰车用芯片“H3”采用的还是 16nm 制程工艺,搭 载的还是手机上 7、8 年前的 ARMCortex-A57+A53 架构组合,甚至不少车机芯片 还在使用更为老旧的 28nm 芯片以及 A55+A53 组合。现在来看,H3 性能孱弱、 制程老旧、架构落后。

图片

目前全球座舱 SOC 供应商格局趋于明朗,分为“传统汽车芯片”和“消费电子芯片 家”两类厂商,其中后者具有天然优势。汽车座舱市场过去由传统的汽车半导体供 应商主导,以恩智浦、瑞萨、德州仪器等为代表的“传统汽车芯片”厂商,在传统 汽车 MCU、ECU 芯片业务之外,顺应智能化趋势布局座舱芯片领域;而以高通、 三星等为代表的“消费级芯片”厂商,也在切入汽车座舱 SOC 领域,复用其在消费 电子领域深厚的技术积累。

传统汽车芯片厂商占有份额仍然较大,主要是由“中低端车型销量占比较大” 的汽车销售结构决定的。恩智浦、瑞萨、德州仪器三家传统汽车智能座舱芯 片的主要供应商,在智能化转型中节奏偏慢,除满足车规级安全外,性能不 及消费级芯片厂商,在销量占比仍然较大的中低端车型中部署广泛。瑞萨 RCARH3 采用 16nm 制程,而恩智浦 i.MX8 系列、德州仪器 Jacinto7 均基于 28nm 制程设计,CPU 算力最高 40K DMIPS,逊色于消费级芯片厂商。

高通、三星等消费电子厂商凭借性能及迭代优势在中高端芯片市场快速发展, 高通复刻在消费电子芯片的成功,在智能座舱芯片领域也占据了绝对的优势。 随着越来越多的智能手机功能被引入汽车座舱中,汽车硬件产品升级周期已 经从每代 5-10 年缩短到目前的 2-3 年(这主要得益于造车新势力如特斯拉、 蔚小理车型对软件功能频繁升级),这一趋势有利于高通、联发科、三星等领 先的智能手机 SOC 企业切入汽车座舱 SOC 市场。步入智能座舱时代,智能 驾舱芯片可以分为低端、中端和高端,目前在高端市场高通一家独大,约占 市场 80%的市场份额,高通、三星最新款座舱芯片已采用 10nm 以下制程, 且均计划在下一代芯片平台中采用 5nm 制程。

我们认为高通成为智能座舱 SOC 领域王者主要有以下 6 点原因: (1)从制程/算力角度,2019 年发布的高通 8155 为全球首款 7nm 高算力座舱 SOC,算力 8 TOPS,领先同期恩智浦、瑞萨等传统汽车座舱芯片厂商 2~3 代。 2021 年,高通发布骁龙 8295,将座舱 SOC 芯片的制程工艺从 7nm 带入 5nm 时 代,算力 30 TOPS,意味着第 4 代的 8295 芯片将与手机上最顶级的芯片处于同一 世代。 (2)从研发周期来看,高通座舱 SOC 架构可以通过智能手机 SOC 迁移过来, 缩短研发周期的同时可以更快和主机厂进行适配迭代。比如车规芯片 620A、820A 以及 8155,对应的手机芯片就是 620、820 和 855,这也是为什么高通能在短时间 内就推出车规级芯片的原因。高通车规芯片更新迭代规律非常明确,最新的技术 在手机芯片上经过验证后,再下放至车规芯片上使用,节省了研发周期与适配难 度。

(3)从流片费用来看,高通在消费电子领域的出货量平摊了其在汽车座舱领域的 研发先进制程的成本。先进制程 7nm 和 5nm 芯片的封装和开发成本远高于成熟 制程,对于恩智浦或瑞萨这样的传统汽车 SOC 制造商来说,在没有大量汽车市场 芯片需求的情况下,追求先进制程没有经济意义,因此 14-28nm 节点仍然是他们 的旗舰产品解决方案。而高通可以通过手机 SOC 芯片的规模优势来平摊汽车 SOC 芯片的开发成本。 消费级芯片是一个非常典型的寡头市场,企业获得先发优势后,可以凭借较大的 出货量平摊研发费用。而芯片的高技术壁垒导致研发及流片费用在数千万美元以 上,竞争者很难进入。CPU 是英特尔和 AMD 的天下,GPU 是英伟达和 AMD 的 天下,手机(移动)芯片是高通和联发科的天下。拥有消费市场是成为搅局者的 重要因素。苹果、特斯拉和华为海思都是凭借自身品牌形象,在手机和汽车领域 拥有相当数量的消费群体后,开始进行芯片自研,这保证了芯片研发费用的分摊 以及芯片更新迭代的动力。而汽车芯片是一个全新市场,同消费级产品不同的是, 汽车对安全性、稳定性的要求更高,设计成本和流片成本相应也更高,市场的参 与者主要是传统芯片行业巨头、创业公司以及车企。

图片

(4)从汽车内部通讯要求来看,未来智能座舱作为“移动第三空间”,随着 APP、 汽车生态逐步完善,对汽车高速通信的要求也会越来越高,那么对芯片基带处理 能力的要求也会越来越高。手机基带芯片壁垒之高主要系其他厂商难以绕过高通 专利,未来随着手机 SOC 芯片可以逐步下放到汽车座舱 SOC 中,预计高通在手 机基带领域芯片的领先优势可以进一步复制到汽车座舱领域中。

(5)高通芯片适应安卓系统:车机系统大多是运行安卓系统的衍生版本,高通芯 片在手机上已经完全适应安卓系统丰富的应用生态,进行移植适配没有技术障碍。 (6)有本土软件供应商提供服务:高通与中科创达、南京诚迈等本土车企汽车软 件服务商合作,他们弥补了高通与车企之间的沟通障碍,对于转型电动车的传统 车厂和新入局的造车势力有足够的吸引力。 综上,从全球视角来看,高通已经成为高端/旗舰车型的主流选择。智能座舱是实 现千人千面汽车驾乘体验的重心所在,新势力车企与领先自主品牌车企率先发力, “大屏化”、“多屏化”、“多模态交互”、“一芯多屏”成为座舱发展的热门趋势,伴随 着传感器规模的增长与交互模式的复杂化,智能座舱对芯片的算力需求亦水涨船 高。座舱高算力需求驱动下,以高通第 3 代汽车数字座舱平台为代表的高性能处 理器成为领先车企旗舰车型的主流选择,骁龙系列芯片加速上车。

本土厂商加速造芯,但国内座舱芯片竞争格局尚未定型,我们认为未来几年那些 提前布局座舱 SOC 的厂商将开始享受红利。进入 2022 年智能座舱 SOC 的“升级 战”正在愈演愈烈,传统的座舱市场芯片格局即将被打破,自主品牌车企已经逐渐 开始接受国产芯片,但目前尚未出现市占率特别高的国产座舱芯片厂商,整体竞 争格局尚未定型。目前仅几款芯片拿下车企定点,比如芯擎科技旗下首款 7nm 智 能座舱芯片——“龙鹰一号”已经拿下了多款车型定点,预计在今年第四季度实现 量产。2021 年 5 月芯驰科技发布 16nm 工艺的 X9 智能座舱芯片。2022 年 3 月宣 布 X9 芯片已经获得百万片/年的订单,客户覆盖合资、自主品牌车企和 Tier1。地 平线征程 2 已经在长安 UNI-K 中落地。瑞芯微最新发布的座舱 SOCRK3588M 其 AI 算力达到 6TOPS,已获得众多合作伙伴的认可,将在未来上市的车型中得以广 泛应用。

7 国外公司分析

7.1 英伟达

英伟达是 GPU 的发明者,也是人工智能时代的引领者,“平台化芯片+完善的工 具链”是英伟达芯片的主要特征。GPU 的并行架构适合人工智能领域的计算需求, 英伟达敏锐的抓住这个特点成为人工智能芯片及软件工具链的主要供货商。在进 行人工智能领域探索时,英伟达开始涉足智能驾驶及机器人业务,并在该领域拥 有近十年的开发经验。

图片

硬件架构:从拓展嵌入式移动芯片横向拓展到汽车领域。英伟达专注提供高性能 服务,借助嵌入式移动芯片,拓展汽车市场。在智能手机兴起的 2008 年时,英伟 达试图进入移动芯片市场。为此,公司开发了 Tegra 系列芯片,采用了 ARM 的 CPU 架构,并集成了自家的 GPU 芯片,组成了一套 SOC 系统。 Tegra 芯片是英伟达在 2008 年 2 月发布,是针对低功耗、高性能的小型移动设备 所推出的芯片,该款芯片基于 ARM 11 架构设计,采用 65nm 制程工艺,主要用在微软的一款 MP3 和 Kin 手机、小米 3 手机上,但后由于基带问题逐渐退出手机 市场。经过两年的发展,2011 年英伟达推出“全球首款移动四核处理器”Tegra3, 基于台积电 40nm 工艺打造。自此,英伟达不仅开始在移动设备领域“横扫千军”, 在汽车领域也开始“攻城略地”,宝马、奥迪等豪华品牌相继用上了英伟达的芯片。

多样化的计算平台为下游客户提供多种选择:早期英伟达的车载 AI 芯片平台与 单个移动芯片差别不大,但随着车载系统的要求不断多样化,英伟达 Drive 系统 也增加了很多选择。不同的客户可以依照不同的使用场景选择适合的产品,增加 了英伟达车载 AI 芯片的使用场景:

NVIDIA DRIVE Hyperion:NVIDIA DRIVE Hyperion 是用于量产自动驾驶汽 车的平台。此自动驾驶参考架构通过将基于 DRIVE Orin 的 AI 计算与完整 传感器套件(包含 12 个外部摄像头、3 个内部摄像头、9 个雷达、12 个超 声波、1 个前置激光雷达和 1 个用于真值数据收集的)相集成,能够在量产 之路上加速开发、测试和验证。DRIVE Hyperion 具有适用于自动驾驶 (DRIVE AV) 的完整软件堆栈,以及驾驶员监控和可视化 (DRIVE IX),能够 无线更新,在车辆的整个生命周期中添加新的特性和功能。

NVIDIA DRIVE Orin:NVIDIA DRIVE Orin SOC(系统级芯片)可提供每秒 254 TOPS(万亿次运算),是智能车辆的中央计算机。它是理想的解决方案, 为自动驾驶功能、置信视图、数字集群以及 AI 驾驶舱提供动力支持。借助 可扩展的 DRIVE Orin 产品系列,开发者只需在整个车队中构建、扩展和利用一次开发投资,便可从 L2+ 级系统一路升级至 L5 级全自动驾驶汽车系 统。

NVIDIA DRIVE AGX Pegasus:NVIDIA DRIVE AGX Pegasus™ 利用两块 NVIDIA Xavier™ 系统级芯片和两块 Turing™ GPU 的强大功能 ,实现了 320 TOPS 的超级计算能力。该平台专为各种类型的自主系统(包括机器人出 租车)而设计和打造。

NVIDIA DRIVE AGX XAVIER:NVIDIA DRIVE AGX Xavier 可为 L2+ 级和 L3 级自动驾驶提供每秒 30 TOPS 的运算。其核心是 NVIDIA 首次生产的 车规级 Xavier 系统级芯片,该芯片采用了六种不同类型的处理器,包括 CPU、GPU、深度学习加速器 (DLA)、可编程视觉加速器 (PVA)、图像信号 处理器 (ISP) 和立体/光流加速器。

图片

不仅算力领先,英伟达易于上手的软件工具链很大地了方便了芯片使用者的开发 过程,经过 Parker、Xavier、Orin 三代产品快速迭代英伟达已经形成了完整工具 链和软件生态力,非常有助于提升开发效率。自 2017 年 CES 上发布自动驾驶平 台 NVIDIA DRIVE 以来,英伟达的软件生态和工具链都在不断完善。NVIDIA DRIVE 平台支持以 DRIVE AGX 开发平台为起点,在 DRIVE Constellation 上验证 软件算法,充分验证并部署软件后,再通过 DRIVE Hyperion 参考架构进行上路测 试,最后用 NVIDIA DGX 进行人工智能 DNN 训练,进而达到量产标准。在此过 程中平台还为开发者提供丰富的软件开发者套件(SDK)。 英伟达的软件还有一个特点是其软件开放性高。早在 Orin 发布时,英伟达 CEO 黄仁勋就强调过英伟达芯片的开放性:实现自动驾驶汽车所需的投入正在指数级 增长,面对复杂的开发任务,Orin 是可扩展、可编程、软件定义的 AI 平台,对于 车企来说不可或缺。英伟达提供全套算法,包括障碍物识别、路径规划、行为决 策、执行策略、定位、地图流制造、自动泊车,还有底层软件系统,内含了 QNX 的驱动,CUDA 生态系统等等。选择英伟达 Orin 芯片的车企朋友圈分为两派:一 派在 Orin 芯片基础上再选配其他家感知硬件、自动驾驶算法;另一派研发能力充 足,就选择自研算法。

对于车企来说未来可以选择多种方式配置 Thor 的算力,既可以将全部 2000TOPS 用于自动驾驶功能,也可以将一部分用于车载 AI 和娱乐功能,另一部分用于辅 助驾驶,同时又可以减少汽车线束降低车身重量。目前,汽车的停车、主动安全 系统、驾驶员监控、摄像头镜像、集群和信息娱乐均由不同的计算单元控制,未 来这些功能可以同时在 Thor 上运行,即一颗芯片可同时为自动泊车、智能驾驶、 车机、仪表盘、驾驶员监测等多个系统提供算力,并将自动驾驶、信息娱乐等功 能划分成不同的任务区间,同时运行,互不干扰。Thor 将这些功能整合到一个系 统中,能够替代汽车中的大量芯片和电缆,在减少成本、能源消耗等方面将有所 提升。

英伟达 Thor 芯片设计发布具有“终局思维”,代表着在汽车领域已经由分布式的 ECU、DCU 转向了完全集中的功能融合型的单芯片,自动驾驶开启超算时代。 BOSCH 汽车电气架构演进示意图从模块级的 ECU 到集中相关功能的域控制器, 再到完全集中的车载计算机,每个阶段还分了两个子阶段,例如完全集中的车载 计算机还包括了本地计算和云端协同两种方式。根据之前 NVIDIA Altan 的芯片架 构示意图,从此图可以看出:Altan & Thor 的设计思路是完全的“终局思维”,相比 BOSCH 给出的一步步的演进还要更近一层,从跨越集中式的车载计算机和云端 协同的车载计算机,直接到云端融合的车载计算机。云端融合的意思是服务可以 动态的、自适应的运行在云或端,方便云端的资源动态调节。预计 Altan &Thor 采 用的是跟云端完全一致的计算架构:Grace-next CPU、Ampere-next GPU 以及 Bluefield DPU,硬件上可以做到云端融合。

7.2 高通(QCOM.O)

高通领跑、追赶者众,智能座舱芯片进入“跑马圈地”时代。在 2016 年之前智能 座舱 SOC 芯片市场几乎被 NXP 旗下 i.mx 系列完全垄断,但后续随着 NXP 无力 跟进先进制程,i.mx 芯片时代进入尾声。与此同时,消费级 SOC 巨头高通基于对 智能手机 SOC 需求空间逐渐见顶的判断,开始进入汽车智能座舱领域。截止到目 前高通已经发布 4 款智能座舱产品:

2014 年 1 月,高通正式进入车用芯片市场。基于手机芯片骁龙 600 平台,改 造出了旗下第一代汽车数字座舱平台骁龙 620A。在当时车内大屏、车联网还 不是普遍的情况下,骁龙 620A 凭借 4G 车联网、车载 WiFi、以及驾驶舱手 势识别等一系列应用的支持,受到了不少车企的青睐。

图片

在 2016 年 CES 大展上,高通 820A 正式发布,一经发布即吸引了大众、路 虎、小鹏、蔚来等一系列厂家采用。在目前畅销车型上,蔚来 ES8、理想 ONE、 小鹏 P7、奥迪 A4L、极氪 001 等即搭载了高通 820A 这款 SOC 芯片。

2019 年,高通推出新一代智能座舱芯片产品,全球首款量产的 7nm 制程车机 芯片,采用 8 核设计的 SA6155P、SA8155P 和 SA8195P。其中 SA8155P 对应 骁龙 855 手机平台,性能强劲,算力已经能够达到 8 TOPS,是目前中高端车 型智能座舱的首选方案。截至目前,在已上市车型中,小鹏 P5、威马 W6、 蔚来 ET7 和 ET5、哪吒 UPro、零跑 C11、长城 WEY 旗下摩卡、玛奇朵和拿 铁车型、吉利星越 L、凯迪拉克锐歌以及蔚小理即将上市的全新车型均采用 了高通 8155 芯片。

2021 年,高通再次发布第四代智能座舱芯片产品——SA8295P。这是首款 5nm 车机芯片,用于 AI 学习的 NPU 算力达到 30TOPS,接近 8155 的 8 倍;GPU 算力相对于上一代 8155 提升了 200%。高通 8295 首发车型为百度旗下的集度汽车,该量产车型预计在 2023 年交付。另外 SA8295 已获得长城、广汽、 通用等车企的订单,相关车型同样将在 2023 年交付。

7.3 恩智浦半导体(NXPI.O)

恩智浦半导体(NXP Semiconductors)是一家美荷半导体设计商和制造商,前身为 飞利浦半导体,由荷兰飞利浦在 1953 年创立,恩智浦于 2006 年成为独立公司。 公司主要提供安全互联的解决方案。基于高性能混合信号的专业技术,恩智浦在 汽车、智能识别和移动行业,以及无线基础设施、照明、医疗、工业、个人消费 电子和计算等应用领域不断创新。 公司 2021 年汽车电子收入占比达到 50%,产品涵盖车载处理器和微控制器、驾驶 员辅助收发器、车载网络、屏幕驱动、电源管理、传感器等。其中车载处理器 S32 系列涵盖网络、雷达、视觉、以及应用处理器等产品,提供全方位解决方案。以 公司第二代视觉处理器 S32V234 为例,基于 ArmCortexA53 内核,提供图像信号 处理器(ISP)、3D 图形处理器单元(GPU)、双 APEX-2 视觉加速器。产品支持计算 密集型 ADAS、新车碰撞测试(NCAP)前端摄像头、物体检测和识别,环视、汽车 和工业图像处理、以及还包括机器学习(ML)和传感器融合应用。

图片

7.4 德州仪器(TXN.O)

德州仪器公司(TI)成立于 1951 年,是一家总部位于德克萨斯州达拉斯的美国半导 体公司,公司前身为地球物理业务公司。 公司主营业务为模拟 IC 与嵌入式处理器产品开发、制造与销售,以及各类软件的 销售,公司是全球最大的模拟 IC 以及数字信号处理器(DSP)厂商。公司产品应 用领域涵盖通信、汽车、工业、消费电子、计算机等众多应用领域。 公司汽车电子产品涵盖 ADAS、动力传动系统、娱乐信息与仪表信息系统、车身 电子元件与照明系统。在处理器领域,公司有多款产品通过 AEC-Q100 车规级认 证,以公司 TDA4VM 为例,基于 Cortex-A72 内核,搭载深度学习和传统算法加 速器、集成下一代 ISP、视频编解码器。

7.5 Mobileye(MBLY.O)

Mobileye 曾为 ADAS 行业领军者,但收自身业务发展以及半导体行业低迷等原 因,IPO 估值一路下调。Mobileye 于 1999 年在以色列成立,为提供辅助驾驶系 统(ADAS)解决方案的领导者。公司于 2007 年发布第一代 EyeQ 芯片,经过五 年时间实现百万出货量。2014 年,公司在纽约交易所上市,估值约 50 亿美金。 2017 年公司被 Intel 以 153 亿美元收购。2022 年 10 月,公司向纽约纳斯达克交易 所提交 IPO 文件,但 IPO 市值一路 500 亿美金下降到 160 亿美金。

公司 EyeQ 芯片出货量累计超过 1 亿片,已应用于全球 700 余个车型。Mobileye 在 2007 年将 EyeQ1 推向市场后,先后与大陆、麦格纳、意法半导体等全球零部 件供应商签署了合作协议,并将芯片配装到宝马、通用等知名品牌汽车上。公司 在 2014 年推出 EyeQ3 后更是名声大噪。到今年 7 月,Mobileye 的解决方案已安 装在约 800 款车型、超过 1.17 亿辆汽车上。公司预计到 2030 年,其 ADAS 解决 方案将应用于超过 2.66 亿辆汽车。

Mobileye 作为自动驾驶领域的先行者,曾创造了属于自己的辉煌,然而从另一个 维度来看,的确也能看到一些危机。一方面主要系其 mobileye 采用软硬件捆绑的 销售模式,算法难以适应车企需求。另外一方面自动驾驶算法升级周期长, Mobileye 在国内并没有研发团队,难以对中国客户做出快速和定制化的升级。 算力并不是评判芯片好坏的唯一标准,但却在一定程度上决定该自动驾驶系统的 上限,EyeQ5 芯片将面临来自英伟达、高通、地平线、华为等强劲对手的挑战。 EyeQ5 发布于 2020 年,于 2021 年第四季度首次搭载在吉利汽车旗下的极氪 001 车型上,EyeQ5 采用了 7nm FinFET 工艺,算力达到了 24TOPS。英伟达的 Orin 芯 片的单颗算力达到 254TOPS,已经超过 EyeQ5 算力的 10 倍,而同为消费电子芯 片巨头的高通也推出了 Snapdragon Ride 平台,单颗芯片算力分为 10、20、30、 60TOPS 四种版本,并且可以采用多芯片组合方案,再搭配上 300TOPS 的 AI 加 速器,整体算力可以超过 700TOPS。除了英伟达、高通等众多国际竞争对手, Mobileye还正面临着来自中国众多自动驾驶芯片厂商的围攻,像地平线的征程5、 华为的昇腾 610 都是属于与 Mobileye EyeQ5 的同期产品,前两者的各方面性能已 经全面超越 EyeQ5。因此 Mobileye 的 EyeQ 系列芯片的算力较低,也是其损失核 心客户的原因之一。

首页
评论
分享
Top