【ZiDongHua 之汽車駕駛自動(dòng)化收錄關(guān)鍵詞: 自動(dòng)駕駛  汽車芯片   SoC  域控制器  汽車電子】

自動(dòng)駕駛芯片行業(yè)研究:中央計(jì)算,大模型與領(lǐng)航輔助引領(lǐng)新一輪創(chuàng)新

復(fù)盤:英偉達(dá)通用型GPU先聲奪人,地平線把握時(shí)間窗口進(jìn)行國(guó)產(chǎn)替代

背景:汽車EE架構(gòu)向集中化演進(jìn),催化智駕SoC芯片需求

汽車電子電氣(E/E)架構(gòu)從分布走向集中,自動(dòng)駕駛芯片以SoC為主流。伴隨著汽車智能化、網(wǎng)聯(lián)化、電氣化的深入,低效的傳統(tǒng)分布式架構(gòu)已無法滿足升級(jí)需求,汽車電子電氣架構(gòu)逐漸從分布走向集中,以減少車輛線束,提高內(nèi)部信息流轉(zhuǎn)效率。傳統(tǒng)分布式架構(gòu)下,汽車各功能模塊相互獨(dú)立,僅需MCU芯片即可滿足所需算力。而當(dāng)電子電氣架構(gòu)向集中式演進(jìn),算力亦趨向于集中,僅依靠傳統(tǒng)MCU已難以滿足計(jì)算需求,也因此催化了SoC芯片的發(fā)展。當(dāng)前,自動(dòng)駕駛芯片以CPU、GPU以及NPU等AI加速器組成的SoC芯片為主流,并作為算力平臺(tái)集成在域控制器中,從而加速智能汽車走向跨域融合。各大主機(jī)廠基于下一代電子電氣架構(gòu)的車型將于2023年起逐步推出。特斯拉在EE架構(gòu)變革中是引領(lǐng)者,在定義ModelY車型時(shí)直接跳過“域集中式EE架構(gòu)”,直接進(jìn)化至“中央+區(qū)域EEA”的“準(zhǔn)中央計(jì)算式”。2022款ModelY為中央計(jì)算模塊CCM+左車身控制模塊+右車身控制模塊設(shè)計(jì),其中CCM(CentralComputingModule)模塊整合ADAS(Advanceddriver-assistancesystem)域和座艙娛樂域。當(dāng)前國(guó)內(nèi)各大傳統(tǒng)主機(jī)廠與新勢(shì)力均加速布局,總體看在硬件上采用中央計(jì)算+區(qū)域控制架構(gòu)方案,軟件上采用SOA(Service-orientedarchitecture)軟件架構(gòu)的設(shè)計(jì)理念。

我們總結(jié)各電子電氣架構(gòu)的特點(diǎn)如下:

分布式:各模塊功能劃分明確,軟硬件強(qiáng)耦合,各模塊可獨(dú)立開發(fā),但無法共用單個(gè)SoC,且無法做到冗余,分布式架構(gòu)需要大量線束支持內(nèi)部通信,加劇線束成本。此外,各子模塊更新需要各供應(yīng)商提供,迭代效率相對(duì)低下。

跨域集中式:將分散的ECU集中至底盤、動(dòng)力、座艙、智駕域中,從而減少內(nèi)部通信所需的線束成本,未來將逐步簡(jiǎn)化為智駕域、座艙域、車控域。此外軟硬件可逐步解耦,具備一定后期OTA靈活性。

中央計(jì)算式:進(jìn)一步簡(jiǎn)化架構(gòu),顯著降低線束成本,引入SOA化設(shè)計(jì)開放軟件平臺(tái),實(shí)現(xiàn)軟硬件解耦,各功能域共用一個(gè)中央計(jì)算平臺(tái)。未來車載計(jì)算平臺(tái)也有望與云計(jì)算相結(jié)合,實(shí)現(xiàn)車-云一體化。同時(shí),中央集中式架構(gòu)也將真正實(shí)現(xiàn)“艙駕一體”,這也對(duì)車載SoC芯片提出更高性能、安全等級(jí)與集成度的要求。

▍格局:行業(yè)格局未定,英偉達(dá)引領(lǐng)中高端市場(chǎng),地平線異軍突起

自動(dòng)駕駛芯片歷經(jīng)10年發(fā)展演變,國(guó)內(nèi)格局發(fā)生較大變化。我們對(duì)其發(fā)展歷史及格局變化進(jìn)行復(fù)盤,從2014年至今可分為兩大階段:

2014-2018年:玩家以Mobileye、英偉達(dá)和傳統(tǒng)MCU廠商為主,自動(dòng)駕駛功能尚處早期,行業(yè)內(nèi)入局者較少。該階段汽車仍以分布式E/E架構(gòu)為主,自動(dòng)駕駛功能等級(jí)處于L0-L2,用智能前視一體機(jī)即可實(shí)現(xiàn)智駕需求,對(duì)芯片算力需求不高。Mobileye長(zhǎng)期深耕視覺ADAS,自研“視覺算法+芯片”的軟硬一體方案,憑借EyeQ3/Q4迎合市場(chǎng)需求,在該階段占據(jù)了L1-L2視覺ADAS芯片市場(chǎng),營(yíng)收增速迅猛。同時(shí),傳統(tǒng)MCU廠商例如瑞薩、TI等廠商搭載于博世方案,也占據(jù)大量市場(chǎng)份額。英偉達(dá)以通用GPU架構(gòu)為基礎(chǔ),于2016年推出TegraParkerSoC,搭載于特斯拉HW2.0平臺(tái),正式將GPU路線的自動(dòng)駕駛SoC推向市場(chǎng),但該階段的智駕SoC技術(shù)迭代仍較慢。

2019-2022年:行業(yè)發(fā)展提速,英偉達(dá)引領(lǐng)高算力市場(chǎng),地平線抓住時(shí)間窗口進(jìn)行國(guó)產(chǎn)替代。2019年,特斯拉第一代自研FSD芯片成功,車企開始重視打造軟硬結(jié)合的自動(dòng)駕駛能力,自動(dòng)駕駛芯片行業(yè)亦進(jìn)入快速發(fā)展期。在低算力(30TOPS以下)市場(chǎng),地平線抓住時(shí)間窗口進(jìn)行國(guó)產(chǎn)替代,逐漸搶奪Mobileye的市場(chǎng)份額。2019年,地平線搶先發(fā)布J2芯片(4TOPS),并于2020年實(shí)現(xiàn)量產(chǎn),搭載于長(zhǎng)安主力車型UNI-T。2021年,汽車行業(yè)缺“芯”導(dǎo)致車輛減產(chǎn),國(guó)內(nèi)車企開始重視國(guó)產(chǎn)芯片供應(yīng)商的培養(yǎng)。地平線于當(dāng)年實(shí)現(xiàn)了J3芯片(5TOPS)的量產(chǎn),自此在自動(dòng)駕駛領(lǐng)域積累了先發(fā)優(yōu)勢(shì),并憑借更開放的生態(tài)逐步侵蝕Mobileye在國(guó)內(nèi)的市場(chǎng)份額。據(jù)高工智能汽車(微信公眾號(hào),除非特別說明,下同)數(shù)據(jù),2022年1-9月,地平線在中國(guó)市場(chǎng)乘用車前裝標(biāo)配智能駕駛域控制器芯片的出貨量已躍居第二,僅次于特斯拉,Mobileye則跌至第三。除地平線和Mobileye外,TI、賽靈思、瑞薩等芯片廠商的SoC亦占有一席之地。

在中高算力(30TOPS及以上)市場(chǎng),英偉達(dá)基于領(lǐng)先的GPU架構(gòu)先聲奪人,地平線則有望將國(guó)產(chǎn)替代的腳步帶向中高端市場(chǎng)。英偉達(dá)2020年針對(duì)L2市場(chǎng)發(fā)布Xavier芯片(30TOPS),搭載于小鵬P7/P5等車型;2022年又推出大算力Orin芯片(256TOPS),再次引領(lǐng)行業(yè)占據(jù)主流中高端車型市場(chǎng),是此前所有瞄準(zhǔn)L2+高階輔助駕駛車型的選擇。而地平線于2022年推出J5芯片(128TOPS)并上車?yán)硐?,希望以更高的性價(jià)比和更優(yōu)的本土化服務(wù)與英偉達(dá)展開同臺(tái)競(jìng)技。此外,高通、黑芝麻、輝羲智能等一眾玩家也將于今明兩年正式加入中高算力芯片的角逐賽。

▍展望:小算力芯片需求保持強(qiáng)勁,大算力芯片走向更新架構(gòu)

中短期車企智能化策略因產(chǎn)品定價(jià)出現(xiàn)分化,算力需求有所不同

中短期來看,隨著今年車企價(jià)格戰(zhàn)的打響,前幾年一味堆料堆硬件的趨勢(shì)將告一段落,務(wù)實(shí)和高性價(jià)比將是決賽圈存活的關(guān)鍵。也因此,車企智能化策略或因產(chǎn)品定價(jià)出現(xiàn)分化:

1)10-20萬元車型:追求高性價(jià)比智駕方案,算力需求在5-30TOPS。特斯拉降價(jià)導(dǎo)致國(guó)內(nèi)車企成本壓力倍增,加速行業(yè)洗牌。我們認(rèn)為,成本壓力下,10-20萬元的低端車型傾向于追求高性價(jià)比智駕方案,中短期內(nèi)仍將以傳統(tǒng)的L2功能為主,部分車型或可提供基本的高速領(lǐng)航功能,算力需求在5-30TOPS。傳統(tǒng)L2功能僅需10TOPS左右即可滿足需求。而高速領(lǐng)航作為L(zhǎng)2+的代表功能,算力配置亦在下探。盡管在安全冗余性和體驗(yàn)流暢度上或有所欠缺,但也可滿足功能的基本需求。但業(yè)內(nèi)普遍認(rèn)為,高速領(lǐng)航若想要“好用”,即提供更高的冗余性和更平滑流暢的駕駛體驗(yàn),仍需更高算力的支持,30-60TOPS的中算力芯片或更為合適。

2)20-30萬元車型:高速領(lǐng)航漸成標(biāo)配,降本壓力下車企對(duì)硬件配置趨于理性,判斷算力需求在30-80TOPS。處于該價(jià)格帶的車型,一方面面臨特斯拉Model3/Y的直接競(jìng)爭(zhēng),成本壓力尤為明顯;另一方面也需一定的智能化程度以打造差異化特征。我們認(rèn)為,高速領(lǐng)航有望逐漸成為此價(jià)格帶車型標(biāo)配,且相較于低端車型,可以以相對(duì)更高的硬件配置提供更優(yōu)的駕乘體驗(yàn),但車企在降本壓力下也將趨于理性,不再一味堆砌硬件和算力,因此預(yù)計(jì)算力配置將普遍上升至30-80TOPS,中算力芯片有望成為主流選擇。

3)30萬元以上車型:追求更佳的智能化體驗(yàn),芯片走向大算力&新架構(gòu)。我們認(rèn)為,30萬元以上的高端車型受價(jià)格戰(zhàn)影響相對(duì)較小,主機(jī)廠追求打造標(biāo)桿性的智能化標(biāo)簽,或?qū)⒊掷m(xù)發(fā)力城區(qū)領(lǐng)航,當(dāng)前算力配置普遍超200TOPS。為了實(shí)現(xiàn)效果更佳、體驗(yàn)更優(yōu)的領(lǐng)航功能,“BEV+Transformer”開始引領(lǐng)自動(dòng)駕駛感知范式;長(zhǎng)期看,“艙駕一體”也有望成為智能汽車E/E架構(gòu)演變的終局。在上述兩大技術(shù)趨勢(shì)的驅(qū)動(dòng)下,自動(dòng)駕駛芯片開始走向大算力&新架構(gòu)。

小算力芯片:量產(chǎn)交付、安全穩(wěn)定和性價(jià)比是關(guān)鍵,地平線和TI領(lǐng)先地位較為穩(wěn)固

中短期來看,小算力芯片有望伴隨L1-L2功能的快速增長(zhǎng)進(jìn)入規(guī)模放量階段。我們認(rèn)為,車企將更傾向于量產(chǎn)經(jīng)驗(yàn)豐富、交付能力強(qiáng)、安全穩(wěn)定性高且性價(jià)比突出的芯片廠商,地平線和TI當(dāng)前領(lǐng)先地位較為穩(wěn)固,但仍有新玩家持續(xù)入場(chǎng)。過往輔助駕駛以基礎(chǔ)L0-L2功能為主,智能前視一體機(jī)即可實(shí)現(xiàn),以Mobileye、博世、大陸、賽靈思的方案為主。而伴隨輕量級(jí)行泊一體以及基礎(chǔ)高速領(lǐng)航功能滲透率的提升,我們認(rèn)為,集成SoC芯片的小算力域控平臺(tái)將成為主流。由于小算力芯片的技術(shù)壁壘和架構(gòu)難度較中高算力更低,因此我們認(rèn)為,芯片廠商的量產(chǎn)交付能力、安全穩(wěn)定性和性價(jià)比將成為車企關(guān)注的重點(diǎn)。

地平線憑借先發(fā)優(yōu)勢(shì)、生態(tài)圈建立和本土化服務(wù)有望持續(xù)走在國(guó)內(nèi)小算力芯片市場(chǎng)的前列;TI主推的TDA4VM在功能完整度和車規(guī)可靠性上有較大優(yōu)勢(shì),且實(shí)現(xiàn)了小算力芯片中少有的單SoC行泊一體方案,有望持續(xù)保持高競(jìng)爭(zhēng)力。

Mobileye由于黑盒方案難以滿足行泊一體等開發(fā)需求,未來或仍將主要針對(duì)L1-L2需求,將成熟的感知算法內(nèi)嵌至芯片中打包出售,對(duì)自研能力較弱的車企更為友好。此外,以芯馳科技、寒武紀(jì)以及愛芯元智為代表的廠商,此前在其它應(yīng)用場(chǎng)景積累了較為豐富的量產(chǎn)交付經(jīng)驗(yàn),未來亦有機(jī)會(huì)切入智駕芯片市場(chǎng),對(duì)地平線和TI形成競(jìng)爭(zhēng)壓力。

地平線:J2/J3率先卡位小算力芯片市場(chǎng),具有先發(fā)優(yōu)勢(shì),有望持續(xù)受益于國(guó)產(chǎn)替代浪潮,走在國(guó)內(nèi)小算力芯片市場(chǎng)的前列。抓住國(guó)產(chǎn)替代時(shí)間窗口,具有先發(fā)優(yōu)勢(shì),本土化服務(wù)能力領(lǐng)先。地平線J2/J3芯片分別具備4/5TOPS算力,在推出時(shí)瞄準(zhǔn)Mobileye所在的ADAS市場(chǎng),且相比于MobileyeEyeQ4具備更高算力與開放性,因此憑借芯片產(chǎn)品力、較完善的工具鏈以及本土化服務(wù)能力,在供應(yīng)鏈安全可控背景下,迅速受到眾多有軟件算法自研需求的本土車企青睞。

TI:TDA4VM在架構(gòu)完整度和功能安全性方面占優(yōu),有望成為10-20萬車型輕量級(jí)行泊一體方案的主流選擇之一。TDA4VM算力高于J3和EyeQ4,可實(shí)現(xiàn)單SoC輕量級(jí)行泊一體方案。TI于2020年推出核心產(chǎn)品TDA4VM,算力8TOPS,高于地平線J3(5TOPS)和MobileyeEyeQ4(2.5TOPS),且供貨穩(wěn)定。當(dāng)前,大疆、MAXIEYE、Nullmax、禾多科技、縱目科技等玩家都在基于TDA4開發(fā)行泊一體方案。

架構(gòu)完整且集成度高,利于車企和方案商進(jìn)行二次開發(fā)。TDA4采用多核異構(gòu)架構(gòu),集成了ARMCPU、數(shù)字信號(hào)處理器(DSP)、深度學(xué)習(xí)加速器(DLA)、MCU等單元,由對(duì)應(yīng)的核或者加速器處理如邏輯算力和AI算力等不同任務(wù)。TI的AI算力來自于自研矩陣乘法加速器MMA(可類比地平線的BPU),能夠提供較靈活的矩陣乘法運(yùn)算,通用性介于GPU和ASIC之間,因此擁有更強(qiáng)的可擴(kuò)展性與并行處理能力。值得一提的是,TDA4是業(yè)內(nèi)為數(shù)不多內(nèi)置ASIL-D級(jí)MCU的智駕SoC。由于大多智駕SoC還無法滿足高功能安全等級(jí)的要求,因此常見做法是在智駕域控主板上外掛一顆獨(dú)立的MCU芯片,比如英飛凌TC297/397等,以提供狀態(tài)監(jiān)控、整車底盤控制、執(zhí)行最小安全風(fēng)險(xiǎn)策略等。為了簡(jiǎn)化系統(tǒng)設(shè)計(jì)、縮短通訊延時(shí)、節(jié)省硬件成本,部分芯片廠商開始在SoC內(nèi)部?jī)?nèi)置MCU核心(功能安全島SafetyIsland)。TI的TDA4系列就是內(nèi)置MCU的典型代表,其MCU為ASIL-D級(jí)ArmCortex-R5F,進(jìn)行了單獨(dú)電壓和時(shí)鐘設(shè)計(jì),采用專用內(nèi)存和接口確保其與SoC其余部分隔離,因此車企無須再外接MCU進(jìn)行開發(fā)。盡管內(nèi)置MCU已成趨勢(shì),但與成熟穩(wěn)定的傳統(tǒng)外掛MCU相比,內(nèi)置安全島的功能安全性、實(shí)時(shí)性和可靠性在實(shí)際應(yīng)用中仍有一定差距。因此,域控廠商在使用地平線J3、黑芝麻A1000等芯片時(shí),多數(shù)情況下仍會(huì)選擇外掛一個(gè)MCU提供安全冗余。

但TI的相對(duì)劣勢(shì)在于,由于集成了GPU、MMA、DSP等眾多處理單元,TDA4VM在高負(fù)載下功耗可高至20W,對(duì)Tier1與主機(jī)廠在散熱等方面的工程化能力提出了較高的要求。此外,相比于純ASIC路線,TI在特定算法上的運(yùn)算效率或不及地平線。

Mobileye:傳統(tǒng)視覺ADAS龍頭,因黑盒模式和迭代較慢,市場(chǎng)份額正在被地平線等其他玩家快速侵蝕。但其“視覺算法+芯片”的智能前視一體機(jī)方案具備高性價(jià)比,未來或?qū)⒅饕槍?duì)L1-L2需求,對(duì)自研能力較弱的車企更為友好。因黑盒模式和迭代較慢,市場(chǎng)份額正在被快速侵蝕。Mobileye是昔日ADAS領(lǐng)域的主要奠基者和引領(lǐng)者,提供算法+EyeQ系列芯片組成的一體化軟硬件解決方案。在Mobileye方案的幫助下,車企可高效且高性價(jià)比地適配L1-L2級(jí)基礎(chǔ)輔助駕駛功能。但隨著汽車智能化程度的提升,車企開始希望對(duì)自身的智能化方案有更高的話語權(quán)和主動(dòng)權(quán),而Mobileye的全棧黑盒模式已無法滿足大多數(shù)車企的自研需求。此外,區(qū)別于主流CPU架構(gòu)(ARM、X86),Mobileye的EyeQ4芯片采用多MIPS處理器,導(dǎo)致其通用性和可開發(fā)性較差,難以形成良好的軟件生態(tài)。因此近年來,Mobileye智能一體機(jī)方案吸引力開始下降。面對(duì)危機(jī)積極尋變,逐步開放生態(tài),但競(jìng)爭(zhēng)格局遠(yuǎn)較此前激烈。2021年,Mobileye推出EyeQ5芯片,首次提供單芯片(silicon-only)版本,開放SDK、OpenCL環(huán)境和TensorFlow,從而允許客戶部署自研算法,但目前EyeQ5芯片也僅收獲極氪一家定點(diǎn)。自動(dòng)駕駛芯片的競(jìng)爭(zhēng)環(huán)境日益激烈,海內(nèi)外眾多車企正在將平臺(tái)從MobileyeEyeQ系列遷移至英偉達(dá)、地平線、華為、高通等其它玩家。我們認(rèn)為,Mobileye“視覺算法+芯片”的智能前視一體機(jī)方案仍具備高性價(jià)優(yōu)勢(shì),對(duì)自研能力較弱的車企更為友好。但隨著汽車智能化能力逐步提升,后續(xù)能否跟進(jìn)主機(jī)廠快速迭代的需求并進(jìn)一步開放生態(tài),將是Mobileye不掉隊(duì)的關(guān)鍵。

黑芝麻:基于A1000L打造行泊一體方案,獲一汽紅旗下一代FEEA3.0架構(gòu)車型定點(diǎn),但相關(guān)車型規(guī)劃2024年SOP,時(shí)間點(diǎn)上相較地平線和TI不占優(yōu)。公司早在2020年就推出了A1000L芯片,搭載8核ARMCortexA55CPU、ARMGPU、3核高性能DSP、CV加速引擎,以及自研DynamAINN引擎,AI算力達(dá)16TOPS,具備業(yè)內(nèi)領(lǐng)先的功能完整性與計(jì)算性能?;贏1000L芯片打造的DriveSensing解決方案可實(shí)現(xiàn)單SoC芯片的行泊一體方案,支持L2+高速領(lǐng)航NOA、泊車HPA/AVP、3D360環(huán)視全景、多路DVR等功能。2023年5月,公司宣布A1000L獲得一汽紅旗下一代FEEA3.0電子架構(gòu)平臺(tái)項(xiàng)目量產(chǎn)智駕芯片定點(diǎn)。一汽紅旗將基于A1000L打造非分時(shí)復(fù)用的行泊一體自動(dòng)駕駛域控平臺(tái),該平臺(tái)將應(yīng)用于一汽紅旗80%左右的車型,其中一汽紅旗E001和E202兩款車型最快將于2024年量產(chǎn)落地。核心競(jìng)爭(zhēng)力來自兩大自研IP:圖像信號(hào)處理ISP以及神經(jīng)網(wǎng)絡(luò)加速器NPU。ISP負(fù)責(zé)“看得清”,可處理攝像頭采集的每一幀原始圖像數(shù)據(jù);NPU負(fù)責(zé)“看得懂”,通過集成圖像分類、空間分割、特定目標(biāo)分析等多個(gè)功能到單個(gè)神經(jīng)網(wǎng)絡(luò),可實(shí)現(xiàn)結(jié)構(gòu)化剪裁,從而幫助黑芝麻芯片提升神經(jīng)網(wǎng)絡(luò)運(yùn)算能力并降低功耗。

愛芯元智:在智慧城市領(lǐng)域積累了豐富的交付經(jīng)驗(yàn)和完善的工具鏈,有望借此切入小算力智駕芯片市場(chǎng)。愛芯元智成立于2019年,截至目前已成功推出了兩代四顆端側(cè)、邊緣側(cè)AI視覺感知芯片,并實(shí)現(xiàn)大規(guī)模量產(chǎn)供貨。目前愛芯元智的主要下游為智慧城市業(yè)務(wù),例如智慧物聯(lián)領(lǐng)先方案商大華股份就是愛芯元智的重要客戶之一,愛芯元智自主研發(fā)的芯片AX630A和AX620A已作為主控SoC應(yīng)用于大華股份多個(gè)產(chǎn)品線,并獲評(píng)大華股份2021年戰(zhàn)略供應(yīng)商?;谧杂蠭SP與NPU的聯(lián)合架構(gòu)設(shè)計(jì),愛芯元智可大幅提升傳統(tǒng)ISP中多個(gè)關(guān)鍵模塊的性能,實(shí)現(xiàn)高能效比和高算力利用率。目前,公司也開始進(jìn)軍智能駕駛領(lǐng)域,2022年8月參與投資ADAS解決方案商MAXIEYE,后續(xù)二者或有上車合作。我們認(rèn)為,愛芯元智在智慧城市領(lǐng)域積累的量產(chǎn)經(jīng)驗(yàn)和搭建的工具鏈可賦能智駕業(yè)務(wù),尤其是在小算力芯片市場(chǎng),車企將更看重供應(yīng)商的交付能力以及產(chǎn)品的易開發(fā)性。2019至2022年,愛芯元智完成了近20億元的融資,投資方包括美團(tuán)、美團(tuán)龍珠資本、騰訊投資、聯(lián)想之星等互聯(lián)網(wǎng)巨頭,以及啟明創(chuàng)投、GGV紀(jì)源資本、耀途資本等知名機(jī)構(gòu)。

芯馳科技:座艙芯片對(duì)標(biāo)高通,豐富的量產(chǎn)經(jīng)驗(yàn)與車企合作生態(tài)有望助力智駕芯片適配上車,但內(nèi)部資源在不同產(chǎn)品線間的合理化分配是關(guān)鍵。芯馳科技成立于2018年,作為國(guó)內(nèi)少有的“全場(chǎng)景、平臺(tái)化”的芯片和技術(shù)解決方案供應(yīng)商,產(chǎn)品包括域控芯片E3、座艙芯片X9、智駕芯片V9和網(wǎng)關(guān)芯片G9。公司當(dāng)前除智駕芯片外,其余三款芯片已實(shí)現(xiàn)大規(guī)模量產(chǎn)。尤其是在智能座艙芯片領(lǐng)域,公司X9系列座艙芯片能夠在性能上對(duì)標(biāo)高通。我們認(rèn)為,芯馳在座艙芯片積累的量產(chǎn)交付經(jīng)驗(yàn)與產(chǎn)業(yè)鏈生態(tài)建設(shè)有望助力其智駕芯片的滲透,但座艙芯片和智駕芯片在產(chǎn)品架構(gòu)和軟件算法上仍有較大不同,即使是高通目前在智駕領(lǐng)域的進(jìn)展也并不如人意,且作為初創(chuàng)公司,能否在不同產(chǎn)品間合理分配有限的資源目前來看仍待驗(yàn)證。

寒武紀(jì)行歌:母公司寒武紀(jì)豐富的AI芯片技術(shù)積累有望遷移至車端,云邊端一體化統(tǒng)一生態(tài)架構(gòu),有助于構(gòu)建車端推理-云端訓(xùn)練閉環(huán)。寒武紀(jì)行歌成立于2021年,作為寒武紀(jì)控股的子公司,行歌專注于自動(dòng)駕駛芯片研發(fā),目前在研數(shù)款智駕芯片,覆蓋L2-L4:1)已接近量產(chǎn)的SD5223針對(duì)L2+行泊一體方案,具備高能效比,相較于TDA4VM算力提升一倍(16TOPS)。2)基于SD5223,寒武紀(jì)推出低算力低功耗的SD5223C,算力6TOPS,支持8M前視一體機(jī)和自動(dòng)泊車功能,或有望滲透?jìng)鹘y(tǒng)Mobileye占據(jù)的前視一體機(jī)市場(chǎng)。3)公司也表示未來將推出面向L4市場(chǎng)的SD5226,規(guī)劃算力超400TOPS,300K+DMIPS,采用7nm制程,并支持車端訓(xùn)練,亦有望進(jìn)軍中高算力芯片市場(chǎng),但也須留意公司芯片代工或受地緣政治因素影響,從而影響實(shí)際量產(chǎn)時(shí)間。寒武紀(jì)行歌自成立以來,已與經(jīng)緯恒潤(rùn)、一汽等簽訂了自動(dòng)駕駛合作協(xié)議,并累計(jì)獲得了上汽、蔚來、寧德時(shí)代、博世創(chuàng)投等重磅產(chǎn)業(yè)資本加持,待產(chǎn)品技術(shù)打磨成熟,芯片有望快速實(shí)現(xiàn)量產(chǎn)。

中算力芯片:高速領(lǐng)航帶來發(fā)展機(jī)遇,各玩家皆有突圍可能

中算力芯片(30-100TOPS)市場(chǎng)此前相對(duì)空白,以英偉達(dá)Xavier為主。但隨著車企趨于理性,中端車型不再一味參與大算力芯片軍備競(jìng)賽,但同時(shí)又希望實(shí)現(xiàn)較優(yōu)的高速領(lǐng)航功能,中算力芯片需求有所上升。目前來看,英偉達(dá)Xavier和OrinNX/Nano、TITDA4VH以及黑芝麻A1000已瞄準(zhǔn)該市場(chǎng)開始出擊,但同時(shí)也不排除地平線等其他廠商未來推出對(duì)應(yīng)產(chǎn)品以完善產(chǎn)品矩陣的可能性。因此整體而言,我們認(rèn)為,中算力芯片市場(chǎng)的較量才剛剛開始。與小算力和大算力相比,中算力市場(chǎng)或?qū)π酒瑥S商的綜合能力有更高要求,場(chǎng)內(nèi)現(xiàn)有玩家皆有突圍可能。

英偉達(dá):Xavier和OrinNX有望占據(jù)中算力市場(chǎng)較大份額。2020年,英偉達(dá)針對(duì)L2市場(chǎng)發(fā)布Xavier芯片(30TOPS),搭載于小鵬P7/P5等車型;2022年又推出大算力Orin芯片(256TOPS),再次引領(lǐng)行業(yè)占據(jù)主流中高端車型市場(chǎng),是此前所有瞄準(zhǔn)L2+高階輔助駕駛車型的選擇。但隨著行業(yè)回歸理性,Orin對(duì)于大部分20萬-30萬元的中端車型配置或過高,英偉達(dá)也因此通過硬件陸續(xù)推出OrinNX(70/100TOPS)和OrinNano(20/40TOPS),完善自身產(chǎn)品矩陣。鑒于OrinX當(dāng)前已成功上車眾多車型,經(jīng)過量產(chǎn)可靠性驗(yàn)證,我們認(rèn)為,較低配的OrinNX和Nano系列也有望共享同一套英偉達(dá)開發(fā)工具鏈與生態(tài),以切入主流車企的中端車型市場(chǎng)。

黑芝麻:A1000芯片算力58TOPS,精準(zhǔn)填補(bǔ)50-100TOPS芯片市場(chǎng)空缺,我們預(yù)計(jì)2023年上車江淮思皓與領(lǐng)克08。GPU方面,A1000自帶GPU,能夠針對(duì)泊車場(chǎng)景進(jìn)行環(huán)視算法拼接,從而支持單芯片的行泊一體方案,對(duì)比地平線J5需外掛負(fù)責(zé)3D渲染的GPU。CPU方面,A1000搭載八核ARMCortexA55,具備多級(jí)緩存,能夠適應(yīng)大量數(shù)據(jù)的預(yù)處理工作。CV加速方面,A1000包含5核DSP芯片,其中4核可以供客戶進(jìn)行調(diào)用,因此釋放給客戶的CPU資源也更為充裕,對(duì)比J5只含雙核DSP。由于很多算法設(shè)計(jì)需要大量用到CPU性能調(diào)度,因此A1000或更利于客戶靈活開發(fā)部署算法。得益于較高的功能完整性,A1000打造的行泊一體等方案性價(jià)比較高。公司2023年4月宣布將推出BOM成本3000元以內(nèi)的行泊一體域控方案,支持10V配置和50-100TOPS物理算力。

TI:TDA4系列向中算力進(jìn)軍以完善產(chǎn)品矩陣,已與主流Tier1達(dá)成合作。此前行業(yè)眾多Tier1已基于TDA4VM順利開發(fā)面向L2場(chǎng)景的域控,TDA4VM也已成為單SoC輕量級(jí)行泊一體方案的主流選擇之一。TDA4VM由于算力相對(duì)有限(8TOPS),因此實(shí)現(xiàn)的為“分時(shí)復(fù)用”的行泊一體方案,傳感器配置為5V5R或6V5R,而基于單TDA4VH(32TOPS)或TDA4VMPlus(24TOPS)可實(shí)現(xiàn)非分時(shí)復(fù)用行泊一體方案,支持例如10V5R的更高階傳感器方案,以幫助TI進(jìn)一步滲透L2+市場(chǎng)。我們認(rèn)為,得益于TDA4VM在小算力市場(chǎng)的成功,TI不僅積累了豐富的量產(chǎn)經(jīng)驗(yàn),車企也可使用同一套工具鏈以實(shí)現(xiàn)更低的遷移和開發(fā)成本,因此TI在中算力市場(chǎng)亦有一定優(yōu)勢(shì)。當(dāng)前德賽西威、福瑞泰克、百度等廠商已宣布將基于TI中算力SoC開發(fā)域控,其中福瑞泰克ADC30域控基于2顆TDA4VH和3顆地平線J5,公司預(yù)計(jì)2023年量產(chǎn)。

大算力芯片:BEV/Transformer+艙駕一體驅(qū)動(dòng)芯片走向大算力&新架構(gòu)

在“BEV+Transformer”以及“艙駕一體”兩大技術(shù)趨勢(shì)的驅(qū)動(dòng)下,自動(dòng)駕駛芯片開始走向大算力&新架構(gòu)。目前來看,英偉達(dá)和高通走在變革前列,地平線量產(chǎn)進(jìn)度領(lǐng)跑國(guó)內(nèi)市場(chǎng),華為MDC或涅槃歸來,架構(gòu)變化下輝羲智能等國(guó)產(chǎn)廠商亦有突圍機(jī)會(huì)。

趨勢(shì)1:城區(qū)領(lǐng)航年內(nèi)開始上車,“BEV+Transformer”引領(lǐng)自動(dòng)駕駛感知范式。在此趨勢(shì)下,算法復(fù)雜度、數(shù)據(jù)規(guī)模以及模型參數(shù)均呈指數(shù)級(jí)提升,由此對(duì)車載自動(dòng)駕駛芯片的AI算力、數(shù)據(jù)吞吐量與架構(gòu)創(chuàng)新也提出了更高的要求。

小鵬、華為領(lǐng)銜,城區(qū)領(lǐng)航年內(nèi)開始落地。目前,城區(qū)領(lǐng)航尚處發(fā)展早期,小鵬和華為的方案已于2022年9月開始落地,并在逐步拓寬開放區(qū)域。小鵬城市NGP(NavigationGuidedPilot)功能自2022年9月率先于廣州進(jìn)行試點(diǎn),2022年10月于廣州全量推送;2023年3月17日,小鵬宣布城市NGP功能向深圳地區(qū)開放,后又拓展至上海。北汽極狐和長(zhǎng)安阿維塔均選擇HI(HuaweiInside)模式,依靠華為ADS高階自動(dòng)駕駛?cè)珬=鉀Q方案打造城區(qū)NCA功能,分別命名為α-Pilot高階智能駕駛輔助及AVATRANS智能領(lǐng)航系統(tǒng)。極狐城區(qū)NCA已開通深圳、上海及廣州三地,覆蓋車型為極狐阿爾法S全新HI版。阿維塔也于2023年3月9日宣布在上海及深圳開啟城區(qū)NCA(NavigationCruiseAssis)試駕體驗(yàn),覆蓋車型為阿維塔11,廣州、重慶兩地也即將開放體驗(yàn)。除此之外,根據(jù)各公司公告,理想、集度、長(zhǎng)城等車企也計(jì)劃在2023年推出各自的城區(qū)領(lǐng)航功能。

城區(qū)領(lǐng)航被視為L(zhǎng)4級(jí)自動(dòng)駕駛功能在乘用車上的極致演繹,實(shí)現(xiàn)難度和壁壘遠(yuǎn)高于高速領(lǐng)航,當(dāng)前算力需求普遍超200TOPS。盡管在系統(tǒng)訓(xùn)練層面,自動(dòng)駕駛95%的底層架構(gòu)和基礎(chǔ)問題已經(jīng)解決,但最后5%的長(zhǎng)尾問題,也就是cornercases的存在,是制約無人駕駛實(shí)現(xiàn)的最大瓶頸之一。與場(chǎng)景較為規(guī)則、工況較為單一的高速領(lǐng)航相比,城區(qū)領(lǐng)航路口多、變道多、擁堵多,cornercases的數(shù)量和復(fù)雜程度大幅提升,不僅涉及異型車、行人、路障等多類別主體,且存在加塞、“鬼探頭”、前車急停等非規(guī)律行車現(xiàn)象。據(jù)小鵬在2022年1024科技日上的介紹,城市NGP的代碼量是高速NGP的6倍,感知模型的數(shù)據(jù)是高速NGP的4倍,預(yù)測(cè)/規(guī)劃/控制相關(guān)的代碼是高速NGP的88倍。

城區(qū)領(lǐng)航對(duì)自動(dòng)駕駛感知算法提出了更高的要求,“BEV+Transformer”范式粉墨登場(chǎng)。大模型是當(dāng)前AI領(lǐng)域最為火熱的前沿趨勢(shì)之一,可賦能自動(dòng)駕駛領(lǐng)域的感知、標(biāo)注、仿真訓(xùn)練等多個(gè)核心環(huán)節(jié)。在感知層,以特斯拉為首,“BEV+Transformer”范式已開始在自動(dòng)駕駛領(lǐng)域得到廣泛使用,可有效提升感知精確度,利于后續(xù)規(guī)劃控制算法的實(shí)施,促進(jìn)端到端自動(dòng)駕駛框架的發(fā)展。

BEV全稱Bird’sEyeView,即鳥瞰圖,該算法旨在將多傳感器收集的圖像信息投射至統(tǒng)一3D空間,再輸入至單一大模型進(jìn)行整體推理。相較于傳統(tǒng)的攝像頭圖像,BEV提供了一個(gè)更貼近實(shí)際物理世界的統(tǒng)一空間,為后續(xù)的多傳感器融合以及規(guī)劃控制模塊開發(fā)提供了更大的便利和更多的可能。具體來說,BEV感知的優(yōu)勢(shì)在于:

1)統(tǒng)一了多模態(tài)數(shù)據(jù)處理維度,將多個(gè)攝像頭或雷達(dá)數(shù)據(jù)轉(zhuǎn)換至3D視角,再做目標(biāo)檢測(cè)與分割等任務(wù),從而降低感知誤差,并為下游預(yù)測(cè)和規(guī)劃控制模塊提供更豐富的輸出;

2)實(shí)現(xiàn)時(shí)序信息融合,BEV下的3D視角相較于2D信息可有效減少尺度和遮擋問題,甚至可通過先驗(yàn)知識(shí)“腦補(bǔ)”被遮擋的物體,有效提高自動(dòng)駕駛安全性;

3)感知和預(yù)測(cè)可在統(tǒng)一3D空間中實(shí)施,通過神經(jīng)網(wǎng)絡(luò)直接完成端到端優(yōu)化,可有效降低傳統(tǒng)感知任務(wù)中感知與預(yù)測(cè)串行的誤差累積。

Transformer的注意力(Attention)機(jī)制可幫助實(shí)現(xiàn)2D圖像數(shù)據(jù)至3DBEV空間的轉(zhuǎn)化。Transformer是GoogleBrian團(tuán)隊(duì)在2017年提出的神經(jīng)網(wǎng)絡(luò)模型,起初用于機(jī)器翻譯,隨著技術(shù)的發(fā)展開始進(jìn)軍圖像視覺領(lǐng)域,目前已成功涉足分類、檢測(cè)和分割三大圖像問題。據(jù)汽車之心微信公眾號(hào)介紹,傳統(tǒng)CNN模型的原理是通過卷積層構(gòu)造廣義過濾器,從而對(duì)圖像中的元素進(jìn)行不斷地篩選壓縮,因此其感受域一定程度上取決于過濾器的大小和卷積層的數(shù)量。隨著訓(xùn)練數(shù)據(jù)量的增長(zhǎng),CNN模型的收益會(huì)呈現(xiàn)過飽和趨勢(shì)。而Transformer的網(wǎng)絡(luò)結(jié)構(gòu)在嫁接2D圖像和3D空間時(shí)借鑒了人腦的注意力(Attention)機(jī)制,在處理大量信息時(shí)能夠只選擇關(guān)鍵信息處理,以提升神經(jīng)網(wǎng)絡(luò)的效率,因此Transformer的飽和區(qū)間很大,更適宜于大規(guī)模數(shù)據(jù)訓(xùn)練的需求。在自動(dòng)駕駛領(lǐng)域,Transformer相比于傳統(tǒng)CNN,具備更強(qiáng)的序列建模能力和全局信息感知能力,目前已廣泛用于視覺2D圖像數(shù)據(jù)至3D空間的轉(zhuǎn)化。

在“BEV+Transformer”趨勢(shì)下,算法復(fù)雜度、數(shù)據(jù)規(guī)模以及模型參數(shù)均呈指數(shù)級(jí)提升,推動(dòng)自動(dòng)駕駛芯片向著大算力、新架構(gòu)以及存算一體等方向演進(jìn)。

1)大算力:向數(shù)百TOPS算力演進(jìn)。傳統(tǒng)L1/L2輔助駕駛所需處理的數(shù)據(jù)量小且算法模型相對(duì)簡(jiǎn)單,因此以Mobileye為代表的單目視覺+芯片算法強(qiáng)耦合的一體機(jī)方案即可滿足需求。但領(lǐng)航功能作為高階輔助駕駛的代表,需要“更強(qiáng)算力+軟硬件解耦的芯片+域控制器”來滿足海量數(shù)據(jù)處理與后續(xù)持續(xù)OTA迭代的需求。高速領(lǐng)航開始向20萬元以下車型滲透,15-30TOPS可滿足基本需求,但若想要“好用”或需要30-80TOPS。城區(qū)領(lǐng)航的場(chǎng)景復(fù)雜程度和技術(shù)實(shí)現(xiàn)難度更高,目前普遍需要搭載激光雷達(dá),芯片以英偉達(dá)Orin、華為MDC和地平線J5為主,算力配置普遍超200TOPS。而在應(yīng)用“BEV+Transformer”技術(shù)后,多傳感器前融合以及2D至3D空間的轉(zhuǎn)化需要AI芯片具備更強(qiáng)的推理能力,因此也需要比以往更大的算力支撐,包括更高的AI算力、CPU算力和GPU算力。

2)新架構(gòu):加強(qiáng)并行計(jì)算能力和浮點(diǎn)運(yùn)算能力。相較于CNN/RNN,Transformer具有更強(qiáng)的并行計(jì)算能力,可加入時(shí)間序列矢量,其數(shù)據(jù)流特征有顯著差別,浮點(diǎn)矢量矩陣乘法累加運(yùn)算更適合采用BF16精度。Transformer允許數(shù)據(jù)以并行的形式進(jìn)行計(jì)算,且保留了數(shù)據(jù)的全局視角,而CNN/RNN的數(shù)據(jù)流只能以串行方式計(jì)算,不具備數(shù)據(jù)的全局記憶能力。傳統(tǒng)AI推理專用芯片大多針對(duì)CNN/RNN,并行計(jì)算表現(xiàn)不佳,且普遍針對(duì)INT8精度,幾乎不考慮浮點(diǎn)運(yùn)算。因此想要更好適配Transformer算法,就需要將AI推理芯片從硬件層面進(jìn)行完整的架構(gòu)革新,加入專門針對(duì)Transformer的加速器,或使用更強(qiáng)的CPU算力來對(duì)數(shù)據(jù)整形,這對(duì)芯片架構(gòu)、ASIC研發(fā)能力以及成本控制都提出了更高的要求。

3)存算一體:SoC芯片需配置高帶寬存儲(chǔ)器(HBM)或SRAM,并加速向存算一體靠攏,解決大算力下的數(shù)據(jù)吞吐量瓶頸。模型越大,內(nèi)存對(duì)AI加速器就越重要,以頻繁地讀取權(quán)重矩陣或訓(xùn)練好的模型參數(shù)。據(jù)佐思汽研介紹,Transformer中的權(quán)重模型超過1GB,對(duì)比傳統(tǒng)CNN的權(quán)重模型通常不超過20MB。模型參數(shù)越大,就需要更高的帶寬,一次性讀出更多參數(shù)。存算一體可分為近存計(jì)算(PNM)、存內(nèi)處理(PIM)以及存內(nèi)計(jì)算(CIM),存內(nèi)計(jì)算則接近存算一體。當(dāng)前PNM已廣泛用于高性能芯片,即采用HBM堆疊,2.5D封裝,從而與CPU集成,而PIM和CIM仍處在發(fā)展中。以特斯拉FSDSoC為例,其采用總帶寬為68GB/s的8顆LPDDR4內(nèi)存,而集成在NPU中的SRAM可達(dá)到32MBL3緩存,帶寬達(dá)2TB/s,遠(yuǎn)超市面上同類芯片。而據(jù)汽車之心微信公眾號(hào),特斯拉在最新HW4.0上的二代FSDSoC上使用了16顆GDDR6,在內(nèi)存用料上繼續(xù)引領(lǐng)行業(yè)。

趨勢(shì)2:長(zhǎng)期來看,伴隨跨域融合+中央計(jì)算式趨勢(shì),支持“智能駕駛+智能座艙”的艙駕一體多域計(jì)算控制架構(gòu)或成為終局需求,我們預(yù)計(jì)2025年后開始初步量產(chǎn)上車。艙駕一體可有效降低開發(fā)成本和通訊延時(shí)、優(yōu)化算力利用率和功能體驗(yàn),推動(dòng)智能汽車應(yīng)用邁上新的臺(tái)階。高工智能汽車統(tǒng)計(jì),2022年1-10月中國(guó)乘用車前裝同時(shí)標(biāo)配“L2級(jí)輔助駕駛+智能座艙+車聯(lián)網(wǎng)+OTA”的搭載率達(dá)18.01%;且預(yù)測(cè)至2025年同時(shí)標(biāo)配“智能駕駛+智能座艙”的交付車輛有望突破350萬輛。我們總結(jié)艙駕一體的主要優(yōu)勢(shì)在于:

降低成本:物料方面,相比于多SoC方案,單芯片集成度更高、使用物料更少,且共用一套散熱系統(tǒng)帶來散熱成本下降。開發(fā)方面,當(dāng)前智能化的實(shí)現(xiàn)仍需要車企在不同的芯片組合之間進(jìn)行挑選,由此帶來硬件及軟件開發(fā)的多平臺(tái)成本消耗,而使用單SoC可以節(jié)約此類額外的開發(fā)成本和多供應(yīng)商的隱性采購(gòu)管理成本,部分底層軟件的共用也可降低不同平臺(tái)車型的上車速度和軟件開發(fā)成本。

降低通訊延時(shí),優(yōu)化功能體驗(yàn):使用單顆SoC可使艙和駕之間數(shù)據(jù)傳輸從板間通訊變?yōu)槠瑑?nèi)通訊并共享內(nèi)存,從而降低通訊延時(shí),實(shí)現(xiàn)更流暢的艙駕功能。例如英偉達(dá)ThorSoC支持所有顯示器、傳感器集成至單一SoC,極大簡(jiǎn)化了汽車制造的復(fù)雜程序,并有助于傳感器數(shù)據(jù)更及時(shí)充分地復(fù)用,實(shí)現(xiàn)更流暢的汽車智能化功能。

但“艙駕一體”距離真正實(shí)現(xiàn)仍有一定距離,軟硬件技術(shù)和工程化皆面臨挑戰(zhàn)。一方面,座艙和智駕面向的應(yīng)用場(chǎng)景、功能定義、性能邊界不一樣,如若融合在一起,芯片選型、外圍電路設(shè)計(jì)、算力需求重點(diǎn)以及安全等級(jí)要求都不同,因此成本和性能的平衡難度較大。另一方面,當(dāng)前絕大部分廠商受限于軟硬件技術(shù)、對(duì)整體架構(gòu)的理解和供應(yīng)鏈等因素,在技術(shù)上難以實(shí)現(xiàn)單SoC集成座艙和智駕功能。因此當(dāng)前,更多廠商仍采用“多顆SoC+多域控制器”方案。部分廠商已在單個(gè)域控制器中將座艙和智駕SoC部署在不同主板或同一個(gè)主板。例如特斯拉是“中央計(jì)算+區(qū)域控制”理念的最早實(shí)踐者,基于全系統(tǒng)架構(gòu)自研,能夠理清座艙、智駕和整車控制等系統(tǒng)之間的關(guān)聯(lián),并在前期充分預(yù)留接口。早在2019年量產(chǎn)的Model3車型中,中央計(jì)算單元CCM就融合了影音娛樂模塊(座艙)、駕駛輔助系統(tǒng)模塊(智駕)以及車內(nèi)外通信模塊,共用一套液冷系統(tǒng)。但這三個(gè)模塊仍分別部署在不同的PCB板上,各自獨(dú)立運(yùn)行操作系統(tǒng),因此并不算嚴(yán)格意義的艙駕一體核中央集中式架構(gòu)。想要實(shí)現(xiàn)真正的艙駕一體,即單SoC部署在單PCB板,仍需要軟硬件技術(shù)與工程化能力的不斷提升。

我們認(rèn)為,待EE架構(gòu)進(jìn)化到中央集成計(jì)算架構(gòu)階段,且業(yè)內(nèi)逐漸完成底層軟硬件鋪設(shè),艙駕一體或有望在2025年后開始上車,同時(shí)推動(dòng)自動(dòng)駕駛SoC芯片走向以下趨勢(shì):

1)大算力:向上千TOPS演進(jìn),包括CPU算力、GPU算力與AI算力。CPU主要負(fù)責(zé)邏輯運(yùn)算和決策控制,需要同時(shí)負(fù)責(zé)智駕域和座艙域系統(tǒng)調(diào)度、數(shù)據(jù)處理與指令運(yùn)算,隨著艙駕一體化下數(shù)據(jù)處理量增大,CPU需要更大的算力支撐。GPU擅長(zhǎng)圖像渲染、圖形處理以及大規(guī)模并行AI計(jì)算,隨著自動(dòng)駕駛等級(jí)不斷提升、座艙娛樂趨向大屏多屏化以及人機(jī)交互功能逐步強(qiáng)化的背景下,GPU算力需求也將不斷提升。此外,當(dāng)前自動(dòng)駕駛SoC普遍會(huì)在CPU和GPU基礎(chǔ)上搭載AI加速器,例如神經(jīng)網(wǎng)絡(luò)處理器NPU。根據(jù)公司公告,英偉達(dá)Thor和高通SnapdragonRideFlexSoX均規(guī)劃2025年左右量產(chǎn),面向艙駕一體化場(chǎng)景,算力達(dá)2000TOPS。

2)先進(jìn)制程:可能采用Chiplet技術(shù)。要實(shí)現(xiàn)艙駕一體需要高算力支撐(通常超1000TOPS),并需要將功耗控制在合理范圍,自動(dòng)駕駛芯片需要向更先進(jìn)制程方向發(fā)展,從而在相同面積晶圓下放置更多計(jì)算單元,提供額外的算力。當(dāng)前車載AI芯片已下探到5nm,但掌握先進(jìn)工藝的企業(yè)較少,中國(guó)本土廠商還面臨臺(tái)積電產(chǎn)能限制問題。例如地平線J5就仍采用16nm,一方面是使用了功耗/算力比更優(yōu)的ASIC,另一方面或也做了國(guó)產(chǎn)代工的兩手準(zhǔn)備。在此背景下,Chiplet技術(shù)有望成為智駕芯片實(shí)現(xiàn)性能跨越的重要路徑,滿足算力、效率與功耗不斷提升的需求。Chiplet又叫小芯片/芯粒,通過將多個(gè)小芯片與特殊封裝技術(shù)相結(jié)合,構(gòu)成更大的IC。相比于直接生產(chǎn)單SoC,使用小芯片生產(chǎn)有助于提升晶圓面積利用率,且小芯片可以重復(fù)利用,從而降低產(chǎn)品總設(shè)計(jì)和驗(yàn)證成本。此外,采用Chiplet技術(shù)后,各大廠商可以專注于自己的芯粒和IP,省去多余的IP費(fèi)用。小芯粒的流片良率也普遍更高。但需要注意的是,Chiplet技術(shù)仍面臨產(chǎn)業(yè)鏈成熟問題和座艙和智駕融合的工程化難題,當(dāng)前仍處在發(fā)展過程中。而對(duì)于中國(guó)公司,Chiplet技術(shù)中的小芯片仍大量采購(gòu)自海外巨頭,因此國(guó)產(chǎn)替代的邏輯相對(duì)有限。

3)新架構(gòu):分域隔離。座艙和智駕域功能集成在單SoC時(shí),由于兩個(gè)域需求不同,在做硬件資源分配時(shí),既要定義應(yīng)用的優(yōu)先級(jí),又要確保各自有足夠的資源,這對(duì)底層的芯片架構(gòu)提出了更高要求。同時(shí),智駕與座艙域安全等級(jí)不同,所跑的操作系統(tǒng)也不同,需要做好安全隔離,確保不同應(yīng)用的功能安全和信息安全,當(dāng)前座艙娛樂模塊需要達(dá)到ASILA,儀表模塊需要達(dá)到ASILB,而行車模塊需要達(dá)到ASILD,這對(duì)芯片底層的加速器資源如何進(jìn)行有效隔離也是比較大的挑戰(zhàn),同時(shí)艙駕融合需要在操作系統(tǒng)層面做虛擬化技術(shù),也會(huì)帶來額外硬件開銷,但也確保了各域之間功能與信息安全性。

英偉達(dá):基于GPU高技術(shù)壁壘,長(zhǎng)期引領(lǐng)智駕芯片技術(shù)革新。OrinX是當(dāng)前唯一量產(chǎn)且算力超200TOPS的大算力芯片,占據(jù)了主流中高端車型智駕芯片最大市場(chǎng)份額。2022年9月,英偉達(dá)又發(fā)布ThorSoC,算力達(dá)到2000TFLOPS@FP8,面向中央計(jì)算式架構(gòu)設(shè)計(jì),支持云端融合、一芯多用、跨域計(jì)算,被認(rèn)為定義了行業(yè)未來3年的發(fā)展方向,規(guī)劃2025年量產(chǎn),已宣布極氪為首發(fā)車型。針對(duì)BEV+Transformer:英偉達(dá)在HopperGPU架構(gòu)中加入Transformer推理引擎,大幅提升AI運(yùn)算效率。GPU天生適合Transformer模型所需的浮點(diǎn)運(yùn)算以及高帶寬需求,而英偉達(dá)又在Thor的HopperGPU架構(gòu)中加入了Transformer推理引擎,進(jìn)一步提升其AI運(yùn)算效率。該Transformer引擎于2022年已被英偉達(dá)集成于H100訓(xùn)練服務(wù)器中,采用英偉達(dá)HopperTensorCore技術(shù),能夠應(yīng)用FP8和FP16混合精度,以大幅加速Transformer模型的AI計(jì)算,采用FP8的TensorCore運(yùn)算在吞吐量方面是16位運(yùn)算的兩倍。此外,Thor也旨在統(tǒng)一訓(xùn)練和推理端的精度,Transformer引擎在用于推理時(shí),無需進(jìn)行任何數(shù)據(jù)格式轉(zhuǎn)換,能夠以FP8輸出結(jié)果。此前英偉達(dá)、英特爾與ARM三家聯(lián)合推出FP8格式標(biāo)準(zhǔn),當(dāng)前多數(shù)自動(dòng)駕駛模型訓(xùn)練由英偉達(dá)芯片完成,若能夠做到訓(xùn)練與推理端統(tǒng)一使用FP8,則效率和準(zhǔn)確度將大幅超越INT8,因此Thor有望成為英偉達(dá)訓(xùn)練芯片客戶的首選推理端SoC。值得一提的是,英偉達(dá)取消了2021年GTC大會(huì)上所發(fā)布的Atlan,我們認(rèn)為主要原因之一就在于Atlan或沒有考慮Transformer專用引擎且不支持FP8格式。

針對(duì)艙駕一體:英偉達(dá)ThorSoC提出“單芯片解決一切”,算力一騎絕塵,架構(gòu)持續(xù)引領(lǐng)行業(yè)。Thor可以借助NV -C2C技術(shù)整合GraceGPU、HopperGPU與次世代GPU(ARM最新服務(wù)器CPU架構(gòu)V2或波塞冬平臺(tái)),實(shí)現(xiàn)2000TOPS的FP8效能,并支持單SoC實(shí)現(xiàn)座艙與智駕等功能。DRIVEThor能夠進(jìn)行多域計(jì)算,可以將自動(dòng)駕駛、車載信息娛樂等功能劃分為不同任務(wù)區(qū)間,同時(shí)運(yùn)行,互不干擾,并能夠?qū)⑺酗@示器、傳感器計(jì)算需求集中至單SoC。多計(jì)算域隔離能力,可支持時(shí)間關(guān)鍵型的進(jìn)程不間斷同時(shí)運(yùn)行,在單SoC上可以同時(shí)運(yùn)行Linux、QNX和Android,未來主機(jī)廠可以借助Thor隔離特定任務(wù)的能力,告別分布式的電子控制單元,整合全車功能。

高通:立足智能座艙,有望迅速躋身自動(dòng)駕駛第一梯隊(duì)。針對(duì)智能座艙市場(chǎng),高通憑借驍龍SA8155迅速搶占中高端市場(chǎng),SA8295繼續(xù)代表座艙SoC最前沿技術(shù)。而針對(duì)自動(dòng)駕駛市場(chǎng),高通憑借SnapdragonRide自動(dòng)駕駛平臺(tái)以及去年發(fā)布的SnapdragonRideFlexSoC打響進(jìn)軍高性能自動(dòng)駕駛芯片的發(fā)令槍。針對(duì)BEV+Transformer:基于消費(fèi)電子與智能座艙領(lǐng)域積累的芯片開發(fā)經(jīng)驗(yàn),在CPU算力、浮點(diǎn)運(yùn)算能力以及內(nèi)存帶寬上持續(xù)突破,順應(yīng)Transformer上車趨勢(shì)。高通2020年初推出SnapdragonRide自動(dòng)駕駛平臺(tái),配備SA8540PSoC和AI加速器SA9000P,提供若干SoC和ASIC組合的方案,可覆蓋ADAS到L4的算力需求(10-700+TOPS)。據(jù)佐思汽車研究微信公眾號(hào)上發(fā)表的文章《高通自動(dòng)駕駛平臺(tái)SnapdragonRide分析》(周彥武),SnapdragonRide中的SA8540或是驍龍865的車規(guī)版,而S9000或是云端加速芯片CloudAI100的車規(guī)版。驍龍865搭載Adreno650GPU,全面提升16位/32位浮點(diǎn)運(yùn)算能力,并特別加入Hexagon698張量加速器,具備Transformer模型下車端的高效AI推理能力。而CloudAI100則特別針對(duì)AI大模型推理打造,能夠提供400TOPS的算力,峰值性能是Snapdragon855和Snapdragon820的3到50倍,與傳統(tǒng)的FPGA相比推理速度提高約10倍,且在AI推理的每瓦能效上超越英偉達(dá)A100。

地平線:地平線J5是目前唯一規(guī)模化量產(chǎn)的國(guó)產(chǎn)大算力芯片,擁有128TOPS算力,30W低功耗,領(lǐng)先同級(jí)競(jìng)品的1531FPS(真實(shí)計(jì)算性能)以及60ms超低延遲感知能力。基于規(guī)模異構(gòu)近存計(jì)算、高靈活大并發(fā)數(shù)據(jù)橋及脈動(dòng)張量計(jì)算核三大核心技術(shù),J5能以更少內(nèi)存、更高M(jìn)AC利用率執(zhí)行更多任務(wù),將并行計(jì)算發(fā)揮到極致,提升算力有效利用率。這也利于芯片在不堆疊面積和有限功耗下,發(fā)揮最多的實(shí)際AI性能。J5在EfficientNet模型測(cè)試中,F(xiàn)PS指標(biāo)優(yōu)于英偉達(dá)Orin和Xavier。當(dāng)前J5已經(jīng)上車?yán)硐隠7、L8Pro等高端車型,未來有望進(jìn)一步占據(jù)英偉達(dá)Orin市場(chǎng)份額。針對(duì)BEV+Transformer:地平線開發(fā)適配J5的Swin-Transformer結(jié)構(gòu),可更好發(fā)揮J5的算力優(yōu)勢(shì),顯著提升網(wǎng)絡(luò)性能、減少訪存時(shí)間。此外,在3D感知算法領(lǐng)域,地平線參考算法集成了基于Transformer的純視覺BEV模型、基于雷達(dá)點(diǎn)云的3D檢測(cè)模型以及單目3D目標(biāo)檢測(cè)算法。地平線所提供的BEV感知模型集成了目標(biāo)檢測(cè)和語義分割多重任務(wù),可開放支持包括IPM(InversePerspectiveMapping)、Transformer等多種轉(zhuǎn)換方式,基于Transformer大模型,開放提供包括DETR3D、GKT、PETR在內(nèi)的多類感知示例。地平線還于2023年上海車展發(fā)布最新3.0BPU架構(gòu)納什,專為大參數(shù)量Transformer、大規(guī)模交互式博弈設(shè)計(jì),可靈活支持Transformer的細(xì)小算子。

黑芝麻:在功能完整性與性價(jià)比上具備一定優(yōu)勢(shì),相比于部分ASIC路線公司產(chǎn)品,或更能夠適應(yīng)BEV+Transformer新趨勢(shì)。黑芝麻主要瞄準(zhǔn)中高算力市場(chǎng),華山系列A1000、A1000Pro、A2000的算力分別為58、106和256TOPS。此前,黑芝麻A1000的量產(chǎn)進(jìn)程有所延遲,目前有望于今年上車江淮思皓與領(lǐng)克08,正式開啟商業(yè)化之路。針對(duì)BEV+Transformer:黑芝麻自研NPU具有較好兼容性,可兼顧Transformer算法。黑芝麻自研神經(jīng)網(wǎng)絡(luò)加速器NPU以及圖像信號(hào)處理ISP兩大核心IP,使得A1000具備高性能&高能效,能夠做到卷積層平均80%的MAC陣列利用率,有助于客戶在大模型與復(fù)雜算法場(chǎng)景下更高效開發(fā)。輝羲智能:瞄準(zhǔn)BEV+Transformer行業(yè)新趨勢(shì),切入大算力芯片市場(chǎng),有望抓住軟硬件尚未固化的窗口期,實(shí)現(xiàn)彎道超車。公司成立于2022年,創(chuàng)始團(tuán)隊(duì)具備微軟亞洲研究院、百度、商湯、上汽、蔚來以及上海交大等產(chǎn)學(xué)研背景,擁有芯片&自動(dòng)駕駛系統(tǒng)研發(fā)設(shè)計(jì),以及量產(chǎn)適配上車的深厚經(jīng)驗(yàn)積累。公司于2023年2月完成由順為資本和小米聯(lián)合領(lǐng)投的數(shù)億元天使+輪融資。當(dāng)前產(chǎn)品涵蓋車端智能駕駛芯片和計(jì)算平臺(tái)、云端數(shù)據(jù)智能平臺(tái)、城區(qū)NOA和GPT模型應(yīng)用等全棧式解決方案。芯片層面,公司首款產(chǎn)品R1SoC即針對(duì)BEV+Transformer以及艙駕一體新趨勢(shì)進(jìn)行設(shè)計(jì),規(guī)劃算力超260TOPS,有望于2024H1SOP,具備支持BEV+Transformer的最新架構(gòu)。公司主打“數(shù)據(jù)閉環(huán)定義芯片”,基于自研大算力架構(gòu),介于ASIC和GPU之間,因此算法靈活性與通用性較高,能夠在AI算力、CPU/GPU性能、內(nèi)存帶寬以及整體架構(gòu)上支持大模型算法以及跨域計(jì)算等需求。工具鏈&生態(tài)層面,公司積極構(gòu)建工具鏈生態(tài),利于客戶加速向國(guó)產(chǎn)化平臺(tái)遷移。輝羲提供完整工具鏈RhinoRT,做到CUDALike,支持BEV/Transformer算法部署,同時(shí)支持常見的AIstack以及客戶的自定義算子,有利于加速現(xiàn)有英偉達(dá)產(chǎn)品客戶的遷移效率。華為:定位Tier1,多維度賦能車企造車,自研MDC計(jì)算平臺(tái)在架構(gòu)與算力上表現(xiàn)突出。我們認(rèn)為,基于MDC計(jì)算平臺(tái)、通信技術(shù)、大模型積累以及鴻蒙底層生態(tài),華為將持續(xù)引領(lǐng)自動(dòng)駕駛基礎(chǔ)軟硬件行業(yè),但目前仍主要面向智選車生態(tài)合作伙伴,向更廣泛車企拓展的能力仍待觀察。MDC平臺(tái)為自動(dòng)駕駛提供可擴(kuò)展且靈活的算力支持。華為MDC平臺(tái)基于多顆鯤鵬CPU與昇騰AI芯片的SoC組合,推出MDC210、MDC300F、MDC610和MDC810,實(shí)現(xiàn)48TOPS–400+TOPS的算力,覆蓋L2+至L4級(jí)別自動(dòng)駕駛。MDC平臺(tái)遵循平臺(tái)化和標(biāo)準(zhǔn)化原則,能夠以一套軟件架構(gòu),支持不同硬件配置,實(shí)現(xiàn)軟硬件解耦。同時(shí),MDC平臺(tái)充分考慮到感知、決策、規(guī)劃、控制等不同環(huán)節(jié)對(duì)CPU和AI算力的不同需求,由自研鯤鵬SoC提供CPU算力,昇騰SoC提供AI算力。2021年4月,華為宣布MDC810已實(shí)現(xiàn)量產(chǎn),并于2022年正式上車北汽極狐阿爾法SHi版以及長(zhǎng)安阿維塔11,MDC610也于2022年量產(chǎn)上車。

市場(chǎng)空間:中國(guó)自動(dòng)駕駛芯片市場(chǎng)2030年有望超700億元

中短期來看,隨著價(jià)格戰(zhàn)打響,不同價(jià)位車型的智能化方案或有所分化,進(jìn)而產(chǎn)生對(duì)芯片算力和架構(gòu)的不同需求。而長(zhǎng)期來看,智能化滲透率決定需求,中央計(jì)算、大模型等新范式?jīng)Q定技術(shù)路線,量產(chǎn)經(jīng)驗(yàn)、工具鏈、性價(jià)比決定規(guī)模與競(jìng)爭(zhēng)格局。自動(dòng)駕駛芯片將是全產(chǎn)業(yè)鏈格局最為穩(wěn)固、集中度最高的環(huán)節(jié),我們判斷,全球市場(chǎng)4-5家、國(guó)內(nèi)市場(chǎng)3-4家寡頭或有望占據(jù)行業(yè)80%-90%以上的市場(chǎng)份額。同時(shí),我們對(duì)國(guó)內(nèi)市場(chǎng)2022-2030E自動(dòng)駕駛芯片市場(chǎng)規(guī)模進(jìn)行測(cè)算,至2025年有望超100億元,至2030年有望超700億元。我們測(cè)算的核心假設(shè)如下:1)乘用車銷量:我們假設(shè)2023至2030年,中國(guó)乘用車銷量以年平均1%速度增長(zhǎng)。2)功能滲透率:針對(duì)傳統(tǒng)L1/L2功能,我們預(yù)計(jì)未來2-3年將是功能快速規(guī)模放量的階段,分別將于2024和2026年達(dá)到滲透率的最高點(diǎn)(25%/40%),隨后開始逐漸下降,預(yù)計(jì)至2030年分別約3%和30%。針對(duì)NOA功能,我們預(yù)計(jì)高速NOA將于2023年開始加速落地,而城區(qū)NOA今年才正式開始上車,且需要3年左右的時(shí)間實(shí)現(xiàn)“從有到優(yōu)”,因此我們假設(shè)至2025年高速/城區(qū)NOA滲透率將分別達(dá)到15%/1%,至2030年滲透率將分別達(dá)到45%/20%。而L4距離真正落地仍有較遠(yuǎn)距離,我們認(rèn)為Robotaxi大規(guī)模鋪開的前提是前裝量產(chǎn)車型的推出,而目前運(yùn)行的車型仍為后裝改造車。根據(jù)我們進(jìn)行的產(chǎn)業(yè)鏈調(diào)研,頭部L4玩家皆規(guī)劃在2025年前后推出前裝量產(chǎn)車型,屆時(shí)才有可能沖擊萬臺(tái)規(guī)模,因此我們測(cè)算至2025/2030年,L4滲透率將分別約0.05%/2.0%,對(duì)應(yīng)車隊(duì)規(guī)模超1萬和50萬臺(tái)。3)芯片配置:我們假設(shè),傳統(tǒng)L1/L2功能單車配備1/1.5顆小算力自動(dòng)駕駛芯片,高速NOA功能(L2+)單車配備1顆中算力自動(dòng)駕駛芯片,城區(qū)NOA功能(L2++/L3)單車配備2顆大算力芯片,L4/L5等全無人自動(dòng)駕駛單車則需要平均配備4顆大算力芯片。4)芯片單價(jià):L1/L2等級(jí)自動(dòng)駕駛系統(tǒng)通常配備以MobileyeEyeQ3、地平線J2/J3為代表的中低算力芯片,以J2約20-30美元、J3約50美元的價(jià)格測(cè)算,我們假設(shè)L1/L2所配備的自動(dòng)駕駛芯片單顆平均為100/200元。對(duì)于配置高速NOA功能的車型,中算力芯片單價(jià)參考黑芝麻A1000約100美元、英偉達(dá)Xaiver約150美元,我們假設(shè)單顆平均價(jià)格為1000元。對(duì)于配置城區(qū)NOA以及L4/L5功能的車型,我們參考英偉達(dá)OrinX約400美元的單價(jià)測(cè)算,假設(shè)單車配備的芯片平均單顆為2500元。上述價(jià)格皆針對(duì)2022年進(jìn)行假設(shè),而伴隨量產(chǎn)規(guī)模擴(kuò)大,我們認(rèn)為芯片單價(jià)將呈逐步遞減趨勢(shì),且在中低算力芯片上表現(xiàn)更為顯著。