【ZiDongHua 之駕駛自動化收錄關(guān)鍵詞:電動汽車 自動駕駛 大模型 智能駕駛 新能源汽車
  
  2024中國電動汽車百人會丨顧維灝:自動駕駛3.0時代,大模型重塑汽車智能化技術(shù)路線
  
  “以大模型、大算力、大數(shù)據(jù)為代表的自動駕駛3.0時代已經(jīng)到來,這些都是智能汽車新質(zhì)生產(chǎn)力關(guān)鍵要素。毫末將以技術(shù)領(lǐng)先的‘極致性價比’智駕產(chǎn)品,助力車企智能化革命。”
  
  3月17日,毫末智行 CEO 顧維灝受邀出席中國電動汽車百人會論壇(2024),并在現(xiàn)場發(fā)表主題演講《自動駕駛3.0時代,大模型重塑汽車智能化路線》。顧維灝透露,毫末第二代 HPilot 極致性價比無圖 NOH 智駕產(chǎn)品,已陸續(xù)進(jìn)入交付狀態(tài)。
  
  
  
  圖|顧維灝出席中國電動汽車百人會論壇(2024)
  
  本屆中國電動汽車百人會論壇(2024)以“鞏固和擴(kuò)大新能源汽車發(fā)展優(yōu)勢”為主題,3月15日-3月17日在京召開。中國工程院院士鄔賀銓,中國電動汽車百人會副理事長、中國科學(xué)院院士歐陽明高等來自政府主管部門、研究機(jī)構(gòu)、企業(yè)的重磅嘉賓共聚一堂,聚焦產(chǎn)業(yè)變革趨勢,探索產(chǎn)業(yè)發(fā)展新路徑,共同為新能源汽車產(chǎn)業(yè)的繁榮與發(fā)展獻(xiàn)計獻(xiàn)策。
  
  近年來,全球科技競爭日趨激烈,ChatGPT、Sora 的相繼問世,引發(fā)國內(nèi)大模型的涌現(xiàn),智能駕駛也正在成為汽車革命下半場的主角。毫末率先布局大模型、大算力、大數(shù)據(jù)為代表的自動駕駛3.0時代,構(gòu)建智能汽車新質(zhì)生產(chǎn)力,希望用技術(shù)推進(jìn)產(chǎn)業(yè)的進(jìn)步。
  
  顧維灝認(rèn)為,端到端自動駕駛是未來很重要的技術(shù)方向,但還需要幾年的時間才能到來。因此這幾年是從離散到聚集,感知模型、認(rèn)知模型、控制模型聚集到一塊,從分散到聚集的一個過程。
  
  毫末發(fā)布了行業(yè)首個自動駕駛生成式大模型 DriveGPT 雪湖·海若之后,始終在堅定投入大模型技術(shù)的研發(fā)創(chuàng)新,在數(shù)據(jù)的篩選挖掘、自動標(biāo)注、生成仿真以及認(rèn)知可解釋性等方面實(shí)現(xiàn)了顯著的突破和創(chuàng)新。
  
  
  
  顧維灝解釋,相比2.0時代主要采用傳統(tǒng)模塊化框架,3.0時代的技術(shù)框架會發(fā)生顛覆性變化。
  
  首先,自動駕駛會在云端實(shí)現(xiàn)感知大模型和認(rèn)知大模型的能力突破,并將車端各類小模型逐步統(tǒng)一為感知模型和認(rèn)知模型,同時將控制模塊也 AI 模型化。
  
  其次,車端智駕系統(tǒng)的演進(jìn)路線也是一方面會逐步全鏈路模型化,另一方面會逐步大模型化,即小模型逐漸統(tǒng)一到大模型內(nèi)。
  
  第三,云端大模型也可以通過剪枝、蒸餾等方式逐步提升車端的感知能力,在通訊環(huán)境比較好的地方,大模型甚至可以通過車云協(xié)同的方式實(shí)現(xiàn)遠(yuǎn)程控車。
  
  最后,在未來,車端、云端都會是端到端的自動駕駛大模型。
  
  
  
  在感知階段,DriveGPT 首先通過構(gòu)建視覺感知大模型來實(shí)現(xiàn)對真實(shí)物理世界的學(xué)習(xí),將真實(shí)世界建模到三維空間,再加上時序形成 4D 向量空間;然后,在構(gòu)建對真實(shí)物理世界的 4D 感知的基礎(chǔ)上,毫末進(jìn)一步引入開源的圖文多模態(tài)大模型,構(gòu)建更為通用的語義感知大模型,實(shí)現(xiàn)文、圖、視頻多模態(tài)信息的整合,從而完成 4D 向量空間到語義空間的對齊,實(shí)現(xiàn)跟人類一樣的“識別萬物”的能力。
  
  在認(rèn)知階段,基于通用語義感知大模型提供的“萬物識別”能力,DriveGPT  通過構(gòu)建駕駛語言(Drive Language)來描述駕駛環(huán)境和駕駛意圖,再結(jié)合導(dǎo)航引導(dǎo)信息以及自車歷史動作,借助外部大語言模型 LLM 的海量知識來輔助給出駕駛決策。
  
  由于大語言模型已經(jīng)學(xué)習(xí)到并壓縮了人類社會的全部知識,因而也就包含了駕駛相關(guān)知識。毫末經(jīng)過對大語言模型的專門訓(xùn)練和微調(diào),從而讓大語言模型更好地適配自動駕駛?cè)蝿?wù),使得大語言模型能真正看懂駕駛環(huán)境、解釋駕駛行為,做出駕駛決策。
  
  認(rèn)知大模型通過與大語言模型結(jié)合,使得自動駕駛認(rèn)知決策獲得了人類社會的常識和推理能力,也就是獲得了世界知識,從而提升自動駕駛策略的可解釋性和泛化性。
  
  演講中,顧維灝分享了毫末的產(chǎn)品量產(chǎn)成果。目前,毫末已推出七款 HPilot 乘用車智能駕駛極致性價比產(chǎn)品,可滿足高、中、低價位不同車型的量產(chǎn)需求。其中,HP170、HP370、HP570 三款千元級輔助駕駛產(chǎn)品,已陸續(xù)進(jìn)入交付狀態(tài)。截至2024年3月,毫末 HPilot 搭載車輛超過20款,用戶輔助駕駛行駛里程突破1.3億公里。
  
  近日,在全球權(quán)威的自動駕駛 nuScenes 競賽的最新評測中,毫末智行斬獲純視覺 3D 目標(biāo)檢測任務(wù)(nuScenes Detection task)無外部數(shù)據(jù)榜單第一名,并將關(guān)鍵性指標(biāo) nuScenes Detection Score(NDS)提高到68.8%。
  
  今年恰逢中國電動汽車百人會論壇成立十周年,十年來百人會不僅深度參與新能源汽車行業(yè)政策制定,為各方提供重要信息與支持,更見證了行業(yè)的每一次飛躍,成為推動行業(yè)發(fā)展的重要力量。
  
  顧維灝表示:“毫末希望攜手行業(yè)同仁,用最領(lǐng)先的技術(shù)、產(chǎn)品,助力中國和全球汽車產(chǎn)業(yè)的發(fā)展與壯大。”