【ZiDongHua 之汽車駕駛自動(dòng)化收錄關(guān)鍵詞:自動(dòng)駕駛 多模態(tài)系統(tǒng)融合 北京航空航天大學(xué) 田大新 激光雷達(dá) 毫米波雷達(dá) 世界智能大會(huì) 智能網(wǎng)聯(lián)汽車 高質(zhì)量發(fā)展 】
 
 
  頭條|田大新:多模態(tài)系統(tǒng)融合助力自動(dòng)駕駛技術(shù)落地
 
 
在第七屆世界智能大會(huì)-智能網(wǎng)聯(lián)汽車高質(zhì)量發(fā)展論壇上,北京航空航天大學(xué)交通科學(xué)與工程學(xué)院副院長(zhǎng)田大新發(fā)表了題為《自動(dòng)駕駛關(guān)鍵技術(shù)》主旨報(bào)告。
 
  他指出,目前自動(dòng)駕駛已經(jīng)成為技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展的熱點(diǎn),拉動(dòng)了很多行業(yè)和產(chǎn)業(yè)鏈的協(xié)同發(fā)展。當(dāng)前,世界各國(guó)都在這個(gè)領(lǐng)域進(jìn)行了廣泛布局,設(shè)立了各種國(guó)家級(jí)的行政計(jì)劃和項(xiàng)目。
 
  自動(dòng)駕駛技術(shù)涉及四大模塊
 
  《汽車駕駛自動(dòng)化分級(jí)》將自動(dòng)駕駛分為五級(jí),L0是最低等級(jí),命名為人類駕駛,和自動(dòng)駕駛完全不沾邊。L1為輔助駕駛,正在體現(xiàn)技術(shù)創(chuàng)新還是在L2、L3階段,特定場(chǎng)景、特殊環(huán)境下的L4、L5則還需要很長(zhǎng)的時(shí)間才能夠?qū)崿F(xiàn)。作為科研人員和技術(shù)研究者以及產(chǎn)業(yè)創(chuàng)新將突破L3作為當(dāng)前的重要目標(biāo)。
 
  
 
  田大新認(rèn)為,實(shí)現(xiàn)上述目標(biāo),剖析一下自動(dòng)駕駛涉及的關(guān)鍵組成部分或者關(guān)鍵的技術(shù)可以分為四大類:其中環(huán)境感知是基礎(chǔ),它替代的是我們?nèi)搜鄣挠^察、聽覺(jué)、觸覺(jué),這是感知層面。有了感知后涉及路徑規(guī)劃,決定了車輛按照哪條路線走,以及行為的決策。最后實(shí)現(xiàn)真正的行駛離不開機(jī)械的自動(dòng)控制,也就是運(yùn)動(dòng)控制模塊。實(shí)現(xiàn)完整的自動(dòng)駕駛,這四類技術(shù)缺一不可。
 
  在環(huán)境感知層面,主要運(yùn)用攝像頭、激光雷達(dá)等感知元件。除了特斯拉堅(jiān)持僅采用攝像頭為感知方案外,現(xiàn)在通用的自動(dòng)駕駛感知模塊還是依靠激光雷達(dá)+攝像頭的組合方案。
 
  如何將圖像和雷達(dá)進(jìn)行融合,是當(dāng)前學(xué)術(shù)的前沿?zé)狳c(diǎn),這稱作跨模態(tài)感知。“我們知道圖像有它的特點(diǎn),直觀反映出它的原貌,有點(diǎn)兒類似人的眼睛。在雨霧遮擋等惡劣的環(huán)境下會(huì)受限,光線遮擋 后無(wú)法識(shí)別。但是雷達(dá)卻可以不受 惡劣環(huán)境影響,把周邊環(huán)境識(shí)別出來(lái)。”田大新談道,多模態(tài)的信息融合能夠增強(qiáng)自動(dòng)駕駛技術(shù)應(yīng)對(duì)復(fù)雜多變場(chǎng)景的能力,它的感知準(zhǔn)確性以及魯棒性增強(qiáng),業(yè)界都在持續(xù)進(jìn)行相關(guān)領(lǐng)域的探索。
 
  除了基礎(chǔ)模塊層面,從體系架構(gòu)方面也在探索。田大新指出,單車感知方案雖然可以做到眼觀六路,但是無(wú)法預(yù)料未知路段和環(huán)境,這就需要車路協(xié)同感知。將路側(cè)的感知信息傳遞給車輛,便于駕駛員及時(shí)了解前方的交通狀況,為決策模塊提供很好的支撐。
 
  “車路協(xié)同感知為車輛提供預(yù)判信息,讓自動(dòng)駕駛技術(shù)越來(lái)越完善。單車智能+車路協(xié)同,使自動(dòng)駕駛技術(shù)水平提升了很大一個(gè)量級(jí)。”田大新表示。
 
  在路徑規(guī)劃層面,根據(jù)道路的情況,生成路徑,控制車速,最后形成最優(yōu)的目標(biāo)路線,這是路徑規(guī)劃方面通用的處理流程。但車輛在道路上行駛,會(huì)受到多重因素的影響,加上中國(guó)的道路情況復(fù)雜多變,僅靠單車智能的挑戰(zhàn)非常大,需要提前做好多車協(xié)同規(guī)劃。
 
  在行為決策層面,現(xiàn)在非?;鸬氖菣C(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、規(guī)則學(xué)習(xí)以及諸如ChatGPT的大模型等。自動(dòng)駕駛的技術(shù)是不斷學(xué)習(xí)的過(guò)程,怎樣用擬人化的學(xué)習(xí)過(guò)程最終實(shí)現(xiàn)控制車輛,做出正確的操作,這是最終決策的過(guò)程。
 
  “現(xiàn)在非常熱的深度強(qiáng)化學(xué)習(xí),針對(duì)自動(dòng)駕駛有相應(yīng)的動(dòng)作和激勵(lì)來(lái)訓(xùn)練模型。自動(dòng)駕駛有一個(gè)問(wèn)題叫做長(zhǎng)尾效應(yīng),涉及的問(wèn)題和場(chǎng)景非常多,比如馬路上突然飄來(lái)白色塑料袋,一個(gè)小動(dòng)物突然穿行馬路等,在平時(shí)的訓(xùn)練過(guò)程中很難窮盡。而通過(guò)仿真系統(tǒng)生成大量場(chǎng)景,訓(xùn)練行為的測(cè)算,使得機(jī)器在短時(shí)間內(nèi)能夠快速迭代,實(shí)現(xiàn)擬人化,未來(lái)可能會(huì)超過(guò)人的駕駛性能學(xué)習(xí)的模型算法。”田大新進(jìn)一步介紹道。
 
  此外,他還提到,自動(dòng)駕駛技術(shù)要具體落到車的機(jī)械操縱上,涉及和傳統(tǒng)的機(jī)械設(shè)置、PID控制、閉環(huán)控制、MPC控制器來(lái)做運(yùn)動(dòng)控制的整體算法,這是一整套的控制體系。
 
  探索多模態(tài)融合系統(tǒng)
 
  “圍繞自動(dòng)駕駛從感知、規(guī)劃和決策方面,我們的團(tuán)隊(duì)開展了一系列的研究,針對(duì)融合感知跨模態(tài),提出了輕量化自注意力特征融合模塊,最終是一個(gè)優(yōu)化目標(biāo)回歸和分類損失函數(shù)的計(jì)算。相關(guān)論文也發(fā)表在這個(gè)領(lǐng)域最權(quán)威的期刊,識(shí)別精度得到了最大提升。”田大新表示。
 
  
 
  他進(jìn)一步補(bǔ)充道,在針對(duì)不同的自注意力特征融合和視覺(jué)感知融合,以及不同的天氣光照條件下,團(tuán)隊(duì)的研究成果使整個(gè)識(shí)別的準(zhǔn)確率和精度均得到較大提升,同時(shí)構(gòu)建了點(diǎn)云的語(yǔ)義增強(qiáng)模塊,使生成的效果像圖像一樣直觀,對(duì)駕駛員進(jìn)行提醒。“就像現(xiàn)在四周遍布無(wú)線電波,手機(jī)可以借助無(wú)線信號(hào)傳輸一樣,看不見摸不著,點(diǎn)云也是這樣的,需要多模態(tài)跨模態(tài)間的融合。”
 
  不僅如此,在探索輕量級(jí)的動(dòng)態(tài)濾波和動(dòng)態(tài)融合模塊方面,團(tuán)隊(duì)研究對(duì)三維距離的交并比目標(biāo)函數(shù)進(jìn)行優(yōu)化,目前在人工智能領(lǐng)域最權(quán)威的期刊發(fā)表。
 
  田大新表示,不是靠單車感知,要形成多車感知,每個(gè)車的感知范圍有限,多個(gè)車分布的信息整合,類似基本數(shù)學(xué)做并集,還要去除冗余,彌補(bǔ)缺失,最終形成宏觀全局的態(tài)勢(shì)感知,這是目前團(tuán)隊(duì)在做的創(chuàng)新性工作,相關(guān)成果也正在預(yù)發(fā)表階段。另外,在多車協(xié)同時(shí)空融合算法以及多目標(biāo)感知方面,團(tuán)隊(duì)也進(jìn)行了一些探索性的工作。
 
  與此同時(shí),在控制決策方面,需要重點(diǎn)考慮不同場(chǎng)景下的多車協(xié)同編隊(duì)換道算法,縱向編隊(duì)多車協(xié)同換道以及基于不確定多車協(xié)同的換道。“特別是在十字路口特殊場(chǎng)景下,自動(dòng)駕駛車輛最難的挑戰(zhàn),是不敢過(guò)十字路口,對(duì)向的車總覺(jué)得危險(xiǎn),不像人在駕駛時(shí)覺(jué)得這個(gè)空隙可以穿過(guò)去,自動(dòng)駕駛車輛對(duì)這個(gè)場(chǎng)景的預(yù)判還是非常有挑戰(zhàn)的。”田大新補(bǔ)充道。