國際洞察:讓自動駕駛汽車成為現(xiàn)實,AI 準備好了嗎?
國際洞察:讓自動駕駛汽車成為現(xiàn)實,AI 準備好了嗎?
來源:Digital Engineering
作者:Tom Kevan
編譯:李兆榮
自動駕駛汽車安全高效地將人員和貨物運送到目的地的現(xiàn)實在很大程度上取決于汽車制造商如何利用AI(人工智能)的力量。AI的影響力已經(jīng)跨越了自動駕駛汽車生命周期的整個領(lǐng)域,突破了設(shè)計、功能和性能的極限,但該行業(yè)要充分利用人工智能的優(yōu)勢并實現(xiàn)全面的駕駛自動化,還有很長的路要走。
自動駕駛汽車可用的感知輸入數(shù)量不斷增加,這為更準確、更詳細地理解運行環(huán)境提供了可能,但這些數(shù)據(jù)仍然無法提供滿足安全要求所需的可見性。要應(yīng)對應(yīng)用的復雜性,并填補在物理力量作用下的信息缺口,將成為自動駕駛技術(shù)進一步發(fā)展的下一個里程碑。
要想了解自動駕駛汽車的想法距離現(xiàn)實有多近,重要的是要了解AI的力量在哪里發(fā)揮作用,以及當前技術(shù)的實際效果如何。要做到這一點,讓我們從研究AI對設(shè)計過程的基本工具和實踐的影響開始。
圖 1:利用 AI,自動駕駛汽車開發(fā)團隊可以使用物理上精確的模擬和 3D 環(huán)境來創(chuàng)建、測試和驗證自動駕駛系統(tǒng)和服務(wù)的設(shè)計。圖片由 NVIDIA 提供。
▍擴展數(shù)據(jù)基礎(chǔ)
AI系統(tǒng)驅(qū)動自動駕駛汽車技術(shù)的基本機制是算法。算法的創(chuàng)建始于收集大量高質(zhì)量、有標簽的物理數(shù)據(jù)。這些數(shù)據(jù)用于訓練、測試和驗證算法。
Nauto工程總監(jiān)Ben Alpert表示:“為了實現(xiàn)穩(wěn)健可靠的AI系統(tǒng),訓練數(shù)據(jù)準確地代表現(xiàn)實世界的豐富性和多樣性是很重要的。例如,數(shù)據(jù)集應(yīng)該代表不同的環(huán)境條件,包括弱光或眩光之類的東西。”
好消息是,該行業(yè)現(xiàn)在有許多 AI 軟件開發(fā)工具,可以收集、標記、索引、存檔和管理訓練 自動駕駛汽車算法所需的數(shù)據(jù)。當前的技術(shù)標簽不僅包括捕獲的圖像和視頻幀中的對象,還包括視頻序列中的場景和條件。
此外,還標記了數(shù)據(jù)收集條件。這提供了一個條件矩陣,工程師可以使用這些條件矩陣來針對各種場景、天氣條件和一天中的時間測試算法的性能。當性能不符合關(guān)鍵性能指標時,工程師會收集和處理更多數(shù)據(jù)以進行驗證。
數(shù)據(jù)處理后,AI 工程師使用標記的數(shù)據(jù)來訓練感知算法和其他自動駕駛功能。這是一個迭代過程,工程師根據(jù)需要調(diào)整算法參數(shù),然后重新訓練算法,此時將下一組標記數(shù)據(jù)添加到訓練集中。此過程一直持續(xù)到達到所需的模型性能和準確性為止。
AI公司正在不斷地改進和擴展這些開發(fā)工具的功能。
NVIDIA 汽車副總裁丹尼·夏皮羅 (Danny Shapiro) 表示:“我們擁有的數(shù)據(jù)越多樣化、越公正,構(gòu)成深度神經(jīng)網(wǎng)絡(luò)等AI系統(tǒng)的算法就越強大、越安全。我們還定義了關(guān)鍵性能指標來衡量收集到的數(shù)據(jù)質(zhì)量,并將合成數(shù)據(jù)添加到我們的訓練數(shù)據(jù)集中。最終目標是不斷添加訓練數(shù)據(jù),以構(gòu)建一個包含位置、條件和場景的綜合矩陣。”
算法訓練數(shù)據(jù)的不斷豐富和細化對于保持自動駕駛技術(shù)發(fā)展和進步的勢頭至關(guān)重要。它還為更復雜的模擬奠定了基礎(chǔ),這是自動駕駛汽車設(shè)計創(chuàng)新的主要推動者之一。
夏皮羅說:“在開發(fā)過程中,必須在各種駕駛條件下對自動駕駛技術(shù)進行一次又一次的評估,以確保這些車輛比人類駕駛的車輛安全得多。模擬在虛擬世界中運行試駕場景,向駕駛堆棧提供渲染的傳感器數(shù)據(jù)并執(zhí)行駕駛命令。重新模擬將之前記錄的傳感器數(shù)據(jù)回放到駕駛堆棧。人工智能模型最終根據(jù)大量且不斷增長的測試數(shù)據(jù)集進行驗證。”
▍將自動駕駛汽車模擬提升到一個新的水平
迄今為止,從感官和操作來源提取的算法訓練數(shù)據(jù)僅用于自動駕駛汽車開發(fā)人員。僅僅提供無人駕駛汽車運行時遇到的所有變量是不夠的。
問題在于,目前的自動駕駛測試車隊不可能遇到訓練自動駕駛汽車安全應(yīng)對現(xiàn)實世界所需的所有罕見和危險的場景和條件。
例如,一個穿著深色衣服的小孩晚上在街上跑出來不是一種可以反復測試的常見場景,但卻是自動駕駛汽車必須能夠安全、正確地做出反應(yīng)的場景。當前的實體車輛測試無法在足夠大的范圍內(nèi)進行驗證。它受限于車隊規(guī)模和測試區(qū)域的地理位置。
然而,隨著AI和計算技術(shù)的不斷發(fā)展,現(xiàn)在可以在部署前通過安全測試和驗證自動駕駛設(shè)計和技術(shù)來填補空白。
夏皮羅說:“NVIDIA DRIVE Sim等高保真、時間準確的模擬平臺提供了一個物理上準確的駕駛環(huán)境數(shù)字雙胞胎,以支持大規(guī)模開發(fā)和驗證自動駕駛汽車,而不會讓其他人在路上受到傷害。與現(xiàn)實世界的試駕相比,這可以提高效率、成本效益,最重要的是安全性。”
使用每個域的專用模型模擬駕駛環(huán)境、交通和車輛行為的能力使自動駕駛汽車測試能夠在沒有腳本的情況下進行。汽車設(shè)計師可以使用仿真來測試邊緣情況并挖掘車輛在現(xiàn)實世界中可能遇到的未知變量。
一旦發(fā)現(xiàn),這些模擬場景可以用于迭代測試自動駕駛汽車,在部署前改進汽車的硬件和軟件。有了這種水平的模擬,自動駕駛汽車制造商可以加快開發(fā),減少寶貴的時間和成本。
然而,先進的技術(shù)帶來了一系列全新的挑戰(zhàn)。通過模擬重建真實世界的駕駛場景和生成真實的數(shù)據(jù)可能耗時且勞動密集,需要熟練的工程師。即便如此,這也可能很困難。
▍綜合真實場景
為了進一步推進自動駕駛,開發(fā)人員已經(jīng)開始使用兩種基于AI的技術(shù),通過生成逼真的合成訓練數(shù)據(jù)和重建真實世界的駕駛場景來增強模擬。
這些技術(shù)中的第一種被稱為虛擬重建。此方法將真實世界場景復制為完全合成的3D場景。這些數(shù)據(jù)可以幫助訓練算法并增強自動駕駛汽車模擬能力。
開發(fā)人員首先將有問題的道路網(wǎng)絡(luò)的數(shù)字雙胞胎轉(zhuǎn)換為可駕駛的模擬環(huán)境,然后工程師使用該環(huán)境來重現(xiàn)事件,例如在施工區(qū)導航。如果出現(xiàn)任何缺口,開發(fā)人員將基于人工智能的交通模型應(yīng)用于被跟蹤對象,以預測其將如何反應(yīng)并填補其軌跡中的缺口。
虛擬重建幫助開發(fā)人員找到具有潛在挑戰(zhàn)性的情況來訓練和驗證自動駕駛系統(tǒng),使用高保真度、傳感器生成的數(shù)據(jù)來增強AI行為模型,工程師可以使用這些模型來創(chuàng)建新的場景。來自場景的數(shù)據(jù)也可以訓練行為模型。
第二種方法稱為神經(jīng)重建,使用人工智能將錄制的視頻數(shù)據(jù)轉(zhuǎn)化為模擬。該過程從記錄的駕駛數(shù)據(jù)開始。AI從這種材料中識別并提取關(guān)鍵的動態(tài)元素,并將其加載到高保真度模擬中,工程師可以根據(jù)需要進行更改。這種方法允許閉環(huán)測試,并在自動駕駛軟件和它所處的世界之間進行充分地交互。
▍深入了解AI
AI 不僅重新定義了自動駕駛汽車的設(shè)計方式,而且在無人駕駛汽車控制和安全等領(lǐng)域發(fā)揮著關(guān)鍵作用。
CerebrumX首席技術(shù)官Sarika Gupta表示:“AI和機器學習使車輛控制系統(tǒng)能夠評估風險并做出預防事故的決策。配備AI技術(shù)的車輛可以分析來自攝像頭、激光雷達和雷達等各種傳感器的數(shù)據(jù),并識別道路上的潛在危險。然后,AI算法可以做出避免這些危險的決定,例如減速或變道。這項技術(shù)有可能大大減少事故數(shù)量。”
雖然風險評估具有巨大潛力,但該技術(shù)也是自動駕駛最大的漏洞之一。
Nauto的Alpert說:“即使是當今最先進的系統(tǒng)也無法在發(fā)生危險情況時提供足夠的警告,因此它們需要人工持續(xù)監(jiān)控情況,并準備好立即接管。”。
開發(fā)人員希望,隨著AI增強仿真的成熟并提供更高的準確性和可見性,控制算法可以提供更安全、更可靠的決策和控制。
▍自動駕駛汽車找到自己的聲音了嗎?
自然語言處理的進步正在進入下一代汽車。這些系統(tǒng)通??梢蕴幚韽碗s的查詢,并允許駕駛員或乘客自然地與車內(nèi)系統(tǒng)進行通信。
但AI技術(shù)與車內(nèi)語音應(yīng)用的匹配并不是一成不變的。如今,自動駕駛開發(fā)者必須決定哪種風格的AI語音最適合無人駕駛汽車。
一種選擇是對話式AI。在當今的數(shù)字助理中可以找到這種技術(shù)的好例子。這是一項更成熟的技術(shù),因此,它已經(jīng)開始開拓自己的利基市場。
Sama產(chǎn)品高級副總裁Duncan Curtis表示:“從技術(shù)準備的角度來看,亞馬遜的Alexa、蘋果的Siri和谷歌的Assistant等車載語音輔助技術(shù)已經(jīng)部署在全球許多車輛上。這些系統(tǒng)是為車內(nèi)體驗精心設(shè)計的。”
圖 2:配備AI風險評估系統(tǒng)的自動駕駛汽車可以分析來自車載和基礎(chǔ)設(shè)施傳感器的數(shù)據(jù),并識別道路上的潛在危險。圖片由 Sama 提供。
另一種選擇,生成式 AI,如ChatGPT,仍處于早期階段。
這種風格的AI專注于開發(fā)無監(jiān)督和半監(jiān)督算法,它能夠從現(xiàn)有數(shù)據(jù)中產(chǎn)生新的內(nèi)容,如文本、音頻、視頻、圖像和代碼。
Alpert說:“生成式AI有潛力實現(xiàn)一系列新的應(yīng)用。這包括顯著改進車內(nèi)語音助理的功能。例如,可以使用語音識別讓導航應(yīng)用程序找到最近的咖啡店。一個基于生成型AI和大型語言模型的更高級助手將能夠回答更復雜、更個性化的問題,比如‘給我找一個洗手間干凈、汽油便宜且繞行時間不會超過 5 分鐘的加油站。’這樣的助手將更善于理解駕駛員的意圖,并提供更豐富的反應(yīng)。”
然而,這些問題繼續(xù)影響生成式AI的可靠性,這些缺陷阻礙了其應(yīng)用的推廣。
Curtis說:“至于ChatGPT和其他生成式AI系統(tǒng),現(xiàn)階段還沒有大規(guī)模部署。我們?nèi)蕴幱诹私馊绾我园踩姆绞皆谲囕v內(nèi)啟用ChatGPT等功能的早期階段。例如,讓它訪問音樂功能很容易,但核心的車輛駕駛和安全功能還有很長的路要走。”
最近推出的第三個選項稱為SoundHound Chat AI for Automotive,它將生成式AI功能與對話式AI的語音助手相結(jié)合,提供了一種車載語音助手。該平臺承諾讓司機及其乘客能夠訪問大量信息域(圖3)。
AI技術(shù)開發(fā)人員認為,他們的系統(tǒng)可以響應(yīng)用戶的復合查詢,例如“搖下窗戶,關(guān)掉空調(diào)”,以及從多個領(lǐng)域獲取知識的復雜查詢,如“打開空調(diào),然后導航到最近的沙龍,在那里我可以修指甲,而且營業(yè)時間超過下午 6 點。”
圖 3:對話式AI可以讓自動駕駛汽車和乘客實時訪問多域信息,并提供支持語音的車內(nèi)控制。圖片由 SoundHound 提供。
SoundHound汽車業(yè)務(wù)發(fā)展總監(jiān)Matt Anderson表示:“通過超越命令和控制技術(shù),并預測駕駛員的需求,先進的語音人工智能使汽車制造商能夠擺脫循序漸進的語音菜單,提供對話式、方便快捷的語音體驗。在簡化車輛“用戶體驗”的整體設(shè)計的同時,現(xiàn)代AI驅(qū)動的語音技術(shù)還減少了硬按鈕和軟按鈕的數(shù)量,提高了系統(tǒng)的整體安全性,同時為制造商騰出了寶貴的空間。”
考慮到可用選項和功能組合,自動駕駛開發(fā)人員在確定標準 AI 方法之前需要一段時間是一個不錯的選擇。
咨詢詳情:如需咨詢文中涉及的相關(guān)產(chǎn)品或解決方案詳情,請加微信:ZiDongHuaX 。
微信聯(lián)盟:人工智能微信群、汽車駕駛自動化微信群、NVIDIA微信群、深度神經(jīng)網(wǎng)絡(luò)微信群,各細分行業(yè)微信群:點擊這里進入。
鴻達安視:水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器 金葉儀器: 氣體/顆粒物/煙塵在線監(jiān)測解決方案
西凱昂:SMC氣動元件、力士樂液壓元件、倍加福光電產(chǎn)品等 山東諾方: 顆粒物傳感器、粉塵濃度傳感器
深圳金瑞銘:RFID射頻識別、智能傳感器等物聯(lián)網(wǎng)解決方案 北京英諾艾智: 容錯服務(wù)器、邊緣計算解決方案
微信聯(lián)盟:人工智能微信群、汽車駕駛自動化微信群、NVIDIA微信群、深度神經(jīng)網(wǎng)絡(luò)微信群,各細分行業(yè)微信群:點擊這里進入。
鴻達安視:水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器 金葉儀器: 氣體/顆粒物/煙塵在線監(jiān)測解決方案
西凱昂:SMC氣動元件、力士樂液壓元件、倍加福光電產(chǎn)品等 山東諾方: 顆粒物傳感器、粉塵濃度傳感器
深圳金瑞銘:RFID射頻識別、智能傳感器等物聯(lián)網(wǎng)解決方案 北京英諾艾智: 容錯服務(wù)器、邊緣計算解決方案
我要收藏
個贊
評論排行