上海交大先進(jìn)體系結(jié)構(gòu)實(shí)驗(yàn)室在電子設(shè)計(jì)自動(dòng)化領(lǐng)域頂會DAC 2024發(fā)表5篇研究成果
【ZiDongHua 之設(shè)計(jì)自動(dòng)化收錄關(guān)鍵詞:電子設(shè)計(jì)自動(dòng)化 自動(dòng)駕駛 虛擬現(xiàn)實(shí) 】
上海交大先進(jìn)體系結(jié)構(gòu)實(shí)驗(yàn)室在電子設(shè)計(jì)自動(dòng)化領(lǐng)域頂會DAC 2024發(fā)表5篇研究成果
近期,電子設(shè)計(jì)自動(dòng)化(EDA)領(lǐng)域頂級會議Design Automation Conference(DAC 2024)揭曉論文錄用榜單,上海交通大學(xué)電子信息與電氣工程學(xué)院計(jì)算機(jī)科學(xué)與工程系先進(jìn)體系結(jié)構(gòu)實(shí)驗(yàn)室5篇論文被該會議收錄。
DAC會議介紹
DAC會議被譽(yù)為EDA界的“奧斯卡”,同時(shí)也是CCF-A類會議,由美國電子協(xié)會(Electronic Design Automation Consortium)主辦,目前已經(jīng)舉辦超過60屆,每年提供近300多場的技術(shù)演講,是EDA領(lǐng)域規(guī)模宏大、影響深遠(yuǎn)、歷史悠久的頂級會議之一。
論文1: 基于莫頓碼的點(diǎn)云神經(jīng)網(wǎng)絡(luò)量化技術(shù)
第一作者:計(jì)算機(jī)系博士研究生劉學(xué)淵
通訊作者:計(jì)算機(jī)系助理研究員宋卓然
點(diǎn)云是3維空間中一組無序點(diǎn)的集合,常被用于捕捉真實(shí)世界中物體的幾何和屬性等信息,在自動(dòng)駕駛、虛擬現(xiàn)實(shí)等場景中扮演著十分重要的角色。然而,點(diǎn)云具有數(shù)據(jù)規(guī)模大、無序、特征維度高等特點(diǎn),給點(diǎn)云處理應(yīng)用的開發(fā)和部署帶來了巨大挑戰(zhàn),其中不乏涉及高實(shí)時(shí)性、安全攸關(guān)的場景,而由此帶來的運(yùn)算和存儲開銷顯然難以滿足這些場景的需求。為了解決上述挑戰(zhàn),本文提出一套基于莫頓編碼的細(xì)粒度混合精度量化算法及加速器架構(gòu)。論文首次嘗試對3D空間中的點(diǎn)云數(shù)據(jù)進(jìn)行兩級混合精度量化,使用莫頓編碼捕獲點(diǎn)的空間局部性,從而消除了點(diǎn)云無序性帶來的弊端。此外,論文還設(shè)計(jì)了一個(gè)加速器架構(gòu),它不僅硬化了上述算法設(shè)計(jì),還有效地將莫頓編碼通路和關(guān)鍵路徑上的操作并行起來,從而掩蓋了新增操作的執(zhí)行時(shí)間,顯著提升了點(diǎn)云神經(jīng)網(wǎng)絡(luò)的執(zhí)行性能。論文在7個(gè)具有代表性的點(diǎn)云神經(jīng)網(wǎng)絡(luò)模型、4個(gè)被廣泛使用的點(diǎn)云數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),取得了對比此前最新研究最高3.8倍的加速和高達(dá)5.2倍的能效提升。
論文2: 面向視頻Transformer模型的專用加速器
第一作者:計(jì)算機(jī)系博士研究生王旭航
通訊作者:計(jì)算機(jī)系助理研究員宋卓然
目前,基于注意力機(jī)制的模型在視頻理解任務(wù)中取得了非凡的結(jié)果,然而面向視頻的模型展現(xiàn)出高精度的性能是以大量的計(jì)算開銷為代價(jià)。為了提高模型的性能,本文從算法,數(shù)據(jù)流以及硬件架構(gòu)三個(gè)方面切入。首先,在算法層面,基于同一視頻不同幀的輸入特征之間具有大量相似性這一觀察,論文設(shè)計(jì)了一套稀疏算法發(fā)掘并且去除特征間的冗余計(jì)算;在數(shù)據(jù)流方面,本文通過將關(guān)鍵特征和稀疏的非關(guān)鍵特征沿時(shí)域維度拼接,將稀疏計(jì)算轉(zhuǎn)化稠密張量計(jì)算,避免了設(shè)計(jì)硬件架構(gòu)時(shí)為支持稀疏計(jì)算而引入的額外開銷;在硬件架構(gòu)方面,論文對傳統(tǒng)的空間硬件架構(gòu)的計(jì)算引擎進(jìn)行修改使其支持?jǐn)?shù)據(jù)流中需要的向量-標(biāo)量運(yùn)算,并建立專用硬件以較低的開銷實(shí)時(shí)執(zhí)行稀疏算法和拼接關(guān)鍵特征和非關(guān)鍵特征。從實(shí)驗(yàn)結(jié)果看,與CPU、GPU,以及兩個(gè)先進(jìn)的Transformer加速器相比,本文可取得高達(dá)81倍的性能收益。
論文3: 基于時(shí)空相似性的LLM大語言模型加速技術(shù)
第一作者:計(jì)算機(jī)系助理研究員宋卓然
通訊作者:計(jì)算機(jī)系教授梁曉峣
近年來,大語言模型取得了顯著的效果,包括ChatGPT在內(nèi)的多種應(yīng)用應(yīng)運(yùn)而生,但將模型在端側(cè)部署時(shí)模型的計(jì)算開銷通常難以接受。為了提高模型性能,本文提出了一套基于時(shí)域-空域相似性的Attention加速框架。該框架觀察到同批次輸入的多句話之間可能存在較強(qiáng)的關(guān)聯(lián)性,因此試圖挖掘句子與句子之間的優(yōu)化機(jī)會。本文通過在線+離線的預(yù)測機(jī)制,動(dòng)態(tài)地識別模型運(yùn)行過程中的重復(fù)計(jì)算,并通過復(fù)制-粘貼的輕量級恢復(fù)機(jī)制獲得該詞語的特征結(jié)果,從而在保證算法精度的前提下取得性能收益;另外該論文在架構(gòu)層面以分塊方法保證預(yù)測與模型執(zhí)行的過程可以流水化起來,從而掩蓋預(yù)測的開銷。經(jīng)過大量實(shí)驗(yàn)表明,與多個(gè)大語言模型專用加速器相比,本文可取得高達(dá)8.5倍的加速。
論文4:通過硬件友好的索引對編碼加速深度神經(jīng)網(wǎng)絡(luò)
第一作者:計(jì)算機(jī)系助理研究員劉方鑫、博士研究生楊寧
通訊作者:計(jì)算機(jī)系副教授蔣力
深度神經(jīng)網(wǎng)絡(luò)推理消耗了大量的計(jì)算和存儲資源,而數(shù)據(jù)量化是一種有效減少神經(jīng)網(wǎng)絡(luò)計(jì)算和內(nèi)存開銷的技術(shù)。然而,現(xiàn)有的量化方法大多依賴于固定長度的數(shù)據(jù)格式,使得需要更多位寬來維持模型的準(zhǔn)確度,且異常值的存在使得現(xiàn)有的量化方法難以同時(shí)對激活(動(dòng)態(tài))和權(quán)重(靜態(tài))有效,尤其是在Transformer類模型中。相比之下,可變長度量化同時(shí)考慮了異常值需求的高精度和對正常值的低精度,提供了算法上的優(yōu)勢。但由于變長編碼和解碼引入了顯著的硬件開銷,實(shí)際收益無法難以達(dá)到理論收益。本文提出了一種算法/架構(gòu)協(xié)同設(shè)計(jì)的解決方案,通過引入索引對量化,并以低硬件開銷和高性能增益處理全局異常值。該方案的核心在于識別與重要值相關(guān)的數(shù)據(jù)特征,將它們編碼為索引,并預(yù)先計(jì)算相應(yīng)的結(jié)果,以便在查找表中存儲。而在推理過程中,計(jì)算結(jié)果可以直接根據(jù)索引從表中檢索,從而消除了此過程復(fù)雜的計(jì)算開銷。此外,我們設(shè)計(jì)了一個(gè)統(tǒng)一的處理單元架構(gòu),使得它可以與現(xiàn)有神經(jīng)網(wǎng)絡(luò)加速器架構(gòu)無縫集成。實(shí)驗(yàn)結(jié)果表明,本方案的加速器在模型精度近乎無損的同時(shí),可以實(shí)現(xiàn)9.31倍加速和81.3%的能量減少。
論文5:耗能驅(qū)動(dòng)的脈沖神經(jīng)網(wǎng)絡(luò)攻擊框架
第一作者:計(jì)算機(jī)系助理研究員劉方鑫、博士研究生楊寧
通訊作者:計(jì)算機(jī)系副教授蔣力
脈沖神經(jīng)網(wǎng)絡(luò)(SNNs)作為傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的高能效替代方案正在嶄露頭角。SNN的事件驅(qū)動(dòng)信息處理方案顯著降低了計(jì)算需求,同時(shí)保持了競爭性能。然而,隨著SNNs在邊緣設(shè)備上的部署越來越多,各種安全問題也逐漸浮現(xiàn)。雖然已經(jīng)有如此大量的研究工作致力于解決源自惡意輸入的安全漏洞,但SNN參數(shù)的安全性仍亟待探索。本文觀察到SNN實(shí)現(xiàn)中的能量消耗與脈沖活動(dòng)密切相關(guān),因此設(shè)計(jì)了一種針對SNNs的新型攻擊方法,稱為能量導(dǎo)向的SNN攻擊框架,旨在通過惡意操縱存儲了神經(jīng)元信息的DRAM中的二進(jìn)制位來增加其能耗。該框架采用了嵌入式攻擊中主流的行錘攻擊(Row Hammer)來翻轉(zhuǎn)二進(jìn)制位。為了減少被發(fā)覺的可能性,通過識別SNN中基于脈沖活動(dòng)的最強(qiáng)大神經(jīng)元,并盡可能減少比特翻轉(zhuǎn)來實(shí)現(xiàn)此目標(biāo)。進(jìn)一步,該采用了脈沖活動(dòng)分析和漸進(jìn)搜索策略的組合來確定位翻轉(zhuǎn)攻擊的目標(biāo)神經(jīng)元,其主要目標(biāo)是在確保準(zhǔn)確性不受影響的情況下逐步增加SNN的能耗。經(jīng)過實(shí)驗(yàn),通過本文攻擊框架的實(shí)施成功對SNNs的攻擊可能導(dǎo)致平均能耗增加43%,而準(zhǔn)確性不會受到影響。
來源:上海交通大學(xué)
咨詢詳情:如需咨詢文中涉及的相關(guān)產(chǎn)品或解決方案詳情,請加微信:ZiDongHuaX 。
微信聯(lián)盟:自動(dòng)駕駛微信群、虛擬現(xiàn)實(shí)微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器 金葉儀器: 氣體/顆粒物/煙塵在線監(jiān)測解決方案
西凱昂:SMC氣動(dòng)元件、力士樂液壓元件、倍加福光電產(chǎn)品等 山東諾方: 顆粒物傳感器、粉塵濃度傳感器
深圳金瑞銘:RFID射頻識別、智能傳感器等物聯(lián)網(wǎng)解決方案 北京英諾艾智: 容錯(cuò)服務(wù)器、邊緣計(jì)算解決方案
微信聯(lián)盟:自動(dòng)駕駛微信群、虛擬現(xiàn)實(shí)微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器 金葉儀器: 氣體/顆粒物/煙塵在線監(jiān)測解決方案
西凱昂:SMC氣動(dòng)元件、力士樂液壓元件、倍加福光電產(chǎn)品等 山東諾方: 顆粒物傳感器、粉塵濃度傳感器
深圳金瑞銘:RFID射頻識別、智能傳感器等物聯(lián)網(wǎng)解決方案 北京英諾艾智: 容錯(cuò)服務(wù)器、邊緣計(jì)算解決方案
我要收藏
個(gè)贊
評論排行