浪潮信息發(fā)布 "源2.0-M32" 開源大模型，大幅提升模算效率

時(shí)間：2024-06-07 09:28:32 發(fā)布：第一對(duì)焦：浪潮信息

5月28日，浪潮信息發(fā)布"源2.0-M32"開源大模型。"源2.0-M32"在基于"源2.0"系列大模型已有工作基礎(chǔ)上，創(chuàng)新性地提出和采用了"基于注意力機(jī)制的門控網(wǎng)絡(luò)"技術(shù)，構(gòu)建包含32個(gè)專家（Expert）的混合專家模型（MoE），并大幅提升了模型算力效率，模型運(yùn)行時(shí)激活參數(shù)為37億，在業(yè)界主流基準(zhǔn)評(píng)測(cè)中性能全面對(duì)標(biāo)700億參數(shù)的LLaMA3開源大模型。

在算法層面，源2.0-M32提出并采用了一種新型的算法結(jié)構(gòu)：基于注意力機(jī)制的門控網(wǎng)絡(luò)（Attention Router），針對(duì)MoE模型核心的專家調(diào)度策略，這種新的算法結(jié)構(gòu)關(guān)注專家模型之間的協(xié)同性度量，有效解決傳統(tǒng)門控網(wǎng)絡(luò)下，選擇兩個(gè)或多個(gè)專家參與計(jì)算時(shí)關(guān)聯(lián)性缺失的問(wèn)題，使得專家之間協(xié)同處理數(shù)據(jù)的水平大為提升。源2.0-M32采用源2.0-2B為基礎(chǔ)模型設(shè)計(jì)，沿用并融合局部過(guò)濾增強(qiáng)的注意力機(jī)制（LFA, Localized Filtering-based Attention），通過(guò)先學(xué)習(xí)相鄰詞之間的關(guān)聯(lián)性，然后再計(jì)算全局關(guān)聯(lián)性的方法，能夠更好地學(xué)習(xí)到自然語(yǔ)言的局部和全局的語(yǔ)言特征，對(duì)于自然語(yǔ)言的關(guān)聯(lián)語(yǔ)義理解更準(zhǔn)確，進(jìn)而提升了模型精度。

Figure1- 基于注意力機(jī)制的門控網(wǎng)絡(luò)（Attention Router）

在數(shù)據(jù)層面，源2.0-M32基于2萬(wàn)億的token進(jìn)行訓(xùn)練、覆蓋萬(wàn)億量級(jí)的代碼、中英文書籍、百科、論文及合成數(shù)據(jù)。大幅擴(kuò)展代碼數(shù)據(jù)占比至47.5%，從6類最流行的代碼擴(kuò)充至619類，并通過(guò)對(duì)代碼中英文注釋的翻譯，將中文代碼數(shù)據(jù)量增大至1800億token。結(jié)合高效的數(shù)據(jù)清洗流程，滿足大模型訓(xùn)練"豐富性、全面性、高質(zhì)量"的數(shù)據(jù)集需求?；谶@些數(shù)據(jù)的整合和擴(kuò)展，源2.0-M32在代碼生成、代碼理解、代碼推理、數(shù)學(xué)求解等方面有著出色的表現(xiàn)。

在算力層面，源2.0-M32采用了流水并行的方法，綜合運(yùn)用流水線并行+數(shù)據(jù)并行的策略，顯著降低了大模型對(duì)芯片間P2P帶寬的需求，為硬件差異較大訓(xùn)練環(huán)境提供了一種高性能的訓(xùn)練方法。針對(duì)MOE模型的稀疏專家計(jì)算，采用合并矩陣乘法的方法，模算效率得到大幅提升。

基于在算法、數(shù)據(jù)和算力方面全面創(chuàng)新，源2.0-M32的性能得以大幅提升，在多個(gè)業(yè)界主流的評(píng)測(cè)任務(wù)中，展示出了較為先進(jìn)的能力表現(xiàn)，在MATH（數(shù)學(xué)競(jìng)賽）、ARC-C（科學(xué)推理）榜單上超越了擁有700億參數(shù)的LLaMA3大模型。

Figure2 源2.0-M32業(yè)界主流評(píng)測(cè)任務(wù)表現(xiàn)

源2.0-M32大幅提升了模型算力效率，在實(shí)現(xiàn)與業(yè)界領(lǐng)先開源大模型性能相當(dāng)?shù)耐瑫r(shí)，顯著降低了在模型訓(xùn)練、微調(diào)和推理所需的算力開銷。在模型推理運(yùn)行階段，M32處理每token所需算力為7.4GFLOPs，而LLaMA3-70B所需算力為140GFLOPs。在模型微調(diào)訓(xùn)練階段，對(duì)1萬(wàn)條平均長(zhǎng)度為1024 token的樣本進(jìn)行全量微調(diào)，M32消耗算力約0.0026PD(PetaFLOPs/s-day)，而LLaMA3消耗算力約為0.05PD。M32憑借特別優(yōu)化設(shè)計(jì)的模型架構(gòu)，在僅激活37億參數(shù)的情況下，取得了和700億參數(shù)LLaMA3相當(dāng)?shù)男阅芩?，而所消耗算力僅為L(zhǎng)LaMA3的1/19，從而實(shí)現(xiàn)了更高的模算效率。

浪潮信息人工智能首席科學(xué)家吳韶華表示：當(dāng)前業(yè)界大模型在性能不斷提升的同時(shí)，也面臨著所消耗算力大幅攀升的問(wèn)題，對(duì)企業(yè)落地應(yīng)用大模型帶來(lái)了極大的困難和挑戰(zhàn)。源2.0-M32是浪潮信息在大模型領(lǐng)域持續(xù)耕耘的最新探索成果，通過(guò)在算法、數(shù)據(jù)、算力等方面的全面創(chuàng)新，M32不僅可以提供與業(yè)界領(lǐng)先開源大模型相當(dāng)?shù)男阅?，更可以大幅降低大模型所需算力消耗?b>大幅提升的模算效率將為企業(yè)開發(fā)應(yīng)用生成式AI提供模型高性能、算力低門檻的高效路徑。M32開源大模型配合企業(yè)大模型開發(fā)平臺(tái)EPAI（Enterprise Platform of AI），將助力企業(yè)實(shí)現(xiàn)更快的技術(shù)迭代與高效的應(yīng)用落地，為人工智能產(chǎn)業(yè)的發(fā)展提供堅(jiān)實(shí)的底座和成長(zhǎng)的土壤，加速產(chǎn)業(yè)智能化進(jìn)程。

自動(dòng)對(duì)焦：大模型人工智能

咨詢?cè)斍椋?/strong>如需咨詢文中涉及的相關(guān)產(chǎn)品或解決方案詳情，請(qǐng)加微信：ZiDongHuaX 。

微信聯(lián)盟：大模型微信群、人工智能微信群，各細(xì)分行業(yè)微信群：點(diǎn)擊這里進(jìn)入。

鴻達(dá)安視：水文水利在線監(jiān)測(cè)儀器、智慧農(nóng)業(yè)在線監(jiān)測(cè)儀器　　　　　　金葉儀器：氣體/顆粒物/煙塵在線監(jiān)測(cè)解決方案

 西凱昂：SMC氣動(dòng)元件、力士樂(lè)液壓元件、倍加福光電產(chǎn)品等　　　　　山東諾方：顆粒物傳感器、粉塵濃度傳感器

 深圳金瑞銘：RFID射頻識(shí)別、智能傳感器等物聯(lián)網(wǎng)解決方案　　　　　　北京英諾艾智：容錯(cuò)服務(wù)器、邊緣計(jì)算解決方案

評(píng)論排行

自動(dòng)化網(wǎng)誠(chéng)征自動(dòng)化科技賦能高質(zhì)量發(fā)展解決方案(3)

深耕應(yīng)用，兆易創(chuàng)新攜全系產(chǎn)品和行業(yè)解決方案亮相慕尼黑電子展(3)

推好品牌觀察：西門子在滬設(shè)立其中國(guó)首個(gè)智能基礎(chǔ)設(shè)施數(shù)字化賦能中心(2)

黑芝麻智能發(fā)布華山開發(fā)者計(jì)劃高質(zhì)量賦能多元應(yīng)用場(chǎng)景(2)

WOODHEAD通訊卡備品備件：Applicom International PCU1500S7 PCU 1500 S7 V4.5.0(2)

安森美和上能電氣攜手引領(lǐng)可持續(xù)能源應(yīng)用的發(fā)展兩家公司合作開發(fā)高性能儲(chǔ)能和太陽(yáng)能組串式逆變器方案以實(shí)現(xiàn)可持續(xù)的未來(lái)(2)

【6.15-16日】2023第八屆中國(guó)數(shù)字供應(yīng)鏈創(chuàng)新峰會(huì),演講大咖陣容官宣(2)

LS伺服電機(jī)APM-SB02ADK(2)

Kepware 工業(yè)數(shù)據(jù)采集軟件及常見問(wèn)題解答(2)

維視教育大咖年終講：打造智能制造人才培養(yǎng)體系(1)

白鶴灘水電站全部機(jī)組投產(chǎn)發(fā)電世界最大清潔能源走廊全面建成|將為建設(shè)新型能源體系、保障國(guó)家能源安全、實(shí)現(xiàn)“雙碳”目標(biāo)提供有力支撐(1)

推好細(xì)分產(chǎn)業(yè)觀察--物聯(lián)網(wǎng)：2026年中國(guó)物聯(lián)網(wǎng)市場(chǎng)規(guī)模接近3000億美元智慧工廠、智慧城市、智慧電網(wǎng)等將占60%以上(1)

加大在用計(jì)量器具、試驗(yàn)檢測(cè)設(shè)備的自動(dòng)化、數(shù)字化改造力度|市場(chǎng)監(jiān)管總局工業(yè)和信息化部關(guān)于促進(jìn)企業(yè)計(jì)量能力提升的指導(dǎo)意見(1)

全國(guó)首套自動(dòng)化虛擬電廠系統(tǒng)在深圳試運(yùn)行功能匹敵大型電廠，已入選國(guó)際典型案例(1)

自動(dòng)化科技將在鄉(xiāng)村振興工作中大有作為|《關(guān)于做好2023年全面推進(jìn)鄉(xiāng)村振興重點(diǎn)工作的意見》發(fā)布(1)

ECG-E30 邊緣計(jì)算網(wǎng)關(guān)及典型應(yīng)用場(chǎng)景 | 工業(yè)級(jí)嵌入式AI計(jì)算機(jī) ，嵌入式無(wú)風(fēng)扇工業(yè)計(jì)算機(jī)(1)

將充分調(diào)動(dòng)超級(jí)自動(dòng)化各技術(shù)領(lǐng)域?qū)＜屹Y源|中國(guó)信通院“超級(jí)自動(dòng)化平臺(tái)”標(biāo)準(zhǔn)研制工作正在進(jìn)行中(1)

自動(dòng)化網(wǎng)“創(chuàng)新自科文”欄目更名為“創(chuàng)新自化成”(1)

韓國(guó)工控自動(dòng)化-丹陽(yáng)昌達(dá)電器(1)

“TWINHOW 推好”高質(zhì)量發(fā)展 2022年度細(xì)分產(chǎn)業(yè)領(lǐng)域典型應(yīng)用場(chǎng)景中的優(yōu)質(zhì)自動(dòng)化科技解決方案—“金好質(zhì)級(jí)”解決方案測(cè)評(píng)工作啟動(dòng)(0)

我要收藏
個(gè)贊

上一篇：CISILE2024自主創(chuàng)新獎(jiǎng)評(píng)選結(jié)果揭曉，這些儀器獲此殊榮
下一篇：立邦助力中信戴卡供應(yīng)墨西哥市場(chǎng)，加速中國(guó)汽車產(chǎn)業(yè)鏈出海

相關(guān)文章

榮耀再續(xù)！羅地格連續(xù)七年獲《WirtschaftsWoche》全球航空貨運(yùn)站技術(shù)領(lǐng)導(dǎo)者稱號(hào)

SMART Club 智慧的火花｜共同探索數(shù)字化轉(zhuǎn)型的無(wú)限可能

“科創(chuàng)100-新質(zhì)生產(chǎn)力調(diào)研行”走進(jìn)經(jīng)緯恒潤(rùn)

光在科技創(chuàng)始人夏海云帶領(lǐng)團(tuán)隊(duì)獲第三屆“金燧獎(jiǎng)”金獎(jiǎng)

霍尼韋爾發(fā)展供應(yīng)鏈領(lǐng)域新未來(lái)

華為云石冀琳：共創(chuàng)產(chǎn)業(yè)實(shí)際價(jià)值，共赴全面智能化時(shí)代

戴盟引領(lǐng)含觸覺多模態(tài)機(jī)器人操作，邁向下一代具身智能系統(tǒng)

中控技術(shù)榮獲“浙江省工業(yè)大獎(jiǎng)”

科大訊飛獲得2024年世界互聯(lián)網(wǎng)大會(huì)全新設(shè)立的“世界互聯(lián)網(wǎng)大會(huì)杰出貢獻(xiàn)獎(jiǎng)”

藍(lán)普鋒榮獲中國(guó)電氣工業(yè)創(chuàng)新企業(yè)TOP10稱號(hào)！

保隆科技空懸關(guān)鍵技術(shù)創(chuàng)新及產(chǎn)業(yè)化榮獲科學(xué)技術(shù)獎(jiǎng)

陜西水務(wù)發(fā)展集團(tuán)所屬水處理設(shè)備公司與上海威派格公司簽訂戰(zhàn)略合作協(xié)議

驍龍X Elite榮獲2024年“世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)”

霍尼韋爾在第十五屆中國(guó)航展上深化本土合作，共塑未來(lái)航空

激光雷達(dá)市占率全球領(lǐng)先！禾賽科技用10年走通“最艱難的路”

16家華為機(jī)器人概念企業(yè)來(lái)了

ABB多家企業(yè)榮登中國(guó)電氣百?gòu)?qiáng)榜并獲多項(xiàng)殊榮

驕成超聲榮獲株洲中車時(shí)代半導(dǎo)體“聯(lián)合創(chuàng)新獎(jiǎng)”

SW 中國(guó)公司十周年慶典盛大舉行

“2024智能傳感器新銳企業(yè)TOP50榜單”在無(wú)錫發(fā)布