近日,浪潮信息與四川省天府云數(shù)據(jù)科技有限責(zé)任公司(簡稱能投天府云)聯(lián)合發(fā)布國內(nèi)首款42kW智算風(fēng)冷算力倉,單機(jī)柜可部署AI服務(wù)器的數(shù)量是傳統(tǒng)風(fēng)冷機(jī)柜的6倍以上,實(shí)現(xiàn)業(yè)界風(fēng)冷單機(jī)柜功率密度從3~7kW到超高密度42kW的躍升,在提升算力密度的同時(shí)降低能耗,相比傳統(tǒng)風(fēng)冷數(shù)據(jù)中心整體節(jié)能25%以上,是目前最佳的且經(jīng)過大規(guī)模實(shí)踐驗(yàn)證的高密風(fēng)冷智算中心建設(shè)解決方案。

42kW智算風(fēng)冷算力倉以AI算力為核心,是為AI服務(wù)器量身定制的支持高算力密度部署的新一代智算基礎(chǔ)設(shè)施,兼容國內(nèi)外主流的CPU和異構(gòu)加速芯片,集計(jì)算/存儲(chǔ)/網(wǎng)絡(luò)于一體,高效融合機(jī)柜、配電、UPS、空調(diào)、監(jiān)控、消防等系統(tǒng),基于標(biāo)準(zhǔn)化、去工程化、運(yùn)行效率最優(yōu)化、管理智能化等原則設(shè)計(jì),可以支撐自動(dòng)駕駛、生物制藥、AIGC、智能制造等多場景應(yīng)用。

步入AI時(shí)代,智算中心建設(shè)面臨兼顧"高密低耗"新挑戰(zhàn)

在新一輪科技浪潮的推動(dòng)下,人工智能產(chǎn)業(yè)正蓬勃發(fā)展。2023年我國人工智能核心產(chǎn)業(yè)規(guī)模超5000億元,增速13.9%,相關(guān)企業(yè)數(shù)量超4000家。而隨著人工智能技術(shù)持續(xù)突破,智能時(shí)代加速到來,數(shù)據(jù)中心機(jī)柜功耗及功率密度急劇攀升。在過去十年,CPU 熱設(shè)計(jì)功耗(TDP)幾乎翻了一番,而GPU熱設(shè)計(jì)功耗已從2008年的不足200W增長到現(xiàn)在的1000W,同時(shí)全球數(shù)據(jù)中心單機(jī)柜功率也隨之快速增長,預(yù)計(jì)到2025年平均功率將達(dá)到25kW。

面對(duì)AI算力需求爆發(fā),高功耗芯片、高功率AI服務(wù)器及單機(jī)柜功率密度的發(fā)展,大規(guī)模、高密度、低能耗無疑是下一代智算中心的主要演進(jìn)方向。然而,提升算力密度與降低能耗往往存在矛盾,幾乎是不可能同時(shí)完成的任務(wù),如何使二者由"非此即彼"的關(guān)系轉(zhuǎn)化為"攜手并進(jìn)",滿足"既要又要"的需求,已成為AI時(shí)代智算中心建設(shè)的核心挑戰(zhàn)。

傳統(tǒng)數(shù)據(jù)中心單機(jī)柜功率多為3~7kW,1臺(tái)AI服務(wù)器需要占用兩個(gè)機(jī)柜的電力和散熱資源,機(jī)柜資源、機(jī)房空間嚴(yán)重浪費(fèi),機(jī)房需要實(shí)現(xiàn)更高算力密度的部署,并解決隨之而來的如何在有限空間內(nèi)實(shí)現(xiàn)高效散熱的問題。

單純以技術(shù)指標(biāo)的角度看,全面采用液冷散熱似乎是高密度智算中心節(jié)能減碳的不二之選,但現(xiàn)實(shí)狀況更加復(fù)雜,需要綜合考慮既有設(shè)備投資的維護(hù)、業(yè)務(wù)快速上線等限制與要求。例如當(dāng)傳統(tǒng)機(jī)房單柜功率低、網(wǎng)絡(luò)及場地環(huán)境差,改造復(fù)雜,難以滿足智算中心快速建設(shè)和算力服務(wù)快速上線的需求,或當(dāng)因場地限制不具備液冷部署條件時(shí),如何實(shí)現(xiàn)高密風(fēng)冷智算中心的高效散熱、節(jié)能降碳是我們亟需解決的難題。

42kW智算風(fēng)冷算力倉發(fā)布,為AI而生的高密風(fēng)冷智算中心建設(shè)方案

為解決智算中心建設(shè)高密度部署、高功率散熱"兩手抓,兩手都要硬"的問題,能投天府云和浪潮信息創(chuàng)新開發(fā)42kW智算風(fēng)冷算力倉,單機(jī)柜可部署AI服務(wù)器的數(shù)量是傳統(tǒng)風(fēng)冷機(jī)柜的6倍以上,大幅節(jié)約建設(shè)用地,同時(shí)可大幅降低風(fēng)冷散熱PUE,節(jié)能降耗,是為AI而生的"高密低耗"風(fēng)冷智算中心建設(shè)最佳方案。

在高密部署方面,42kW智算風(fēng)冷算力倉的單機(jī)柜功率密度從3~7kW提升至42kW,是傳統(tǒng)風(fēng)冷機(jī)柜的6倍以上,輸出超高密度算力,挑戰(zhàn)風(fēng)冷極限,實(shí)現(xiàn)高密部署,相比傳統(tǒng)數(shù)據(jù)中心,減少40%模塊部署量,減少建設(shè)用地60%。

從3~7kW到42kW,單機(jī)柜功率密度實(shí)現(xiàn)超6倍的飛躍,這得益于42kW智算風(fēng)冷算力倉在高效節(jié)能方面的多項(xiàng)創(chuàng)新實(shí)踐。42kW智算風(fēng)冷算力倉融合中壓到末端饋線的全功率簡鏈路供電及高效UPS系統(tǒng),有效降低電能損耗30%以上;采用冷熱通道全密封+列間空調(diào)高溫進(jìn)水模式,將冷熱氣流循環(huán)與外界環(huán)境進(jìn)行隔離,避免了冷量散失,使其得以100%利用,采用18℃高溫進(jìn)水,相比傳統(tǒng)數(shù)據(jù)中心提高3~6℃的進(jìn)水水溫,制冷系統(tǒng)能效比有效提升10%以上;并通過AI智能管控平臺(tái),實(shí)現(xiàn)制冷系統(tǒng)聯(lián)動(dòng)調(diào)優(yōu),從而保障單柜42kW智算設(shè)備的正常運(yùn)行,整體節(jié)能25%以上,風(fēng)冷散熱PUE大幅降低。

在成功應(yīng)對(duì)"高密度、低能耗"挑戰(zhàn)的同時(shí),42kW智算風(fēng)冷算力倉還能夠滿足客戶快速上線的需求,采用模塊化設(shè)計(jì)、去工程化安裝,一周即可完成部署,AI服務(wù)器和數(shù)據(jù)中心基礎(chǔ)設(shè)施一體化交付,建設(shè)周期縮短了70%。此外,在運(yùn)維管理方面,42kW智算風(fēng)冷算力倉做到了安全智能讓客戶省心,采用浪潮信息自研AI管理平臺(tái),打通基礎(chǔ)設(shè)施和IT設(shè)備統(tǒng)一納管,安全可靠性提升30%,并采用AIStation智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺(tái),有效提升大模型算力平臺(tái)的使用效率,助力客戶加速AI大模型開發(fā)與部署。

目前該方案已經(jīng)在坐落于四川能投天府云數(shù)智產(chǎn)業(yè)園的天府智算西南算力中心批量化部署,在有限空間內(nèi)部署高功率風(fēng)冷機(jī)柜,節(jié)省空間60%,并實(shí)現(xiàn)模塊內(nèi)IB組網(wǎng),降低50% IB線纜成本;同時(shí),面對(duì)業(yè)界最高功率密度設(shè)計(jì)的GPU機(jī)柜,采用創(chuàng)新節(jié)能技術(shù),降低電能損耗,實(shí)現(xiàn)對(duì)服務(wù)器散熱的精準(zhǔn)控制,相比傳統(tǒng)風(fēng)冷數(shù)據(jù)中心節(jié)能提高25%以上。未來,天府智算西南算力中心將為高校研究所、科技企業(yè)等提供綜合算力服務(wù),賦能工業(yè)制造、自然科學(xué)、生物醫(yī)學(xué)、科研模擬實(shí)驗(yàn)等領(lǐng)域的人工智能創(chuàng)新,推動(dòng)成都乃至四川人工智能技術(shù)與各行各業(yè)的深度融合。

在智算中心建設(shè)領(lǐng)域,浪潮信息具備全流程智算中心建設(shè)服務(wù)能力,并積累了豐富經(jīng)驗(yàn),已成功在浙江、江蘇、安徽等地打造智算中心區(qū)域樣板,為區(qū)域經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型提供強(qiáng)有力的算力支持。未來,作為全球領(lǐng)先的IT基礎(chǔ)設(shè)施提供商,浪潮信息將繼續(xù)堅(jiān)持智算創(chuàng)新,會(huì)同能投天府云推動(dòng)42kW智算風(fēng)冷算力倉解決方案在更多應(yīng)用場景的落地,并攜手產(chǎn)業(yè)伙伴為人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展及加速AI產(chǎn)業(yè)化打造堅(jiān)實(shí)的算力底座。