日前,開放計算標(biāo)準(zhǔn)工作委員會(OCTC)與OCP中國社區(qū)共同主辦了"面向應(yīng)用的服務(wù)器算效標(biāo)準(zhǔn)與評估"開放計算技術(shù)沙龍。浪潮信息出席會議。會上,為推動算力產(chǎn)業(yè)的快速發(fā)展,OCTC正式公布面向多樣化應(yīng)用場景的《服務(wù)器算力算效評價規(guī)范》(以下簡稱"規(guī)范")。該規(guī)范由中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會牽頭,業(yè)界芯片廠商、系統(tǒng)廠商及數(shù)據(jù)中心用戶等聯(lián)合參與編制,旨在面向大數(shù)據(jù)、虛擬化、數(shù)據(jù)庫、人工智能等不同計算場景評估系統(tǒng)性能,幫助客戶從應(yīng)用出發(fā)找到適合的算力支撐平臺。

與傳統(tǒng)評測更看重CPU基礎(chǔ)性能不同,《服務(wù)器算力算效評價規(guī)范》是一款面向?qū)嶋H應(yīng)用場景的評價基準(zhǔn),以服務(wù)器整機為評測對象,構(gòu)建20多個基礎(chǔ)性能和應(yīng)用性能評測指標(biāo),其中應(yīng)用性能涵蓋數(shù)據(jù)庫、大數(shù)據(jù)、虛擬化、AI等多種場景。目前,互聯(lián)網(wǎng)、通信、能源和交通行業(yè)用戶正針對評價規(guī)范率先開展測試工作。

應(yīng)對多樣化算力缺口,亟需服務(wù)器算力算效評價新法

隨著大數(shù)據(jù)、人工智能、云計算等前沿技術(shù)的廣泛應(yīng)用,服務(wù)器應(yīng)用場景日益豐富,從大數(shù)據(jù)分析到深度學(xué)習(xí)模型訓(xùn)練,任務(wù)類型日趨多樣化。多樣化不僅體現(xiàn)在計算量和數(shù)據(jù)規(guī)模的增長,還體現(xiàn)在計算范式變化,如實時分析、圖計算等,而傳統(tǒng)以處理器主頻、浮點運算能力為評價指標(biāo)的性能評測基準(zhǔn),已遠(yuǎn)遠(yuǎn)不能全面、準(zhǔn)確地反映服務(wù)器的算力算效。

舉例來看,傳統(tǒng)評測基準(zhǔn)主要評估處理器在特定負(fù)載下的整數(shù)和浮點運算能力,通常僅關(guān)注CPU和RAM之間的交互,忽略了新興場景中IO、大數(shù)據(jù)、AI、虛擬化、數(shù)據(jù)庫等特定計算任務(wù)對算力的差異化需求。而且隨著技術(shù)的進步,市場涌現(xiàn)了眾多針對不同應(yīng)用場景優(yōu)化的服務(wù)器硬件和軟件解決方案,如專為深度學(xué)習(xí)設(shè)計的加速卡、用于大數(shù)據(jù)分析優(yōu)化的DPU等,傳統(tǒng)基準(zhǔn)已不再適用這些創(chuàng)新產(chǎn)品的評測。

與此同時,降低能源成本和數(shù)據(jù)中心碳排放的壓力不斷增加,服務(wù)器能效提升成為必然趨勢。雖然業(yè)界對于國家及地區(qū)宏觀能效調(diào)控以及規(guī)?;懔χ行牡哪苄?biāo)準(zhǔn)均有定義,但對于整機及部件使用環(huán)節(jié)的碳排放評測缺乏統(tǒng)一標(biāo)準(zhǔn),亟需針對算力能效的科學(xué)評價規(guī)范,實現(xiàn)最小顆粒度的量化評估,引導(dǎo)服務(wù)器廠商提高算力能效相關(guān)設(shè)計,滿足綠色低碳、降低PUE等要求。

《服務(wù)器算力算效評價規(guī)范》立項,行業(yè)用戶已啟動測試

為構(gòu)建面向多樣化應(yīng)用的科學(xué)算力算效評價基準(zhǔn),《服務(wù)器算力算效評價規(guī)范》在中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會立項。該規(guī)范通過衡量服務(wù)器系統(tǒng)在多樣化場景和業(yè)務(wù)中的算力性能,旨在展示服務(wù)器產(chǎn)品在各應(yīng)用領(lǐng)域中的算力特性,以滿足多樣化計算評估、能效優(yōu)化、ROI評估和市場推廣等需求。

該規(guī)范遵循權(quán)威基準(zhǔn)測試的相關(guān)性、可重復(fù)性、公平性、可驗證性、可用性五大原則,推出了一套全新的面向應(yīng)用的算力算效標(biāo)準(zhǔn),涵蓋從常規(guī)的CPU和GPU,到專用的AI和大數(shù)據(jù)處理硬件等多種計算設(shè)備,同時測試框架支持風(fēng)冷和液冷服務(wù)器環(huán)境,以幫助用戶有效的監(jiān)控和評估計算效率,以便高效管理和優(yōu)化計算資源。

該規(guī)范共設(shè)計20多個評測指標(biāo),涵蓋整數(shù)型、浮點運算,代碼解析,IO等基礎(chǔ)性能,以及數(shù)據(jù)庫、大數(shù)據(jù)庫、虛擬化、AI等應(yīng)用性能。通過運行典型應(yīng)用場景,能夠全面評估服務(wù)器的基礎(chǔ)性能、工作負(fù)載效率和應(yīng)用負(fù)載效率。如利用Hadoop場景評估服務(wù)器系統(tǒng)面向大數(shù)據(jù)分布式計算、海量數(shù)據(jù)處理能力;利用ResNet、BERT評估服務(wù)器系統(tǒng)在深度學(xué)習(xí)和語言模型應(yīng)用中的性能;利用KVM+MySQL評估服務(wù)器系統(tǒng)在虛擬化和云主機場景中的能力等。會上,OCTC展示了服務(wù)器算效評價規(guī)范的測試場景、工具、各項功能及展現(xiàn)結(jié)果等,獲得OCTC各成員的高度評價。

該規(guī)范的制定,能夠為服務(wù)器制造商、測試機構(gòu)、數(shù)據(jù)中心運營商和云服務(wù)提供商等提供科學(xué)、系統(tǒng)的評估依據(jù),確保服務(wù)器在不同應(yīng)用場景下的高效運行和能耗優(yōu)化,滿足高效、可衡量和可優(yōu)化的計算力解決方案的評估需求,推動整個計算行業(yè)的發(fā)展。目前,《服務(wù)器算力算效評價規(guī)范》的評測工具和標(biāo)準(zhǔn)細(xì)則正在制定中,OCTC熱忱歡迎產(chǎn)學(xué)研各界機構(gòu)積極加入,共同推動該規(guī)范的發(fā)布和落地。