推動標準化、智能化、一體化發(fā)展

/美通社/ -- 近日,開放計算標準工作委員會(OCTC)正式批準發(fā)布《數(shù)據(jù)中心物理基礎(chǔ)設(shè)施管理要求白皮書》,這是業(yè)界首個針對數(shù)據(jù)中心計算、存儲、網(wǎng)絡(luò)、動力環(huán)境等IT基礎(chǔ)設(shè)施運維的管理要求。

該白皮書由國網(wǎng)智能電網(wǎng)研究院有限公司、中國電子技術(shù)標準化研究院、浪潮信息、中國質(zhì)量認證中心、南京大學(xué)、北京信息科技大學(xué)等單位聯(lián)合編制,深入剖析了智能時代數(shù)據(jù)中心基礎(chǔ)設(shè)施管理的標準化、智能化和一體化發(fā)展趨勢,并通過最新智能化實踐案例,為數(shù)據(jù)中心多樣化的基礎(chǔ)設(shè)施運維管理提供了重要的技術(shù)指南。

在大數(shù)據(jù)、云計算、人工智能等技術(shù)的推動下,生產(chǎn)力、生產(chǎn)工具、運營模式被重新改寫,各行各業(yè)對算力和存儲的需求不斷增長,數(shù)據(jù)中心的建設(shè)呈現(xiàn)規(guī)?;?、集約化、多元化發(fā)展,數(shù)據(jù)中心基礎(chǔ)設(shè)施管理軟件的種類也隨之增多。當下,很多數(shù)據(jù)中心設(shè)備規(guī)模已突破10萬,數(shù)據(jù)中心基礎(chǔ)設(shè)施的多樣性和復(fù)雜性增加,架構(gòu)也更加復(fù)雜,不同管理軟件由于缺乏標準接口和統(tǒng)一的管理規(guī)范,難以協(xié)同工作,管理效率低。此外,現(xiàn)有的基礎(chǔ)設(shè)施管理技術(shù)在覆蓋不同行業(yè)客戶應(yīng)用方面存在不足,導(dǎo)致數(shù)據(jù)中心管理軟件無法滿足不同行業(yè)的特殊需求,限制了其應(yīng)用范圍。

《數(shù)據(jù)中心物理基礎(chǔ)設(shè)施管理要求白皮書》,旨在解決數(shù)據(jù)中心物理基礎(chǔ)設(shè)施管理標準各異、智能化水平低和一體化能力欠缺的問題。該白皮書對數(shù)據(jù)中心基礎(chǔ)設(shè)施管理規(guī)范進行了統(tǒng)一的定義,基礎(chǔ)設(shè)施包括數(shù)據(jù)中心計算、存儲、網(wǎng)絡(luò)、動力環(huán)境等,管理功能涵蓋資產(chǎn)管理、監(jiān)控管理、自動化配置、能耗管理、拓撲管理、安全防范管理、統(tǒng)計管理、用戶管理、平臺兼容性、平臺可靠性以及平臺高性能等方面。白皮書也詳細定義了不同功能模塊下的技術(shù)參數(shù)、技術(shù)標準、功能要求等,以此提高數(shù)據(jù)中心運維管理與對應(yīng)平臺軟件的標準化程度,促進數(shù)據(jù)中心軟硬件上下游廠商之間的技術(shù)交流和對話。統(tǒng)一要求的制定有利于多元背景下差異化數(shù)據(jù)中心的自動化、規(guī)范化、標準化、智能化管理,提高數(shù)據(jù)中心的管理效率、可靠性和安全性,降低運營成本,推動整個數(shù)據(jù)中心基礎(chǔ)設(shè)施管理的高效發(fā)展。

白皮書指出,面對數(shù)據(jù)中心基礎(chǔ)設(shè)施規(guī)模快速攀升、需求日益多樣化的挑戰(zhàn),標準化管理、智能化管理以及一體化、平臺化等成為了數(shù)據(jù)中心演進的重要方向。

  • 標準化管理是數(shù)據(jù)中心管理的必然趨勢

通過標準化可以幫助運維人員基于標準接口自動化和集中化管理不同品牌和不同類型的設(shè)備,提高效率、降低成本,并增強安全性。白皮書對數(shù)據(jù)中心基礎(chǔ)設(shè)施管理給出了統(tǒng)一的規(guī)范要求,以此提高數(shù)據(jù)中心運維管理與對應(yīng)平臺軟件的標準化程度,促進數(shù)據(jù)中心軟硬件上下游廠商之間的技術(shù)交流和對話。

  • 智能化管理是保持競爭優(yōu)勢的關(guān)鍵

通過人工智能、機器學(xué)習等先進技術(shù)賦能數(shù)據(jù)中心各類基礎(chǔ)設(shè)施的運維管理過程,使其更加智能,提高運維管理效率和穩(wěn)定性。AIOps作為一種將人工智能與IT運維相結(jié)合的新興技術(shù),已被業(yè)界廣泛使用,它可以自動分析和識別基礎(chǔ)設(shè)施產(chǎn)生的異常、故障等問題,使運維管理更加高效、準確和及時。其次,智能化管理可以實現(xiàn)前瞻性的故障預(yù)測。利用AI的預(yù)測能力,可以提前預(yù)測IT基礎(chǔ)設(shè)施的異常和故障,從而避免故障對業(yè)務(wù)造成影響,進一步提高數(shù)據(jù)中心的可靠性。白皮書指出通過對CPU、GPU、I/O讀寫速度等監(jiān)測以及對內(nèi)存、硬盤、風扇、PCIe等部件的智能化預(yù)警管理,可以保障數(shù)據(jù)中心的性能最大化并提升數(shù)據(jù)中心中設(shè)備的連續(xù)性,提高運維管理效率和穩(wěn)定性。

  • 一體化、平臺化是數(shù)據(jù)中心持續(xù)發(fā)展的關(guān)鍵路徑

一體化、平臺化可以實現(xiàn)數(shù)據(jù)的集成和關(guān)聯(lián)分析,提供統(tǒng)一的管理界面,節(jié)省時間和精力,提高管理效率,同時可以實現(xiàn)更全面的資源管理和協(xié)同運維,提高整體數(shù)據(jù)中心的效能和可靠性。白皮書也指出了大規(guī)模數(shù)據(jù)中心平臺架構(gòu)的構(gòu)成,需要對算力、存儲、網(wǎng)絡(luò)等產(chǎn)品提供一體化的工具。

OCTC《數(shù)據(jù)中心物理基礎(chǔ)設(shè)施管理要求白皮書》的發(fā)布,通過管理平臺在架構(gòu)、功能和智能等方面的標準化,為數(shù)據(jù)中心應(yīng)對海量多元基礎(chǔ)設(shè)施運維管理,提供了重要參考。未來,OCTC將持續(xù)推動數(shù)據(jù)中心軟硬件上下游廠商之間的技術(shù)交流和對話,促進IT產(chǎn)業(yè)生態(tài)健康發(fā)展。