作為全球最大的金融機(jī)構(gòu)之一,這家國有銀行擁有規(guī)模龐大的IT基礎(chǔ)設(shè)施,囊括大量服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)設(shè)備。這些IT設(shè)備來自不同年代、不同廠商,擁有上百種產(chǎn)品型號(hào),主要分布在上海和北京,形成了錯(cuò)綜復(fù)雜的數(shù)據(jù)中心布局。

面對(duì)巨量、復(fù)雜的IT設(shè)備的管理挑戰(zhàn),該行攜手浪潮信息,歷經(jīng)五年聯(lián)合開發(fā),依托InManage基礎(chǔ)設(shè)施智能管理平臺(tái),持續(xù)提升數(shù)字化管理運(yùn)維能力。此過程中,InManage在該行管轄的IT設(shè)備規(guī)模從最初的1000臺(tái)大幅擴(kuò)展至100,000臺(tái),覆蓋國內(nèi)外眾多廠商的上百種不同型號(hào)的IT設(shè)備,實(shí)現(xiàn)不同廠商、不同年代的IT資產(chǎn)全生命周期數(shù)字化管理。這是當(dāng)前金融行業(yè)單一數(shù)據(jù)中心帶外管理的最大規(guī)模,為行業(yè)大規(guī)模數(shù)據(jù)中心的高效運(yùn)維管理樹立了典范。

"近五年里,我們?yōu)檫@家國有大行完成了10萬臺(tái)、上百種不同型號(hào)IT設(shè)備的統(tǒng)一管理,開發(fā)了四十余項(xiàng)定制化功能,涵蓋資產(chǎn)全生命周期管理、AI運(yùn)維、功耗調(diào)優(yōu)、綠色數(shù)據(jù)中心等多方面,幫助該行實(shí)現(xiàn)了超大規(guī)模IT設(shè)備的智能、高效、精準(zhǔn)、安全的運(yùn)維管理",浪潮信息金融行業(yè)部總經(jīng)理吳超表示。

大行有"大"挑戰(zhàn) 十萬IT設(shè)備如何統(tǒng)攬

2023年底,中央金融工作會(huì)議指出,要做好包括"數(shù)字金融"在內(nèi)的"五篇大文章",作為全球最大的金融機(jī)構(gòu)之一,該行積極落實(shí),緊密圍繞科技金融、數(shù)字金融的發(fā)展規(guī)劃,強(qiáng)化科技創(chuàng)新,以科技賦能"數(shù)字銀行"建設(shè)。

在推進(jìn)數(shù)字金融過程中,該行不僅積極構(gòu)建并創(chuàng)新數(shù)字應(yīng)用場(chǎng)景,更加重視數(shù)字基礎(chǔ)設(shè)施的建設(shè)和運(yùn)維領(lǐng)域的創(chuàng)新。然而,數(shù)字基礎(chǔ)設(shè)施作為該行數(shù)字化轉(zhuǎn)型的壓艙石,在新時(shí)代正面臨著諸多新的挑戰(zhàn)。

  • 挑戰(zhàn)一,大規(guī)模、多品牌、多種類的IT設(shè)備如何統(tǒng)一納管?

在數(shù)據(jù)中心投入運(yùn)行的十余年里,這家國有大行的IT設(shè)備數(shù)量和種類不斷增長。統(tǒng)計(jì)顯示,總行目前IT設(shè)備約為10萬臺(tái),包含不同年代、不同廠商的服務(wù)器、存儲(chǔ)設(shè)備等。設(shè)備數(shù)量的大幅增長意味著管理復(fù)雜性的顯著提升,更多的設(shè)備意味著更多的狀態(tài)監(jiān)控、故障排查、軟件更新等任務(wù),存在管理效率低下、數(shù)據(jù)不一致性加劇、維護(hù)成本上升等問題。

同時(shí),傳統(tǒng)的基礎(chǔ)設(shè)施管理平臺(tái)是各項(xiàng)功能緊耦合的系統(tǒng),一般用一臺(tái)管理服務(wù)器完成數(shù)據(jù)采集、存儲(chǔ)、分析、展現(xiàn)等功能,但該行數(shù)據(jù)中心每天服務(wù)器運(yùn)行狀態(tài)數(shù)據(jù)達(dá)到近30T,集中化管理無法滿足超大規(guī)模IT設(shè)備管理的分鐘級(jí)甚至秒級(jí)的實(shí)時(shí)并發(fā)需求,容易出現(xiàn)故障上報(bào)不及時(shí)甚至管理平臺(tái)宕機(jī)的問題。

為了解決這些問題,浪潮信息為其打造了一個(gè)能夠兼容多種設(shè)備和品牌的統(tǒng)一管理平臺(tái),提供統(tǒng)一界面來管理所有設(shè)備,從底層屏蔽設(shè)備差異,基于基線策略實(shí)現(xiàn)設(shè)備無狀態(tài)運(yùn)維,簡化操作流程,提高效率。通過研究大規(guī)模數(shù)據(jù)中心物理基礎(chǔ)設(shè)施智能管理平臺(tái)的分布式網(wǎng)格架構(gòu)及高性能數(shù)據(jù)采集技術(shù),設(shè)計(jì)"一中心多網(wǎng)格"的體系模型,InManage實(shí)現(xiàn)了100,000級(jí)設(shè)備的統(tǒng)一管理、10,000,000級(jí)指標(biāo)項(xiàng)的秒級(jí)采集,提供批量作業(yè)的并行處理能力,實(shí)現(xiàn)多設(shè)備并行處理,對(duì)設(shè)備執(zhí)行過程監(jiān)控、結(jié)果檢查,可用性達(dá)到99.99%,有效解決了管理復(fù)雜度高和故障上報(bào)不及時(shí)等問題。

通過對(duì)種類繁多的IT設(shè)備的統(tǒng)一管理,浪潮信息助力該行打破了數(shù)據(jù)壁壘,節(jié)省硬件成本300萬以上,運(yùn)維工作量降低1/3,將運(yùn)維效率提升200%。

  • 挑戰(zhàn)二,金融數(shù)據(jù)中心如何進(jìn)行實(shí)時(shí)精準(zhǔn)化管理?

傳統(tǒng)監(jiān)控方式較為粗放,IT管理部門能夠了解數(shù)據(jù)中心大致的設(shè)備數(shù)量,但無法精準(zhǔn)掌握每臺(tái)設(shè)備的運(yùn)行狀況,比如哪臺(tái)服務(wù)器CPU利用率偏低,哪臺(tái)超負(fù)荷運(yùn)行,哪臺(tái)設(shè)備已經(jīng)掉線或能耗過高等等。

鑒于此,銀行亟需一套更為精準(zhǔn)的管理解決方案,確保實(shí)時(shí)洞悉服務(wù)器的性能、健康狀況、安全狀態(tài)。同時(shí),此管理方案還需具備高效地處理和分析大量數(shù)據(jù)的能力,以便及時(shí)發(fā)現(xiàn)和解決問題。

"我們希望為客戶打造實(shí)時(shí)、精準(zhǔn)、智能的管理運(yùn)維方案",吳超表示。

為此,浪潮信息InManage軟件團(tuán)隊(duì)與該行IT團(tuán)隊(duì)攜手合作,深度融合物聯(lián)網(wǎng)(IoT)、人工智能、數(shù)字孿生、邊緣計(jì)算等數(shù)字化技術(shù),成功實(shí)現(xiàn)了數(shù)據(jù)中心的全方位精準(zhǔn)管理。

在全棧、全場(chǎng)景動(dòng)態(tài)管理方面,浪潮信息基于RFID (射頻識(shí)別,Radio Frequency Identification)技術(shù)棧,適配多種場(chǎng)景下的資產(chǎn)管理需求,對(duì)設(shè)備、物資、位置、狀態(tài)、人員等全方位數(shù)據(jù)中心資源進(jìn)行實(shí)時(shí)動(dòng)態(tài)管理,可以準(zhǔn)確識(shí)別出設(shè)備利用率、使用情況、能耗等多個(gè)方面。

智能運(yùn)維方面,浪潮信息InManage基礎(chǔ)設(shè)施智能管理平臺(tái)集成了ISBMC、InService、AIOps等故障處理能力,基于AI技術(shù)掌握了數(shù)萬種服務(wù)器宕機(jī)案例,可對(duì)故障進(jìn)行智能實(shí)時(shí)預(yù)警。其故障診斷定位精度業(yè)界領(lǐng)先,精準(zhǔn)度達(dá)到95%,遠(yuǎn)高于業(yè)界50%的平均標(biāo)準(zhǔn),充分保證金融行業(yè)數(shù)據(jù)中心安全,助力金融業(yè)韌性發(fā)展。

  • 挑戰(zhàn)三,如何給金融數(shù)據(jù)中心"畫地圖"、"開導(dǎo)航"?

超大規(guī)模數(shù)據(jù)中心的設(shè)計(jì)布局,往往面臨多重挑戰(zhàn)。

首先,空間布局。IT設(shè)備數(shù)量龐大,如何準(zhǔn)確掌握設(shè)備分布情況,機(jī)房中哪些區(qū)域是高密度使用,哪些區(qū)域則相對(duì)空閑,這是一個(gè)難題;

其次,設(shè)備安置。數(shù)據(jù)中心內(nèi)設(shè)備繁多,且隨時(shí)可能面臨新設(shè)備的接入需求,如何快速、高效地找到合適位置來安置新設(shè)備很關(guān)鍵;

再次,能耗優(yōu)化。IT運(yùn)營者要同時(shí)考量電源、散熱等因素,以最大限度地提高能源利用效率,合理進(jìn)行規(guī)范布局。

超大規(guī)模數(shù)據(jù)中心如同一座龐大的"城市", IT運(yùn)營者想快速了解數(shù)據(jù)中心的空間布局、設(shè)備位置,就要做到"一圖在手,縱橫馳騁"。為了實(shí)現(xiàn)這一目標(biāo),浪潮信息InManage基礎(chǔ)設(shè)施智能管理平臺(tái)通過對(duì)數(shù)據(jù)中心機(jī)房、柜機(jī)、U位資源實(shí)時(shí)監(jiān)控和智能分析,為超大規(guī)模數(shù)據(jù)中心繪制了一張動(dòng)態(tài)的"3D地圖",使IT運(yùn)營者能夠一目了然地掌握數(shù)據(jù)中心的實(shí)時(shí)狀態(tài)。

吳超進(jìn)一步闡述道:"我們利用數(shù)字孿生技術(shù),結(jié)合機(jī)柜和U位資源的實(shí)時(shí)數(shù)據(jù),包括機(jī)型U位詳情、設(shè)備運(yùn)行狀況及能耗情況等,全方位展示機(jī)房機(jī)柜設(shè)備的空間分布,能提高設(shè)備選柜效率和精確度,從而助力大行數(shù)據(jù)中心更有效地規(guī)劃和優(yōu)化空間布局、資源配置。"

3秒看到全景圖 鑄造AI運(yùn)維利器

隨著技術(shù)的不斷進(jìn)步,浪潮信息的InManage基礎(chǔ)設(shè)施智能管理平臺(tái)已開發(fā)了40余項(xiàng)定制化功能,借助AI技術(shù),實(shí)現(xiàn)數(shù)據(jù)中心資產(chǎn)全生命周期的精細(xì)管理,推動(dòng)銀行加快數(shù)字化轉(zhuǎn)型的步伐。浪潮信息的這一解決方案不僅幫助這家銀行將IT運(yùn)維效率提升了整整2倍,更在IT設(shè)備采購、到貨、驗(yàn)收、入庫、上線、淘汰全流程中,為IT運(yùn)營者提供了極大的便利,只需短短3秒,即可獲得數(shù)據(jù)中心設(shè)備的全面運(yùn)行視圖,大大提高了工作效率。

當(dāng)前,浪潮信息InManage基礎(chǔ)設(shè)施智能管理平臺(tái)已在該行得到全面部署和應(yīng)用,足以驗(yàn)證產(chǎn)品的成熟度和可靠性。如今,國內(nèi)TOP100銀行中,已有大約1/3的銀行對(duì)浪潮信息的InManage基礎(chǔ)設(shè)施智能管理平臺(tái)進(jìn)行了規(guī)?;渴稹?/p>