分布式算力被中國信通院列入"2024政企數(shù)智化轉型十大關鍵詞"。中國信通院指出,隨著新一代通信規(guī)模建設和邊緣計算應用的持續(xù)部署,越來越多的應用運行和數(shù)據(jù)生產處理在邊端側開展,這對于傳統(tǒng)算力基礎設施的部署、調度提出了新要求,分布式算力通過不同范圍部署不同規(guī)模算力,為政企數(shù)智化轉型各場景隨需獲取算力提供新思路。

作為全球最大的通信基礎設施服務商,成立十年的中國鐵塔擁有擁有210萬站址資源、能源設施和近百萬處機房,升級22萬現(xiàn)有"通信塔"為"數(shù)字塔"……依托自有超大規(guī)模分布式算力資源,中國鐵塔在2024年啟動了分布式算力池建設,打造超大規(guī)模分布式資源池,該項目是國內通信行業(yè)首個集云計算、云原生、大數(shù)據(jù)、AI、邊緣計算等多元算力于一體,覆蓋范圍最廣、開放兼容性最好、一云多芯的自有資源分布式節(jié)點項目。

中國鐵塔信息技術研究院院長葉臻強調,中國鐵塔分布式資源池項目取得的成績,說明整個行業(yè)都處于從集中大型云到邊端小型云的發(fā)展過程中。當前,算力正從集中式向"云邊端"分布式范式轉變。隨著大型語言模型、工業(yè)大模型等智能化應用熱度不斷高漲,邊緣算力作為產業(yè)智能化發(fā)展的數(shù)字化底座將迎來戰(zhàn)略機遇期。而中國鐵塔分布式資源池項目,實踐了超大規(guī)模分布式節(jié)點建設,對推動邊緣算力發(fā)展和技術落地,有著重大技術價值和產業(yè)意義。

發(fā)展數(shù)字經(jīng)濟,向邊緣算力要業(yè)務創(chuàng)新力

2014年7月,中國鐵塔成立,負責統(tǒng)籌建設通信鐵塔設施,提高基礎設施共建共享水平。2019年,中國鐵塔正式開啟了"一體兩翼"業(yè)務布局,即以面向通信行業(yè)的業(yè)務為"一體",以依托獨特資源優(yōu)勢面向社會的智聯(lián)業(yè)務和能源業(yè)務為"兩翼"。十年來,中國鐵塔在發(fā)展"兩翼"業(yè)務過程中推進"一塔多用",將"通信塔"升級為"數(shù)字塔",即在鐵塔上掛載環(huán)境監(jiān)測儀、氣象監(jiān)測儀、基站CDN、傳感器等多種信息化設備,可以滿足行業(yè)企業(yè)視覺感知、數(shù)據(jù)采集、圖像分析、信息處理等數(shù)字化需求。此外,中國鐵塔還推進從"通信機房"變"數(shù)據(jù)機房",布局邊緣算力網(wǎng)絡。

目前,中國鐵塔已經(jīng)形成了"前端視頻采集+邊緣AI計算+云端AI計算"的"端邊云"技術架構體系,自主研發(fā)了分布式視頻監(jiān)測平臺、自主定制邊緣網(wǎng)關、自研AI算法等,實現(xiàn)多個領域的技術創(chuàng)新。在"端邊云"技術架構和遍布全國的邊緣算力資源支持下,中國鐵塔已經(jīng)為40多個行業(yè)數(shù)字化轉型賦智賦能。

啟動分布式資源池建設,深入推進數(shù)字中國

隨著"一體兩翼"戰(zhàn)略的深入實施,中國鐵塔啟動了分布式資源池建設項目,目標是將遍布數(shù)百萬平方公里的海量數(shù)字基礎設施組建成一張"數(shù)字天網(wǎng)",通過新一代信息通信技術賦能千行百業(yè)實現(xiàn)數(shù)字化轉型,服務"數(shù)字中國"戰(zhàn)略藍圖實現(xiàn)。

由于中國鐵塔兩百多萬座鐵塔分布在全國,從數(shù)據(jù)采集的壓力來看,集中資源池的模式面臨很大挑戰(zhàn)。中國鐵塔從2020年開始嘗試利用分布在全國的自有小型機房,建設分布式節(jié)點,并且與浪潮云海合作,將云平臺的分布建設、邏輯集中的管理模式,應用到實際數(shù)字化底座的建設中。

實際上,隨著數(shù)字塔業(yè)務的發(fā)展,中國鐵塔每數(shù)據(jù)中心每日新增數(shù)據(jù)量數(shù)十T,預計2025年每數(shù)據(jù)中心接入約二十萬站,未來數(shù)據(jù)規(guī)模將達數(shù)十PB級別,且存在大量的視頻、圖像等非結構化數(shù)據(jù)。此外,中國鐵塔的設備數(shù)量極多,所有設施都需要接入平臺中實現(xiàn)統(tǒng)一納管。由于基礎設施分布地域跨度極大,同時要求在算力下沉的同時,實現(xiàn)多數(shù)據(jù)中心的統(tǒng)一運維管理和"云邊端"協(xié)同。

葉臻院長強調,中國鐵塔啟動自有資源分布式算力池建設主要基于三個方面的考慮。

第一是基于業(yè)務特點考慮,基礎設施資源分散在全國各地,而且也面臨地方數(shù)據(jù)不出省的需求,因此既要解決客戶需求又要實現(xiàn)統(tǒng)一管理。而分布式算力的業(yè)務邏輯和管理邏輯的相對分離,恰好滿足這兩個需求,可以將用戶側的管理結果留在省內,資源側的管理則集中到總部,實現(xiàn)IT建設隨業(yè)務發(fā)展而行。

第二,從經(jīng)濟性考慮。由于中國鐵塔在各地的都是小型機房,大多數(shù)位于中國鐵塔屬地分公司購置的綜合樓內,不需要專門征用大型土地以及增加管理難度。而將綜合樓用于機房建設,也節(jié)約了成本,從經(jīng)濟性角度來看,加強了對自身資產的有效使用。

第三,從業(yè)務前瞻性考慮。在發(fā)展數(shù)字經(jīng)濟當中,中國鐵塔依托豐富的分布式資源,可能成為數(shù)據(jù)采集方面最有優(yōu)勢的企業(yè),將來在數(shù)據(jù)的采集、存儲和通過邊緣網(wǎng)絡傳送到其他數(shù)字資源進行處理時,分布式中間節(jié)點將對企業(yè)未來的發(fā)展帶來很大便利。

中國鐵塔分布式資源池建成后,將帶來顯著的經(jīng)濟和社會價值。中國鐵塔基站分布在全國各地,對基站的數(shù)據(jù)源采集后可用于社會治理的方方面面,例如可以采集道路、農田等各行各業(yè)的數(shù)據(jù),用于耕地保護、治安、森林防火、河流監(jiān)控、大氣污染防控、地震強度預警預報等,對數(shù)字經(jīng)濟的發(fā)展提供強有力支撐。目前鐵塔的智聯(lián)業(yè)務按行業(yè)開展,一旦實現(xiàn)數(shù)據(jù)共享,產生的經(jīng)濟和社會價值就可能翻倍。

戰(zhàn)略再升級,分布式節(jié)點支撐邊緣算力大發(fā)展

作為目前國內超大規(guī)模的分布式資源池,中國鐵塔分布式資源池項目的建設難點在于地域跨度極大、設備數(shù)量極多、數(shù)據(jù)類型復雜,需要解決單數(shù)據(jù)中心跨類別多元異構資源統(tǒng)一管理、多數(shù)據(jù)中心高效調度運維以及可持續(xù)建設等嚴峻挑戰(zhàn)。這一項目由浪潮云海負責實施,浪潮云海以可演進的私有云理念,打造面向未來的"云數(shù)智、云網(wǎng)安一體化"云底座,確保中國鐵塔技術架構的升級迭代以及全國數(shù)據(jù)中心的持續(xù)建設。

中國鐵塔分布式算力池建設項目的目標為實現(xiàn)"全國一朵云、兩級多中心",在各省建立滿足虛擬化、云原生、AI識別等場景智算中心,實現(xiàn)算力的就近調度、就近服務。配合中國鐵塔"十四五"規(guī)劃,中國鐵塔分布式算力池項目啟動了首期山東、遼寧、湖南等6個省的骨干節(jié)點建設,后續(xù)將推進到更多省份。

浪潮云?;谥袊F塔的項目建設需求,明確了軟硬解耦、存算分離、IaaS異構兼容、PaaS生態(tài)融合等建設原則。InCloud OS通過分層解耦、開放標準和一云多芯的創(chuàng)新架構設計,實現(xiàn)以云為核心的數(shù)字化基礎設施的模塊化、組件化封裝,幫助客戶構建持續(xù)演進的下一代私有云數(shù)據(jù)中心,為企業(yè)業(yè)務創(chuàng)新提供多元融合和高效便捷的私有云平臺,云海OS的最新特色包括精細化基礎設施管理、云原生PaaS、智算融合、一云多芯等。

浪潮云海方案為中國鐵塔提供了四大方案價值:

第一,提升信息化服務水平、提升資源方法效率、實現(xiàn)數(shù)智化運維,通過分布式數(shù)據(jù)中心,信息化支撐響應效率由數(shù)天縮短至2小時,資源管理效率大幅提升,采用"末端視頻采集+云端AI計算+邊緣AI計算"等手段,基本實現(xiàn)了自動巡檢、自主派單、智能資管等功能,做到了遠程管理、不上站管理,支撐了遍布全國的鐵塔站址的智能化、數(shù)字化運維。

第二,降本增效、經(jīng)濟效益增加,自有資源分布式節(jié)點數(shù)據(jù)中心的持續(xù)建設助力節(jié)約信息化投入。

第三,多元融合、推動數(shù)據(jù)中心持續(xù)演進、支撐鐵塔未來戰(zhàn)略,浪潮云海云平臺的可演進理念,未來將伴隨中國鐵塔圍繞新基建、空間數(shù)智化治理、人工智能、邊緣算力網(wǎng)絡、低空經(jīng)濟等多個方面,加速推進戰(zhàn)略性新興產業(yè)和未來產業(yè)發(fā)展,加快形成新質生產力。

第四,助力數(shù)字中國建設、提升社會安全性,建設云網(wǎng)融合、智能敏捷、綠色低碳、安全可靠的智能化綜合性數(shù)字信息基礎設施,有力支撐網(wǎng)絡強國。

超大規(guī)模分布式云,打造邊緣算力新樣板

浪潮云海首席科學家張東介紹,從分布式算力的角度來看,中國鐵塔分布式算力資源在中國甚至在全球都算超大規(guī)模,這為實踐超大規(guī)模分布式節(jié)點、發(fā)展邊緣算力和邊緣計算技術,提供了難得的機會。

中國鐵塔分布式算力池浪潮云海方案的整體技術特色包括:以IaaS、PaaS分層解耦的原則建設云平臺,融合云上安全生態(tài),面向未來構建云數(shù)智、云網(wǎng)安一體化的數(shù)字化底座;邊緣計算能力增強,進一步完善多協(xié)議端設備的生命周期管理功能,增強異構邊緣資源的統(tǒng)一管理及多地域邊緣應用按需編排能力;構建面向分布式、大規(guī)模場景的智能化運維能力,實現(xiàn)巡檢工具化、管理自動化、運維智能化,提升數(shù)據(jù)中心自治能力;在存儲先進性方面,按照中國鐵塔業(yè)務需求實現(xiàn)塊存儲、文件存儲、對象存儲分級建設,面向高速IO場景構建全閃資源池,滿足及時響應需求,面向海量存儲場景構建混閃資源池。采用領先的RDMA技術提升分布式存儲性能,實現(xiàn)NVMe-OF、ISCSI、FC等多協(xié)議類型全兼容。

由于中國鐵塔算力資源的超大規(guī)模特性,浪潮云海在提供方案時,雙方也進行了聯(lián)合技術攻關。浪潮云海云計算方案總監(jiān)劉健介紹,中國鐵塔自有分布式資源具有環(huán)境復雜、跨度大、規(guī)模大等特點,對于解決方案提出了特殊的挑戰(zhàn)。雙方在項目推進過程中組成了聯(lián)合項目組,共同解決技術挑戰(zhàn)、落實技術方案。

中國鐵塔信息技術研究院維護室經(jīng)理王焱介紹,中國鐵塔分布式算力資源池首期項目推進過程遇到了很多挑戰(zhàn):首先是異構,不同節(jié)點具有不同廠商、不同類型的設備,需要考慮異構設備的兼容性;其次是可靠性問題,特別是系統(tǒng)連續(xù)性的要求,對自建分布式資源平臺提出了較大挑戰(zhàn),最終雙方合作解決了挑戰(zhàn),包括在架構設計初期對容錯方面進行了較大的投入;第三是網(wǎng)絡可靠性,因為分布式算力節(jié)點分布在不同的地理位置上,網(wǎng)絡比較復雜,還有I/O性能的挑戰(zhàn),浪潮云海通過專題優(yōu)化,結合硬件的I/O能力和網(wǎng)絡SDN的能力,最終解決了大規(guī)模并發(fā)場景的問題;最后是網(wǎng)絡安全,因為云平臺上承載的是企業(yè)敏感數(shù)據(jù),如何保證不被未授權的人訪問、抵御外部攻擊和內部泄露,中國鐵塔與包括浪潮云海在內的業(yè)界網(wǎng)絡安全企業(yè)合作。

葉臻院長介紹,與浪潮云海雙方合作的分布式資源池建設項目,既提高了工作效率,也加強了資源管理能力。同時,浪潮云海在網(wǎng)絡安全支撐方面也給予了全面支持。

【展望未來】中國鐵塔分布式資源池將成為中國乃至全球超大規(guī)模分布式節(jié)點和邊緣算力的樣板工程,為探索和發(fā)展分布式云、邊緣算力與邊緣計算和分布式AI等提供了廣闊的空間和機會。中國鐵塔分布式資源池在推動通信業(yè)數(shù)字化轉型的同時,也將為深入推進數(shù)實融合、發(fā)展數(shù)字經(jīng)濟、提速數(shù)字中國,提供源源不斷的動力和動能。正如葉臻院長強調,中國鐵塔和浪潮云海雙方強強聯(lián)合,不僅有過去的成果,還有更加輝煌的未來!