監(jiān)控系統(tǒng)解圍企業(yè)應(yīng)用集成平臺困境

2011年04月22日08:23

  【IT168 信息化】

  最近我們?yōu)橐患已肫筮M行了關(guān)于基于企業(yè)服務(wù)總線(ESB)和面向服務(wù)架構(gòu)(SOA)的企業(yè)應(yīng)用集成(EAI)平臺的咨詢與實施,在此過程中,客戶經(jīng)常會提出這樣的問題:應(yīng)用集成平臺通常處于企業(yè)信息平臺的核心位置,很多系統(tǒng)都與集成平臺關(guān)聯(lián),很多需要跨系統(tǒng)實現(xiàn)的業(yè)務(wù)都要經(jīng)過集成平臺,因此集成平臺能否正常的運行,將對企業(yè)的業(yè)務(wù)運營產(chǎn)生重要的影響。

  那如何才能確保企業(yè)應(yīng)用集成平臺正常運行,保證業(yè)務(wù)運營的正常運作呢針對這樣的問題,實施顧問們都會建議客戶進行集群部署,實現(xiàn)Fault Tolerance或者Load Balance等等,來確保平臺的可靠運行。除此之外,我還建議客戶建立一套集成平臺管理監(jiān)控系統(tǒng),對企業(yè)應(yīng)用集成平臺以及平臺上部署的應(yīng)用進行管理與監(jiān)控,隨時掌握平臺和應(yīng)用的運行情況,及時發(fā)現(xiàn)問題,保證企業(yè)業(yè)務(wù)的正常運營。

  其實,很多ESB、SOA產(chǎn)品都提供管理和監(jiān)控的功能,比如TIBCO Administrator和Service Performance Management等等,這些產(chǎn)品能除了能夠進行集成應(yīng)用的部署、啟動等操作之外,也可以進行應(yīng)用狀態(tài)的監(jiān)控,但是這些功能對于企業(yè)應(yīng)用集成平臺來說還遠遠不夠,尤其是對那些采用分布式應(yīng)用集成平臺的大型企業(yè),比如我們的客戶。

  我建議企業(yè)應(yīng)用集成平臺管理監(jiān)控系統(tǒng)需要包括如下基本功能:

  服務(wù)信息維護與管理

  提到基于SOA的應(yīng)用集成平臺就不能沒有服務(wù),而且在實際的實施中,服務(wù)的形式也多種多樣,除了常用的Web Service,還有其他各種技術(shù)(比如JMS)接口和各類適配器接口。為了能夠充分發(fā)揮這些服務(wù)的作用,提高服務(wù)的重用性,就需要對這些服務(wù)進行維護和管理,功能包括:

  服務(wù)基本信息維護:包括服務(wù)功能、位置、類型、輸入/輸出參數(shù)、調(diào)用方法說明等等,使用戶在需要調(diào)用某種功能的服務(wù)時,能夠快速的查找服務(wù)資源,便于應(yīng)用系統(tǒng)的開發(fā)。

  服務(wù)訪問管理:管理和維護服務(wù)的訪問者信息,以便管理人員能夠了解服務(wù)的應(yīng)用范圍和使用情況,并對新增加的訪未者(應(yīng)用系統(tǒng))設(shè)置審批流程,防止服務(wù)訪問的隨意性和不可控性。

  服務(wù)變更管理:記錄因為應(yīng)用系統(tǒng)需求變更產(chǎn)生的服務(wù)版本的變更,并對訂閱該服務(wù)用戶及應(yīng)用系統(tǒng)發(fā)布變更通知,便于服務(wù)調(diào)用方及時進行更新。

  平臺監(jiān)控:

  應(yīng)用集成平臺通常都會基于一種或者多種產(chǎn)品平臺進行搭建,這些平臺運行是否正常,決定了整個應(yīng)用集成平臺運行的穩(wěn)定。雖然很多產(chǎn)品本身自帶了監(jiān)控工具,但是這些監(jiān)控工具提供的功能往往還不能滿足用戶的一些個性化得需求,尤其是針對一些大型的客戶采用多種平臺產(chǎn)品,進行分布式部署的時候。如果能對這些平臺產(chǎn)品進行統(tǒng)一的監(jiān)控和管理,將會大大提高應(yīng)用集成平臺的可靠性。用戶可以使用產(chǎn)品提供的API,比如TIBCO Hawk API來定制化開發(fā)自己的監(jiān)控平臺產(chǎn)品。平臺監(jiān)控的功能包括:

  平臺資源監(jiān)控:比如服務(wù)器的CPU占用率、內(nèi)存占用率、磁盤空間等等的監(jiān)控。

  平臺進程的監(jiān)控:監(jiān)控平臺是否運行正常,有沒有意外停機之類。

  報警:在平臺出現(xiàn)異常時進行報警,比如向管理員發(fā)送短信提醒等。

  集成應(yīng)用管理與監(jiān)控:

  集成應(yīng)用是企業(yè)應(yīng)用集成平臺的核心,是真正幫助企業(yè)實現(xiàn)集成業(yè)務(wù)的地方。集成應(yīng)用的管理與監(jiān)控既能夠幫助平臺的運維人員掌握平臺的運行情況,也能夠為業(yè)務(wù)用戶對業(yè)務(wù)的運作情況提供參考依據(jù)。功能包括:

  應(yīng)用運行統(tǒng)計:記錄集成應(yīng)用的運行情況,比如某一服務(wù)接口每天進行的交易數(shù)量,成功記錄數(shù)、失敗記錄數(shù)等等。

  應(yīng)用異常報警:針對失敗記錄過多的應(yīng)用進行報警處理,通知管理員及時查看失敗原因。

  應(yīng)用日志管理:管理集成應(yīng)用中的接口日志,運行日志,異常日志等等。

  業(yè)務(wù)沖正處理:針對失敗的業(yè)務(wù),管理和設(shè)置他們的沖正處理流程,保證業(yè)務(wù)運行的正確性。