開啟主選單

求真百科

一體化智能運維平台

來自 搜狐網 的圖片

一體化智能運維平台一體化智能運維平台包含配置管理、事件管理、變更管理、發布管理、月報管理、機房管理、問題管理、運營管理、知識管理、巡檢管理、員工培訓、投訴與建議、客服中心、集中監控及智能運維等功能。

目錄

一、主要技術內容

1.技術背景和意義

一體化智能運維平台包含配置管理、事件管理、變更管理、發布管理、月報管理、機房管理、問題管理、運營管理、知識管理、巡檢管理、員工培訓、投訴與建議、客服中心、集中監控及智能運維等功能。目前平台應用於攀鋼集團的信息化、智能化和自動化[1]等系統運維監控和管理工作中,涵蓋攀枝花、西昌、成都、江油等區域,具備跨區域、大規模、全業務的一體化智能運維管理能力,是開展星雲智聯運維工作的利器。

2.技術要點和優勢

功能全面。監控告警措施全面;運維管理功能全面;展示功能全面,包括對自動監控、運維管理及運營管理等的手機APP及微信公眾號展示;運維管理全面集成呼叫中心、安全感知、集中監控、智能運維等。

兼顧定製與產品化。基於星雲智能運維實際需求和經驗,開發適合攀鋼信息化運維管理的平台功能,同時兼顧產品化需求可自定義流程配置。

二、技術應用情況

1.應用案例介紹

目前平台應用於攀鋼集團的信息化、智能化和自動化等系統運維監控和管理工作中,涵蓋攀枝花、西昌、成都、江油等區域,具備跨區域、大規模、全業務的一體化智能運維管理能力,具體功能如下∶

一、自動監控

1、監控到因機房停電造成大面積網絡中斷,給維護項目負責人發送短信,縮短了故障判斷及處理時間。

2、監控到雲平台物理服務器[2] CPU資源和內存資源不足,告警提示維護人員處理,避免承載的虛擬機因資源不足故障。

3、監控到Oracle數據庫表空間占用超高,提示處理後正常。

4、監控到產銷系統Tuxedo 中間件服務異常,及時處理後產銷Tuxedo 中間件運行正常。

5、監控到MB數據交換平台 JDBC 連接斷開,提示及時重啟 JDBC連接後正常。

6、監控到機房溫度超高,提示維護人員及時處理,恢復空調正常運行後正常,避免機房服務器大面積故障。

二、故障自愈

1、監控到統計系統某個文件目錄這磁盤空間占用超高,監控並故障自愈清除日誌文件後正常,保障了系統穩定運行,避免了故障擴大。

2、監控到Oracle數據庫工具庫鎖表超時,採用故障自愈措施主動解鎖,避免了業務受阻。

3、監控到重要進程掉線,採用故障自愈措施自動啟動進程後正常。三、運維管理

1、對工單進行全流程跟蹤處理,保證處理時效及效率,更有效地對維護質量進行監管。。

2、對變更及發布進行全流程跟蹤處理,保證變更及發布流程審核規範,更有效地對業務方進行協調。

3、全面掌控眾多信息系統的主機平台、網絡環境性能數據及應用服務數據準確性。

參考文獻