《《智能IT運維》PPT課件》由會員分享,可在線閱讀,更多相關《《智能IT運維》PPT課件(31頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、 智能IT運維管理經(jīng)驗及分享 Page2 運維現(xiàn)狀與困難 信息化迅猛發(fā)展的同時,給IT部門帶來了更大的壓力IT部 門 面 臨 的 “ 技 術 ” 難 題 各種業(yè)務系統(tǒng)越來越多,系統(tǒng)對IT資源的依賴性高,系統(tǒng)一旦出現(xiàn)任何問題,需要逐個排查,故障定位難。1 業(yè)務運行環(huán)境越來越復雜,故障定位慢 運維人員每天面臨大量的重復性、手工性的故障排查工作,不僅費時費力,而且容易出錯,亟需自動化的手段幫助提升效率。2 運維工作繁重,缺少自動化工具和手段 信息化迅猛發(fā)展的同時,給IT部門帶來了更大的壓力IT部 門 面 臨 的 “ 管 理 ” 難 題 信息化投入了巨大資金,到底都花到哪了?花的錢建設成了什么效果?對
2、單位的信息化提升起到了什么幫助?4 信息化建設投入巨大,難以展現(xiàn)效果 日常運維工作流程混亂,或者沒有標準流程,造成工作效率低下,同時客戶抱怨、投訴不減 員工干好干壞一個樣,員工績效無法體現(xiàn)3 運維工作沒有流程化、規(guī)范化、電子化 IT部門運維管理解決思路面對困難,如何找到解決辦法?1 業(yè)務運行環(huán)境越來越復雜,故障定位慢 2 運維工作繁重,缺少自動化工具和手段4 信息化建設投入巨大,難以展現(xiàn)效果3 運維工作沒有流程化、規(guī)范化、電子化 資源統(tǒng)一監(jiān)控 問題高效解決 運維水平提升 業(yè)務系統(tǒng)掌控I P 承 載 網(wǎng)支 撐 資 源 建設成果可視化 Page6 資源統(tǒng)一監(jiān)控 IT基礎管理網(wǎng)絡管理網(wǎng)絡管理主機系統(tǒng)
3、管理 中間件管理應用系統(tǒng)管理數(shù)據(jù)庫管理1.網(wǎng)絡自動發(fā)現(xiàn) 360度雷達掃描視圖多協(xié)議多算法自動調(diào)整自動發(fā)現(xiàn)詳情多協(xié)議并發(fā)發(fā)現(xiàn),效率高自動發(fā)現(xiàn)與建模2.網(wǎng)絡設備性能管理全局性能監(jiān)測設備負荷TOPN排名實時性能監(jiān)控3.網(wǎng)絡拓撲管理全局拓撲視圖、拓撲分層視圖拓撲試圖可自定義編輯分布式拓撲模式拓撲發(fā)現(xiàn)深入,2、3層拓撲4.網(wǎng)絡流量管理全局流量監(jiān)測鏈路流量TOPN排名重要鏈路流量信息應用流量分析5.網(wǎng)絡故障管理網(wǎng)絡管理:通過多種協(xié)議的主動管理方式,實時監(jiān)控網(wǎng)絡設備性能參數(shù),快速發(fā)現(xiàn)故障,及時發(fā)出告警自動發(fā)現(xiàn)設備性能管理網(wǎng)絡故障管理機房監(jiān)控管理網(wǎng)絡拓撲管理 IT基礎管應用管理網(wǎng)絡管理服務器管理 中間件管理基
4、礎服務管理數(shù)據(jù)庫管理機房監(jiān)控管理1. 業(yè)務視圖(以業(yè)務角度管理IT)2.非代理監(jiān)控方式3.實時性能分析 網(wǎng)絡實時性能分析 主機性能實時分析4.關鍵進程監(jiān)控管理5.應用指標TOP10總結(jié)應用系統(tǒng)管理:對網(wǎng)絡內(nèi)的主機、操作系統(tǒng)、數(shù)據(jù)庫、中間件等應用系統(tǒng)的故障檢測和性能管理。1.事件關聯(lián)分析2.根源性告警設置3.智能化告警處理 告警通知 智能告警處理,避免告 警風暴4.告警詳細信息展示5.經(jīng)驗知識庫維護管理告警事件管理:將IT環(huán)境中的事件統(tǒng)一搜集,經(jīng)過智能分析與過濾,形成告警事件,并予以通知和展示。應用監(jiān)控管理 告警設置平臺統(tǒng)一告警平臺 性能狀態(tài) IT基礎管理機房管理網(wǎng)絡管理主機系統(tǒng)管理 中間件管理
5、應用系統(tǒng)管理數(shù)據(jù)庫管理機房監(jiān)控管理機房監(jiān)控管理:全面的機房動力環(huán)境元素的監(jiān)控,形成多維匯總報表數(shù)據(jù),通過Portal統(tǒng)一展現(xiàn),1.溫濕度、UPS、市電等統(tǒng)一顯示2.告警數(shù)據(jù)集成顯示3.機房管理系統(tǒng)頁面集成4.統(tǒng)一事件管理5.統(tǒng)一機房監(jiān)控對比6.實時機房性能數(shù)據(jù)展示 Page10 IT生存環(huán)境 無線管理 Page11 可視化無線熱圖,真實反映無線熱點覆蓋情況,直觀體現(xiàn)無線設備下用戶連接數(shù)量;智能的無線障礙物信號衰減算法,真實體現(xiàn)無線信號覆蓋情況,為規(guī)劃無線解決解決方案提供依據(jù);無線AC、AP、Radio、在線用戶、WLAN服務的統(tǒng)一資源管理,可清晰地建立各資源的關聯(lián)關系,降低管理員的管理難度;
6、向?qū)脚渲霉芾恚篃o線方案的落地變得輕松、簡單; 多維度的無線資源統(tǒng)計報表,直觀展示無線設備總體健康狀況和利用情況。 Page12 業(yè)務系統(tǒng)掌控 Page13 掌控的基礎,是很清晰的知道IT資源支撐了哪些業(yè)務,哪些服務 Page14 IT需要全局掌控 Page15 IT需要全局掌控哪個業(yè)務出現(xiàn)了問題 Page16 IT管理需要全局掌控具體發(fā)生了什么 Page17 IT管理需要全局掌控從整體到局部,從宏觀到微觀 Page18 問題高效解決 異常事件即時告警,定位故障 Page19 萬一出了事要能快速定位,解決看看設備之間的關聯(lián)關系,追查故障,排除影響查看維護記錄,尋求相關知識幫助排除問題,恢復業(yè)
7、務 IPAD移動終端,隨身攜帶的IT管家 Page20IPAD客戶端-資源一覽 IPAD客戶端-資源詳情1. 系統(tǒng)全面支持IOS平臺移動終端iPad,通過移動終端隨時隨地了解IT資源運行情況;2. 終端支持事件、告警、資源一覽,實現(xiàn)關鍵設備運行狀態(tài)查詢、告警處理等功能。 Page21 運維水平提升 主動巡防能力,及早發(fā)現(xiàn)隱患 Page22 手工化的設備健康檢查耗時費力,依賴命令檢查技術門檻高,缺乏有效監(jiān)督和提醒,問題發(fā)現(xiàn)不及時,巡檢記錄難以統(tǒng)計、分析。1. 自定義設定自動巡檢范圍、指標、頻度以及巡檢報告表單;2. 自動、手動兩種方式對設備的運行狀況進行巡檢;3. 自動生成巡檢報告;4. 支持巡
8、檢報告自動發(fā)送功能。 自動巡檢設置巡檢報告 掌控所有配置項信息,實現(xiàn)資產(chǎn)全生命周期管理 Page23 這臺設備是誰負責?什么時候采購的?什么時候過保?如果對這臺設備進行變更,會對其他設備及業(yè)務造成什么影響?1. 向?qū)Х绞酵瓿膳渲脤?、自動發(fā)現(xiàn)、權限配置、關聯(lián)關系設定等系列CMDB的構建工作; 2. 可自定義擴展配置項屬性;3. 圖形化設置并展示配置項間關系;4. 可定義配置項審計任務,并進行自動化審計操作,生成審計報告; 5. 實現(xiàn)CMDB與資源管理的雙向關聯(lián)。 配置關系視圖 配置項定義 技術儲備,全面提升組織能力 Page24 人員的經(jīng)驗和技能該如何進行復制?如何形成知識庫,達成經(jīng)驗積累?同
9、類事件再次發(fā)生時,如何找出歷史的解決方法供參考?1. 實現(xiàn)知識在事件處理過程中積累,一步勾選添加知識庫;2. 實現(xiàn)知識生命周期管理,包括新建、審批、發(fā)布等; 3. 按照個人需要可自定義知識查詢視圖;4. 支持知識評級管理,價值排名,且與績效掛鉤。 知識一覽及詳情 添加知識 Page25 建設成果可視化 Page26 管理需要可視化 Page27 管理需要可視化 Page28 管理需要可視化 Page29 建設思路 集簡約、高效、自動化IT運維體系建立的思路 知識庫管理事件管理問題管理計劃任務科技工作管理 自助服務臺變更管理配置管理服務級別 CMDB 數(shù)據(jù)庫 存儲 服務器 網(wǎng)絡 中間件 機房 業(yè)
10、務系統(tǒng) 報障請求 獲得反饋登記、自助知識庫、跟跟進度 快速響應和恢復故障 根源分析和解決 知識積累與共享變更風險管控IT資源全生命周期管理周期性工作值班與巡檢項目進度、資源管理 達成IT交付與業(yè)務需求的平衡 IT資源的集中管理 用戶 IT基礎設施 流程業(yè)務資源 業(yè)務需求 服務承諾 網(wǎng)絡監(jiān)控業(yè)務應用監(jiān)控應用服務資源監(jiān)控服務器 數(shù)據(jù)庫中間件 存儲 業(yè)務卡片 健康繁忙層級管理 業(yè)務關聯(lián) 網(wǎng)絡拓撲 網(wǎng)絡故障網(wǎng)絡性能 自動發(fā)現(xiàn) 第一步:建立自動化監(jiān)控和管理平臺,并展現(xiàn)信息化建設成果第二步:建立故障與流程的自動觸發(fā),結(jié)合SLA提升人員服務效率 第三步:建立可量化的IT部門考核體系,呈現(xiàn)IT部門業(yè)績和價值
11、IT部門工作的未來藍圖 服務器 網(wǎng)絡 數(shù)據(jù)庫存儲 應用 中間件異常告警通知自動生成事件單事件管理快速響應、解決突發(fā)故障及請求,在最短時間內(nèi)恢復業(yè)務IP呼叫中心電話受理,自動識別來電用戶身份 服務臺座席創(chuàng)建事件單自助服務臺 用戶WEB登錄,提報服務或故障請求 生成事件單 技術人員受理并嘗試解決分派查詢知識解決,通知用戶獲得滿意度反饋 升級 問題管理根源分析,找出根本原因,避免故障再次發(fā)生知識庫服務級別管理跟蹤事件處理時效,達成與客戶的服務約定 申請變更 變更管理控制變更可能產(chǎn)生的風險 問題小組分析并根源解決解決方案入知識庫 申請變更變更評審委員會評估、制定變更計劃受理 指派 技術人員變更實施及發(fā)布CMDB 資產(chǎn)配置管理員更新配置信息通知配置管理資產(chǎn)配置全生命周期管理 更新 發(fā)現(xiàn) 同步 客戶與IT主管 計劃任務管理周期性任務提醒、執(zhí)行、監(jiān)督項目管理開發(fā)及重大實施項目周期管理長周期變更任務KPI與報表管理報表輸出,關鍵績效指標分析 達成服務級別協(xié)議IT主管決策、優(yōu)化改進用戶-客戶端服務或故障報告 用戶-電話服務或故障報告 大屏幕 項目經(jīng)理技術人員執(zhí)行計劃任務 機房IT基礎架構監(jiān)控系統(tǒng) 機房監(jiān)控系統(tǒng)