《智能IT運維課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《智能IT運維課件.ppt(31頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、 智能IT運維管理經(jīng)驗及分享 Page2 運維現(xiàn)狀與困難 信息化迅猛發(fā)展的同時,給IT部門帶來了更大的壓力IT部 門 面 臨 的 “ 技 術(shù) ” 難 題 各種業(yè)務(wù)系統(tǒng)越來越多,系統(tǒng)對IT資源的依賴性高,系統(tǒng)一旦出現(xiàn)任何問題,需要逐個排查,故障定位難。1 業(yè)務(wù)運行環(huán)境越來越復(fù)雜,故障定位慢 運維人員每天面臨大量的重復(fù)性、手工性的故障排查工作,不僅費時費力,而且容易出錯,亟需自動化的手段幫助提升效率。2 運維工作繁重,缺少自動化工具和手段 信息化迅猛發(fā)展的同時,給IT部門帶來了更大的壓力IT部 門 面 臨 的 “ 管 理 ” 難 題 信息化投入了巨大資金,到底都花到哪了?花的錢建設(shè)成了什么效果?對
2、單位的信息化提升起到了什么幫助?4 信息化建設(shè)投入巨大,難以展現(xiàn)效果 日常運維工作流程混亂,或者沒有標(biāo)準(zhǔn)流程,造成工作效率低下,同時客戶抱怨、投訴不減 員工干好干壞一個樣,員工績效無法體現(xiàn)3 運維工作沒有流程化、規(guī)范化、電子化 IT部門運維管理解決思路面對困難,如何找到解決辦法?1 業(yè)務(wù)運行環(huán)境越來越復(fù)雜,故障定位慢 2 運維工作繁重,缺少自動化工具和手段4 信息化建設(shè)投入巨大,難以展現(xiàn)效果3 運維工作沒有流程化、規(guī)范化、電子化 資源統(tǒng)一監(jiān)控 問題高效解決 運維水平提升 業(yè)務(wù)系統(tǒng)掌控I P 承 載 網(wǎng)支 撐 資 源 建設(shè)成果可視化 Page6 資源統(tǒng)一監(jiān)控 IT基礎(chǔ)管理網(wǎng)絡(luò)管理網(wǎng)絡(luò)管理主機系統(tǒng)
3、管理 中間件管理應(yīng)用系統(tǒng)管理數(shù)據(jù)庫管理1.網(wǎng)絡(luò)自動發(fā)現(xiàn) 360度雷達(dá)掃描視圖多協(xié)議多算法自動調(diào)整自動發(fā)現(xiàn)詳情多協(xié)議并發(fā)發(fā)現(xiàn),效率高自動發(fā)現(xiàn)與建模2.網(wǎng)絡(luò)設(shè)備性能管理全局性能監(jiān)測設(shè)備負(fù)荷TOPN排名實時性能監(jiān)控3.網(wǎng)絡(luò)拓?fù)涔芾砣滞負(fù)湟晥D、拓?fù)浞謱右晥D拓?fù)湓噲D可自定義編輯分布式拓?fù)淠J酵負(fù)浒l(fā)現(xiàn)深入,2、3層拓?fù)?.網(wǎng)絡(luò)流量管理全局流量監(jiān)測鏈路流量TOPN排名重要鏈路流量信息應(yīng)用流量分析5.網(wǎng)絡(luò)故障管理網(wǎng)絡(luò)管理:通過多種協(xié)議的主動管理方式,實時監(jiān)控網(wǎng)絡(luò)設(shè)備性能參數(shù),快速發(fā)現(xiàn)故障,及時發(fā)出告警自動發(fā)現(xiàn)設(shè)備性能管理網(wǎng)絡(luò)故障管理機房監(jiān)控管理網(wǎng)絡(luò)拓?fù)涔芾?IT基礎(chǔ)管應(yīng)用管理網(wǎng)絡(luò)管理服務(wù)器管理 中間件管理基
4、礎(chǔ)服務(wù)管理數(shù)據(jù)庫管理機房監(jiān)控管理1. 業(yè)務(wù)視圖(以業(yè)務(wù)角度管理IT)2.非代理監(jiān)控方式3.實時性能分析 網(wǎng)絡(luò)實時性能分析 主機性能實時分析4.關(guān)鍵進(jìn)程監(jiān)控管理5.應(yīng)用指標(biāo)TOP10總結(jié)應(yīng)用系統(tǒng)管理:對網(wǎng)絡(luò)內(nèi)的主機、操作系統(tǒng)、數(shù)據(jù)庫、中間件等應(yīng)用系統(tǒng)的故障檢測和性能管理。1.事件關(guān)聯(lián)分析2.根源性告警設(shè)置3.智能化告警處理 告警通知 智能告警處理,避免告 警風(fēng)暴4.告警詳細(xì)信息展示5.經(jīng)驗知識庫維護管理告警事件管理:將IT環(huán)境中的事件統(tǒng)一搜集,經(jīng)過智能分析與過濾,形成告警事件,并予以通知和展示。應(yīng)用監(jiān)控管理 告警設(shè)置平臺統(tǒng)一告警平臺 性能狀態(tài) IT基礎(chǔ)管理機房管理網(wǎng)絡(luò)管理主機系統(tǒng)管理 中間件管理
5、應(yīng)用系統(tǒng)管理數(shù)據(jù)庫管理機房監(jiān)控管理機房監(jiān)控管理:全面的機房動力環(huán)境元素的監(jiān)控,形成多維匯總報表數(shù)據(jù),通過Portal統(tǒng)一展現(xiàn),1.溫濕度、UPS、市電等統(tǒng)一顯示2.告警數(shù)據(jù)集成顯示3.機房管理系統(tǒng)頁面集成4.統(tǒng)一事件管理5.統(tǒng)一機房監(jiān)控對比6.實時機房性能數(shù)據(jù)展示 Page10 IT生存環(huán)境 無線管理 Page11 可視化無線熱圖,真實反映無線熱點覆蓋情況,直觀體現(xiàn)無線設(shè)備下用戶連接數(shù)量;智能的無線障礙物信號衰減算法,真實體現(xiàn)無線信號覆蓋情況,為規(guī)劃無線解決解決方案提供依據(jù);無線AC、AP、Radio、在線用戶、WLAN服務(wù)的統(tǒng)一資源管理,可清晰地建立各資源的關(guān)聯(lián)關(guān)系,降低管理員的管理難度;
6、向?qū)脚渲霉芾?,使無線方案的落地變得輕松、簡單; 多維度的無線資源統(tǒng)計報表,直觀展示無線設(shè)備總體健康狀況和利用情況。 Page12 業(yè)務(wù)系統(tǒng)掌控 Page13 掌控的基礎(chǔ),是很清晰的知道IT資源支撐了哪些業(yè)務(wù),哪些服務(wù) Page14 IT需要全局掌控 Page15 IT需要全局掌控哪個業(yè)務(wù)出現(xiàn)了問題 Page16 IT管理需要全局掌控具體發(fā)生了什么 Page17 IT管理需要全局掌控從整體到局部,從宏觀到微觀 Page18 問題高效解決 異常事件即時告警,定位故障 Page19 萬一出了事要能快速定位,解決看看設(shè)備之間的關(guān)聯(lián)關(guān)系,追查故障,排除影響查看維護記錄,尋求相關(guān)知識幫助排除問題,恢復(fù)業(yè)
7、務(wù) IPAD移動終端,隨身攜帶的IT管家 Page20IPAD客戶端-資源一覽 IPAD客戶端-資源詳情1. 系統(tǒng)全面支持IOS平臺移動終端iPad,通過移動終端隨時隨地了解IT資源運行情況;2. 終端支持事件、告警、資源一覽,實現(xiàn)關(guān)鍵設(shè)備運行狀態(tài)查詢、告警處理等功能。 Page21 運維水平提升 主動巡防能力,及早發(fā)現(xiàn)隱患 Page22 手工化的設(shè)備健康檢查耗時費力,依賴命令檢查技術(shù)門檻高,缺乏有效監(jiān)督和提醒,問題發(fā)現(xiàn)不及時,巡檢記錄難以統(tǒng)計、分析。1. 自定義設(shè)定自動巡檢范圍、指標(biāo)、頻度以及巡檢報告表單;2. 自動、手動兩種方式對設(shè)備的運行狀況進(jìn)行巡檢;3. 自動生成巡檢報告;4. 支持巡
8、檢報告自動發(fā)送功能。 自動巡檢設(shè)置巡檢報告 掌控所有配置項信息,實現(xiàn)資產(chǎn)全生命周期管理 Page23 這臺設(shè)備是誰負(fù)責(zé)?什么時候采購的?什么時候過保?如果對這臺設(shè)備進(jìn)行變更,會對其他設(shè)備及業(yè)務(wù)造成什么影響?1. 向?qū)Х绞酵瓿膳渲脤?dǎo)入、自動發(fā)現(xiàn)、權(quán)限配置、關(guān)聯(lián)關(guān)系設(shè)定等系列CMDB的構(gòu)建工作; 2. 可自定義擴展配置項屬性;3. 圖形化設(shè)置并展示配置項間關(guān)系;4. 可定義配置項審計任務(wù),并進(jìn)行自動化審計操作,生成審計報告; 5. 實現(xiàn)CMDB與資源管理的雙向關(guān)聯(lián)。 配置關(guān)系視圖 配置項定義 技術(shù)儲備,全面提升組織能力 Page24 人員的經(jīng)驗和技能該如何進(jìn)行復(fù)制?如何形成知識庫,達(dá)成經(jīng)驗積累?同
9、類事件再次發(fā)生時,如何找出歷史的解決方法供參考?1. 實現(xiàn)知識在事件處理過程中積累,一步勾選添加知識庫;2. 實現(xiàn)知識生命周期管理,包括新建、審批、發(fā)布等; 3. 按照個人需要可自定義知識查詢視圖;4. 支持知識評級管理,價值排名,且與績效掛鉤。 知識一覽及詳情 添加知識 Page25 建設(shè)成果可視化 Page26 管理需要可視化 Page27 管理需要可視化 Page28 管理需要可視化 Page29 建設(shè)思路 集簡約、高效、自動化IT運維體系建立的思路 知識庫管理事件管理問題管理計劃任務(wù)科技工作管理 自助服務(wù)臺變更管理配置管理服務(wù)級別 CMDB 數(shù)據(jù)庫 存儲 服務(wù)器 網(wǎng)絡(luò) 中間件 機房 業(yè)
10、務(wù)系統(tǒng) 報障請求 獲得反饋登記、自助知識庫、跟跟進(jìn)度 快速響應(yīng)和恢復(fù)故障 根源分析和解決 知識積累與共享變更風(fēng)險管控IT資源全生命周期管理周期性工作值班與巡檢項目進(jìn)度、資源管理 達(dá)成IT交付與業(yè)務(wù)需求的平衡 IT資源的集中管理 用戶 IT基礎(chǔ)設(shè)施 流程業(yè)務(wù)資源 業(yè)務(wù)需求 服務(wù)承諾 網(wǎng)絡(luò)監(jiān)控業(yè)務(wù)應(yīng)用監(jiān)控應(yīng)用服務(wù)資源監(jiān)控服務(wù)器 數(shù)據(jù)庫中間件 存儲 業(yè)務(wù)卡片 健康繁忙層級管理 業(yè)務(wù)關(guān)聯(lián) 網(wǎng)絡(luò)拓?fù)?網(wǎng)絡(luò)故障網(wǎng)絡(luò)性能 自動發(fā)現(xiàn) 第一步:建立自動化監(jiān)控和管理平臺,并展現(xiàn)信息化建設(shè)成果第二步:建立故障與流程的自動觸發(fā),結(jié)合SLA提升人員服務(wù)效率 第三步:建立可量化的IT部門考核體系,呈現(xiàn)IT部門業(yè)績和價值
11、IT部門工作的未來藍(lán)圖 服務(wù)器 網(wǎng)絡(luò) 數(shù)據(jù)庫存儲 應(yīng)用 中間件異常告警通知自動生成事件單事件管理快速響應(yīng)、解決突發(fā)故障及請求,在最短時間內(nèi)恢復(fù)業(yè)務(wù)IP呼叫中心電話受理,自動識別來電用戶身份 服務(wù)臺座席創(chuàng)建事件單自助服務(wù)臺 用戶WEB登錄,提報服務(wù)或故障請求 生成事件單 技術(shù)人員受理并嘗試解決分派查詢知識解決,通知用戶獲得滿意度反饋 升級 問題管理根源分析,找出根本原因,避免故障再次發(fā)生知識庫服務(wù)級別管理跟蹤事件處理時效,達(dá)成與客戶的服務(wù)約定 申請變更 變更管理控制變更可能產(chǎn)生的風(fēng)險 問題小組分析并根源解決解決方案入知識庫 申請變更變更評審委員會評估、制定變更計劃受理 指派 技術(shù)人員變更實施及發(fā)布CMDB 資產(chǎn)配置管理員更新配置信息通知配置管理資產(chǎn)配置全生命周期管理 更新 發(fā)現(xiàn) 同步 客戶與IT主管 計劃任務(wù)管理周期性任務(wù)提醒、執(zhí)行、監(jiān)督項目管理開發(fā)及重大實施項目周期管理長周期變更任務(wù)KPI與報表管理報表輸出,關(guān)鍵績效指標(biāo)分析 達(dá)成服務(wù)級別協(xié)議IT主管決策、優(yōu)化改進(jìn)用戶-客戶端服務(wù)或故障報告 用戶-電話服務(wù)或故障報告 大屏幕 項目經(jīng)理技術(shù)人員執(zhí)行計劃任務(wù) 機房IT基礎(chǔ)架構(gòu)監(jiān)控系統(tǒng) 機房監(jiān)控系統(tǒng)