《面向連接的智能運(yùn)維體系:阿里大數(shù)據(jù)運(yùn)維實(shí)踐》由會(huì)員分享,可在線閱讀,更多相關(guān)《面向連接的智能運(yùn)維體系:阿里大數(shù)據(jù)運(yùn)維實(shí)踐(33頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、面向連接的智能運(yùn)維體系 阿里大數(shù)據(jù)運(yùn)維實(shí)踐 大綱Big dataops產(chǎn)品運(yùn)維歷程智能運(yùn)維理念Tesla產(chǎn)品體系運(yùn)維價(jià)值重塑01.02.03.04. OTSHadoop 02 04產(chǎn)品運(yùn)維歷程01 Before 2012人工&腳本工具整合,業(yè)務(wù)增長(zhǎng)2016智能運(yùn)維體系建設(shè)Hbase GalaxyTTHistore MaxComputeAnalyticDBJstormSLS 032014自動(dòng)化平臺(tái)2013 50 1/5 1:1產(chǎn)品運(yùn)維歷程 困境 求變 新生2014產(chǎn)品運(yùn)維歷程 智能運(yùn)維理念 是否有可以借鑒? 何種智能理念? 產(chǎn)品發(fā)展方向和終態(tài)? 智能運(yùn)維理念末端連接分析展現(xiàn)1.末端:直接操作 系
2、統(tǒng),應(yīng)用程序,硬件,網(wǎng)絡(luò) 的產(chǎn)品。2.分析:實(shí)現(xiàn)運(yùn)維人員思考問(wèn)題,分析需求,排查故障的產(chǎn)品,3.連接:實(shí)現(xiàn)分析與末端產(chǎn)品驅(qū)動(dòng)與反饋的連系產(chǎn)品。4.展現(xiàn):將智能平臺(tái)的狀態(tài) 以多種可視化的方式表達(dá)出來(lái)。 AEC T-FlowIDPS TDS ChangeLineT-cloneStarAgentCMDB ICS changefreeAlimonitor ACL智能運(yùn)維理念 T-Flow 工作流 Simple Flow Multi FlowTesla產(chǎn)品體系 T-Flow關(guān)鍵末端產(chǎn)品-系統(tǒng)層指令序列調(diào)度的服務(wù) Simple FlowTesla產(chǎn)品體系 T-FlowABC param1Tesla產(chǎn)品體系
3、 T-FlowSimple Flow Template/home/admin/update -t _%_param2 param3自動(dòng)忽略自動(dòng)重試異常報(bào)警自動(dòng)忽略超時(shí)時(shí)間/home/admin/update -t _%_自動(dòng)重試異常報(bào)警 cluster011.1.1.4$cluster011.1.1.5$cluster011.1.1.2$cluster011.1.1.3$cluster011.1.1.4$cluster011.1.1.5$cluster011.1.1.3$ clustre011.1.1.7$/home/admin/tools(-p t 3)-data) module1 yum
4、xxx module1) /home/admin/tools(-precheckyum xxx module1)yum xxx module1)yum xxx/home/admin/tools(-postcheck)-restart)/home/admin/tools(-p 1 t 4) Failed/home/admin/tools(-p 1 t 6)/home/admin/tools(-p 1 t 6) Tesla產(chǎn)品體系 T-FlowSimple Flow Instance 1 2 3 4Simple FlowInstanceTesla產(chǎn)品介紹 T-FlowMulti Flow Inst
5、ance= Tesla產(chǎn)品體系 T-Flow案例1. GalaxyUpgradePool2. UpgradeRegionServer3. FlightingUpdate simple flowsimple flowmulti flow Tesla產(chǎn)品體系 T-Flow Tesla產(chǎn)品體系 T-Flow Tesla產(chǎn)品體系 T-Flow Tesla產(chǎn)品體系 T-Flow 30000+實(shí)例運(yùn)行Tesla產(chǎn)品體系 T-Flow Tesla產(chǎn)品體系 ICS intelligent Connection ServiceICS關(guān)鍵連接服務(wù)層-解決事件與末端產(chǎn)品的連接監(jiān)控事件日志分析 流程事件AECT-fl
6、owNoc Tesla產(chǎn)品體系 ICS外部系統(tǒng)監(jiān)控系統(tǒng)1監(jiān)控系統(tǒng)2 日志分析1其他第三方觸發(fā)器監(jiān)控系統(tǒng)1配置,數(shù)據(jù)監(jiān)控系統(tǒng)2配置,數(shù)據(jù)日志分析1配置,數(shù)據(jù)其他第三方配置,數(shù)據(jù)事件處理插件注冊(cè)抑制通知事件調(diào)度沖突檢查K-V 依賴執(zhí)行器T-flow 執(zhí)行器接口AEC執(zhí)行器接口SSH執(zhí)行器接口消息訂閱服務(wù)末端系統(tǒng)T-flowAECPSSHTclone其他末端服務(wù) intelligent Connection Service系統(tǒng)架構(gòu) Tesla產(chǎn)品體系 ICS intelligent Connection Service案例盤古分布式文件系統(tǒng)一副本高危事件 Tesla產(chǎn)品體系 ICS intellig
7、ent Connection Service Tesla產(chǎn)品體系 ICS intelligent Connection Service Tesla產(chǎn)品體系 ICS intelligent Connection Service Tesla產(chǎn)品體系 ICS intelligent Connection Service Tesla產(chǎn)品體系 ICS intelligent Connection Service容量檢查,調(diào)參/縮擴(kuò)容硬件異常 ,維修下線分布式文件系統(tǒng)副本高危加速修補(bǔ)核心應(yīng)用服務(wù)Hang 緊急輪換 Tesla產(chǎn)品體系 TDS Troubleshoot Decision Service關(guān)鍵末
8、端分析型產(chǎn)品-提供通用線上故障智能分析及處理方案Checkpoint配置執(zhí)行類型:Check API,Check Script分析結(jié)果:example: A,B,C邊條件配置上游節(jié)點(diǎn):Checkpoint 下游節(jié)點(diǎn):Checkpoint / ICS上游結(jié)果表達(dá)式:case=A,case=C ,case=A&B 排查點(diǎn)1排查點(diǎn)2排查點(diǎn)3排查點(diǎn)4排查點(diǎn)5日志分析監(jiān)控報(bào)警故障工單ICSTesla產(chǎn)品體系 TDS Troubleshoot Decision ServiceTDS排查點(diǎn)6排查點(diǎn)7排查點(diǎn)8 Tesla產(chǎn)品體系 AEC & Crond關(guān)鍵末端產(chǎn)品-應(yīng)用環(huán)境實(shí)時(shí)維護(hù) rpm,文件,目錄低部署成本,簡(jiǎn)單通用灰度發(fā)布,低消高效規(guī)則多樣,文件模板多級(jí)綁定,靈活組合 Tesla產(chǎn)品體系 AEC & Crond關(guān)鍵末端產(chǎn)品-集中管理線上服務(wù)器定時(shí)調(diào)度任務(wù) Crond管理散亂執(zhí)行結(jié)果丟失異常通知機(jī)制積累日常任務(wù)效果數(shù)據(jù) D ata運(yùn)維價(jià)值重塑自動(dòng)化智能化 運(yùn)維價(jià)值重塑2017T-Flow ICS TDS 提供工作流引擎&智能連接服務(wù)&智能故障排查服務(wù),面向公有云及中小運(yùn)規(guī)模提供開(kāi)源版本,共建運(yùn)維自動(dòng)化生態(tài)代碼開(kāi)源