應(yīng)用運(yùn)維管理 (Application Operations Management)是面向運(yùn)維、開發(fā)、運(yùn)營人員及IT經(jīng)理的云上運(yùn)維平臺(tái),以日志、指標(biāo)、事件形式實(shí)時(shí)監(jiān)控運(yùn)行、運(yùn)營數(shù)據(jù),為您提供云資源、網(wǎng)絡(luò)、中間件、上云業(yè)務(wù)等全鏈路的數(shù)百種運(yùn)維指標(biāo),讓您統(tǒng)一監(jiān)控資源、上云業(yè)務(wù),一站式完成云上運(yùn)維。
應(yīng)用監(jiān)控
應(yīng)用監(jiān)控是針對(duì)資源和應(yīng)用的監(jiān)控,通過應(yīng)用監(jiān)控您可以及時(shí)了解應(yīng)用的資源使用情況、趨勢(shì)和告警,使用這些信息,您可以快速響應(yīng),保證應(yīng)用流暢運(yùn)行。
應(yīng)用監(jiān)控是逐層下鉆設(shè)計(jì),層次關(guān)系為:應(yīng)用列表->應(yīng)用詳情->服務(wù)詳情->實(shí)例詳情->容器詳情->進(jìn)程詳情。即在應(yīng)用監(jiān)控中,將應(yīng)用、服務(wù)、實(shí)例、容器、進(jìn)程做了層層關(guān)聯(lián),在界面上就可以直接得知各層關(guān)系。
主機(jī)監(jiān)控
主機(jī)監(jiān)控是針對(duì)主機(jī)的監(jiān)控,通過主機(jī)監(jiān)控您可以及時(shí)了解主機(jī)的資源使用情況、趨勢(shì)和告警,使用這些信息,您可以快速響應(yīng),保證主機(jī)流暢運(yùn)行。
主機(jī)監(jiān)控的設(shè)計(jì)類似應(yīng)用監(jiān)控,主機(jī)的層級(jí)關(guān)系為:主機(jī)列表->主機(jī)詳情。詳情頁面包含了當(dāng)前主機(jī)上所發(fā)現(xiàn)的所有實(shí)例,顯卡,網(wǎng)卡,磁盤,文件系統(tǒng)。
指標(biāo)監(jiān)控
AOM 提供指標(biāo)監(jiān)控界面來檢索指標(biāo),通過資源的層級(jí)關(guān)系在指標(biāo)樹上進(jìn)行展示。當(dāng)前的資源關(guān)系為:集群->服務(wù)->實(shí)例->容器/進(jìn)程。在指標(biāo)監(jiān)控界面您可以將同一資源的不同指標(biāo)進(jìn)行對(duì)比,也可將不同資源的同一指標(biāo)進(jìn)行對(duì)比。一個(gè)指標(biāo)圖表最多可展示12個(gè)指標(biāo)。您還可將指標(biāo)圖表快速添加到儀表盤,以CSV或TXT文件形式導(dǎo)出指標(biāo)數(shù)據(jù)到本地。
應(yīng)用全景
應(yīng)用全景以應(yīng)用為中心,拉通服務(wù)、實(shí)例、主機(jī)、中間件等多維度關(guān)聯(lián)分析。通過應(yīng)用、服務(wù)、實(shí)例、主機(jī)和事務(wù)等多視角分析關(guān)聯(lián)指標(biāo)和告警數(shù)據(jù),直擊異常。
應(yīng)用自動(dòng)發(fā)現(xiàn)
您在主機(jī)上部署應(yīng)用后,在主機(jī)上安裝的ICAgent將自動(dòng)收集應(yīng)用信息,包括進(jìn)程名稱,應(yīng)用名稱,容器名稱,Kubernetes pod名稱等,自動(dòng)發(fā)現(xiàn)的應(yīng)用在界面上以圖形化方式展示,支持您自定義別名和分組對(duì)資源進(jìn)行管理。
儀表盤
通過儀表盤可將不同圖表展示到同一個(gè)屏幕上,通過不同的儀表形式來展示資源數(shù)據(jù),例如,曲線圖、數(shù)字圖、TopN圖表等,進(jìn)而全面、深入地掌握監(jiān)控?cái)?shù)據(jù)。
例如,可將重要資源的關(guān)鍵指標(biāo)添加到儀表盤中,從而實(shí)時(shí)地進(jìn)行監(jiān)控。還可將不同資源的同一指標(biāo)展示到同一個(gè)圖形界面上進(jìn)行對(duì)比。另外,對(duì)于例行運(yùn)維需要查看的指標(biāo),可添加到儀表盤中,以便再次打開AOM時(shí)無需重新選擇指標(biāo)就可進(jìn)行例行檢查任務(wù)。
告警中心
告警中心是告警和事件的管理平臺(tái),支持自定義通知?jiǎng)幼?,即您可通過郵件、短信等方式獲得告警信息,可幫您在第一時(shí)間發(fā)現(xiàn)異常及其根因。對(duì)于重點(diǎn)資源的指標(biāo)您可以創(chuàng)建閾值規(guī)則,當(dāng)指標(biāo)數(shù)據(jù)滿足閾值條件時(shí),AOM會(huì)產(chǎn)生閾值告警,還可使用閾值告警訂閱功能,將閾值告警對(duì)接到您的運(yùn)維平臺(tái)進(jìn)行分析。
日志管理
提供強(qiáng)大的日志管理能力。日志檢索功能可幫您快速在海量日志中查詢到所需的日志;日志轉(zhuǎn)儲(chǔ)幫您實(shí)現(xiàn)長期存儲(chǔ);通過創(chuàng)建日志統(tǒng)計(jì)規(guī)則實(shí)現(xiàn)關(guān)鍵詞周期性統(tǒng)計(jì),并生成指標(biāo)數(shù)據(jù),實(shí)時(shí)了解系統(tǒng)性能及業(yè)務(wù)等信息;通過配置分詞可將日志內(nèi)容按照分詞符切分為多個(gè)單詞,在日志搜索時(shí)可使用切分后的單詞進(jìn)行搜索;開啟日志訂閱功能可將AOM的日志實(shí)時(shí)對(duì)接到您的運(yùn)維平臺(tái)。
AOM集成了應(yīng)用性能管理服務(wù)(Application Performance Management,簡稱 APM )的相關(guān)功能(例如:拓?fù)鋱D、調(diào)用鏈、端測分析、異常SQL分析等),通過與APM配合實(shí)現(xiàn)更高級(jí)監(jiān)控,幫助運(yùn)維人員快速解決應(yīng)用在分布式架構(gòu)下的問題定位和性能瓶頸等難題,為您的體驗(yàn)保駕護(hù)航。