應用與資源配置管理
當應用模型層級復雜,需要通過應用快速找到依賴的云資源,以應用為基礎,配置統(tǒng)一監(jiān)控大盤、閾值告警、告警降噪策略、權限管理和變更管理等
優(yōu)勢
應用模型靈活
支持應用/子應用(可選)/組件/環(huán)境,最多6級模型關系
容器掛載配置
用戶只需要在工作負載中添加應用、組件和環(huán)境名稱,容器可自動掛載CMDB樹
基于CMDB的可觀測分析
AOM支持將指標、日志和性能數(shù)據(jù)關聯(lián)至CMDB應用上,用戶可統(tǒng)一對應用與資源運維分析
應用進程發(fā)現(xiàn)
發(fā)現(xiàn)規(guī)則支持通過環(huán)境變量或進程啟動命令行提取CMDB信息,采集器在采集指標、日志時同步完成CMDB樹創(chuàng)建
立體化監(jiān)控
AOM通過融合APM、LTS和CES,打造立體化監(jiān)控平臺。業(yè)務指標可通過APM事務或ELB負載均衡日志提取,應用指標通過APM應用性能或Prometheus獲取,資源指標直接集成云監(jiān)控。同時用戶也可將不同維度指標關聯(lián)到CMDB樹上,按應用模型統(tǒng)一管理
優(yōu)勢
全方位監(jiān)控
覆蓋基礎設施、云數(shù)據(jù)庫、云中間件、應用等多個維度監(jiān)控。提供一站式運維能力
故障關聯(lián)分析
通過應用、組件、環(huán)境等多維度關聯(lián)和分析上百種運維指標和告警數(shù)據(jù),以便您迅速定位故障原因
數(shù)據(jù)開放
應用運維管理產(chǎn)品架構
AOM是一個以資源數(shù)據(jù)為中心并關聯(lián)日志、指標、資源、告警和事件等數(shù)據(jù)的立體運維服務。AOM從架構上主要分為數(shù)據(jù)采集接入層、傳輸存儲層和業(yè)務計算層。
采用三層架構
數(shù)據(jù)采集接入層
ICAgent采集數(shù)據(jù)
給主機安裝ICAgent(插件式的數(shù)據(jù)采集器)并通過ICAgent上報相關的運維數(shù)據(jù)。
API接入數(shù)據(jù)
通過AOM提供的OpenAPI接口或者Exporter接口,將業(yè)務指標作為自定義指標,接入到AOM。
傳輸存儲層
數(shù)據(jù)傳輸:AOM Access是用來接收運維數(shù)據(jù)的代理服務,運維數(shù)據(jù)接收上來之后,會將數(shù)據(jù)投放到Kafka隊列中,利用Kafka高吞吐的能力,實時將數(shù)據(jù)傳輸給業(yè)務計算層。
數(shù)據(jù)存儲:運維數(shù)據(jù)經(jīng)過AOM后端服務的處理,將數(shù)據(jù)寫入到數(shù)據(jù)庫中,其中Cassandra用來存儲時序的指標數(shù)據(jù),Redis用來查詢緩存,ETCD用來存儲AOM的配置數(shù)據(jù),ElasticSearch用來存儲資源、日志、告警和事件。
業(yè)務計算層
AOM提供告警、日志、監(jiān)控、指標等基礎運維服務,同時也提供異常檢測與分析等AI服務。