華為云計算 云知識 應用運維管理
應用運維管理

應用運維管理 (Application Operations Management)是面向運維、開發(fā)、運營人員及IT經(jīng)理的云上運維平臺,以日志、指標、事件形式實時監(jiān)控運行、運營數(shù)據(jù),為您提供云資源、網(wǎng)絡、中間件、上云業(yè)務、手機APP等全鏈路的數(shù)百種運維指標,讓您統(tǒng)一監(jiān)控資源、上云業(yè)務,一站式完成云上運維。

產(chǎn)品優(yōu)勢

立體運維

提供覆蓋應用性能、應用狀態(tài)、基礎設施狀態(tài)、云資源使用情況的一站式立體運維平臺。

關聯(lián)分析

以應用為中心,覆蓋組件、實例、主機、云資源等多維度關聯(lián)分析,迅速找到異常根因。

智能分析

AI智能閾值自動檢測,機器學習歷史基線數(shù)據(jù)產(chǎn)生告警,通過RCA分析找到問題根因。

開箱即用

無需修改業(yè)務代碼即可接入使用,非侵入式數(shù)據(jù)采集,安全無憂。

應用場景

AOM 應用廣泛,下面介紹AOM的四個典型應用場景,以便您深入了解。

端到云全鏈路監(jiān)控

當出現(xiàn)頁面加載較慢或者網(wǎng)站卡頓等諸多端側(cè)性能問題時,如果無法復現(xiàn)問題,就很難快速發(fā)現(xiàn)性能瓶頸并精準定位具體原因。例如:當頁面加載較慢時,是網(wǎng)絡問題、資源加載問題,還是頁面DOM(Document Object Model)解析問題?是與所在的省份、國家有關系,還是與瀏覽器、設備有關系?當網(wǎng)站出現(xiàn)卡頓現(xiàn)象,是終端到服務端的網(wǎng)絡問題,是服務端負載過高導致響應變慢,還是 數(shù)據(jù)庫 壓力過大?即使定位到了導致卡頓的環(huán)節(jié),也很難快速定位到代碼層面的根本原因。

AOM提供覆蓋從Browser或Mobile端側(cè)、網(wǎng)絡、WEB服務、數(shù)據(jù)中心的全鏈路監(jiān)控能力,您可以通過拓撲展示Mobile或Browser側(cè)到數(shù)據(jù)中心的時延和吞吐數(shù)據(jù),也可以通過端側(cè)分析獲取應用體驗、吞吐量、錯誤數(shù)、卡頓&崩潰分析、地理位置分布等應用性能監(jiān)控數(shù)據(jù),實時了解應用的運行狀態(tài),快速診斷故障。

優(yōu)勢

E2E全鏈路追蹤:通過分布式調(diào)用鏈追蹤技術還原問題現(xiàn)場,快速定位代碼性能瓶頸。

RCA智能根因分析:對運維數(shù)據(jù)智能實時分析,識別成功和異常的規(guī)律,從而找出問題根因。

零編碼接入:APP側(cè)采用非侵入式埋點技術,無需使用SDK方式埋點,APP快速接入。

運維指標智能分析

海量業(yè)務下,出現(xiàn)百種指標監(jiān)控、KPI數(shù)據(jù)、調(diào)用跟蹤數(shù)據(jù)等豐富但無關聯(lián)的運維數(shù)據(jù),如何通過應用、服務、實例、主機和事務等多視角分析關聯(lián)指標和告警數(shù)據(jù),自動完成故障根因分析;如何基于歷史數(shù)據(jù)學習與運維經(jīng)驗庫,對異常進行智能分析并給出可能原因。

AOM通過AI智能算法分析各類運維指標趨勢變化,提前預測潛在異常,包括指標的增幅過高、規(guī)律變化等。

優(yōu)勢

場景智能識別:根據(jù)運維指標特征選擇算法匹配,如狀態(tài)跳變、周期異常等。

自適應算法:當出現(xiàn)過多告警時,自動調(diào)整算法參數(shù)抑制告警。

毛刺信號自動過濾:自動過濾掉偶然出現(xiàn)離散的毛刺信號,避免誤報。

巡檢與問題定界

日常運維中,遇到異常難定位、日志難獲取等問題,需要一個監(jiān)控平臺對資源、日志、應用性能進行全方位的監(jiān)控。

AOM深度對接應用服務,一站式收集基礎設施、中間件和應用實例的運維數(shù)據(jù),通過指標監(jiān)控、 日志分析 、事件報警等功能,支持日常巡檢資源、應用整體運行情況,及時發(fā)現(xiàn)并定界應用與資源的問題。

優(yōu)勢

應用自動發(fā)現(xiàn):自動部署采集器,針對應用的運行環(huán)境,主動發(fā)現(xiàn)應用并進行監(jiān)控。

跨云服務的分布式應用監(jiān)控:對于同時使用了多種云服務的分布式應用,提供統(tǒng)一的運維平臺,便于您對業(yè)務進行立體排查。

事件告警靈活通知:提供多種異常檢測策略并支持豐富的異常事件觸發(fā)方式及API。

立體化運維

您需全方位掌控系統(tǒng)的運行狀態(tài),并快速響應各類問題。

AOM提供從云平臺到資源,再到應用的監(jiān)控和微服務調(diào)用鏈的立體化運維分析能力。

優(yōu)勢

體驗保障:實時掌控業(yè)務KPI健康狀態(tài),對異常事務根因分析。

故障快速診斷:分布式調(diào)用追蹤,快速找到異常故障點。

資源運行保障:實時監(jiān)控容器、磁盤、網(wǎng)絡等上百種資源運維指標集群-虛機-應用-容器異常關聯(lián)分析。