應用運維管理 (Application Operations Management)是面向運維、開發(fā)、運營人員及IT經(jīng)理的云上運維平臺,以日志、指標、事件形式實時監(jiān)控運行、運營數(shù)據(jù),為您提供云資源、網(wǎng)絡、中間件、上云業(yè)務、手機APP等全鏈路的數(shù)百種運維指標,讓您統(tǒng)一監(jiān)控資源、上云業(yè)務,一站式完成云上運維。
產(chǎn)品優(yōu)勢
立體運維
提供覆蓋應用性能、應用狀態(tài)、基礎設施狀態(tài)、云資源使用情況的一站式立體運維平臺。
關聯(lián)分析
以應用為中心,覆蓋組件、實例、主機、云資源等多維度關聯(lián)分析,迅速找到異常根因。
智能分析
AI智能閾值自動檢測,機器學習歷史基線數(shù)據(jù)產(chǎn)生告警,通過RCA分析找到問題根因。
開箱即用
無需修改業(yè)務代碼即可接入使用,非侵入式數(shù)據(jù)采集,安全無憂。
應用場景
AOM 應用廣泛,下面介紹AOM的四個典型應用場景,以便您深入了解。
端到云全鏈路監(jiān)控
當出現(xiàn)頁面加載較慢或者網(wǎng)站卡頓等諸多端側(cè)性能問題時,如果無法復現(xiàn)問題,就很難快速發(fā)現(xiàn)性能瓶頸并精準定位具體原因。例如:當頁面加載較慢時,是網(wǎng)絡問題、資源加載問題,還是頁面DOM(Document Object Model)解析問題?是與所在的省份、國家有關系,還是與瀏覽器、設備有關系?當網(wǎng)站出現(xiàn)卡頓現(xiàn)象,是終端到服務端的網(wǎng)絡問題,是服務端負載過高導致響應變慢,還是 數(shù)據(jù)庫 壓力過大?即使定位到了導致卡頓的環(huán)節(jié),也很難快速定位到代碼層面的根本原因。
AOM提供覆蓋從Browser或Mobile端側(cè)、網(wǎng)絡、WEB服務、數(shù)據(jù)中心的全鏈路監(jiān)控能力,您可以通過拓撲展示Mobile或Browser側(cè)到數(shù)據(jù)中心的時延和吞吐數(shù)據(jù),也可以通過端側(cè)分析獲取應用體驗、吞吐量、錯誤數(shù)、卡頓&崩潰分析、地理位置分布等應用性能監(jiān)控數(shù)據(jù),實時了解應用的運行狀態(tài),快速診斷故障。
優(yōu)勢
E2E全鏈路追蹤:通過分布式調(diào)用鏈追蹤技術還原問題現(xiàn)場,快速定位代碼性能瓶頸。
RCA智能根因分析:對運維數(shù)據(jù)智能實時分析,識別成功和異常的規(guī)律,從而找出問題根因。
零編碼接入:APP側(cè)采用非侵入式埋點技術,無需使用SDK方式埋點,APP快速接入。
運維指標智能分析
海量業(yè)務下,出現(xiàn)百種指標監(jiān)控、KPI數(shù)據(jù)、調(diào)用跟蹤數(shù)據(jù)等豐富但無關聯(lián)的運維數(shù)據(jù),如何通過應用、服務、實例、主機和事務等多視角分析關聯(lián)指標和告警數(shù)據(jù),自動完成故障根因分析;如何基于歷史數(shù)據(jù)學習與運維經(jīng)驗庫,對異常進行智能分析并給出可能原因。
AOM通過AI智能算法分析各類運維指標趨勢變化,提前預測潛在異常,包括指標的增幅過高、規(guī)律變化等。
優(yōu)勢
場景智能識別:根據(jù)運維指標特征選擇算法匹配,如狀態(tài)跳變、周期異常等。
自適應算法:當出現(xiàn)過多告警時,自動調(diào)整算法參數(shù)抑制告警。
毛刺信號自動過濾:自動過濾掉偶然出現(xiàn)離散的毛刺信號,避免誤報。
巡檢與問題定界
日常運維中,遇到異常難定位、日志難獲取等問題,需要一個監(jiān)控平臺對資源、日志、應用性能進行全方位的監(jiān)控。
AOM深度對接應用服務,一站式收集基礎設施、中間件和應用實例的運維數(shù)據(jù),通過指標監(jiān)控、 日志分析 、事件報警等功能,支持日常巡檢資源、應用整體運行情況,及時發(fā)現(xiàn)并定界應用與資源的問題。
優(yōu)勢
應用自動發(fā)現(xiàn):自動部署采集器,針對應用的運行環(huán)境,主動發(fā)現(xiàn)應用并進行監(jiān)控。
跨云服務的分布式應用監(jiān)控:對于同時使用了多種云服務的分布式應用,提供統(tǒng)一的運維平臺,便于您對業(yè)務進行立體排查。
事件告警靈活通知:提供多種異常檢測策略并支持豐富的異常事件觸發(fā)方式及API。
立體化運維
您需全方位掌控系統(tǒng)的運行狀態(tài),并快速響應各類問題。
AOM提供從云平臺到資源,再到應用的監(jiān)控和微服務調(diào)用鏈的立體化運維分析能力。
優(yōu)勢
體驗保障:實時掌控業(yè)務KPI健康狀態(tài),對異常事務根因分析。
故障快速診斷:分布式調(diào)用追蹤,快速找到異常故障點。
資源運行保障:實時監(jiān)控容器、磁盤、網(wǎng)絡等上百種資源運維指標集群-虛機-應用-容器異常關聯(lián)分析。