9月19日,華為全聯(lián)接大會2024舉辦期間,在“AI賦能應(yīng)用現(xiàn)代化,加速軟件生產(chǎn)力躍升”為主題的論壇上,華為云發(fā)布全棧可觀測平臺 AOM ,以AI賦能應(yīng)用運維可觀測,提升企業(yè)應(yīng)用可用性與穩(wěn)定性。
該平臺發(fā)布標(biāo)志著華為云在推動數(shù)字化轉(zhuǎn)型和智能化運維領(lǐng)域的又一重大突破,全??捎^測平臺的推出不僅為企業(yè)提供了更加全面和深入的系統(tǒng)監(jiān)控和數(shù)據(jù)分析能力,還通過集成先進的人工智能技術(shù),實現(xiàn)了對復(fù)雜應(yīng)用環(huán)境的實時優(yōu)化和問題預(yù)警。

應(yīng)用運維管理 (Application Operations Management,簡稱AOM)是云上應(yīng)用一站式可觀測性分析平臺,基于四層指標(biāo)體系(業(yè)務(wù)層指標(biāo)、應(yīng)用層指標(biāo)、中間件層指標(biāo)、基礎(chǔ)設(shè)施層),提供指標(biāo)、日志、調(diào)用鏈3類數(shù)據(jù)關(guān)聯(lián)分析、根因分析、場景化分析等可觀測分析能力,全面掌握應(yīng)用、資源實時運行狀況,及時發(fā)現(xiàn)故障。
華為云AOM主要能力
全場景數(shù)據(jù)接入,統(tǒng)一監(jiān)控大盤與告警管理:統(tǒng)一接入中心實現(xiàn)4層指標(biāo)體系數(shù)據(jù)上報,提供可視化圖表統(tǒng)一匯總呈現(xiàn)指標(biāo)、日志信息,統(tǒng)一告警規(guī)則配置、開箱即用告警模板以及智能告警降噪。
全鏈路調(diào)用鏈分析,智能化代碼級剖析Profiling:支持調(diào)用鏈路時序圖,直觀展示W(wǎng)eb端、App端到后端服務(wù)、 數(shù)據(jù)庫 、中間件鏈路關(guān)系,用戶一站式定位故障鏈路,快速發(fā)現(xiàn)消耗資源的代碼,定位CPU、內(nèi)存、時延性能問題。
容器監(jiān)控體系洞察:支持集群維度、核心插件、節(jié)點、負(fù)載、外部5大檢測維度、16個巡檢場景、49個檢測項診斷,實施掌握容器健康狀態(tài)。
海量日志引擎:自主創(chuàng)新的高性能搜索引擎,存算分離架構(gòu),多租戶共享海量彈性計算資源,實現(xiàn)百億級日志3秒內(nèi)返回搜索結(jié)果,提供日志結(jié)構(gòu)化解析組合編排、高性能SQL分析、一站式日志加工等能力。

華為云PaaS服務(wù)產(chǎn)品部部長徐峰對AIOps領(lǐng)域的發(fā)展做了系統(tǒng)性的規(guī)劃與展望,未來AIOps將是小模型與大模型結(jié)合使用,小模型聚焦故障感知定位解決量化確定性問題,大模型面向故障修復(fù)決策提升運維輔助人效,從AI故障感知、AI故障定位、AI生成故障修復(fù)建議三個方面構(gòu)筑未來智能可觀測產(chǎn)品力。
故障感知:通過多維指標(biāo)智能聚合與故障預(yù)測算法,面向AnyStack與AnyWhere數(shù)據(jù)實時分析,實現(xiàn)應(yīng)用故障1分鐘及時發(fā)現(xiàn)。
故障定位:通過告警相關(guān)性分析、水平&垂直關(guān)聯(lián)分析能力實現(xiàn)場景化根因分析,5分鐘完成故障定位診斷。
故障決策與修復(fù):生成式算法結(jié)合華為SRE運維經(jīng)驗和案例庫,覆蓋應(yīng)用到資源各類場景問題的解決方案,提供精準(zhǔn)修復(fù)建議,10分鐘完成應(yīng)用故障修復(fù)閉環(huán)。

會上,上海松鼠云上人工智能技術(shù)有限公司(簡稱松鼠AI)技術(shù)VP劉海濤分享了松鼠AI基于華為云AOM在智慧教育領(lǐng)域的實踐。
松鼠AI基于華為云AOM構(gòu)建Ai智適應(yīng)學(xué)習(xí)系統(tǒng)一站式可觀測性分析能力,融合指標(biāo)、日志、調(diào)用鏈3類數(shù)據(jù),實時掌握應(yīng)用健康狀態(tài),通過數(shù)據(jù)關(guān)聯(lián)、根因診斷、場景化分析等可觀測能力,做到應(yīng)用運維問題早發(fā)現(xiàn)早消除,全面保證Ai智適應(yīng)學(xué)習(xí)系統(tǒng)的健康、平穩(wěn)運轉(zhuǎn)。
未來,華為云應(yīng)用運維管理AOM將持續(xù)聚焦可觀測領(lǐng)域,利用AI賦能應(yīng)用智能可觀測,推動數(shù)字化轉(zhuǎn)型和智能化升級,面向用戶提供更高效、精準(zhǔn)的監(jiān)控和分析解決方案,通過智能化的數(shù)據(jù)處理和分析能力,為客戶提供全方位的系統(tǒng)洞察,在復(fù)雜的業(yè)務(wù)環(huán)境中快速識別潛在風(fēng)險,優(yōu)化操作流程,提升業(yè)務(wù)效益,顯著降低運維成本。