開通應(yīng)用性能管理 APM2.0
步驟一、開通APM2.0。
- 登錄華為云APM管理控制臺。
- 單擊左側(cè)
,選擇“管理與監(jiān)管 > 應(yīng)用性能管理 APM”進入APM服務(wù)頁面。 - 單擊右上角“點擊體驗新版”進入APM2.0服務(wù)頁面。
- 單擊“免費體驗應(yīng)用監(jiān)控”,開通服務(wù)。
步驟二、自動創(chuàng)建訪問密鑰。
- 自動創(chuàng)建訪問密鑰。
- APM2.0通過AK/SK進行簽名驗證,通過授權(quán)的帳號才能上報數(shù)據(jù)。
- 登錄APM2.0服務(wù)控制臺。
- 單擊左側(cè)導(dǎo)航欄“系統(tǒng)管理 > 訪問密鑰”,進入訪問密鑰頁面。
- 在訪問密鑰頁面查看自動創(chuàng)建的訪問密鑰。
通過應(yīng)用性能管理 APM 快速管理應(yīng)用
在“總覽”頁面的應(yīng)用視角下,如何通過APM快速管理應(yīng)用,包括應(yīng)用快速接入、手工接入等操作。
-
快速接入
-
步驟二:進程發(fā)現(xiàn)
為應(yīng)用配置進程發(fā)現(xiàn)規(guī)則,采集器會主動上報運維數(shù)據(jù)。
為應(yīng)用配置進程發(fā)現(xiàn)規(guī)則,采集器會主動上報運維數(shù)據(jù)。
應(yīng)用運維管理 APM應(yīng)用場景
-
應(yīng)用異常診斷
業(yè)務(wù)痛點
分布式微服務(wù)架構(gòu)下的應(yīng)用,雖然豐富多樣且開發(fā)效率高,但是給傳統(tǒng)運維診斷技術(shù)帶來了巨大挑戰(zhàn)。以電商為例,主要遇到如下問題:
定位問題難
客服人員接到用戶反饋商品購買出現(xiàn)問題后,會交由技術(shù)人員排查解決。而微服務(wù)分布式架構(gòu)中的一個業(yè)務(wù)請求通常要經(jīng)過多個服務(wù)/節(jié)點后返回結(jié)果。一旦請求出現(xiàn)錯誤,往往要在多臺機器上反復(fù)翻看日志才能初步定位問題,對簡單問題的排查也常常涉及多個團隊。
架構(gòu)梳理難
在業(yè)務(wù)邏輯變得逐漸復(fù)雜以后,很難從代碼層面去梳理某個應(yīng)用依賴了哪些下游服務(wù)(數(shù)據(jù)庫、HTTP API、緩存),以及被哪些外部調(diào)用所依賴。業(yè)務(wù)邏輯的梳理、架構(gòu)的治理和容量的規(guī)劃(例如活動的準(zhǔn)備過程中,需要為每個應(yīng)用準(zhǔn)備多少臺機器)也變得更加困難。
業(yè)務(wù)實現(xiàn)
APM提供大型分布式應(yīng)用異常診斷能力,當(dāng)應(yīng)用出現(xiàn)崩潰或請求失敗時,通過應(yīng)用拓撲+調(diào)用鏈下鉆能力分鐘級完成問題定位。
可視化拓撲:應(yīng)用拓撲自發(fā)現(xiàn),異常應(yīng)用實例無處躲藏。
調(diào)用鏈跟蹤:發(fā)現(xiàn)異常應(yīng)用后,通過調(diào)用鏈一鍵下鉆,代碼問題根因清晰可見。
慢SQL分析:提供數(shù)據(jù)庫、SQL語句的調(diào)用次數(shù)、響應(yīng)時間、錯誤次數(shù)等關(guān)鍵指標(biāo)視圖,支持異常SQL語句導(dǎo)致的數(shù)據(jù)庫性能問題分析。
業(yè)務(wù)痛點
分布式微服務(wù)架構(gòu)下的應(yīng)用,雖然豐富多樣且開發(fā)效率高,但是給傳統(tǒng)運維診斷技術(shù)帶來了巨大挑戰(zhàn)。以電商為例,主要遇到如下問題:
定位問題難
客服人員接到用戶反饋商品購買出現(xiàn)問題后,會交由技術(shù)人員排查解決。而微服務(wù)分布式架構(gòu)中的一個業(yè)務(wù)請求通常要經(jīng)過多個服務(wù)/節(jié)點后返回結(jié)果。一旦請求出現(xiàn)錯誤,往往要在多臺機器上反復(fù)翻看日志才能初步定位問題,對簡單問題的排查也常常涉及多個團隊。
架構(gòu)梳理難
在業(yè)務(wù)邏輯變得逐漸復(fù)雜以后,很難從代碼層面去梳理某個應(yīng)用依賴了哪些下游服務(wù)(數(shù)據(jù)庫、HTTP API、緩存),以及被哪些外部調(diào)用所依賴。業(yè)務(wù)邏輯的梳理、架構(gòu)的治理和容量的規(guī)劃(例如活動的準(zhǔn)備過程中,需要為每個應(yīng)用準(zhǔn)備多少臺機器)也變得更加困難。
業(yè)務(wù)實現(xiàn)
APM提供大型分布式應(yīng)用異常診斷能力,當(dāng)應(yīng)用出現(xiàn)崩潰或請求失敗時,通過應(yīng)用拓撲+調(diào)用鏈下鉆能力分鐘級完成問題定位。
可視化拓撲:應(yīng)用拓撲自發(fā)現(xiàn),異常應(yīng)用實例無處躲藏。
調(diào)用鏈跟蹤:發(fā)現(xiàn)異常應(yīng)用后,通過調(diào)用鏈一鍵下鉆,代碼問題根因清晰可見。
慢SQL分析:提供數(shù)據(jù)庫、SQL語句的調(diào)用次數(shù)、響應(yīng)時間、錯誤次數(shù)等關(guān)鍵指標(biāo)視圖,支持異常SQL語句導(dǎo)致的數(shù)據(jù)庫性能問題分析。
-
應(yīng)用體驗管理
業(yè)務(wù)痛點
在用戶體驗至上的互聯(lián)網(wǎng)時代,即使后臺業(yè)務(wù)穩(wěn)定運行,仍然無法獲悉用戶訪問系統(tǒng)時的具體情況,因而定位線上用戶偶現(xiàn)的前端問題變得非常困難。一個系統(tǒng)上線之后,訪問時的大量報錯導(dǎo)致用戶無法正常使用,如果我們無法及時獲知,就會導(dǎo)致流失大量用戶,如果用戶反饋頁面的使用情況,我們能否第一時間復(fù)現(xiàn)用戶的使用場景;能否知曉用戶遇到的詳細報錯信息而快速修復(fù)。
業(yè)務(wù)實現(xiàn)
APM提供應(yīng)用體驗管理能力,實時分析應(yīng)用事務(wù)從用戶請求、服務(wù)器到數(shù)據(jù)庫,再到服務(wù)器、用戶請求的完整過程,實時感知用戶對應(yīng)用的滿意度,幫助您全面了解用戶體驗狀況。對于用戶體驗差的事務(wù),通過拓撲和調(diào)用鏈完成事務(wù)問題定位。
應(yīng)用KPI分析:吞吐量、時延、成功率指標(biāo)分析,實時掌控用戶體驗健康狀態(tài),用戶體驗一覽無遺。
全鏈路性能跟蹤:Web服務(wù)、緩存、數(shù)據(jù)庫全棧跟蹤,性能瓶頸輕松掌握
業(yè)務(wù)痛點
在用戶體驗至上的互聯(lián)網(wǎng)時代,即使后臺業(yè)務(wù)穩(wěn)定運行,仍然無法獲悉用戶訪問系統(tǒng)時的具體情況,因而定位線上用戶偶現(xiàn)的前端問題變得非常困難。一個系統(tǒng)上線之后,訪問時的大量報錯導(dǎo)致用戶無法正常使用,如果我們無法及時獲知,就會導(dǎo)致流失大量用戶,如果用戶反饋頁面的使用情況,我們能否第一時間復(fù)現(xiàn)用戶的使用場景;能否知曉用戶遇到的詳細報錯信息而快速修復(fù)。
業(yè)務(wù)實現(xiàn)
APM提供應(yīng)用體驗管理能力,實時分析應(yīng)用事務(wù)從用戶請求、服務(wù)器到數(shù)據(jù)庫,再到服務(wù)器、用戶請求的完整過程,實時感知用戶對應(yīng)用的滿意度,幫助您全面了解用戶體驗狀況。對于用戶體驗差的事務(wù),通過拓撲和調(diào)用鏈完成事務(wù)問題定位。
應(yīng)用KPI分析:吞吐量、時延、成功率指標(biāo)分析,實時掌控用戶體驗健康狀態(tài),用戶體驗一覽無遺。
全鏈路性能跟蹤:Web服務(wù)、緩存、數(shù)據(jù)庫全棧跟蹤,性能瓶頸輕松掌握
-
故障智能診斷
業(yè)務(wù)痛點
海量業(yè)務(wù)下,出現(xiàn)百種指標(biāo)監(jiān)控、KPI數(shù)據(jù)、調(diào)用跟蹤數(shù)據(jù)等豐富但無關(guān)聯(lián)的應(yīng)用運維數(shù)據(jù),如何通過應(yīng)用、組件和URL跟蹤等多視角分析關(guān)聯(lián)指標(biāo)和告警數(shù)據(jù),自動完成故障根因分析;如何基于歷史數(shù)據(jù)學(xué)習(xí)與運維經(jīng)驗庫,對異常事務(wù)智能分析給出可能原因。
業(yè)務(wù)實現(xiàn)
APM提供故障智能診斷能力,基于機器學(xué)習(xí)算法自動檢測應(yīng)用故障。當(dāng)URL跟蹤出現(xiàn)異常時,通過智能算法學(xué)習(xí)歷史指標(biāo)數(shù)據(jù),多維度關(guān)聯(lián)分析異常指標(biāo),提取業(yè)務(wù)正常與異常時上下文數(shù)據(jù)特征,如資源、參數(shù)、調(diào)用結(jié)構(gòu),通過聚類分析找到問題根因。
業(yè)務(wù)痛點
海量業(yè)務(wù)下,出現(xiàn)百種指標(biāo)監(jiān)控、KPI數(shù)據(jù)、調(diào)用跟蹤數(shù)據(jù)等豐富但無關(guān)聯(lián)的應(yīng)用運維數(shù)據(jù),如何通過應(yīng)用、組件和URL跟蹤等多視角分析關(guān)聯(lián)指標(biāo)和告警數(shù)據(jù),自動完成故障根因分析;如何基于歷史數(shù)據(jù)學(xué)習(xí)與運維經(jīng)驗庫,對異常事務(wù)智能分析給出可能原因。
業(yè)務(wù)實現(xiàn)
APM提供故障智能診斷能力,基于機器學(xué)習(xí)算法自動檢測應(yīng)用故障。當(dāng)URL跟蹤出現(xiàn)異常時,通過智能算法學(xué)習(xí)歷史指標(biāo)數(shù)據(jù),多維度關(guān)聯(lián)分析異常指標(biāo),提取業(yè)務(wù)正常與異常時上下文數(shù)據(jù)特征,如資源、參數(shù)、調(diào)用結(jié)構(gòu),通過聚類分析找到問題根因。
應(yīng)用運維管理 APM常見問題解答
應(yīng)用運維管理 APM常見問題解答
應(yīng)用運維管理 APM幫你您全面了解云上的資源使用情況、業(yè)務(wù)的運行狀況,并及時收到異常告警做出反應(yīng),保證業(yè)務(wù)順暢運行
應(yīng)用運維管理 APM幫你您全面了解云上的資源使用情況、業(yè)務(wù)的運行狀況,并及時收到異常告警做出反應(yīng),保證業(yè)務(wù)順暢運行