華為云計算 云知識 華為云FunctionGraph函數工作流—— “Serverless“遇見”AI,釋放AI生產力
華為云FunctionGraph函數工作流—— “Serverless“遇見”AI,釋放AI生產力

華為云 函數工作流 產品入口>>

 5月26日-27日,由msup主辦的2023年A2M峰會在上海南新雅皇冠假日酒店盛大舉行。本次A2M峰會以“AIGC時代下的AI落地實踐、數據智能和基礎架構演進”為主題,邀請了100余位行業(yè)專家從支撐數字化轉型的幾個關鍵技術切面入手,甄選前沿有典型代表的84個技術創(chuàng)新及研發(fā)實踐的架構案例,分享他們本年度的總結和實踐啟示。

峰會第二日,華為云Serverless研發(fā)工程師朱安東帶來了主題為“Serverless“遇見”AI,釋放AI生產力”的分享,重點介紹了業(yè)界領先的基于函數計算的Serverless AI 推理解決方案,并展示了華為云函數工作流(FunctionGraph)的靈活、速度,如何讓開發(fā)人員提升工程效率,縮短TTM等。

華為云 serverless研發(fā)工程師 朱安東

朱安東表示:“AIGC正逐漸在千行百業(yè)生根發(fā)芽,并且快速成為了行業(yè)中重要的生產力工具。伴隨著AIGC大模型以及領域專家類型的中小模型的快速演進,引發(fā)了海量AI推理、大模型托管以及底層強大算力的訴求。 然而,要想實現AI扎根千行百業(yè)、實現“AI everywhere”的最終目標,我們仍然有很長的路要走。”

Serverless—— AI everywhere的下一塊拼圖

從業(yè)內工程師的角度來看,AI應用迭代發(fā)展的核心痛點主要包含2個方面:

第一:算法工程師作為AI應用的核心開發(fā)者通常只會和模型、數據以及代碼打交道,主要工作圍繞數據清洗、數據工程、特征工程還有模型設計、開發(fā)、訓練等,偏研究和理論方向。但是一旦涉及到算法模型和AI應用的最終落地,推廣給大量用戶使用就會涉及到模型發(fā)布、上線等動作,為了完成這些流程,開發(fā)者通常需要去花時間和經歷學習托管類知識,尤其是 云原生 時代下的docker 還有k8s等;

第二:對于參數量很大的模型上線后很難找到足量、優(yōu)質的算力資源快速獲得推理結果,推理性能差。從基礎架構工程師的視角來看,GPU硬件設備成本高,研究階段的需求量尚且能夠滿足,但是上線后面對海量用戶和請求的資源量過于龐大,需要大量的投入;

另外,業(yè)務通常都是有浮動趨勢的,就像旅游業(yè)的淡季和旺季,為了滿足業(yè)務峰值準備的資源在業(yè)務量低的時候資源利用率也隨之降低,資源嚴重浪費。

綜上,AI應用如果想深入到人們的生活仍有很多問題需要克服。那么如何加速AI應用快速落地、敏捷迭代呢?Serverless是以應用為中心的新型云原生計算形態(tài),這是業(yè)界的共識。而“用戶無感、按需使用、以應用為中心,無需關注基礎設施”這幾個特性正好可以解決AI應用的幾個痛點問題:

第一:以應用為中心:AI工程師可以專注業(yè)務邏輯和模型performance,節(jié)約下大量的時間和精力。

第二:無需關注基礎設施:企業(yè)和架構工程師無需提前準備海量計算資源、自建機房,只需按需使用,按量計費。

華為云FunctionGraph解決AI用戶上云4大問題 

華為云FunctionGraph函數工作流是一項基于事件驅動的函數托管計算服務,通過函數工作流,只需編寫業(yè)務函數代碼并設置運行的條件,無需配置和管理服務器等基礎設施,函數便可以彈性、免運維、高可靠的方式運行。對于現階段人們對業(yè)務、彈性以及降本增效等訴求提升,華為云FunctionGraph無疑是AI推理Serverless化的優(yōu)質選項。

在Serverless的開發(fā)模式下,開發(fā)人員和交付流程實際上是有明顯界限的。開發(fā)人員只需要上傳代碼包或者一個 鏡像 文件即可讓整個業(yè)務跑起來,不需要面對繁瑣的交付流程。

為了讓用戶能夠在Serverless平臺上更加絲滑、流暢的開發(fā)和運行AI,華為云FunctionGraph推出了針對AI場景的解決方案,主要解決AI用戶上云的四大問題: 

①工程效率

  • 模型開發(fā)、編排:專注業(yè)務代碼,NoOps,低碼編排
  • 支持代碼包,容器鏡像

②性能、彈性:

  • 長時負載,支持異步函數調用,最長函數執(zhí)行時間72小時
  • 冷啟動問題:池化預熱、彈性調度

③運行時、異構計算:

  • 支持GPU/NPU,加速推理性能
  • 支持GPU共享,提升資源利用率

④模型加載加速:

  • 大文件加載:OBS+ SFS 結合,解決ML模型庫&模型自身大文件加載問題;
  • 鏈路加速:高性能解壓縮轉換,降網絡開銷、CPU解壓耗時;共享內存加速技術,降解壓IO開銷;依賴包預加載,降低公共依賴的下載、解壓耗時

同時華為云FunctionGraph基于函數計算的 Serverless AI 推理解決方案具有5大優(yōu)勢:

1.更低的學習成本,更卓越的工程效率,更短的TTM

華為云FunctionGraph可以極大提升開發(fā)效率。精通Python的算法科學家無需學習如何安裝、配置和操作復雜的計算和數據存儲基礎設施, 通過可視化拖拽式函數流便能編排復雜業(yè)務場景。此外,函數還支持容器鏡像,簡化了AI推理Serverless化。

2.豐富的函數開發(fā)生態(tài)。

華為云FunctionGraph支持GPU/NPU能力,具備GPU虛擬化技術,從而提高GPU硬件資源的利用率并降低使用成本。

3.更低的資源成本,按需付費,提供工作負載感知智能推薦能力。

函數計算以1ms粒度按量計費,函數編排基于節(jié)點執(zhí)行次數計費

4.極致的冷啟動、彈性及更智能的調度能力。

資源池化預熱、分層預加載與彈性水位控制:通過單實例多并發(fā)、分層預熱提升性能、降低成本。函數實例百毫秒冷啟動時延,毫秒級彈性。

5.多維度結合的大文件加載加速能力。

高性能解壓縮轉換,降網絡開銷、CPU解壓耗時。

共享內存加速技術,降解壓IO開銷。

依賴包預加載,降低公共依賴的下載、解壓耗時

Serverless代表現代化架構的演進方向,與微服務將長期并存,在5-10年內將成為云的首要交付模式。根據IDC今天發(fā)布的《全球半年度公有云服務跟蹤報告》顯示,2020年全球 云計算 市場同比增長24.1%,收入總額達3120億美元。同時Serverless對客戶端還具有成本優(yōu)化、效率提升的商業(yè)價值。面對Serverless的發(fā)展大勢,華為云將打造全棧全場景的Serverless能力,并在音視頻、數據處理、物聯網、端測應用等場景優(yōu)先推廣落地,圍繞這些場景進行打穿,推動相關高階服務進行Serverless化改造。今年,華為云在能力打造上將優(yōu)先推出函數計算2.0、Serverless應用托管 CAE、事件網格服務EventGrid、ADM等;同時,也將在Serverless開發(fā)工具及可觀測性上構建端到端的能力,并重點在前端Trigger、后端BaaS上進行豐富,全面打造Serverless應用生態(tài)。華為云FunctionGraph期待與更多的開發(fā)者見面。

華為云持續(xù)將最先進的技術提供給全球的客戶、伙伴和開發(fā)者,助力千行百業(yè)的客戶商業(yè)成功。