華為云計算 云知識 全域Serverless+AI,華為云加速大模型應用開發(fā)
全域Serverless+AI,華為云加速大模型應用開發(fā)

華為云首席產品官方國偉介紹,在AI時代背景下,軟件開發(fā)的方式由以代碼為中心,走向以模型為中心,如何將AI大模型能力充分利用起來,是當下云廠商積極探索的事情。

cke_176.jpeg

華為云首席產品官方國偉

企業(yè)研發(fā)人員在構建AIGC應用時更多關注開發(fā)部署門檻能否降低,更快的完成企業(yè)需求。運維人員要確保系統(tǒng)能夠穩(wěn)定運行,在業(yè)務量高峰時刻做到快速彈性,業(yè)務量小時節(jié)約成本,企業(yè)既能實現業(yè)務目標,又能保證系統(tǒng)可靠性高、成本較低。

為了更好的支撐AIGC應用,華為云提供了全域Serverless能力,推出了CCE Autopilot、FunctionGraph、CAE等Serverless產品,將一系列的AI原生技術構筑成后端服務,形成BaaS for AI能力,調用即可得。結合完善的工具鏈,幫忙企業(yè)快速構建應用。

cke_177.png

Serverless 容器CCE Autopilot、CCI讓用戶無需關注底層資源,自動運維,幫助用戶降低運維成本。

在Cloud Bursting場景,去哪兒網基于CCI打造了靈活上云新體驗,完成業(yè)務0改造,實現4000實例/30s的極致彈性。

FunctionGraph 3.0八大關鍵能力,助力AIGC應用創(chuàng)新

全新升級的FunctionGraph 3.0,新增Serverless應用中心、獨創(chuàng)Snapshot冷啟動加速、預留實例智能推薦特性,配合異構資源虛擬化技術,實現AIGC應用低成本、低延遲,加上端到端的全鏈路壓測和全??捎^測能力,助力AIGC應用快速開發(fā),天級上線。

cke_178.png

杭州曼孚科技有限公司是行業(yè)領先的AI基礎架構與數據智能平臺服務商,基于FunctionGraph構建 自動化 AI訓練平臺,更細粒度的GPU算力供給加上按需全自動資源彈性,實現成本降低40%。

華為云Serverless事件總線服務事件網格EventGrid能夠支持統(tǒng)一事件中心、事件驅動引擎、開放與集成、降低開發(fā)成本四大典型場景,為企業(yè)提供中心化的事件集成、治理和驅動能力。

在車聯(lián)網場景,某Top車企使用EventGrid構建Serverless化的事件驅動架構的同時,實現上下游異步解耦,便于擴展和避免單點故障;作為無碼化對接的事件中心,避免云服務間點對點對接,減少50%開發(fā)工作量以及數據高可靠0丟失和數據規(guī)則調整0變更。降低成本。

Serverless應用托管CAE產品升級:支持應用0代碼修改平遷上云,用戶無需修改業(yè)務代碼;支持Web/微服務應用Serverless化,幫助企業(yè)降本增效,提升業(yè)務穩(wěn)定性。

香港新世界旗下廣州新合創(chuàng)科技有限公司,使用CAE全托管模式提升50%效率;后續(xù)還會根據商場人流峰值設定定時伸縮,節(jié)省資源以降低成本。

BaaS for AI:華為云BaaS服務DWS 3.0 提供Pay By Resource彈性模式和Pay By Query彈性模式,幫助企業(yè)實現后端服務Serverless化。

“華為云提供全域Serverless能力,讓開發(fā)者5倍速開發(fā)行業(yè)大模型,支撐千行萬業(yè)的AI應用開發(fā)。面向AI領域全新升級的FunctionGraph 3.0,真正實現大模型應用即開即關、即時響應,無限擴展?!?/p>

Serverless 挺進 AI,強強聯(lián)合加速AI應用創(chuàng)新

cke_179.jpeg

華為2012實驗室中軟分布式與并行軟件實驗室主任譚焜

基于自主創(chuàng)新元戎內核構建的FunctionGraph 3.0如何保障AI應用開發(fā)部署低成本和響應低時延,華為2012實驗室中軟分布式與并行軟件實驗室主任譚焜做了深入的技術分享:

模型開發(fā)部署依賴昂貴的異構資源。傳統(tǒng)的異構函數,CPU和XPU資源綁定分配,單一推理函數包含CPU和XPU操作,操作CPU時XPU空閑,操作XPU時CPU空閑,資源利用率低。元戎獨創(chuàng)的純XPU異構函數,CPU和XPU資源綁定解耦,用戶可把不同類型資源的操作寫成不同的函數,執(zhí)行時分解到不同算力處理器上,無閑置資源。

cke_180.png

FunctionGraph打造Serverless AI最佳平臺

在大模型推理場景,包括全量推理和增量推理兩個階段。全量推理階段算力需求遠高于增量推理階段,增量推理階段,耗時可能遠長于全量推理階段。針對這類場景,元戎可以做到全量推理和增量推理解耦,各自按需彈性擴縮,精確算力供給,真正按使用量計費,降低用戶成本。

更快的應用響應速度意味著更好的用戶體驗。元戎自主創(chuàng)新的FoldFormer AI模型可在線持續(xù)預測用戶業(yè)務負載,提前進行實例預熱,達到85%~95%準確率,大大降低了冷啟動概率。無法被準確預測的流量,通過一系列優(yōu)化措施加速冷啟動。在用戶模型下載階段,基于內置的內存數據系統(tǒng)和SSD構建的分級高速緩存,實現系統(tǒng)內緩存模型文件,大幅縮短下載時間。計算時,模型按Layer分批加載,并根據用戶SLA和模型推理時延歷史數據構建最優(yōu)pipeline, 降低參數加載和模型推理總時延,冷啟動優(yōu)化到秒級。

譚焜最后總結道:“基于元戎內核,FunctionGraph 3.0提供異構函數極速冷啟動,細粒度異構資源管理和按需彈性擴縮,打造Serverless AI極低成本和極致性能;依托華為云豐富的BaaS服務和全托管的開發(fā)環(huán)境,打造Serverless AI極優(yōu)體驗?!?/p>

AI賦能建筑行業(yè)數字化

廣聯(lián)達科技股份有限公司首席業(yè)務專家/副總裁祁長福發(fā)表AI賦能建筑行業(yè)數字化主題演講。“廣聯(lián)達作為數字建筑平臺服務商,立足建筑產業(yè),圍繞工程項目的全生命周期,為客戶提供數字化解決方案,公司提出“數字建筑”理念,希望通過“數字建筑”系統(tǒng)、全面、深度地助力建筑產業(yè)轉型升級。”

cke_181.jpeg

廣聯(lián)達科技股份有限公司首席業(yè)務專家/副總裁祁長福

祁長福介紹,在技術方面,廣聯(lián)達通過大力研發(fā)BIM 和 云計算 、 大數據 、物聯(lián)網、移動互聯(lián)網、人工智能等信息技術引領產業(yè)轉型升級。

在AI領域,廣聯(lián)達圍繞行業(yè)難點,圍繞設計、成本、施工等重點領域,打造核心AI應用。應用設計采用Serverless理念,依托華為云Serverless服務構建解決方案,將AI模型以 鏡像 方式部署在FunctionGraph,對外提供通用API,無需管理運維異構資源(GPU等),模型實例隨業(yè)務量全自動擴縮容,無請求時實例縮容到0,低成本高可用運行。上層應用采用FaaS+ BaaS的Serverless應用架構,集成模型推理接口,只需專注于業(yè)務邏輯代碼,可函數級粒度并行開發(fā),快速迭代應用。

華為云FunctionGraph技術極大的優(yōu)化了AI應用的開發(fā)過程,讓AI團隊可以更關注業(yè)務實現,而無需關注底層技術細節(jié)。

“廣聯(lián)達以推動建筑行業(yè)數字化為己任,著力打造‘數字+連接+算法’的系統(tǒng)性數字化。圍繞行業(yè)痛點,我們以智能化技術為基礎,依托華為云FunctionGraph Severless架構,打造建筑從業(yè)人員的CoPilot,幫助行業(yè)人員提升作業(yè)效率,提高管理水平和決策質量?!?/p>

未來,華為云將持續(xù)落地全域Serverless產品,與華為2012實驗室深度合作,以FunctionGraph3.0為核心,打造Serverless AI極低成本和極致性能,充分滿足大模型應用的敏捷要求,助力千行萬業(yè)深度用云。

華為云Serverless 應用中心:http://m.cqfng.cn/product/functiongraph/applications.html