五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

溫馨提示
恭喜您,訂閱成功!
溫馨提示
抱歉,訂閱失敗,請稍后再試!
溫馨提示
您還未綁定郵箱,需要綁定郵箱才能訂閱哦!訂閱成功后,訂閱信息會發(fā)送到您綁定的郵箱。
溫馨提示
請您在新打開的頁面綁定郵箱!
注意:綁定郵箱完成前,請不要關(guān)閉此窗口!

背景介紹

成都潛在人工智能科技有限公司(行者 AI)是一家成立3年的初創(chuàng)企業(yè),2023年加入華為云初創(chuàng)計劃,也是華為云加速器的第一期學(xué)員企業(yè)。通過華為云的技術(shù)賦能和全球生態(tài)資源網(wǎng)絡(luò),加速開拓海外市場。


行者AI是國內(nèi)領(lǐng)先的智慧文娛AI一站式人工智能解決方案提供商,秉承以AI技術(shù)賦能智慧文娛行業(yè)的愿景,自主研發(fā)了AI+美術(shù),AI+音樂,AI+智能體,AI+安全等產(chǎn)品與解決方案。公司研發(fā)人員占比超70%,團(tuán)隊擁有10年以上技術(shù)研發(fā)經(jīng)驗及AI行業(yè)、游戲行業(yè)從業(yè)積累。


截至目前,公司已擁有國家高新技術(shù)企業(yè)、50余項的專利和軟著、10余篇SCI與EI論文等知識產(chǎn)權(quán)。曾主導(dǎo)并參與過工信部、華為中央研究院等橫縱向項目。

業(yè)務(wù)挑戰(zhàn)

系統(tǒng)穩(wěn)定性需求

公司有很多客戶使用API調(diào)用,API的使用跟客戶的APP深度綁定,SLA必須達(dá)到4個9,并且需要保證上線期間也不影響API調(diào)用;產(chǎn)研團(tuán)隊每個月都面臨2-3次機(jī)房故障或者服務(wù)器性能bug,故障期間會造成整個研發(fā)團(tuán)隊停擺,消耗極大的人力和時間成本。

業(yè)務(wù)效果預(yù)警

行者AI的服務(wù)基于AI,服務(wù)的效果并不會一成不變,而是隨著服務(wù)的使用發(fā)生或好或差的變化,如何快速跟進(jìn)算法效果變化,并進(jìn)行優(yōu)化,提高客戶的滿意度,是一個非常核心的問題。

GPU調(diào)度

隨著客戶的增長,服務(wù)消耗的GPU資源越來越多,GPU型號也越來越多,針對不同服務(wù),如何有效地調(diào)用GPU資源,會嚴(yán)重影響公司的營收與利潤,從而影響公司的可持續(xù)發(fā)展。


解決方案

云容器引擎CCE承載API超千萬日調(diào)用量

行者AI的諦聽內(nèi)容安全,API的日調(diào)用量突破了1000萬,采用微服務(wù)框架,包含多個微服務(wù),部署在數(shù)十個容器節(jié)點上,需要可靠穩(wěn)定的容器集群才能保證系統(tǒng)穩(wěn)定性。行者AI將服務(wù)部署在華為云CCE容器集群上,利用CCE調(diào)度近百個微服務(wù)節(jié)點,并利用WAF來防止API被濫用,同時利用流量監(jiān)測進(jìn)行服務(wù)的彈性伸縮,維持了系統(tǒng)的穩(wěn)定性,自上線以來,0事故。

服務(wù)監(jiān)測平臺實時上報業(yè)務(wù)與日志數(shù)據(jù)

行者AI基于華為云ECS和LTS服務(wù)搭建了服務(wù)監(jiān)測平臺,客戶在使用行者AI服務(wù)時,會實時上報使用日志,計算出監(jiān)控業(yè)務(wù)指標(biāo),如發(fā)現(xiàn)算法效果下降,會立即安排算法同學(xué)進(jìn)行排查,快速響應(yīng)客戶成功SOP,讓用戶更滿意服務(wù)。

GPU調(diào)度,嚴(yán)格把控成本

?????????行者AI有大量算法服務(wù),AI生成圖片、AI內(nèi)容安全審核、AINPC、AI生成音樂等,都要使用GPU算力,分散管理帶來GPU的利用率比較低。行者AI利用華為云CCE容器管理去集中管理各種GPU服務(wù)節(jié)點,再利用MongoDB和Redis構(gòu)建了任務(wù)隊列,把GPU資源整體利用率提高到了80%以上,降低了GPU的采購成本,也提高業(yè)務(wù)整體的毛利率。

客戶價值

  • 線上業(yè)務(wù)維持穩(wěn)定,支撐1000以上并發(fā)能力

    從2022年開始,行者AI陸續(xù)把游戲內(nèi)容資產(chǎn)生成、AI音樂、AI內(nèi)容安全等所有業(yè)務(wù)陸續(xù)遷移到華為云上,彈性支撐了業(yè)務(wù)增長,支撐了1000以上并發(fā)能力,完美支撐了客戶的需要。

    從2022年開始,行者AI陸續(xù)把游戲內(nèi)容資產(chǎn)生成、AI音樂、AI內(nèi)容安全等所有業(yè)務(wù)陸續(xù)遷移到華為云上,彈性支撐了業(yè)務(wù)增長,支撐了1000以上并發(fā)能力,完美支撐了客戶的需要。

  • GPU資源平均利用率保持在80%以上

    行者AI的訓(xùn)練和推理任務(wù),需要的算力差異很大,比如:游戲2D美術(shù)的底模訓(xùn)練、風(fēng)格固化Lora訓(xùn)練以及各種不同尺寸的圖片生成,2K以內(nèi)的圖片只需要24G顯存,而4K、8K圖片則需要40G乃至80G顯存?;谌A為云的GPU調(diào)度平臺,讓任務(wù)與算力資源得到了正確的匹配,使GPU資源利用率平均保持在80%以上。

    行者AI的訓(xùn)練和推理任務(wù),需要的算力差異很大,比如:游戲2D美術(shù)的底模訓(xùn)練、風(fēng)格固化Lora訓(xùn)練以及各種不同尺寸的圖片生成,2K以內(nèi)的圖片只需要24G顯存,而4K、8K圖片則需要40G乃至80G顯存?;谌A為云的GPU調(diào)度平臺,讓任務(wù)與算力資源得到了正確的匹配,使GPU資源利用率平均保持在80%以上。

  • 數(shù)據(jù)驅(qū)動讓算法優(yōu)化更高效,模型每天可更新10次以上

    通過建立指標(biāo)監(jiān)測體系、日志分析平臺和5分鐘報警機(jī)制,使線上的算法效果變化盡收眼底,配合客戶成功經(jīng)理的打標(biāo)和模型的自學(xué)習(xí),可以快速輸出效果變化的原因、新模型的效果,從而驅(qū)動算法工程師是否上線新模型,一天可更新模型10次以上。

    通過建立指標(biāo)監(jiān)測體系、日志分析平臺和5分鐘報警機(jī)制,使線上的算法效果變化盡收眼底,配合客戶成功經(jīng)理的打標(biāo)和模型的自學(xué)習(xí),可以快速輸出效果變化的原因、新模型的效果,從而驅(qū)動算法工程師是否上線新模型,一天可更新模型10次以上。

客戶聲音

華為云產(chǎn)品的穩(wěn)定性和技術(shù)人員的貼身服務(wù),讓我們能放心的把行者AI的產(chǎn)品和部署在華為云上,同時,通過與華為云銷售團(tuán)隊的緊密配合,我們的業(yè)務(wù)飛速發(fā)展,在給游戲廠商賦能領(lǐng)域達(dá)到了業(yè)界TOP5,更是占領(lǐng)了游戲內(nèi)容安全領(lǐng)域第一的位置。


行者AI技術(shù)副總裁 陳超