數(shù)字人功能特性
MetaStudio提供形象制作、聲音定制、分身形象視頻制作、分身形象視頻直播、分身形象名片制作、智能交互等能力,如表1所示。
表1 功能特性
|
功能名稱
|
功能描述
|
|---|---|
形象制作 |
通過拍攝真人視頻,建模生成數(shù)字人分身形象。 數(shù)字人可作為虛擬主播、虛擬主持、虛擬客服、虛擬老師等形象使用。 |
聲音制作 |
通過錄制真人聲音,建模生成自定義的數(shù)字人聲音,用于為數(shù)字人配音。 也支持直接購買第三方聲音套餐,使用套餐內(nèi)的聲音,為數(shù)字人配音。 |
視頻制作 |
使用數(shù)字人形象,進行畫布和音頻設(shè)置,合成視頻。 適用于各類培訓(xùn)、宣講、知識分享等場景。 |
視頻直播 |
使用數(shù)字人形象,進行畫布設(shè)置、劇本設(shè)計、互動和開播設(shè)置,生成直播視頻。 可用于在合作的第三方平臺進行數(shù)字人視頻直播。 |
智能交互 |
支持用戶開箱即用的智能交互數(shù)字人場景;也支持使用智能交互API或SDK,自主開發(fā)實現(xiàn)與數(shù)字人對話場景。 |
數(shù)字人名片 |
支持為分身數(shù)字人制作形象名片,且支持通過名片來試聽語音效果。 |
照片數(shù)字人 |
支持上傳正面清晰的人像照片,生成會說話的照片數(shù)字人視頻。 |
產(chǎn)品優(yōu)勢
控制臺自助服務(wù),一站式快速生成所需內(nèi)容
用戶申請賬號并上傳相關(guān)授權(quán),拍攝訓(xùn)練所需音視頻素材,上傳進行模型訓(xùn)練,生成自定義形象和聲音。選擇背景、聲音、模特等內(nèi)容,基于文本或語音智能驅(qū)動,實現(xiàn)視頻制作、視頻直播、智能交互等能力。
華為云盤古數(shù)字人大模型,賦能千行百業(yè)數(shù)字化營銷新模式
MetaStudio服務(wù)依托華為云基礎(chǔ)設(shè)施、海量算力(CPU/GPU/NPU)、全球一張網(wǎng)(算網(wǎng)融合、超低時延),通過華為云盤古數(shù)字人大模型,訓(xùn)練生成數(shù)字人、數(shù)字物、數(shù)字空間,實現(xiàn)數(shù)字人視頻制作、直播、智能交互和數(shù)字人IP代言等場景。
數(shù)字人升級迭代快,提升產(chǎn)品競爭力
- 口型精準:口型匹配度>95%,多語種無縫切換,泛化能力強。
- 表情自然:通過AI眼神矯正,矯正前后眼部ID一致,避免眼神不聚焦。
- 圖像真實:智能重打光,背景融合更真實。
- 多種復(fù)雜場景建模:支持人物走動、側(cè)身等訓(xùn)練,肢體動作更自然。
- 多語言泛化:一次母語訓(xùn)練,多語種支持;支持20+語種,覆蓋主流語言。
相對真人成本下降90%以上
- 一次拍攝與訓(xùn)練后,可無限次使用;無時間約束、無時長限制、無容量限制;統(tǒng)一質(zhì)量,穩(wěn)定性高;口型、動作匹配度高,無限接近真實。
- 僅分身數(shù)字人動作自由度受限于采集視頻的動作范圍,綜合對比數(shù)字人比真人成本低、效率高,且質(zhì)量穩(wěn)定。
數(shù)字人直播更真實、更沉浸
- 支持持物直播、實景直播、彈幕智能互動、真人隨時接管,讓數(shù)字人直播更真實、更沉浸。
- 支持數(shù)字人直播矩陣式管理,高級策略配置管理直播更靈活。
實時智能交互,提升客戶滿意度和品牌形象
開放的Web SDK及API可快速集成到第三方業(yè)務(wù)系統(tǒng),實現(xiàn)AI數(shù)字員工問答、服務(wù)、陪練等場景任務(wù)。
- 1.5秒超低時延交互
實時驅(qū)動極低延時,保障用戶真實體驗。
- 多模型數(shù)字人大腦
華為云智能問答機器人CBS
華為云盤古大模型
- 能力開放可集成
智能交互端側(cè)Web SDK
形象驅(qū)動API
數(shù)字人大腦API
數(shù)字人能力開放,多種合作模式靈活選擇
- 實名安全認證后,可使用控制臺在線自助完成內(nèi)容制作。
- 集成數(shù)字人API、SDK至企業(yè)自建平臺。
- 聯(lián)合專業(yè)直播服務(wù)伙伴,定制場景化解決方案,實現(xiàn)數(shù)字人直播系統(tǒng)交付和運營專業(yè)支持。
幫助客戶提升產(chǎn)品競爭力
- 大幅提升數(shù)字人生產(chǎn)效率
滿足批量生成數(shù)字人訴求,平臺支持幾百到上千的并發(fā)模型訓(xùn)練任務(wù)。
- 大幅提升數(shù)字人生產(chǎn)質(zhì)量
模型質(zhì)量提升30%以上,數(shù)字人名片迅速引流新陣地直播產(chǎn)品,業(yè)務(wù)推廣無后顧之憂。
- 解決產(chǎn)品端到端服務(wù)能力
可接入其他AIGC產(chǎn)品,打造AIGC數(shù)字人視頻生成到剪輯端到端的解決方案能力。
多行業(yè)多場景廣泛應(yīng)用
MetaStudio數(shù)字人已廣泛應(yīng)用于企業(yè)代言、綜藝主持、電商帶貨、新聞播報、培訓(xùn)講師、文旅導(dǎo)覽、營業(yè)廳客服、市場營銷等場景。
安全穩(wěn)定可靠
中國站、國際站(新加坡)、歐洲站(愛爾蘭)公有云均已部署,支撐客戶全球業(yè)務(wù)拓展。
更專業(yè)的數(shù)字內(nèi)容生產(chǎn)工具,創(chuàng)作得心應(yīng)手
產(chǎn)品介紹
關(guān)鍵能力
線上流水線制作,交付效率≤3個工作日
資產(chǎn)加密存儲,人證匹配保證更安全
口型表現(xiàn)更精準,準確率>95%
支持走動/側(cè)身/持物/實景訓(xùn)練,動作隨機編排更智能
AI眼神矯正,提供持續(xù)眼神交流,細節(jié)更豐富
產(chǎn)品介紹???????????
關(guān)鍵能力
基礎(chǔ)版:支持手機錄制20條語料音頻,快速獲得類真人音色
進階版:支持手機錄制100條語料,3天制作,獲得高還原度音色
高級版:錄音棚專業(yè)錄制的1小時語料,5天制作,獲得現(xiàn)場級高品質(zhì)音色
產(chǎn)品介紹
關(guān)鍵能力
支持最高4K分辨率導(dǎo)出
支持文本、音頻驅(qū)動,1080p視頻合成效率1:1.5
支持自動解析ppt素材
支持導(dǎo)入圖片、視頻、音頻等素材,海量預(yù)制模板
支持敏感詞檢測
靈活的接入方式
產(chǎn)品介紹
關(guān)鍵功能
一站式純云端渲染,高清畫面實時推流
彈幕自動回復(fù)、實時插播干預(yù)、真人語音接管等多種模式
模板個性化配置,支持跨賬號分享
靈活的接入方式
經(jīng)驗豐富的數(shù)字人直播運營伙伴,賦能小白用戶快速開播
ai數(shù)字人常見問題
ai數(shù)字人常見問題
數(shù)字人視頻幫助
華為云MetaStudio數(shù)字人
02:26
數(shù)字人行業(yè)應(yīng)用案例
01:17
華為云3D寫實數(shù)字人能力展示
01:32
如何訪問MetaStudio服務(wù)
00:26
如何搭建直播間
00:46
視頻制作全流程展示
02:27