華為云數(shù)字人創(chuàng)建聲音
MetaStudio已經(jīng)預(yù)置了各種類型的聲音,如果仍無法滿足用戶的需求,請(qǐng)參考本節(jié)操作,自定義生成聲音。
MetaStudio不支持個(gè)人用戶定制聲音,僅支持企業(yè)用戶。
定制聲音時(shí),從平臺(tái)下載的授權(quán)書中有明確說明,定制音色需授權(quán)給公司使用。
操作前準(zhǔn)備
用戶創(chuàng)建聲音制作任務(wù)前,需要參考操作步驟準(zhǔn)備如下內(nèi)容:
(可選)參考聲音制作頁面的“錄音指導(dǎo)”,提前錄制生成語料。僅制作聲音,選擇“語料上傳”方式時(shí),需要此語料。
聲音授權(quán)簽署文件。
操作步驟
登錄MetaStudio控制臺(tái)。
單擊“聲音制作”下方的“開始創(chuàng)建”,進(jìn)入聲音制作頁面。
界面左側(cè)是聲音制作頁面,右側(cè)為聲音制作流程。聲音制作錄制教程,可以幫助用戶快速制作聲音。
圖1 定制聲音

配置聲音制作參數(shù)
副文本最多一行
配置聲音制作參數(shù)
|
區(qū)域 |
說明 |
|---|---|
|
請(qǐng)選擇聲音制作服務(wù)
|
系統(tǒng)提供如下聲音制作服務(wù),請(qǐng)選擇一種聲音制作服務(wù)。
每種聲音制作服務(wù)后面都會(huì)展示剩余次數(shù),需要保證剩余次數(shù)充足。 其中,進(jìn)階版和高品質(zhì)聲音制作需要更多語料,訓(xùn)練時(shí)長(zhǎng)更長(zhǎng),聲音效果更佳。 |
|
定制聲音名稱
|
輸入聲音名稱。 示例:歡快女聲。 |
|
請(qǐng)選擇聲音性別
|
聲音的性別,如下所示:
|
|
選擇語言
|
聲音的語言,包含如下選項(xiàng):
|
|
選擇聲音標(biāo)簽
|
聲音的標(biāo)簽,包含如下選項(xiàng): 電商 新聞 營銷 針對(duì)上述標(biāo)簽,MetaStudio服務(wù)預(yù)置了相應(yīng)的文案內(nèi)容,如文案樣例(基礎(chǔ)版)、文案樣例(進(jìn)階版)和文案樣例(高品質(zhì))所示。如果按句錄制方式(僅基礎(chǔ)版和進(jìn)階版支持),且使用預(yù)置文案,必須選對(duì)標(biāo)簽。 |
|
請(qǐng)制作聲音
|
制作聲音的方式為:
如果選擇“語料上傳”的方式,且未使用服務(wù)預(yù)置文案,聲音標(biāo)簽僅作為標(biāo)簽,來區(qū)分聲音使用場(chǎng)景;如果選擇“在線錄音”的方式,服務(wù)會(huì)根據(jù)聲音標(biāo)簽,生成其對(duì)應(yīng)格式的音頻文件,界面不展示音頻文件格式,用戶可不關(guān)注。 |
|
聲音授權(quán)
|
單擊“授權(quán)書模板”,下載授權(quán)書模板后打印。用戶手寫相關(guān)信息后,重新生成簽署后的pdf文件,或者拍攝成jpg或png格式的圖片后上傳。 授權(quán)書內(nèi)容,可參考授權(quán)書。 |
|
第三方用戶ID(可選)
|
第三方用戶ID,為查詢資產(chǎn)列表接口參數(shù)“X-App-UserId”的值。 僅需調(diào)用查詢資產(chǎn)列表接口,通過參數(shù)“X-App-UserId”過濾查詢2D數(shù)字人模型資產(chǎn)時(shí)填寫。 |
|
區(qū)域 |
說明 |
|---|---|
|
請(qǐng)選擇聲音制作服務(wù)
|
系統(tǒng)提供如下聲音制作服務(wù),請(qǐng)選擇一種聲音制作服務(wù)。
每種聲音制作服務(wù)后面都會(huì)展示剩余次數(shù),需要保證剩余次數(shù)充足。 其中,進(jìn)階版和高品質(zhì)聲音制作需要更多語料,訓(xùn)練時(shí)長(zhǎng)更長(zhǎng),聲音效果更佳。 |
|
定制聲音名稱
|
輸入聲音名稱。 示例:歡快女聲。 |
|
請(qǐng)選擇聲音性別
|
聲音的性別,如下所示:
|
|
選擇語言
|
聲音的語言,包含如下選項(xiàng):
|
|
選擇聲音標(biāo)簽
|
聲音的標(biāo)簽,包含如下選項(xiàng): 電商 新聞 營銷 針對(duì)上述標(biāo)簽,MetaStudio服務(wù)預(yù)置了相應(yīng)的文案內(nèi)容,如文案樣例(基礎(chǔ)版)、文案樣例(進(jìn)階版)和文案樣例(高品質(zhì))所示。如果按句錄制方式(僅基礎(chǔ)版和進(jìn)階版支持),且使用預(yù)置文案,必須選對(duì)標(biāo)簽。 |
|
請(qǐng)制作聲音
|
制作聲音的方式為:
如果選擇“語料上傳”的方式,且未使用服務(wù)預(yù)置文案,聲音標(biāo)簽僅作為標(biāo)簽,來區(qū)分聲音使用場(chǎng)景;如果選擇“在線錄音”的方式,服務(wù)會(huì)根據(jù)聲音標(biāo)簽,生成其對(duì)應(yīng)格式的音頻文件,界面不展示音頻文件格式,用戶可不關(guān)注。 |
|
聲音授權(quán)
|
單擊“授權(quán)書模板”,下載授權(quán)書模板后打印。用戶手寫相關(guān)信息后,重新生成簽署后的pdf文件,或者拍攝成jpg或png格式的圖片后上傳。 授權(quán)書內(nèi)容,可參考授權(quán)書。 |
|
第三方用戶ID(可選)
|
第三方用戶ID,為查詢資產(chǎn)列表接口參數(shù)“X-App-UserId”的值。 僅需調(diào)用查詢資產(chǎn)列表接口,通過參數(shù)“X-App-UserId”過濾查詢2D數(shù)字人模型資產(chǎn)時(shí)填寫。 |
- 單擊“提交制作”。
- 彈出“資源消耗提示”對(duì)話框。提示用戶目前聲音制作服務(wù)剩余數(shù)量,本次將消耗1個(gè)資源。
- 如果用戶確認(rèn)無誤,單擊“確認(rèn)提交”。
- 聲音制作任務(wù)提交成功后,界面提示“制作任務(wù)提交成功”,如圖2所示。
- 聲音制作任務(wù)提交成功后,需要等待1天左右的時(shí)間審核。任務(wù)審核通過后,啟動(dòng)聲音制作。
- 圖2 制作任務(wù)提交成功

- 用戶可以單擊“查看制作任務(wù)列表”,查看聲音制作任務(wù)審核進(jìn)展。
- 當(dāng)狀態(tài)變更為“系統(tǒng)審核完成”,自動(dòng)啟動(dòng)算法訓(xùn)練。如果系統(tǒng)存在多個(gè)算法訓(xùn)練任務(wù),可能會(huì)存在排隊(duì)和延遲的現(xiàn)象,請(qǐng)耐心等待。
1分鐘教程讓您快速上手體驗(yàn)
1分鐘教程讓您快速上手體驗(yàn)
您只需上傳正面照片,在5秒內(nèi)就能生成自己的專屬風(fēng)格化數(shù)字人形象,低門檻數(shù)字人制作,捏臉制作,所見即所得。
MetaStudio虛擬直播讓用戶無需專業(yè)的動(dòng)作和昂貴不便的面部捕捉設(shè)備,只需普通的攝像頭就能實(shí)現(xiàn)對(duì)人體動(dòng)作和表情的高精度捕捉。
MetaStudio數(shù)字人視頻制作,實(shí)現(xiàn)圖片、視頻、文檔一鍵轉(zhuǎn)化,用戶僅需輸入文本或錄入語音,依托華為強(qiáng)大的AI智能功能,快速生成數(shù)字人播報(bào)視頻,讓數(shù)字人演繹你的表達(dá)。