定制聲音
MetaStudio支持自定義生成聲音
操作前準備
用戶創(chuàng)建聲音制作任務前,需要參考操作步驟準備如下內(nèi)容:
參考真人聲音錄制(基礎版&進階版),提前錄制20條語料的長音頻WAV文件,每句之間需要有2~3秒的停頓。
語料請使用直播帶貨風格文案(20句)。
聲音授權(quán)簽署文件。
操作步驟
登錄MetaStudio控制臺。
單擊“聲音制作”下方的“開始創(chuàng)建”,進入聲音制作頁面。如圖1所示。
圖1 定制數(shù)字人形象

配置聲音制作參數(shù)
配置聲音制作參數(shù)
區(qū)域
說明
選擇聲音制作服務“基礎版聲音制作”
輸入聲音名稱,示例:歡快女聲
選擇聲音的性別,示例:女生
選擇聲音的語言,示例:中文
聲音的標簽,請選擇“電商”
使用“語料上傳”的方式,直接上傳已錄制好的20條電商文案長音頻WAV文件
單擊“授權(quán)書模板”,下載授權(quán)書模板后打印。用戶手寫相關(guān)信息后,重新生成簽署后的pdf文件,或者拍攝成jpg或png格式的圖片后上傳
無需填寫
說明
選擇聲音制作服務“基礎版聲音制作”
輸入聲音名稱,示例:歡快女聲
選擇聲音的性別,示例:女生
選擇聲音的語言,示例:中文
聲音的標簽,請選擇“電商”
使用“語料上傳”的方式,直接上傳已錄制好的20條電商文案長音頻WAV文件
單擊“授權(quán)書模板”,下載授權(quán)書模板后打印。用戶手寫相關(guān)信息后,重新生成簽署后的pdf文件,或者拍攝成jpg或png格式的圖片后上傳
無需填寫
- 單擊“提交制作”。
- 彈出“資源消耗提示”對話框。提示用戶目前聲音制作服務剩余數(shù)量,本次將消耗1個資源。
- 如果用戶確認無誤,單擊“確認提交”。
- 聲音制作任務提交成功后,界面提示“制作任務提交成功”,如圖2所示。
- 聲音制作任務提交成功后,需要等待1天左右的時間審核。任務審核通過后,啟動聲音制作。
- 圖2 制作任務提交成功

- 用戶可以單擊“查看制作任務列表”,查看聲音制作任務審核進展。
- 當狀態(tài)變更為“系統(tǒng)審核完成”,自動啟動算法訓練。如果系統(tǒng)存在多個算法訓練任務,可能會存在排隊和延遲的現(xiàn)象,請耐心等待。
- 確認聲音制作任務已訓練完成后,在左側(cè)導航欄中,單擊“我的創(chuàng)作”。
- 選擇“聲音”,找到已生成的聲音,單擊
試聽聲音效果。