檢測(cè)到您已登錄華為云國(guó)際站賬號(hào),為了您更好的體驗(yàn),建議您訪問國(guó)際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
語(yǔ)音通話價(jià)格說明 計(jì)費(fèi)概述 語(yǔ)音通話服務(wù)按照業(yè)務(wù)使用量,即賬號(hào)所有固話號(hào)碼數(shù)量(月租)和通話時(shí)長(zhǎng)進(jìn)行計(jì)費(fèi),具體可參考計(jì)費(fèi)詳情和計(jì)費(fèi)原則。 語(yǔ)音通話采用預(yù)付費(fèi)模式,使用語(yǔ)音通話服務(wù)前,需先在華為云賬戶中充值,可參考如何給賬戶充值。
查詢訓(xùn)練作業(yè)列表 功能介紹 根據(jù)指定條件查詢用戶創(chuàng)建的訓(xùn)練作業(yè)。 URI GET /v1/{project_id}/training-jobs 參數(shù)說明如表1所示。 表1 路徑參數(shù) 參數(shù) 是否必選 參數(shù)類型 說明 project_id 是 String 用戶項(xiàng)目ID。
AI說 為醫(yī)生打造專屬數(shù)字分身! AIGC:人工智能生成內(nèi)容的崛起與未... ModelArts JupyterLab常見問題解決...
使用實(shí)時(shí)語(yǔ)音識(shí)別 前提條件 確保已按照配置CPP環(huán)境(Windows)配置完畢。 請(qǐng)參考SDK(websocket)獲取最新版本SDK包。 初始化Client 初始化RasrClient,其參數(shù)包括AuthInfo。
實(shí)施步驟 準(zhǔn)備工作 快速部署 開始使用 快速卸載
實(shí)時(shí)語(yǔ)音識(shí)別接口 接口說明 Websocket握手請(qǐng)求 實(shí)時(shí)語(yǔ)音識(shí)別請(qǐng)求 實(shí)時(shí)語(yǔ)音識(shí)別響應(yīng)
結(jié)果示例 客服中心語(yǔ)音質(zhì)檢結(jié)果如下所示,支持語(yǔ)音識(shí)別結(jié)果、原始錄音文件地址、錄音時(shí)長(zhǎng)、規(guī)則命中結(jié)果、命中位置等多個(gè)字段。
model_property 否 String 特征字符串,{language}_{speaker}_{domain},默認(rèn)chinese_xiaoyan_common。具體信息請(qǐng)參見《API參考》中語(yǔ)音合成章節(jié)。
訓(xùn)練時(shí)會(huì)自動(dòng)下載OBS中{training-project}目錄下的數(shù)據(jù)到訓(xùn)練容器的本地路徑$MA_JOB_DIR/{training-project}/。
資源和成本規(guī)劃 該解決方案主要部署如下資源,不同產(chǎn)品的花費(fèi)僅供參考,具體請(qǐng)參考華為云官網(wǎng)價(jià)格,實(shí)際以收費(fèi)賬單為準(zhǔn): 表1 資源和成本規(guī)劃(按需計(jì)費(fèi)) 華云服務(wù) 配置示例 每月預(yù)估花費(fèi) 語(yǔ)音交互服務(wù) 區(qū)域:華北-北京四 計(jì)費(fèi)模式:按需計(jì)費(fèi) 涉及服務(wù):錄音文件識(shí)別 錄音文件識(shí)別:2.5
空 channel String 必填 語(yǔ)音文件聲道信息,可設(shè)置為MONO,LEFT_AGENT, RIGHT_AGENT。如果channel 為MONO,那么原始文件需要為單聲道文件。LEFT_AGENT 指定左聲道語(yǔ)音為agent(坐席)。
修訂記錄 發(fā)布日期 修訂記錄 2022-11-30 第一次正式發(fā)布。 2023-03-09 修訂實(shí)施步驟。 2024-09-18 適配函數(shù)工作流EventGrid觸發(fā)器。
語(yǔ)音合成 TTS 語(yǔ)音合成 TTS 語(yǔ)音合成服務(wù)提供在線語(yǔ)音合成能力,支持將文本信息實(shí)時(shí)轉(zhuǎn)化為近似的真人發(fā)聲,支持多語(yǔ)言多音色語(yǔ)音在線合成。支持客戶的個(gè)性化語(yǔ)音定制化需求。 語(yǔ)音合成服務(wù)提供在線語(yǔ)音合成能力,支持將文本信息實(shí)時(shí)轉(zhuǎn)化為近似的真人發(fā)聲,支持多語(yǔ)言多音色語(yǔ)音在線合成。
圖1 獲取事件通道ID 語(yǔ)音交互服務(wù)開通授權(quán) 登錄語(yǔ)音交互服務(wù)控制臺(tái),在控制臺(tái)左上角選擇區(qū)域?yàn)?ldquo;北京四”,左側(cè)菜單選擇服務(wù)授權(quán),打開對(duì)象存儲(chǔ)服務(wù)授權(quán)。如之前已打開過授權(quán),如圖1,則無需操作。
快速卸載 登錄資源編排服務(wù) RFS,進(jìn)入“資源棧”,選擇創(chuàng)建的資源棧名稱,單擊“刪除”。 圖1 一鍵卸載 在彈出的刪除資源棧確認(rèn)框中,輸入“Delete”,單擊“確定”,即可卸載解決方案。 圖2 刪除資源棧確認(rèn) 父主題: 實(shí)施步驟
如何開通語(yǔ)音質(zhì)檢? 新增應(yīng)用:登錄隱私保護(hù)通話控制臺(tái)添加應(yīng)用時(shí),“是否開通錄音”和“是否開通語(yǔ)音質(zhì)檢”都選擇“是”即可開通。
方案優(yōu)勢(shì) 高效性 僅需5秒的聲音樣本,即刻體驗(yàn)文本到語(yǔ)音的轉(zhuǎn)換;僅需1分鐘的訓(xùn)練素材,即可微調(diào)訓(xùn)練出聲音相似度較高的語(yǔ)音克隆模型。 個(gè)性化 該項(xiàng)目可以根據(jù)用戶的語(yǔ)音樣本,生成個(gè)性化的語(yǔ)音克隆,并支持跨語(yǔ)言推理。
語(yǔ)音機(jī)器人9大亮點(diǎn) 極速響應(yīng) 不足1秒極速反饋,高度擬人音色,帶來無限趨近于真人的聊天體驗(yàn) 不足1秒極速反饋,高度擬人音色,帶來無限趨近于真人的聊天體驗(yàn) 機(jī)器人訓(xùn)練 根據(jù)已有對(duì)話內(nèi)容,高效訓(xùn)練,自主學(xué)習(xí),讓機(jī)器人越用越聰明 根據(jù)已有對(duì)話內(nèi)容,高效訓(xùn)練,自主學(xué)習(xí),讓機(jī)器人越用越聰明
語(yǔ)音模型訓(xùn)練 TTS帶有預(yù)訓(xùn)練的模型,是衡量數(shù)據(jù)集質(zhì)量的工具,旨在在易于訓(xùn)練、速度和質(zhì)量之間實(shí)現(xiàn)最佳權(quán)衡。
實(shí)時(shí)語(yǔ)音識(shí)別 RASR 實(shí)時(shí)語(yǔ)音識(shí)別 RASR 實(shí)時(shí)語(yǔ)音識(shí)別(Real-time ASR),將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換成文本,語(yǔ)音識(shí)別更快。可應(yīng)用于直播實(shí)時(shí)字幕、會(huì)議實(shí)時(shí)記錄、即時(shí)文本生成等場(chǎng)景。