檢測(cè)到您已登錄華為云國(guó)際站賬號(hào),為了您更好的體驗(yàn),建議您訪(fǎng)問(wèn)國(guó)際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
channel 否 String 語(yǔ)音文件聲道信息,可以為MONO(缺省), LEFT_AGENT, RIGHT_AGENT。默認(rèn)MONO。 emotion 否 Boolean 是否需要做情緒檢測(cè),默認(rèn)true。
語(yǔ)音合成 支持“華北-北京四”、“華東-上海一”區(qū)域。 當(dāng)前服務(wù)僅支持北京和上海區(qū)域,后續(xù)會(huì)陸續(xù)上線(xiàn)其他區(qū)域。 華北-北京四,推薦的區(qū)域,支持一句話(huà)識(shí)別、錄音文件識(shí)別、實(shí)時(shí)語(yǔ)音識(shí)別和語(yǔ)音合成和熱詞等接口。
channel 否 String 語(yǔ)音文件聲道信息,可以為MONO(缺省)、LEFT_AGENT、RIGHT_AGENT。 emotion 否 Boolean 是否需要做情緒檢測(cè),默認(rèn)true。 speed 否 Boolean 是否需要輸出語(yǔ)速信息,默認(rèn)true。
實(shí)時(shí)語(yǔ)音識(shí)別 支持“華北-北京一”、“華北-北京四”、“華東-上海一”區(qū)域。 音頻采樣率8KHz或者16KHz,采樣位數(shù)8bit或者16bit。 支持中文普通話(huà)、方言的語(yǔ)音識(shí)別,其中方言包括:四川話(huà)、粵語(yǔ)和上海話(huà)。
實(shí)施步驟 準(zhǔn)備工作 快速部署 開(kāi)始使用 快速卸載
解決方案架構(gòu)如下: 圖1 方案架構(gòu) 該解決方案會(huì)部署如下資源: 語(yǔ)音交互服務(wù)SIS: 提供隱私通話(huà)錄音文件轉(zhuǎn)寫(xiě)的能力。 對(duì)象存儲(chǔ)服務(wù)OBS:用于存放用戶(hù)上傳的隱私通話(huà)錄音文件和工作流處理的語(yǔ)音識(shí)別結(jié)果和分析結(jié)果。
emotion 否 String 情緒類(lèi)型,目前僅支持NORMAL(正常),ANGRY(憤怒),UNKNOWN(未知)。 在識(shí)別配置中emotion為true時(shí)存在。 speed 否 Float 語(yǔ)速信息,單位是每秒字?jǐn)?shù)。 在識(shí)別配置中speed為true時(shí)存在。
修訂記錄 發(fā)布日期 修訂記錄 2022-09-30 第一次正式發(fā)布。 2023-02-28 修訂實(shí)施步驟。 2025-03-06 適配函數(shù)工作流EventGrid觸發(fā)器。
實(shí)施步驟 準(zhǔn)備工作 快速部署 開(kāi)始使用 快速卸載
流式一句話(huà) 功能介紹 流式一句話(huà)模式的語(yǔ)音長(zhǎng)度限制為一分鐘,適合于對(duì)話(huà)聊天等識(shí)別場(chǎng)景。 該接口支持用戶(hù)將一整段語(yǔ)音分段,以流式輸入,最后得到識(shí)別結(jié)果。實(shí)時(shí)語(yǔ)音識(shí)別引擎在獲得分段的輸入語(yǔ)音的同時(shí),就可以同步地對(duì)這段數(shù)據(jù)進(jìn)行特征提取和解碼工作,而不用等到所有數(shù)據(jù)都獲得后再開(kāi)始工作。
快速卸載 卸載解決方案前,請(qǐng)先確保OBS桶中無(wú)數(shù)據(jù),否則解決方案將卸載失敗。 登錄資源編排服務(wù) RFS,進(jìn)入“資源棧”,選擇創(chuàng)建的資源棧名稱(chēng),單擊“刪除”。 圖1 一鍵卸載 在彈出的刪除資源棧確認(rèn)框中,輸入“Delete”,單擊“確定”,即可卸載解決方案。 圖2 刪除資源棧確認(rèn) 父主題
已完成綁定 【論文筆記】語(yǔ)音情感識(shí)別之手工特征深度學(xué)習(xí)方法 本文章主體基于PilgrimHui的論文筆記:《語(yǔ)音情感識(shí)別(三)手工特征+CRNN》,在原來(lái)基礎(chǔ)上,補(bǔ)充了數(shù)據(jù)處理部分以及論文方法的一些細(xì)節(jié),歡迎語(yǔ)音情感分析領(lǐng)域的同學(xué)一起討論。 1.
修訂記錄 發(fā)布日期 修訂記錄 2022-11-30 第一次正式發(fā)布。 2023-03-09 修訂實(shí)施步驟。 2025-01-06 適配函數(shù)工作流EventGrid觸發(fā)器。
charset=UTF-8 Guid:xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx.AgentGateway1 請(qǐng)求參數(shù) 無(wú) 響應(yīng)參數(shù) { "message": "success", "retcode": "0" } 父主題: 訂閱語(yǔ)音識(shí)別結(jié)果接口
結(jié)果示例 隱私通話(huà)內(nèi)容分析結(jié)果如下所示,支持語(yǔ)音識(shí)別結(jié)果、原始錄音文件地址、錄音時(shí)長(zhǎng)、規(guī)則命中結(jié)果、命中位置等多個(gè)字段。
計(jì)劃于2021/05/15 20:30:00(北京時(shí)間)將華北-北京一區(qū)域的短語(yǔ)音識(shí)別及語(yǔ)音合成服務(wù)正式退市,功能切換到一句話(huà)識(shí)別及定制語(yǔ)音合成服務(wù)。
資源和成本規(guī)劃 該解決方案主要部署如下資源,不同產(chǎn)品的花費(fèi)僅供參考,實(shí)際以收費(fèi)賬單為準(zhǔn),具體請(qǐng)參考華為云官網(wǎng)價(jià)格: 表1 資源和成本規(guī)劃 華為云服務(wù) 配置示例 每月花費(fèi) 錄音文件識(shí)別服務(wù) 區(qū)域:華北-北京四 計(jì)費(fèi)模式:包年包月套餐包 計(jì)費(fèi)價(jià)格:15元/10h 15元 對(duì)象存儲(chǔ)服務(wù)
圖2 上傳語(yǔ)音文件 選擇用于存放結(jié)果的“speech-recognition-output”桶(實(shí)際桶名稱(chēng)以部署指定參數(shù)為準(zhǔn)),即可自動(dòng)獲取該語(yǔ)音文件的識(shí)別結(jié)果,以語(yǔ)音文件名稱(chēng)為前綴的Json文件存儲(chǔ)。 圖3 獲取識(shí)別結(jié)果文件 父主題: 實(shí)施步驟
已完成綁定 【論文筆記】語(yǔ)音情感識(shí)別之聲譜圖卷積方法 本文章主體基于PilgrimHui的《論文筆記:語(yǔ)音情感識(shí)別(二)聲譜圖+CRNN》,在原來(lái)基礎(chǔ)上,補(bǔ)充了數(shù)據(jù)處理部分以及論文方法的一些細(xì)節(jié),歡迎語(yǔ)音情感分析領(lǐng)域的同學(xué)一起討論。 1.
圖1 獲取事件通道ID 購(gòu)買(mǎi)、配置語(yǔ)音交互服務(wù)錄音文件識(shí)別 登錄語(yǔ)音交互服務(wù),選擇錄音文件識(shí)別,單擊購(gòu)買(mǎi)錄音識(shí)別套餐包。 圖2 登錄語(yǔ)音交互服務(wù) 圖3 購(gòu)買(mǎi)錄音套餐 選擇服務(wù)授權(quán),開(kāi)通對(duì)象服務(wù)授權(quán)。