檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
如何使用Websocket調(diào)用實時語音識別 解決方案 1. 下載Java SDK 或 Python SDK,參考《SDK參考》中獲取SDK章節(jié)。 2. 配置SDK環(huán)境,參考《SDK參考》中配置Java環(huán)境。 3. 使用SDK里的demo進行調(diào)用。
資源和成本規(guī)劃 該解決方案主要部署如下資源,不同產(chǎn)品的花費僅供參考,實際以收費賬單為準(zhǔn),具體請參考華為云官網(wǎng)價格: 表1 資源和成本規(guī)劃 華為云服務(wù) 配置示例 每月花費 錄音文件識別服務(wù) 區(qū)域:華北-北京四 計費模式:包年包月套餐包 計費價格:15元/10h 15元 對象存儲服務(wù)
結(jié)果示例 隱私通話內(nèi)容分析結(jié)果如下所示,支持語音識別結(jié)果、原始錄音文件地址、錄音時長、規(guī)則命中結(jié)果、命中位置等多個字段。
快速卸載 登錄資源編排服務(wù) RFS,進入“資源棧”,選擇創(chuàng)建的資源棧名稱,單擊“刪除”。 圖1 一鍵卸載 在彈出的刪除資源棧確認(rèn)框中,輸入“Delete”,單擊“確定”,即可卸載解決方案。 圖2 刪除資源棧確認(rèn) 父主題: 實施步驟
Websocket握手請求 流式一句話 實時語音識別連續(xù)模式 實時語音識別單句模式 父主題: 實時語音識別接口
LEFT_AGENT 登錄華為云解決方案實踐,選擇“語音識別-客服中心語音質(zhì)檢”模板,單擊“一鍵部署”,跳轉(zhuǎn)至解決方案創(chuàng)建堆棧界面。 圖1 解決方案實施庫 在選擇模板界面中,單擊“下一步”。 圖2 選擇模板 在配置參數(shù)界面中,參考表1完成自定義參數(shù)填寫,單擊“下一步”。
實時語音識別多人同時使用,如何區(qū)分各自識別結(jié)果 每個用戶獨立建立websocket連接,不可共用一個websocket連接。 父主題: API使用類
charset=UTF-8 Guid:xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx.AgentGateway1 請求參數(shù) 無 響應(yīng)參數(shù) { "message": "success", "retcode": "0" } 父主題: 訂閱語音識別結(jié)果接口
資源和成本規(guī)劃 該解決方案主要部署如下資源,不同產(chǎn)品的花費僅供參考,具體請參考華為云官網(wǎng)價格,實際以收費賬單為準(zhǔn): 表1 資源和成本規(guī)劃(按需計費) 華云服務(wù) 配置示例 每月預(yù)估花費 語音交互服務(wù) 區(qū)域:華北-北京四 計費模式:按需計費 涉及服務(wù):錄音文件識別 錄音文件識別:2.5
可定制化 針對客戶的特定場景需求,定制垂直領(lǐng)域的語音識別模型,識別效果更精確。 功能特性 功能特性 支持熱詞 針對專業(yè)詞匯,支持上傳至熱詞表,增加專業(yè)詞匯的語音識別準(zhǔn)確率。 多模型多音頻格式 提供對話、銀行、保險等多種領(lǐng)域模型,支持8種以上音頻格式的轉(zhuǎn)寫,適配場景廣泛。
nlrresult", "nlpFlag": "true", "flowAccessCode": "801166010768953344" } 響應(yīng)參數(shù) { "message": "success", "retcode": "0" } 父主題: 訂閱語音識別結(jié)果接口
一句話識別將口述音頻轉(zhuǎn)換為文本,通過API調(diào)用識別不超過一分鐘的不同音頻源發(fā)來的音頻流或音頻文件。適用于語音搜索、人機交互等語音交互識別場景。 立即購買 產(chǎn)品文檔 控制臺 效果出眾 使用深度學(xué)習(xí)技術(shù),語音識別準(zhǔn)確率高,在業(yè)界具有一定的技術(shù)優(yōu)勢。
快速卸載 在進行卸載之前,需要先刪除該方案創(chuàng)建的委托。 一鍵卸載 登錄資源編排服務(wù) RFS,進入“資源棧”,選擇創(chuàng)建的資源棧名稱,單擊“刪除”。 圖1 一鍵卸載 在彈出的刪除資源棧確認(rèn)框中,輸入“Delete”,單擊“確定”,即可卸載解決方案。 圖2 刪除資源棧確認(rèn) 父主題: 實施步驟
圖2 上傳語音文件 選擇用于存放結(jié)果的“speech-recognition-output”桶(實際桶名稱以部署指定參數(shù)為準(zhǔn)),即可自動獲取該語音文件的識別結(jié)果,以語音文件名稱為前綴的Json文件存儲。 圖3 獲取識別結(jié)果文件 父主題: 實施步驟
圖1 獲取事件通道ID 購買、配置語音交互服務(wù)錄音文件識別 登錄語音交互服務(wù),選擇錄音文件識別,單擊購買錄音識別套餐包。 圖2 登錄語音交互服務(wù) 圖3 購買錄音套餐 選擇服務(wù)授權(quán),開通對象服務(wù)授權(quán)。
faqId": 10001, "faqGroupId": 10000 } } } } 響應(yīng)參數(shù) { "message": "success", "retcode": "0" } 父主題: 訂閱語音識別結(jié)果接口
空 登錄華為云解決方案實踐,選擇“語音識別-隱私通話內(nèi)容分析”模板,單擊“一鍵部署”,跳轉(zhuǎn)至解決方案創(chuàng)建堆棧界面。 圖1 解決方案實施庫 在選擇模板界面中,單擊“下一步”。 圖2 選擇模板 在配置參數(shù)界面中,參考表1完成自定義參數(shù)填寫,單擊“下一步”。
DNN應(yīng)用到語音識別領(lǐng)域后取得了非常明顯的效果,DNN技術(shù)的成功,鼓舞著業(yè)內(nèi)人員不斷將新的深度學(xué)習(xí)工具應(yīng)用到語音識別上,從CNN到RNN再到RNN與CTC的結(jié)合等等,伴隨著這個過程,語音識別的性能也在持續(xù)提升,未來我們可以期望將可以和機器進行無障礙的對話。
801166010768953344" } 響應(yīng)參數(shù) { "result": { "serverId": "20140414172508-001-00101" }, "message": "success", "retcode": "0" } 父主題: 訂閱語音識別結(jié)果接口
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx.AgentGateway1 請求參數(shù) { "serverId": "20140414172508-001-00101" } 響應(yīng)參數(shù) { "message": "success", "retcode": "0" } 父主題: 訂閱語音識別結(jié)果接口