檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
附錄 名詞解釋 基本概念、云服務(wù)簡介、專有名詞解釋 語音交互服務(wù)SIS:以API的形式,對外提供語音轉(zhuǎn)文本以及文本轉(zhuǎn)語音的服務(wù)。 函數(shù)工作流 FunctionGraph:FunctionGraph是一項基于事件驅(qū)動的函數(shù)托管計算服務(wù)。
實時語音識別多人同時使用,如何區(qū)分各自識別結(jié)果 每個用戶獨立建立websocket連接,不可共用一個websocket連接。 父主題: API使用類
實時語音識別連續(xù)模式 前提條件 確保已經(jīng)按照配置好Android開發(fā)環(huán)境。 請參考SDK(websocket)獲取最新版本SDK包。
語音時長不超過5小時,文件大小不超過300M,用戶的識別任務(wù)在6小時內(nèi)完成并返回識別結(jié)果,識別結(jié)果保存72小時(從轉(zhuǎn)寫完成的時間算起)。 支持中文普通話、四川話識別。 父主題: 約束與限制
支持各種場景下的語音搜索,比如地圖導(dǎo)航、網(wǎng)頁搜索等 優(yōu)勢 識別準確 語音識別準確率高 速度快 語音識別效率高,速度快 語音短消息 場景介紹 通過語音發(fā)送或者接收短消息時,將音頻消息轉(zhuǎn)文字,提升閱讀效率和交互體驗 優(yōu)勢 識別準確 識別準確率高 游戲娛樂 場景介紹 將游戲娛樂中的語音聊天轉(zhuǎn)成文字消息
華東-上海一,推薦的區(qū)域,支持一句話識別、錄音文件識別、實時語音識別、語音合成和熱詞等接口。
addPunc 否 String 表示是否在識別結(jié)果中添加標點,取值為yes 、 no,默認no。 digitNorm 否 String 表示是否將語音中的數(shù)字識別為阿拉伯數(shù)字,取值為yes 、 no,默認為yes。
訂閱語音識別結(jié)果接口通用返回結(jié)果碼 結(jié)果碼 說明 0 調(diào)用配置接口成功 107-000 緩存登錄信息失效,需要重新登錄鑒權(quán) 107-001 調(diào)用配置接口拋了異常 107-002 輸入?yún)?shù)不合法,必填字段為空 107-003 配置管理員密碼錯誤,重試多次后鎖定賬號 107-004 無效配置管理員賬號
語音識別與語音合成 將口述音頻、語音文件識別成可編輯的文本,并支持多音色語音合成。
語音識別-隱私通話內(nèi)容分析 語音識別-隱私通話內(nèi)容分析 查看部署指南 方案咨詢 該解決方案有何用途? 該解決方案基于華為云語音交互服務(wù) SIS及函數(shù)工作流 FunctionGraph,構(gòu)建一套隱私通話內(nèi)容分析工作流。
如何查看實時語音識別的中間結(jié)果 實時語音識別分為開始識別、發(fā)送音頻數(shù)據(jù)、結(jié)束識別,斷開連接四個階段。在使用API或SDK時,可以通過將interim_results參數(shù)設(shè)置為yes,將識別過程的中間結(jié)果返回。如果設(shè)置為no,則會等每句話完畢才會返回識別結(jié)果。
資源和成本規(guī)劃 該解決方案主要部署如下資源,不同產(chǎn)品的花費僅供參考,具體請參考華為云官網(wǎng)價格,實際以收費賬單為準: 表1 資源和成本規(guī)劃(按需計費) 華云服務(wù) 配置示例 每月預(yù)估花費 語音交互服務(wù) 區(qū)域:華北-北京四 計費模式:按需計費 涉及服務(wù):錄音文件識別 錄音文件識別:2.5
請求消息 表1 參數(shù)說明 名稱 參數(shù)類型 是否必選 說明 command String 是 需設(shè)置為START,表示開始識別請求。
圖1 身份證示例圖 身份證識別支持中華人民共和國居民身份證識別。 如果圖片中包含多張卡證票據(jù),請調(diào)用智能分類識別服務(wù)。 約束與限制 支持中華人民共和國居民身份證的識別。 只支持識別PNG、JPG、JPEG、BMP、TIFF格式圖片。
實施步驟 準備工作 快速部署 開始使用 快速卸載
錄音文件識別接口 提交錄音文件識別任務(wù) 獲取錄音文件識別結(jié)果
一句話識別 http接口 websocket接口
結(jié)果示例 客服中心語音質(zhì)檢結(jié)果如下所示,支持語音識別結(jié)果、原始錄音文件地址、錄音時長、規(guī)則命中結(jié)果、命中位置等多個字段。
LEFT_AGENT 登錄華為云解決方案實踐,選擇“語音識別-客服中心語音質(zhì)檢”模板,單擊“一鍵部署”,跳轉(zhuǎn)至解決方案創(chuàng)建堆棧界面。 圖1 解決方案實施庫 在選擇模板界面中,單擊“下一步”。 圖2 選擇模板 在配置參數(shù)界面中,參考表1完成自定義參數(shù)填寫,單擊“下一步”。
修訂記錄 發(fā)布日期 修訂記錄 2022-11-30 第一次正式發(fā)布。 2023-03-09 修訂實施步驟。 2024-09-18 適配函數(shù)工作流EventGrid觸發(fā)器。