該解決方案有何用途?
該解決方案基于華為云語音交互服務(wù) SIS語音識別構(gòu)建,可自動將用戶上傳到對象存儲服務(wù) OBS的wav語音文件轉(zhuǎn)化為文字,并將結(jié)果存放到指定對象存儲服務(wù) OBS桶。該方案可以將用戶上傳在對象存儲服務(wù) OBS的語音文件識別成可編輯的文本,支持中文普通話的識別和合成,其中語音識別還支持帶方言口音的普通話識別以及方言(四川話、粵語和上海話)的識別。適用于如下場景:識別客服、客戶的語音,進(jìn)一步通過文本檢索,檢查有沒有違規(guī)、敏感詞、電話號碼等信息。對會議記錄的音頻文件,進(jìn)行快速的識別,轉(zhuǎn)化成文字,方便進(jìn)行會議記錄等場景。
方案架構(gòu)
該方案基于華為云語音交互服務(wù) SIS語音識別構(gòu)建,可自動將用戶上傳到對象存儲服務(wù) OBS的wav語音文件轉(zhuǎn)化為文字。
架構(gòu)描述
架構(gòu)描述
-
創(chuàng)建兩個對象存儲服務(wù) OBS桶,一個用于用戶上傳和存儲用戶的語音文件,另一個用于存儲語音識別結(jié)果,用戶可以從該桶中獲取結(jié)果并處理
-
使用函數(shù)工作流 FunctionGraph,只需編寫業(yè)務(wù)函數(shù)代碼并設(shè)置運行的條件,即可以彈性、免運維、高可靠的方式運行
-
使用語音交互服務(wù) SIS,將wav語音文件轉(zhuǎn)化為文字
-
創(chuàng)建一個EventGrid觸發(fā)器,該觸發(fā)器關(guān)聯(lián)事件網(wǎng)格 EG,默認(rèn)創(chuàng)建一個事件訂閱,事件源為OBS應(yīng)用事件源,用于自動觸發(fā)函數(shù)執(zhí)行相關(guān)業(yè)務(wù)邏輯