語音交互 服務(wù)(Speech Interaction Service,簡稱SIS)是一種人機交互方式,以開放API(Application Programming Interface,應(yīng)用程序編程接口)的方式提供給用戶,用戶通過實時訪問和調(diào)用API獲取語音交互結(jié)果。
使用前必讀
用戶需要具備編程能力,熟悉Java、Python等編程語言。
SIS服務(wù)需要用戶通過調(diào)用API接口,將語音文件識別成可編輯的文本,然后返回JSON格式的識別結(jié)果,用戶需要通過編碼將識別結(jié)果對接到業(yè)務(wù)系統(tǒng)或保存為TXT、Excel等格式。
支持的語言
目前語音交互服務(wù)僅支持中文識別與合成。
首次使用SIS
如果您是首次使用SIS的用戶,建議您學(xué)習(xí)并了解如下信息:
功能介紹
通過功能介紹章節(jié)的內(nèi)容,了解SIS不同功能的具體介紹,主要包括定制 語音識別 (ASR Customization,ASRC)、實時語音轉(zhuǎn)寫(Real-time ASR,RASR)、語音識別(Automatic Speech Recognition,ASR)、 語音合成 (Text To Speech, TTS )、定制語音合成(Text To Speech Customization,TTSC)功能。
入門使用
SIS以開放API的方式提供給用戶,您可以參考《快速入門》學(xué)習(xí)并使用SIS服務(wù)。
使用方式
如果您是一個開發(fā)工程師,熟悉代碼編寫,想要直接調(diào)用SIS的API或SDK使用服務(wù),您可以參考《API參考》或《SDK參考》獲取詳情。
由淺入深學(xué)習(xí)
您可以參考成長地圖,由淺入深學(xué)習(xí)使用SIS。