五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

語音交互服務(wù)教程

什么是語音交互服務(wù)?

語音交互服務(wù)(Speech Interaction Service,簡稱SIS)是一種人機交互方式,用戶通過實時訪問和調(diào)用API獲取語音交互結(jié)果。

其中,一句話識別實時語音識別是最常用的兩個功能。例如用戶通過語音識別功能,將口述音頻或者語音文件識別成可編輯的文本,同時也支持通過語音合成功能將文本轉(zhuǎn)換成逼真的語音等提升用戶體驗。適用場景如語音客服質(zhì)檢、會議記錄、語音短消息、有聲讀物、電話回訪等。


語言交互支持哪些語言?

支持中文普通話的識別和合成,其中語音識別還支持帶方言口音的普通話識別以及方言(四川話、粵語和上海話)的識別。

語音交互服務(wù)的應(yīng)用場景

語音交互服務(wù)價格表

計費項
月使用量
單價
價格單位
調(diào)用接口
0~6000小時(含)
3.2
元/小時
調(diào)用接口
6000~30000小時(含)
2.8
元/小時
調(diào)用接口
30000~60000小時(含)
2.5
元/小時
調(diào)用接口
60000~150000小時(含)
1.8
元/小時
調(diào)用接口
大于150000
1.2
元/小時
計費項
月使用量
單價
價格單位
調(diào)用接口
0百萬次~3百萬次(含)
4
元/千次
調(diào)用接口
3百萬次~15百萬次(含)
3.4
元/千次
調(diào)用接口
15百萬次~30百萬次(含)
2.8
元/千次
調(diào)用接口
30百萬次~150百萬次(含)
2.2
元/千次
調(diào)用接口
150百萬次~300百萬次(含)
1.6
元/千次
調(diào)用接口
大于300百萬次
1.2
元/千次
計費項
月使用量
單價
價格單位
調(diào)用接口
0小時~6,000小時(含)
2.5
元/小時
調(diào)用接口
6,000小時~30,000小時(含)
2.2
元/小時
調(diào)用接口
30,000小時~60,000小時(含)
1.9
元/小時
調(diào)用接口
60,000小時~150,000小時(含)
1.6
元/小時
調(diào)用接口
150,000小時~1,500,000小時(含)
1
元/小時
調(diào)用接口
大于1,500,000小時
0.7
元/小時
計費項
月使用量
單價
價格單位
調(diào)用接口
0小時~6,000小時(含)
3
元/小時
調(diào)用接口
6,000小時~30,000小時(含)
2.6
元/小時
調(diào)用接口
30,000小時~60,000小時(含)
2.2
元/小時
調(diào)用接口
60,000小時~150,000小時(含)
1.8
元/小時
調(diào)用接口
大于150,000小時
1.3
元/小時
計費項
月使用量
單價
價格單位
調(diào)用接口
0千次~10千次(含)
0
元/千次
調(diào)用接口
大于10千次
2
元/千次
實時語音識別
調(diào)用接口
月使用量:
0~6000小時(含)
單價:
3.2
價格單位:
元/小時
調(diào)用接口
月使用量:
6000~30000小時(含)
單價:
2.8
價格單位:
元/小時
調(diào)用接口
月使用量:
30000~60000小時(含)
單價:
2.5
價格單位:
元/小時
調(diào)用接口
月使用量:
60000~150000小時(含)
單價:
1.8
價格單位:
元/小時
調(diào)用接口
月使用量:
大于150000
單價:
1.2
價格單位:
元/小時
一句話識別
調(diào)用接口
月使用量:
0百萬次~3百萬次(含)
單價:
4
價格單位:
元/千次
調(diào)用接口
月使用量:
3百萬次~15百萬次(含)
單價:
3.4
價格單位:
元/千次
調(diào)用接口
月使用量:
15百萬次~30百萬次(含)
單價:
2.8
價格單位:
元/千次
調(diào)用接口
月使用量:
30百萬次~150百萬次(含)
單價:
2.2
價格單位:
元/千次
調(diào)用接口
月使用量:
150百萬次~300百萬次(含)
單價:
1.6
價格單位:
元/千次
調(diào)用接口
月使用量:
大于300百萬次
單價:
1.2
價格單位:
元/千次
錄音文件識別
調(diào)用接口
月使用量:
0小時~6,000小時(含)
單價:
2.5
價格單位:
元/小時
調(diào)用接口
月使用量:
6,000小時~30,000小時(含)
單價:
2.2
價格單位:
元/小時
調(diào)用接口
月使用量:
30,000小時~60,000小時(含)
單價:
1.9
價格單位:
元/小時
調(diào)用接口
月使用量:
60,000小時~150,000小時(含)
單價:
1.6
價格單位:
元/小時
調(diào)用接口
月使用量:
150,000小時~1,500,000小時(含)
單價:
1
價格單位:
元/小時
調(diào)用接口
月使用量:
大于1,500,000小時
單價:
0.7
價格單位:
元/小時
錄音文件識別極速版
調(diào)用接口
月使用量:
0小時~6,000小時(含)
單價:
3
價格單位:
元/小時
調(diào)用接口
月使用量:
6,000小時~30,000小時(含)
單價:
2.6
價格單位:
元/小時
調(diào)用接口
月使用量:
30,000小時~60,000小時(含)
單價:
2.2
價格單位:
元/小時
調(diào)用接口
月使用量:
60,000小時~150,000小時(含)
單價:
1.8
價格單位:
元/小時
調(diào)用接口
月使用量:
大于150,000小時
單價:
1.3
價格單位:
元/小時
語音合成
調(diào)用接口
月使用量:
0千次~10千次(含)
單價:
0
價格單位:
元/千次
調(diào)用接口
月使用量:
大于10千次
單價:
2
價格單位:
元/千次

語音交互服務(wù) 常見問題

常見問題

  • 語音合成后輸出的音頻格式是什么?

    語音合成后返回一組Base64編碼格式的語音數(shù)據(jù),用戶需要用編程語言或者sdk將返回的Base64編碼格式的數(shù)據(jù)解碼成byte數(shù)組,再保存為wav格式的音頻。

  • 語音合成后能否返回播放時長?

    不能,當(dāng)前語音合成無此參數(shù)。若需要知道語音時長,可以將返回語音數(shù)據(jù)解碼轉(zhuǎn)換成音頻格式,播放后查看。

  • 是否支持aac格式的語音文件轉(zhuǎn)文字?

    一句話識別和錄音文件識別以及實時語音識別均可實現(xiàn)語音轉(zhuǎn)文字,一句話識別支持aac格式,錄音文件識別和實時語音識別不支持aac格式。

  • 為什么會出現(xiàn)識別結(jié)果非常差的情況?

    調(diào)用語音識別接口,識別結(jié)果同真實結(jié)果差別很大,或者服務(wù)端報音頻格式錯誤。

    解決方案

    1. 檢查音頻采樣率是否符合。
    2. 對于裸音頻,可采用toolsoft Audio player等工具進(jìn)行試聽,通過設(shè)置不同的采樣率,播放正常的即為音頻正常采樣率。
    3. 如果檢查參數(shù)“property”是否與采樣率一致,如“chinese_8k_common”, 8k即采樣率。


  • 語音交互服務(wù)是否支持私有化部署?

    目前語音交互服務(wù)暫不支持私有化部署。

  • 什么是區(qū)域與可用區(qū)?

    區(qū)域(Region):從地理位置和網(wǎng)絡(luò)時延維度劃分,同一個Region內(nèi)共享彈性計算、塊存儲、對象存儲、VPC網(wǎng)絡(luò)、彈性公網(wǎng)IP、鏡像等公共服務(wù)。Region分為通用Region和專屬Region,通用Region指面向公共租戶提供通用云服務(wù)的Region;專屬Region指只承載同一類業(yè)務(wù)或只面向特定租戶提供業(yè)務(wù)服務(wù)的專用Region。


    可用區(qū)(AZ,Availability Zone):一個AZ是一個或多個物理數(shù)據(jù)中心的集合,有獨立的風(fēng)火水電,AZ內(nèi)邏輯上再將計算、網(wǎng)絡(luò)、存儲等資源劃分成多個集群。一個Region中的多個AZ間通過高速光纖相連,以滿足用戶跨AZ構(gòu)建高可用性系統(tǒng)的需求

    查看詳情

  • 語音交互服務(wù)的區(qū)域如何選擇?

    不同區(qū)域的資源之間內(nèi)網(wǎng)不互通。為保證網(wǎng)絡(luò)的連通性,降低網(wǎng)絡(luò)時延、提高訪問速度,請選擇靠近您客戶的區(qū)域,當(dāng)前語音服務(wù)支持北京和上海區(qū)域,后續(xù)會陸續(xù)上線其他區(qū)域,當(dāng)前支持的區(qū)域請參見地區(qū)與終端節(jié)點。

    查看詳情

  • 語音交互服務(wù)需要申請什么權(quán)限?

    語音交互服務(wù)本身無權(quán)限限制,用戶不需要額外添加任何權(quán)限,即可對語音交互服務(wù)執(zhí)行操作。

    但是如下場景除外:

    當(dāng)用戶需要使用錄音文件識別功能時,需要用戶具有主帳號或者Security Administrator的權(quán)限。

    查看詳情

  • 如何通過主帳號創(chuàng)建一個子帳號?

    語音交互服務(wù)服務(wù)不支持IAM細(xì)粒度劃分策略,IAM賬號與主賬號具備相同的操作權(quán)限。

    您可以使用IAM的用戶管理功能,給員工或應(yīng)用程序創(chuàng)建IAM用戶,可避免分享自己的帳號密碼。詳細(xì)創(chuàng)建步驟請參見創(chuàng)建IAM用戶。