產(chǎn)品列表
產(chǎn)品列表
實(shí)時(shí)語(yǔ)音識(shí)別 RASR
實(shí)時(shí)語(yǔ)音識(shí)別(Real-time ASR),將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換成文本,語(yǔ)音識(shí)別更快。可應(yīng)用于直播實(shí)時(shí)字幕、會(huì)議實(shí)時(shí)記錄、即時(shí)文本生成等場(chǎng)景。
一句話(huà)識(shí)別 SASR
一句話(huà)識(shí)別將口述音頻轉(zhuǎn)換為文本,通過(guò)API調(diào)用識(shí)別不超過(guò)一分鐘的不同音頻源發(fā)來(lái)的音頻流或音頻文件。適用于語(yǔ)音搜索、人機(jī)交互等語(yǔ)音交互識(shí)別場(chǎng)景。
語(yǔ)音合成 TTS
語(yǔ)音合成服務(wù)提供在線(xiàn)語(yǔ)音合成能力,支持將文本信息實(shí)時(shí)轉(zhuǎn)化為近似的真人發(fā)聲,支持多語(yǔ)言多音色語(yǔ)音在線(xiàn)合成。支持客戶(hù)的個(gè)性化語(yǔ)音定制化需求。
錄音文件識(shí)別 LASR
錄音文件識(shí)別,基于深度學(xué)習(xí)技術(shù),可以實(shí)現(xiàn)5小時(shí)以?xún)?nèi)的音頻到文字的轉(zhuǎn)換。支持垂直領(lǐng)域定制,對(duì)應(yīng)領(lǐng)域轉(zhuǎn)換效果更佳。