申請試用

手機號
姓名
驗證碼
我們收到您的消息后,會立刻與您取得聯系。

語音轉文字ASR增強識別引擎

基于領域知識圖譜模型,解決南北方不同人群發音不準確,形成強大的糾錯能力,為機器人大腦NLP處理層輸入更準確的文字。在特定的領域下能區分用戶到底是說“帶寬”還是“貸款”,也能理解用戶發的音“灰機”其實是“飛機”。

技術概要

應用業內最領先語音識別算法,包括LSTM、BLSTM、Deep CNN、LFMMI、CTC 等算法;可以將語音中內容、說話、語種等信息識別出來,相當于給機器人裝上了人工耳朵

技術特性

智能糾錯

針對南北方差異發音不標諸如Chi、ci、shi、shi 不分的發音者提供糾錯引擎。語音識別準確率由70%提升到90%

噪音環境識別

能夠識別來自嘈雜環境的音頻信息,不需要客戶進行降噪處理

快速識別

對60秒之內的實時短音頻流進行識別,可應用于運營活動等場景

錄音識別

對錄音文件進行識別,可用于字幕生成、錄音資料轉寫等場景