首頁  >  IT頻道  >  業界資訊  > 正文

奪CHiME三連冠 科大訊飛產品“立地”源於技術底氣

2020-05-07 16:18:15 | 來源: 北國網 | 責編: 鄭思雯
分享到:

  5月4日,國際多通道語音分離和識別大賽(CHiME)比賽最新一屆CHiME-6成績在線揭曉。科大訊飛聯合中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)在給定說話人邊界的多通道語音識別兩個參賽任務上奪冠,其中語音識別錯誤率更是從CHiME-5的46.1%降至30.5%。

奪CHiME三連冠 科大訊飛產品“立地”源於技術底氣

  科大訊飛奪得CHiME-6冠軍 (Track1:Ranking A)

奪CHiME三連冠 科大訊飛產品“立地”源於技術底氣

  科大訊飛奪得CHiME-6冠軍 (Track1:Ranking B)

  深耕語音識別技術突破,錯誤率從46.1%降至30.5%

  據了解,本次CHiME-6使用的語音素材相包括多人在廚房邊做飯邊聊天、在起居室邊用餐邊聊天、在客廳聊天,聊天的聲音中包括遠場、混響、噪音、語音疊加等各種複雜因素,因而技術難度極大。

奪CHiME三連冠 科大訊飛產品“立地”源於技術底氣

  (CHiME-6音頻樣本採集于廚房、起居室、客廳等場景的多人對話)

  2018年的CHiME-5比賽,科大訊飛聯合中科大語音及語言信息處理國家工程實驗室杜俊教授團隊(USTC-NELSLIP)斬獲了四個比賽項目的全部冠軍。然而,當年最優的參賽系統語音識別錯誤率仍高達46.1%,距離實用仍有較大差距,所以,今年USTC-NELSLIP聯合團隊重點聚焦于Track1,希望進一步探索複雜場景語音識別實用化的可能性。通過團隊的技術攻關,將該任務上的語音識別錯誤率從原來的46.1%降至30.5%,大幅刷新該項賽事歷史最好成績,進一步拉大領先優勢,最終在Track1的兩個子任務(Track1-Ranking A,需使用官方語言模型;Track1-Ranking B,不限制語言模型)上均斬獲冠軍。

  以技術領跑發展,科大訊飛厚積薄發的應對之道

  積跬步,得以至千里。基於多年來在真實場景中的技術積累,科大訊飛僅用一年半就實現了CHiME-6成績的大幅躍升。

  據了解,針對比賽任務,USTC-NELSLIP聯合團隊結合技術與經驗累積,進行了一系列技術創新。在前端信號處理方面,聯合團隊提出了基於空間-說話人同步感知的迭代掩碼估計算法(Spatial-and-Speaker-Aware Iterative Mask Estimation, SSA-IME),該算法結合傳統信號處理和深度學習的優點,利用空時多維信息進行建模,迭代的從多個說話人場景中精確捕捉目標說話人的信息。該算法不僅有效降低環境干擾噪聲,而且可以有效消除干擾說話人的語音,從而大幅降低語音識別的處理難度。

  在後端聲學模型上,聯合團隊提出了基於空間-說話人同步感知的聲學模型(Spatial-and-Speaker-Aware Acoustic Model, SSA-AM),通過在聲學模型輸入端拼接多維度空間信息和不同說話人信息,使其能自適應區分目標說話人和干擾說話人。因此,聲學模型不僅依賴前端算法的處理結果,也能夠自適應完成對目標說話人語音特徵的提取,大幅提升多人對話場景下語音識別聲學模型的容錯率和魯棒性。

  回顧2018年組委會發佈CHiME-5數據集,官方的基線系統錯誤率高達73.3%,USTC-NELSLIP聯合團隊通過不斷進行技術創新,逐步刷新最好成績。這充分說明,在遠場、混響、噪音、聲音疊加、語言風格隨意等諸多不確定性的複雜場景下,USTC-NELSLIP聯合團隊的技術積累一直處於世界領先水平。

  技術發展,是實現應用落地的基礎。目前,科大訊飛正在大力拓展多語種語音識別方面的技術研究,通過長期的智慧語音技術積累及研發攻關,有望為全球更多企業及消費者提供優質的多語種智慧語音解決方案。

國際在線版權與信息產品內容銷售的聲明:

1、“國際在線”由中國國際廣播電臺主辦。經中國國際廣播電臺授權,國廣國際在線網絡(北京)有限公司獨家負責“國際在線”網站的市場經營。

2、凡本網註明“來源:國際在線”的所有信息內容,未經書面授權,任何單位及個人不得轉載、摘編、複製或利用其他方式使用。

3、“國際在線”自有版權信息(包括但不限于“國際在線專稿”、“國際在線消息”、“國際在線XX消息”“國際在線報道”“國際在線XX報道”等信息內容,但明確標注為第三方版權的內容除外)均由國廣國際在線網絡(北京)有限公司統一管理和銷售。

已取得國廣國際在線網絡(北京)有限公司使用授權的被授權人,應嚴格在授權範圍內使用,不得超範圍使用,使用時應註明“來源:國際在線”。違反上述聲明者,本網將追究其相關法律責任。

任何未與國廣國際在線網絡(北京)有限公司簽訂相關協議或未取得授權書的公司、媒體、網站和個人均無權銷售、使用“國際在線”網站的自有版權信息產品。否則,國廣國際在線網絡(北京)有限公司將採取法律手段維護合法權益,因此產生的損失及為此所花費的全部費用(包括但不限于律師費、訴訟費、差旅費、公證費等)全部由侵權方承擔。

4、凡本網註明“來源:XXX(非國際在線)”的作品,均轉載自其它媒體,轉載目的在於傳遞更多信息,豐富網絡文化,此類稿件並不代表本網贊同其觀點和對其真實性負責。

5、如因作品內容、版權和其他問題需要與本網聯絡的,請在該事由發生之日起30日內進行。