share_log

奇富科技方言识别技术亮相全球顶会INTERSPEECH 2024

奇富科技方言識別技術亮相全球頂會INTERSPEECH 2024

TechWeb ·  09/27 11:47

【TechWeb】9月27日消息,奇富科技受邀出席在希臘舉辦的國際語音通信與信號處理頂級會議——INTERSPEECH 2024,並發表了題爲/Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition/的主旨演講,全面展示了其在語音識別技術領域的成就,爲中國語音技術走向世界、參與全球競爭樹立了新的標杆。

奇富科技介紹了可同時支持20多種方言的新一代奇富語音識別系統「QiFree」,這是國內金融行業內字錯率最低的中文語音識別系統。在中文口音與方言語音識別領域的權威測試集KeSpeech的對比中,奇富科技憑藉其在自動語音識別(Automatic Speech Recognition, ASR)領域的深厚積累,實現了方言口音分類準確率的顯著提升,達到了79.10%,遠超KeSpeech的基線水平61.13%。同時,在衡量識別錯誤率的關鍵指標——CER(Character Error Rate, 字符錯誤率)上,奇富科技更是以8.08%的成績,遠優於KeSpeech的10.38%,展現了其在中文方言識別領域的高效與精準。

big

奇富科技「QiFree」性能效果與KeSpeech Baseline對比

奇富科技自研的中文語音識別系統「QiFree」,打破了單一模型只能識別特定單一方言的困境,通過創新的層自適應融合結構,藉助共享信息編碼模塊更高效的提取方言信息,實現了即說即譯,進一步增強了語音機器人的實時交互能力。值得一提的是,「QiFree」不僅在普通話識別領域的CER上保持領先地位,更在冀-魯、江淮、膠-遼、蘭-銀等多個方言區域的識別性能上,相比過往最佳成績實現了超過15%的顯著提升。這一突破性成果得到了INTERSPEECH三位獨立審稿人的高度認可,他們一致認可奇富科技論文《Qifusion-Net:基於特徵融合的流式/非流式端到端多口音語音識別框架》所展現的系統框架創新性與識別性能的卓越表現,並一致授予其「ACCEPT」的評定。

資料顯示,INTERSPEECH是全球語音科學界最負盛名的年度會議之一,匯聚了來自世界各地的頂尖學者、研究人員及行業領袖,共同探討語音技術的最新進展、挑戰與未來趨勢。這一平台不僅代表了語音技術領域的最高學術水平,也是新技術、新理念交流與碰撞的絕佳場所。

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與富途相關的任何投資建議。富途竭力但無法保證上述全部內容的真實性、準確性和原創性。
    搶先評論