奇富科技方言識別技術亮相全球頂會INTERSPEECH 2024快訊
在中文口音與方言語音識別領域的權威測試集KeSpeech的對比中,性能效果與KeSpeech Baseline對比 奇富科技自研的中文語音識別系統,奇富科技介紹了可同時支持20多種方言的新一代奇富語音識別系統。
【TechWeb】9月27日消息,奇富科技受邀出席在希臘舉辦的國際語音通信與信號處理頂級會議——INTERSPEECH 2024,并發表了題為/Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition/的主旨演講,全面展示了其在語音識別技術領域的成就,為中國語音技術走向世界、參與全球競爭樹立了新的標桿。
奇富科技介紹了可同時支持20多種方言的新一代奇富語音識別系統“QiFree”,這是國內金融行業內字錯率最低的中文語音識別系統。在中文口音與方言語音識別領域的權威測試集KeSpeech的對比中,奇富科技憑借其在自動語音識別(Automatic Speech Recognition, ASR)領域的深厚積累,實現了方言口音分類準確率的顯著提升,達到了79.10%,遠超KeSpeech的基線水平61.13%。同時,在衡量識別錯誤率的關鍵指標——CER(Character Error Rate, 字符錯誤率)上,奇富科技更是以8.08%的成績,遠優于KeSpeech的10.38%,展現了其在中文方言識別領域的高效與精準。

奇富科技“QiFree”性能效果與KeSpeech Baseline對比
奇富科技自研的中文語音識別系統“QiFree”,打破了單一模型只能識別特定單一方言的困境,通過創新的層自適應融合結構,借助共享信息編碼模塊更高效的提取方言信息,實現了即說即譯,進一步增強了語音機器人的實時交互能力。值得一提的是,“QiFree”不僅在普通話識別領域的CER上保持領先地位,更在冀-魯、江淮、膠-遼、蘭-銀等多個方言區域的識別性能上,相比過往最佳成績實現了超過15%的顯著提升。這一突破性成果得到了INTERSPEECH三位獨立審稿人的高度認可,他們一致認可奇富科技論文《Qifusion-Net:基于特征融合的流式/非流式端到端多口音語音識別框架》所展現的系統框架創新性與識別性能的卓越表現,并一致授予其“ACCEPT”的評定。
資料顯示,INTERSPEECH是全球語音科學界最負盛名的年度會議之一,匯聚了來自世界各地的頂尖學者、研究人員及行業領袖,共同探討語音技術的最新進展、挑戰與未來趨勢。這一平臺不僅代表了語音技術領域的最高學術水平,也是新技術、新理念交流與碰撞的絕佳場所。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。