行業資訊 it其它 資訊詳情
國內語音識別技術快速發展 行業發展有望迎拐點
 語音識別 2016-01-02 11:42:22

  隨著高速發展之後,智慧型手機和它所帶動的相關產業都陷入了發展瓶頸,機器學習和人工智慧被認為是下一個科技熱潮,而語音識別也會趁著這個風口飛起來,語音識別技術所涉及的領域包括:信號處理、模式識別、機率論和資訊理論、發聲機理和聽覺機理、人工智慧等等。

  近兩年,受益於大數據和深度學習技術的不斷發展,語音識別技術突飛猛進,速度及準確性都有了長足進步。美國麻省理工官網近日消息,麻省理工計算機科學和人工智慧實驗室研發了新的聲音識別系統,比起上一代聲音識別系統正確率提高了15%。

國內語音識別技術快速發展 行業發展有望迎拐點

  近年來人工智慧系統在語音和圖像識別領域已有較成熟的算法,但在嘈雜環境下的聲音辨識能力相對較弱。此次研究人員利用視覺和聲音的自然同步,在原有資料庫中導入大量視頻信息,結合新算法對聲音識別系統進行測試。在10個不同聲音測試中,該系統獲得了92%的正確率,在50個聲音測試中準確率為74%,而人類在相同樣本測試中的正確率分別為96%和81%。未來該系統將改善用戶在戶外使用語音識別的體驗。

  研究人員表示,該系統應用潛力巨大,比如無人駕駛汽車系統搭載該聲音識別技術後,當聽到救護車聲音,無人駕駛汽車能更早選擇新的路線規劃。另外手機安裝該系統後,用戶到電影院後該系統通過周圍聲音環境判斷電影是否開始放映,並自動切換成靜音模式。該聲音識別系統將在本周召開的國際神經信息處理系統大會(NIPS)上進行展示。

  作為人工智慧最重要的技術之一,國外語音識別技術的準確率已基本達到人類的水平。微軟旗下最新語音識別系統的識別錯誤率僅為5.9%,這和專業速記員將對話轉錄成文字的最低錯誤率一致。而微軟也在一年前將語音識別系統的深度學習算法進行開源,使其他人工智慧產品通過該算法擁有語音識別技術。海外市場調研機構預計,未來幾年全球語音識別市場規模有望突破百億美元。

  國內的語音識別技術也在快速發展。11月底搜狗和百度分別召開發布會表示,旗下語音識別系統正確率已達到97%左右,同時有不少智能語音產品支持不同地區的方言識別。《2016年網際網路趨勢報告》顯示,近幾年用戶通過語音搜索的使用量大幅提升,使用語音的本質是解放雙手,而目前全球語音識別系統依然存在場景辨識率低等問題。隨著場景聲音辨識技術的加速完善,語音識別技術有望迎來拐點,未來發展空間將進一步擴大。

  據中國報告大廳發布的《2016年中國語音識別產業研究報告》預測分析認為,語音識別技術有很大潛力,未來語音技術在很多應用場景有很好的機會,將為人機互動帶來巨大的改變。

熱門推薦

相關資訊

更多

免費報告

更多
語音識別相關研究報告
關於我們 幫助中心 聯繫我們 法律聲明
京公網安備 11010502031895號
閩ICP備09008123號-21