語音識別是人工智慧和機器學習應用的一個重要方向,並發展成為一個具有廣闊前景的新興高技術產業。語音識別現在已經有很多的產品,包括維語到漢語的翻譯等等。人工智慧目前落地最成功的就是語音識別技術。以下對語音識別市場現狀分析。
美國目前的手機語音助手使用比例已經從2013年的30%左右快速攀升至2015年的60%以上,滲透率快速提升一倍以上。谷歌的語音搜索量較2008年增加35倍以上,較2010年增加7倍以上。2016年中國語音識別產業研究報告表明,隨著語音識別近年來的突破性進展,相關商業應用已經展開。2014年,全球智能語音市場規模整體達到45.6億美元,與2013年的33.7億美元同比增長35.3%。2015年,全球智能語音市場規模預計將達到61.9億美元,較2014年增長35.7%。
全球智能語音產業規模持續增長
隨著人工智慧產品在生活中的滲透率越來越高,其中技術的發展也成為了眾人關心的重點所在。作為人機自然交互的基本途徑之一,近期以來,語音識別的發展不可謂不快速。現從四大階段來分析語音識別市場現狀。
第一階段是技術萌芽階段(20世紀50~70年代),以孤立詞和少詞彙量句子識別,並通過關鍵詞匹配實現簡單命令操作為主要內容,AT&T貝爾實驗室開發的Audrey語音識別系統是其主要標誌。語音識別市場現狀指出,Audrey能夠通過跟蹤語音中的共振峰,識別10個英文數字,正確率高達98%。
第二階段是技術突破階段(20世紀80年代),語音識別和自然語言處理技術有了較大進展。語音識別市場現狀分析,智能語音技術研究由傳統的基於標準模板匹配的技術思路開始轉向基於統計模型(HMM)的技術思路,並再次提出了將神經網絡技術引入語音識別問題的技術思路。
第三階段是產業化階段(20世紀90年代到21世紀初),智能語音技術由研究走向實用並開始產業化,以1997年IBM推出的ViaVoice為重要標誌。語音識別市場現狀分析,智能語音產品開始進入呼叫中心、家電、汽車等各個領域。比如,上世紀70年代由美國國防部遠景研究計劃局資助的,旨在支持語言理解系統的研究開發工作的計劃DARPA,進入90年代後,研究重點已轉向識別裝置中的自然語言處理部分,識別任務設定為「航空旅行信息檢索」。
第四個階段是快速應用階段(2010年以後),以蘋果Siri的發布為重要引爆點,智能語音應用領域由傳統行業開始向移動網際網路等新興領域延伸。語音識別市場現狀分析,在一些已開發國家,大量的語音識別產品已經進入市場和服務領域並取得很好的效果。
我國語音識別技術的研究水平已經基本上與國外同步,在漢語語音識別技術上還有自己的特點與優勢,並達到國際先進水平。語音識別市場現狀分析,語音識別技術發展到今天,特別是中小詞彙量非特定人語音識別系統識別精度已經大於98%,對特定人語音識別系統的識別精度就更高。這些技術已經能夠滿足通常應用的要求。由於大規模集成電路技術的發展,這些複雜的語音識別系統已經完全可以製成專用晶片,大量生產。在西方經濟已開發國家,大量的語音識別產品已經進入市場和服務領域。