語音識別 內容詳情
語音識別行業現狀分析
 語音識別 2018-04-25 13:46:44

  隨著機器學習和人工智慧的熱鬧,國內語音行業也可謂是百花齊放,尤其是最近幾年,不僅湧現了很多國內外的小公司,而且巨頭們也開始加速語音識別行業的布局。以下對語音識別行業現狀分析。

  在眾多商業化應用中,輸入法、車載語音、智能家居、教育測評是語音識別最為普遍的應用模式。其中,輸入法是最為優質的數據入口,由訊飛、百度、搜狗三家獨占;教育測評也是發展較成熟的一類,目前市場上各類外語教學、測評軟體,都有不錯的數據流量;而社交軟體的流量則被騰訊搶占了,在這種情況下,新興的語音識別公司不得不另闢蹊徑。

  對於新崛起的科技公司,硬體搭配語音識別是一個很普遍的應用模式,例如雲知聲做智能家居,思必馳做智能車載語音系統,出門問問推出智能手錶。由於智能家居、車載語音、手錶本身的場景要求,其需要處理的語音複雜度較低,對於數據流量的要求也沒那麼苛刻。至此,數據流量幾乎被全部搶占,後來者能參與的只是商業模式的複製和差異化。

  任何時候提到語音識別,都不能避過Nuance這家公司,這家公司曾經在語音領域一統江湖,世界上有超過80%的語音識別都用過Nuance識別引擎技術,其語音產品可以支持超過50種語言,在全球擁有超過20億用戶,幾乎壟斷了金融和電信行業。就算現在,仍舊是瘦死的駱駝比馬大,Nuance依舊是全球最大的語音技術公司,掌握著全球最多的語音技術專利。蘋果語音助手Siri、三星語音助手S-Voice、各大航空公司和頂級銀行的自動呼叫中心,剛開始都是採用他們的語音識別引擎技術。Nuance已經登陸了納斯達克,三星、蘋果和百度都和它傳過緋聞,傳言多次收購,但是全都無疾而終。

  事實上,Nuance有點過於自大了,語音技術即便冠絕全球,但是在具體應用上,差距就沒有那麼大了。語音識別技術並非高不可攀,實際上一款用戶體驗較好的語音識別系統,很大程度上依靠數據和經驗,專利和算法什麼的並沒有那麼重要。聰明人自然很多,所以巨頭們只需考慮挖到專業人士或者收購初創公司,自主研發出不遜於Nuance的語音識別技術也不是太難的事情,又何必花費巨資看Nuance臉色呢。

  語音識別主要有以下五個問題;⒈對自然語言的識別和理解。首先必須將連續的講話分解為詞、音素等單位,其次要建立一個理解語義的規則。⒉語音信息量大。語音模式不僅對不同的說話人不同,對同一說話人也是不同的,例如,一個說話人在隨意說話和認真說話時的語音信息是不同的。一個人的說話方式隨著時間變化。⒊語音的模糊性。說話者在講話時,不同的詞可能聽起來是相似的。這在英語和漢語中常見。⒋單個字母或詞、字的語音特性受上下文的影響,以致改變了重音、音調、音量和發音速度等。⒌環境噪聲和干擾對語音識別有嚴重影響,致使識別率低。

  以上介紹了實現語音識別系統的各個方面的技術。這些技術在實際使用中達到了較好的效果,但如何克服影響語音的各種因素還需要更深入地分析。目前聽寫機系統還不能完全實用化以取代鍵盤的輸入,但識別技術的成熟同時推動了更高層次的語音理解技術的研究。由於英語與漢語有著不同的特點,針對英語提出的技術在漢語中如何使用也是一個重要的研究課題,而四聲等漢語本身特有的問題也有待解決。以上就是筆者對語音識別行業現狀分析了。

熱門推薦

相關資訊

更多

免費報告

更多
語音識別相關研究報告
語音識別相關研究報告
關於我們 幫助中心 聯繫我們 法律聲明
京公網安備 11010502031895號
閩ICP備09008123號-21