當前人工智慧軟體在各個領域,正變得必不可少。它幾乎被應用到所有的應用程式中。運用人工智慧技術,無論是圖像識別,還是語音識別,正變得越來越準確,這包括機器能準確識別語音、語義甚至靜態的圖片以及動態的視頻。對於圖像識別技術,大家已經不陌生。
圖像識別是計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。識別過程包括圖像預處理、圖像分割、特徵提取和判斷匹配。簡單來說,圖像識別就是計算機如何像人一樣讀懂圖片的內容。藉助圖像識別技術,我們不僅可以通過圖片搜索更快的獲取信息,還可以產生一種新的與外部世界交互的方式,甚至會讓外部世界更加智能的運行。
圖像識別分為生物識別、物體與場景識別和視頻識別。據《通信行業人工智慧圖像識別專題報告》估算,到2020年,生物識別技術市場規模將達到250億美元,5年內年均增速約14%。其中,人臉識別增速最快,將從2015年的9億美元增長到2020年的24億美元。
圖像識別背後的技術就是新的機器學習方式,即深度學習。具體來說,在數據的基礎上,計算機自動生成特徵量,而非人為設置特徵量,然後計算機根據這些特徵量來進行分類。
「相比2012年時的技術,這些年圖像識別再次突飛猛進,」數相科技CEO鄧立邦告訴21世紀經濟報導記者,「從技術角度來說,入門容易,從0做到40、60分相對門檻較低,要提升到90分就需要深厚的模型。」
圖像識別技術的迅速落地有多方面原因,一方面,很多大企業已經開源了基本工具,鄧立邦談道:「就人臉識別來說,有很多學術機構已經做了相當長時間的研究,發了很多論文,論文也已經接入到實際的應用中。但是人臉之外,例如情緒仍舊是比較難的話題。」
另一方面,產業鏈的更新疊代也為圖像技術打下基礎。平安證券的報告中提到,高性能的AI 計算晶片、深度學習算法都是推動圖像識別發展的因素。其中,AI 底層架構從CPU+GPU 到FPGA,再到人工智慧專用晶片,運行表現不斷刷新,目前英偉達的DGX-1 晶片在程序運行速度上比舊版GPU 加速解決方案快12倍。
圖普科技方面也告訴記者,近年來,得益於計算機速度的提升、大規模集群技術的興起、GPU的應用以及眾多優化算法的出現,耗時數月的訓練過程可縮短為數天甚至數小時,深度學習才逐漸可用於工業化。
儘管還未達到真正的人工智慧,但日漸成熟的圖像識別技術已開始探索各類行業的應用。此前圖普科技CEO李明強就告訴記者,現在重要的是將人工智慧切入到具體行業中,在垂直行業中獲取和管理大數據。
據悉,在農林行業,圖像識別技術已經得到應用。中國林產業協會非洲分會秘書長丁磊向21世紀經濟報導記者介紹道:「木材的生產包含多個環節,過去這些環節往往牽涉到大量的人力投入。如今,圖像識別已在多個環節中得到應用,例如森林調查,通過無人機對圖像進行採集,再通過圖像分析系統對森林樹種的覆蓋比例、林木的健康狀況進行分析,從而可以做出更科學的開採方案。而原木檢驗方面,圖像識別可以快速對木材的樹種、優劣、規格進行判斷,省去了大量人工參與的環節。」
平安證券在研究報告中舉例道,在金融領域,身份識別和智能支付將提高身份安全性與支付的效率和質量;在安防領域,未來在仍硬體鋪設到後端軟體管理平台的建設轉型中,圖像識別系統將成為打造智慧城市的核心環節;在醫療領域,醫療影像基於人工智慧的快速匹配可幫助醫生更快更準確的讀取病人的影像數據;在無人駕駛領域,低成本的攝像頭加視頻處理軟體方案將為無人駕駛商業化打下基礎。
此外,智能家居、電商等行業中,圖像識別也有不同程度的應用。從目前的應用案例來看,以To B行業居多,當然不乏Face++等To C類產品。在深度學習之下,各公司面向不同行業,培育掌握不同知識的圖像識別機器。未來,如何在圖像的基礎上收集、處理大數據將成為行業內各玩家的另一個比拼點。
據中國報告大廳發布的2016-2021年中國圖形圖像識別和處理系統行業市場需求與投資諮詢報告顯示,隨著各領域對於身份識別和驗證的精確度要求的提高,基於圖像識別技術的人臉識別和視頻識別技術在金融、安防、醫療、無人駕駛等領域迎來了發展機會。
受益於圖像識別應用場景不斷豐富和需求端規模不斷擴大,我們建議重點關注圖像識別產業鏈技術應用層(人臉識別、物體識別、視頻識別)和方案集成層(智慧城市、智慧全融、機器人)的公司,他們將率先享受行業發展的紅利以及大規模人工智慧場景商業化。