當前位置:
首頁 > 最新 > AI不斷滲透,人機差異帶來新機會

AI不斷滲透,人機差異帶來新機會

來源:萌主風向標

作者:陳萌 王洪祥

原標題:《【建投中小盤?深度】萬物智聯,感知先行--AI系列報告第一篇》

概要

AI不斷滲透,人機差異帶來新機會

AI與行業的融合是目前AI創業的最大方向,國內外佔比分別為46%和77%,AI與行業的融合最終要實現的是對人腦的終極替代,目前各個行業各個崗位的主要操作和決策者都是「人腦」AI與人腦對信息的需求有較大的差異,這一差異將會給感測器市場帶來巨大的機會。

DVS助力,攝像頭效率大幅提升

DVS感測器輸出是連續三維的點雲,不但提供位置信息,同時還告知發生運動是在哪一個時刻,時間坐標精度達到納秒級;其可以有效的過濾背景冗餘數據,從而多至成千倍的節省運算數據流,降低了數據傳輸、存儲壓力和系統成本。我們認為DVS用於汽車高速信號採集具有較大優勢,未來有望佔據車載攝像頭20%的市場份額。

車載攝像頭數量不斷增多,拉動高速信號傳輸晶元出貨量

全球車載攝像頭出貨量在2020年將達8300萬枚,一個車載攝像頭需搭載兩塊高速數據傳輸晶元,則僅從車載攝像頭應用領域需求來看,2020年高速數據傳輸晶元需求量將達1.6億塊,市場空間超過30億元人民幣。

語音應用範圍不斷拓寬,降噪演算法&晶元行業景氣度好

語音交互將在智能家居市場中的滲透率逐年提升,預計2020年語音交互在智能家居市場中的滲透率在美國和中國將分別達到38%和27%。隨著語音應用範圍的不斷拓展,對降噪演算法和晶元的需求將不斷上升,我們認為降噪會帶來單機1-10元人民幣的價值提升,未來市場空間有望破百億。

相關概念股

正文

◆◆

1

人工智慧----對人腦力/體力的終極解放

人工智慧是利用數字計算機或者數字計算機控制的機器模擬、延伸和擴展人的智能,感知環境、獲取知識並使用知識獲得最佳結果的理論、方法、技術及應用系統,其起源可以追溯到上世紀五十年代,經過半個多世紀的發展,在技術和應用領域均取得重大突破。

全球人工智慧行業經歷三次發展浪潮,中國人工智慧方興未艾

全球人工智慧已有60多年的發展史,共經歷了三次發展浪潮。20世紀50年代到70年代,人們認為如果賦予機器邏輯推理能力,機器就具有智能,人工智慧處於推理期。20世紀80年代,人們意識到人類之所以能夠判斷、決策,除了推理能力外,還需要知識,人工智慧進入了知識期,大量專家系統在此時誕生,隨著研究的進行,專家發現人類知識無窮無盡,且有些知識本身難以總結後交給計算機,於是一些學者誕生了將知識學習能力賦予計算機本身的想法,機器學習開始真正成為一個獨立學科領域。2006年,深度學習神經網路的提出將人工智慧的發展推向了一個新的高峰,語音識別、計算機視覺等領域陸續取得重大進展,圍繞語音、圖像等的人工智慧技術的創業開始湧現。

中國人工智慧起步較晚,但正一步步趕超發達國家水平,人工智慧產業方興未艾。我國人工智慧始於19世紀80年代初期,中國人工智慧學會(CAAJ)成立,隨後國家陸續發布人工智慧相關政策、設立相關項目計劃引導和支持產業發展。目前我國面向2030年,確定了15個重大項目的立項建議,涉及航空、網路安全、智能電網、智能製造和機器人等多個高新領域,醞釀「人工智慧2.0」推動中國高新技術發展及產業化水平。

人工智慧產業爆發,中美並駕齊驅

美國和中國人工智慧企業數量全球領先。截止2018年6月,全球共監測到人工智慧企業總數達4925家,其中美國人工智慧企業數2028家,中國大陸人工智慧企業總數1011家,美國和中國人工智慧企業數分別位列全球第一和第二,其次分別是英國、加拿大和印度。而從城市尺度來看,全球人工智慧企業數量排名Top20的城市中,美國佔9個,中國佔4個,加拿大佔3個。其中,北京成為全球人工智慧企業數量最大的城市,其次是美國舊金山和英國倫敦,上海、深圳和杭州的人工智慧企業數量也進入全球前20。

中國人工智慧企業應用技術更集中於視覺和語音,行業更集中於終端產品市場。人工智慧的應用技術主要包括語音類技術(語音識別、語音合成等)、視覺類技術(圖像識別、生物識別等)和自然語言處理類技術(機器翻譯、文本挖掘、情感分析等)。將基礎硬體考慮在內,國內外人工智慧企業應用技術分布如下圖左所示,相比國外,中國人工智慧企業的應用技術更集中於視覺和語音,且基礎硬體佔比偏小。在行業應用上,人工智慧包括智能機器人、智能駕駛、無人機、AR/VR、大數據及數據服務、以及各類垂直領域應用(「AI+」)。國內外人工智慧企業的行業應用分布如下圖右所示,相比於國外,國內企業更看重智能機器人、無人機和智能駕駛等終端產品市場,而國外企業更注重AI在各類垂直行業的應用。

各巨頭爭相布局,未來行業格局未定

當前人工智慧行業格局仍在形成中,落地應用星羅棋布,最為廣泛的有機器學習、計算機視覺、文本和自然語言處理等,但落地實際商業場景不多,且主要方式是依附於企業自身的業務,實現某些局部應用的「人工智慧化」,「從端到端」實現人工智慧的產業鏈較少。縱覽國內外幾大科技巨頭的AI布局,大抵遵循了這種模式:從現有業務中發掘AI需求,借力人工智慧技術裝備現有產品和服務,此外也通過收購和合作,利用AI拓展新業務。

過去一年,人工智慧各種應用層出不窮,但收穫卻很少。2017年中國AI創業公司獲得的累計融資超過500億元,但2017年中國AI商業落地100強創業公司累計產生的收入卻不足100億元,90%以上的AI企業虧損。

人工智慧的應用在其現有技術能達到的範圍內被廣泛開發,但真正能否落地還要看三個方面:技術角度,應用要求的數據的可獲得性和結構化程度、多樣性能否滿足;從產業角度,是否有相應的商業場景和一定客戶群體、是否能夠創造一定的收入以維持產品的開發改進;從法律和政策的角度,要考慮AI涉及的應用是否合法合規。從以上三個角度來判斷應用的落地速度,我們認為AI在市場營銷和零售和供應鏈管理與生產等領域將大有作為;在無人車、醫療等領域落地還有一段距離。

AI技術產業鏈分析

人工智慧實現的三大支撐:大數據、智能晶元以及智能演算法。人工智慧技術實現分為兩個階段,訓練和推斷。訓練需要大量的結構化、標籤化的數據,通過演算法處理,兩者相輔相成;演算法通過數據訓練不斷完善,同時也由於智能演算法的不斷改進,大量自然數據得以完成歸類和整理,成為可用於演算法訓練的結構化數據。訓練成型的模型落地實際應用,也就是推斷過程,是通過感測器等採集關於某個情景的信息,經過儲存與編譯,傳送到智能晶元中,用已成型的演算法模型進行計算處理並給出反饋的指令。

人工智慧產業上游是大數據,包括圖像數據和語音數據等,而存在於生活場景中的大量信息無法直接用於計算機演算法的訓練,且大量數據存儲以及處理成本高昂,因此專業的數據採集、處理以及存儲公司應運而生。人工智慧的中游主要由半導體晶元和智能演算法構成,在人工智慧發展早期,傳統的演算法主要是解決標準化、數學化的抽象問題,而目前人工智慧需要挑戰的是解決現實場景中的各類問題,例如圖像、語音識別或者生物特徵識別,這就涉及到將真實信息進行抽象處理從而轉化為計算機可以理解的程序語言,為了實現這一目標,各類新型智能演算法被提出,新型演算法往往對計算機的計算能力提出了更高要求,因此具備更強運算能力的計算機晶元也應運而生,涉及到的關鍵技術主要有機器學習、知識圖譜、自然語言處理、人機交互、計算機視覺、生物特徵識別、AR和VR等。人工智慧的下游應用極為廣泛,目前主要行業包括智能安防、智能交通、智能家居等。

信號種類包羅萬象,圖像&語音佔比高

信息的採集與處理是AI應用實現的一大基石,信息的形式和類別多種多樣,就AI領域而言,圖像和語音信息的採集和傳輸效率是我們關注的重點。根據美國哈佛商學院有關研究人員的分析資料表明,人的大腦通過聽覺及視覺接收的信息佔比94%,因此語音和圖像信息的接收和處理成為我們研究的重點。

中國人工智慧市場規模中圖像&語音佔比高。2017年我國人工智慧市場規模達到237.4億元,相較於2016年增長67%。其中以生物識別、圖像識別、視頻識別等技術為核心的計算機視覺市場規模最大,佔比34.9%,達到82.8億元;其次是智能語音市場,佔比24.8%,達58.88億元。

2

「人機有別」機器視覺為產業鏈帶來新機遇

傳統攝像頭為取悅人眼而存在,應用於機器視覺並不經濟:傳統攝像頭追求更高解析度,更高幀率和更好的對比度,成像結果主要是用於人眼觀看,進步多年其評判標準也是是否能夠給人帶來更好的視覺體驗以及是否能夠更好的對人眼所觀測到的場景進行還原等。而專門用於機器視覺的攝像頭其成像要求理應更適合於機器處理,例如其採集信息可能不僅限於可見光範圍、其成像要求可能不再以像素為首選等等。

DVS助力,攝像頭效率大幅提升

人工智慧帶動機器視覺系統市場,數據冗餘成市場發展瓶頸。近年來,智能工廠和無人駕駛汽車等人工智慧領域的興起,帶熱了市場對機器視覺系統的需求。而隨著這些高需求應用的興起,大量的冗餘數據帶來巨大的運算壓力。據英特爾報告顯示,一輛自動駕駛汽車一天可能產生超過4TB的數據,其中大部分數據和圖像直接相關。僅以車載攝像頭為例,據我們估算,未來一輛無人駕駛汽車可能裝有多達10個攝像頭,在行車過程中每個攝像頭每秒鐘可產生約20~40M的數據量,僅車載攝像頭部分每秒鐘可產生約400M的數據量,一小時可產生約1TB的數據量。而隨著汽車的不斷升級換代和智能化,單輛汽車車載攝像頭的數量將持續增加,全球汽車需求量也呈上升趨勢,這些因素將使車載攝像頭的總需求量將不斷增加。根據IHS估計,2018年全球車載攝像頭需求量將超5000萬,2018年中國車載攝像頭需求量將達約3000萬,由此產生的龐大的數據量要交給後端去處理。目前市場多把注意力放在處理數據的後端,執迷於越來越高的算力堆砌,疲於應付隨之而來的整體模組尤其是內存、GPU等成本上漲、系統效能不堪重負等問題,卻往往忽視了機器視覺的數據之源——前端攝像頭。如果能從前端減少數據冗餘,將大大提高運算效率,減輕後端整體模組負擔。一種從前端減少數據冗餘的方法是對關鍵信息進行篩選,如動態視覺感測器DVS(DynamicVisionSensor)技術。

DVS感測器成像原理為單獨觸發機制。傳統的圖像感測器是基於幀來成像,在固定時間段(幀時間)內,像素陣列檢測到的光電流被積分在電容器中,在每一幀時間內,每個像素的到達電壓電平以順序方式傳送出晶元。因此,使用傳統圖像感測器時,每一幀時間內會將所有像素的信息傳輸出去,而不管單個像素上是否有變化進而判斷是否需要進行信息傳輸。此外,由於光電流是在固定時間段(通常在20-30ms的數量級)完成積分的,當物體高速移動運動時候就會造成信息丟失。而DVS晶元由一個個獨立感光像素組成,每一個像素都在獨立判斷自身是否被激發,若被激發則產生一個「ON」事件,若激發離開則產生一個「OFF」事件。如以下第一幅圖所示,一束光從晶元左側緩慢移入晶元,在第二幅圖中,當光束接觸到第一個像素時,該像素被激發併產生一個「ON」事件,同時發出位置、明暗度和時間三組信息,在第三幅圖中,當光束移除第一個像素時,該像素再次被激發併產生一個「OFF」事件。這種單獨觸發機制與傳統的全幅觸發機制在設計機理上就存在著巨大的差異,這也是動態圖像感測晶元在機器處理方面擁有優勢的原因。

DVS感測器可通過篩選關鍵信息從前端減少數據冗餘,減輕後端模組負擔。DVS感測器的特色之處在於,其檢測每個像素點的光強是否隨時間有細微的變化,只有接受光強發生改變時,才會有事件(脈衝)信號輸出,否則感測器將只保留之前的記錄數值,不會如同傳統攝像機那樣造成冗餘的數據和多餘的計算。這種實時監測動態信息的能力,直接可以移除冗餘的背景圖像數據,為機器視覺提供精確的輸入,解決多餘計算問題。DVS感測器輸出是連續三維的點雲,不但提供位置信息,同時還告知發生運動是在哪一個時刻,時間坐標精度達到納秒級,其通過精密的電路布局和並行運算能力搭配業界獨樹一幟的讀出原理使得其速度不受傳統的曝光時間和幀速率限制,可以有效的過濾背景冗餘數據,從而多至成千倍的節省運算數據流,降低了數據傳輸、存儲壓力和系統成本,減輕機器視覺後端信號處理演算法的複雜度,使實時處理的難度大大降低,提升系統整體的魯棒性。據估計,DVS感測器比傳統感測器產生的數據量減少了近100~1000倍,若據上文估計一輛汽車的普通攝像頭一小時產生約1TB的數據量,則使用DVS感測器的攝像頭一小時僅產生約1~10GB的數據量。

DVS感測器與傳統APS感測器對比優勢明顯。傳統的機器視覺系統攝像頭前端普遍採用CMOS有源像素感測器APS,其將捕捉到的光學信息(包括採集點的灰度和顏色)轉化成電信號,實現整個場景的還原。DVS感測器與傳統APS感測器相比在數據速率、響應時間、連續性等方面對比優勢明顯,且量產後成本差別不大。此外,由於在很多汽車智能化系統裡面,如特斯拉對應系統的功耗是100多瓦,因此雖然DVS感測器功耗比傳統感測器高約500毫瓦,但跟100多瓦相比幾百毫瓦並不算多,僅在原來系統功耗的基礎上增加了0.5%,且使用DVS感測器可以節省下來的後端計算功耗並不是毫瓦級別,因此與DVS感測器能帶來的優勢相比,其功耗提高帶來的劣勢不值一提。

DVS技術應用廣泛,前景可期。DVS技術在許多領域將有重要應用,除運用在自動駛ADAS系統中外,還可應用於機器人和無人機防撞系統、體感和人機交互工業過程式控制制、爆炸/碰撞分析、安防監控、物聯網、高速運動物體軌跡記錄與實時分析等。在所有目標快速變化的領域,DVS能夠更快發現、更准把握、更低代價的傳輸和計算,大大擴展機器視覺的應用範圍。我們認為DVS技術相比於傳統攝像頭更適合於機器視覺,未來在高速視頻信號採集方向例如自動駕駛、低頻率事件變化如安防監控等領域具備較強的競爭優勢。相比於傳統的圖像感測器,DVS圖像感測器晶元成本不會比它們高,同時還節省了大量後端處理的計算成本,並大幅提高效能,這對於追求技術差異化和尋找解決傳統圖像感測器痛點的應用廠商來說,是革命性的突破。DVS技術未來市場潛在空間巨大,未來可期。

全球已有三家公司具備完整開發DVS感測器能力,多家公司有DVS布局。目前全球已有三家公司具備完整開發DVS感測器的能力,瑞士的Inilabs、法國的Prophesee和中國的芯侖科技CelePixel。Inlilabs整合了主動像素感測器(APS)技術,開發了DAVIS晶元系列;Prophesee採用了脈衝寬度調製(PWM)技術,推出了基於非同步時間的圖像感測器ATIS(AsynchronousTime-BasedImageSensor)晶元和軟體演算法;芯侖採用的是對數編碼圖像感測器,同時在晶元中融合了光流演算法,其產品有CeleX?感測器和CeleX?晶元組。從解析度、反應速度等參數指標和兼容性上來對比,芯侖科技目前處在領先地位。此外全球已由多家公司有DVS布局,如三星先進技術研究院曾在2016年將IBM用來模擬大腦的TrueNorth處理器集成到自家DVS感測器中,IBM在2018年度電腦視覺與圖形識別研討會(CVPP)上提出正在推廣一種立體視覺(stereo-vision)系統,該設計利用了IBM自家的TureNorth晶片以及一對Inilabs開發的DVS攝影機。

信號變化頻率較低,DVS可有效節省存儲空間

安防需求帶來視頻攝像頭需求上升

安防需求快速增長,視頻監控設備市場處於上升周期。近年來得益於國內平安城市和智慧城市的打造,國內安防產業始終保持年增長率達2位數的高增長態勢,顯著高於全球平均水平。安防行業包括安防工程、安防產品和報警運營服務及其他三個子行業,其中安防產品佔比約35%,可分為視頻監控、出入口控制、防爆安檢、防盜報警、實體防護、樓宇對講及其他。視頻監控是整個安防系統最重要的物理基礎,也是安防行業的核心環節,視頻監控產品占安防產品的比例在50%左右。隨著安防需求的不斷增長,輔以技術升級和網路攝像機的推動等因素,視頻監控設備市場同樣也處在上升周期,我國視頻監控市場規模從2010年的242億元上升到了2017年的1063億元,CAGR達23.54%,預計2018年市場規模將達1192億元。

安防產業進入數據爆炸時代。據IHS估計,2017年全球專業銷售渠道出貨約9800萬台網路監控攝像頭,其中2900萬台為高清設備。TSR數據顯示,未來幾年全球安防視頻監控市場仍將保持穩步增長,預計2020年全球安防鏡頭市場銷量和市場金額將分別達到1.84億件和6.53億美元。在視頻監控大範圍、高密度、高清晰度的趨勢下,視頻監控數據量正在成倍增長。據估計,國內現有的監控設備每月將產生數百EB級(1EB1000000GB)的數據,安防產業已進入數據爆炸時代。

DVS攝像頭運用於安防領域解決數據冗餘問題

DVS可從源頭解決安防監控中低頻率變化事件導致的數據冗餘問題。安防領域每年產生大量非結構化數據,傳統的人工查看方式已無法滿足日益增長的安防需求,且安防監控大都捕捉的是低頻率變化事件,使用傳統攝像頭會產生大量冗餘數據,給後端模組帶來巨大的運算壓力。面對這些問題,一種解決方法是通過智能化處理,實現對視頻敏感信息的快速自動定位和結構化存儲,以便後續快速檢索查找,當前,視頻監控智能化在部分應用領域已經展現出其強大的效能,如車輛違章自動抓拍、人員侵入自動報警等;我們認為另一種更高效的方法是引入DVS攝像頭,篩選關鍵信息、僅捕捉變化事件,這將從前端源頭處減少數據冗餘,大大提高效率。

高速低時延,DVS可有效節省帶寬

自動駕駛&ADAS帶來攝像頭需求上升

車載攝像頭性價比高,廣泛應用於汽車感測系統,在智能駕駛ADAS系統中也發揮著難以替代的作用。車載攝像頭的視覺處理技術能夠較好辨識道路標識、行人,也可以通過演算法和機器學習判斷行人與車輛的動軌軌跡,目前技術相對成熟,且其成本比雷達技術更低、功能也更全面,因此被廣泛應用於汽車感測系統中。車載攝像頭也可以幫助ADAS(高級輔助駕駛系統)系統實現前向駕駛輔助、行車記錄、全景環視等功能,因此也是ADAS系統的重要組成部分,按照安裝位置可分為前視、後視、環視、側視以及車內監控五種。

ADAS滲透加速,車載攝像頭需求量不斷增長。伴隨人工智慧的飛速發展,汽車智能化發展趨勢將從高級駕駛輔助系統(ADAS)普及開始,伴隨著技術持續進步從而最終達到完全自動駕駛。傳統汽車中車載攝像頭的應用並不廣泛,其中運用最多的為前視以及後視攝像頭,分別用於行車記錄和倒車影像,用於單車配比攝像頭數量一般為2~4枚左右,且多用於高配型號;而一套完整的ADAS系統一般至少裝配6個攝像頭,包括1個前視、1個後視和4個環視,高端智能汽車中車載攝像頭可多達8個,如特斯拉Autopilot包含了3個前視、2個側視和3個後視攝像頭;未來隨著ADAS系統功能的逐步完善,車內和側視攝像頭會進一步滲透,汽車搭載的攝像頭數量會是現在2倍以上,攝像頭數量將超過10個。

汽車銷量穩步提升,ADAS滲透率不斷提高,車載攝像頭增量空間未來可期。根據IHS估計,全球車載攝像頭出貨量將從2014年的2800萬枚上升到2020年的8300萬枚,CAGR達20%,市場前景廣闊。2017年我國乘用車銷量2474萬輛,按照未來三年平均5%的年增速,則2020年乘用車銷量將達2864萬輛。根據高工智能產業研究院(GGAI)的預測,到2020年,前視攝像頭(1顆)的滲透率為30%;側視攝像頭(2顆)的滲透率為20%;後視攝像頭(1顆)滲透率為50%;內置攝像頭(1顆)滲透率為6%。根據以上預測,2020年我國汽車攝像頭需求量為3609萬顆,按照平均每顆140元的價格,市場規模約為50億元。而從細分種類來看,根據高工智能產業研究院(GGAI)的預測,國內前裝市場中,預計2018年至2025年,前視ADAS攝像頭出貨量將由330萬顆上升至7500萬顆,CAGR達56%,環視攝像頭出貨量將由1500萬顆增長至1.7億顆,CAGR達42%,而內置攝像頭出貨量將由180萬顆上升至4600萬顆,CAGR達59%。

DVS攝像頭運用於自動駕駛ADAS系統優勢明顯

DVS攝像頭能有效縮短汽車制動距離。在所有目標快速變化的領域,DVS能夠更快發現、更准把握、更低代價的傳輸和計算。專註於汽車行業的法國諮詢公司YOLE把動態視覺感測器(又叫事件驅動的圖像感測器)列入到了L4和L5級別的自動駕駛的方案當中。有評估表明,採用DVS攝像頭使得汽車對緊急情況的反映時間能縮短約150ms,相當於時速120公里/小時的汽車能夠節約5米的制動距離。我們認為未來DVS攝像頭有望佔據車載攝像頭20%的市場份額,年出貨量有望超過2000萬。

AI+行業,向感測器提出新要求:DVS攝像頭只是AI與行業融合過程中催生出的一個新的感測器品類,其從設計理念上從傳統攝像頭的「以人為本」改為以「AI為本」,抓住「人機」差異對產品的性能指標進行優化,進而得到更加適用於AI的感測器。我們認為隨著AI向各個行業的不斷深入,未來會有越來越多的面向AI的感測器設計方案推向市場。建議投資者關注相關投資機會。

ADAS功能不斷增多,高速視頻數據傳輸晶元需求強勁

隨著汽車銷量穩步提升和ADAS滲透率不斷提高,車載攝像頭需求市場前景廣闊,帶動高速視頻數據傳輸晶元需求。車載攝像頭在使用過程中,採集的數據需前後經過兩塊高速數據傳輸晶元進行處理,兩塊高速數據傳輸晶元分別充當串列器和解串器的角色,主要用於電子控制單元(ECU)中成像器與視頻處理器的連接,最後由DSP晶元(數字信號處理晶元)處理圖像才能在駕駛系統里顯示出來,供駕駛人員/人工智慧參考。根據IHS估計,全球車載攝像頭出貨量在2020年將達8300萬枚,一個車載攝像頭需搭載兩塊高速數據傳輸晶元,則僅從車載攝像頭應用領域需求來看,2020年高速數據傳輸晶元需求量將達1.6億塊,市場前景廣闊。

ADAS功能不斷增多,傳輸晶元速率承壓:隨著ADAS功能的不斷豐富,車載攝像頭所採集信息已經遠不僅僅為取證和倒車影像等應用了。隨著AI、機器對於汽車駕駛干預的加深,對信息的快速有效獲取和處理提出了更高的要求。目前產業鏈中主流的車載攝像頭傳輸晶元速率多在1.7Gbps以下,就意味著一幀720P圖像需要經過16ms的延遲才能傳輸至主控晶元,以120km/h的汽車計算要0.6米左右的反應距離。其次,車載攝像頭對於傳輸穩定性要求較高,這也提升了晶元設計難度。據我們了解,目前行業內除國際大廠以外,國內僅有近北京慷智集成電路公司有此產品。從技術轉移的角度上來看,我們認為未來矽谷數模(萬盛股份擬收購標的)有望向此方向拓展。

國內產業鏈自主可控,利好下游廠商:核心元器件的國產化對於下游系統廠商具有較大的意義。首先,國內供應鏈從價格、服務上均具有一定的優勢,降低了下游廠商的成本並提升了其研發效率;其次也避免了核心元器件被禁運的風險,增加了供應鏈的安全性。我們認為DVS和高速視頻傳輸晶元的國產對國內下游ADAS和汽車電子相關公司具有較大的意義,能夠提升其整體競爭力,有望助力國內ADAS系統廠商向國際發展,成為國際一流廠商。

3

語音應用場景擴充,降噪需求凸顯

語音識別等技術進步、應用端市場需求增多帶動語音交互市場

語音識別等技術進步推動語音交互商業化落地。語音交互是基於語音輸入的新一代交互模式,人通過同機器說話就可以得到機器的反饋結果,代表性的語音交互產品有智能音箱、虛擬助手等。實現語音交互所需的技術有語音識別(ASR)、自然語言理解(NLU)、對話管理(DM)、自然語言生成(NLG)、語音合成(TTS)等,其中ASR語音識別是語音交互的起點,也是核心,其效果的優劣決定了後續語音處理過程的質量。ASR語音識別技術賦予機器感知能力,將語音信號轉變為相應的文本或命令供機器處理,一個完整的語音識別大致分為兩個步驟:首先是在語音輸入之後的語音特徵提取,其目的是從語音波形中提取出隨時間變化的語音特徵序列;隨後是聲學模型與模式的匹配過程,過程中將輸入語音的特徵矢量依次與訓練階段模板庫中的每個模板進行相似度比較,輸出相似度最高者作為識別結果。近年來隨著機器學習等能力的發展,在比較安靜的環境、無噪音的場景下,ASR語音識別模塊的識別準確率不斷提升,如根據KPCB發布的《2018互聯網趨勢報告》,谷歌機器學習技術詞語識別準確率達95%,超過了人類識詞準確率門檻(約94%);國內廠商科大訊飛更是在2018年率先在行業內做到通用語音識別率達98%,基本可以滿足用戶的高頻需求。語音識別準確性的提升使得語音交互的商業化落地成為可能,如近幾年智能音箱產品真正落地成為現實,智能音箱所帶來的用戶數據也將成為未來AI領域的核心資源。

應用端市場需求增多推動語音交互大規模應用。如今智能語音技術已經在語音輸入、語音導航、語音拍照、語音撥號、語音喚醒等功能中得到運用,未來語音交互將在更多垂直行業得到深入應用,並推動這些垂直行業加快向智能化方向發展,應用場景包括智能醫療、智能金融、智能安防、智能家居、智能營銷、智能汽車、電商零售、個人助手、工業機器人、伺服器機器人、智能隨身設備等。而語音智能終端場景應用主要集中在家居場景、車載場景和其他移動場景,這三類場景下有一些通用的應用領域,也有部分有場景特殊性的應用領域。智能家居、智能車載、智能隨身設備是智能語音交互目前落地的重要應用場景,根據IDC報告,在2020年的中國,27%的智能家庭將會擁有智能語音設備,51%的智能汽車和68%的智能手機和智能穿戴設備也會具備語音對話功能。

全球智能家居市場將達萬億級,語音交互滲透率不斷提高。智能家居中各種家電和移動設備組成了一個有機整體,用戶可以使用人機語音交互功能通過語音控制整套智能家庭設備。據StrategyAnalytics估計,2017年全球智能家居市場規模達到840億美元,預測2018年將高達960億美元,且在未來五年內將呈現高速增長態勢,2023年將增長至1550億美元(約9951億人民幣)。據IDC估計,語音交互將在智能家居市場中的滲透率逐年提升,預計2020年語音交互在智能家居市場中的滲透率在美國和中國將分別達到38%和27%。

隨身設備市場高速增長,語音交互滲透率將達68%。隨身設備市場包含可穿戴設備和智能手機,根據IDC數據,中國VR/AR、智能手錶、智能手環等可穿戴設備興起,市場規模將持續增長,從2015年的120.7億元上升到2020年的415.5億元,CAGR達28%;中國智能手機出貨量也逐年增長,近年來均保持在4億部以上,IDC估計2021年中國智能手機出貨量將達4.89億部。而語音識別技術的進步和硬體的發展驅動使得語音交互在隨身設備市場中滲透率迅速上升,預計到2020年中國語音交互隨身設備滲透率將達68%。

智能車載市場CAGR達16%,未來語音交互功能將成為智能車載系統標配。目前語音交互功能已經廣泛用於車載系統,主要功能包括用語音撥打電話、語音指令、語音導航系統、語音娛樂系統等。中國智能車載市場前景廣闊,市場潛力巨大,預計未來語音交互功能將成為智能車載系統標配。根據IDC數據,中國智能車載市場規模將持續增長,從2015年的288億元上升到2020年的604億元,CAGR達16%。而語音交互在智能車載市場的滲透率也在逐年提升,預計到2020年,語音交互在中國智能車載市場滲透率將超過50%。

語音交互市場空間加速擴大。隨著語音交互技術的不斷進步和應用端需求的不斷增多,語音交互使用場景在不斷增多,智能語音交互市場空間在不斷擴大。根據SIAC數據,預計全球智能語音產業規模將從2011年的19.7美元增加到2017年的105億美元,CAGR達32.17%;其中中國智能語音產業規模將從2011年的6.3億元增加到2017年的83.2億元,CAGR達53.74%,佔全球智能語音產業規模的比重也逐年上升。

語音交互距離增加帶動降噪需求

遠場使用場景增加促使語音交互距離增加,給語音識別帶來巨大挑戰。伴隨近距離語音識別技術穩定後語音交互使用場景的擴展,在面向智能車載、智能家居、智能可穿戴設備等領域時,應用場景從近距離低雜訊轉變到了遠距離高雜訊,這使得機器識別難度大幅提升,環境雜訊、混響、回聲等聲學問題以及人的吞音、語速變化等對語音識別的準確度帶來了巨大挑戰。比如,如何在複雜的客廳環節中輕鬆語音喚醒設備成為實現家居智能化首先要解決的問題。目前遠場識別的錯誤率是近場識別的2倍左右,所以解決遠場以及強雜訊干擾情況的語音識別技術有待進步。目前語音設備的降噪方法有利用麥克風陣列、降噪晶元等。

麥克風陣列解決部分雜訊干擾問題。在硬體端,語音設備主要包含晶元、揚聲器、麥克風、結構件等。語音交互依賴麥克風拾音,在手機等近距離使用的設備上傳統的單麥克風即能滿足拾音需求,而在遠距離、嘈雜環境下,傳統單麥克風使用效果欠佳,其接收的信號由多個聲源和環境雜訊疊加,很難實現各個聲源的分離,從而無法實現聲源定位和分離,而麥克風陣列可部分解決這些問題。麥克風陣列指的是麥克風的排列,由一定數目的聲學感測器(一般為麥克風)組成,是用來對聲場的空間特性進行採樣並處理的系統,在這過程中需要完成採集音頻、識別信號、傳輸信息等步驟和聲源定位、噪音降解、雜音屏蔽等功能。

降噪晶元能有效過濾雜訊和消除回聲。在語音交互下,人的語音輸入通常伴隨著環境雜訊和回聲,而降噪晶元能過濾不必要的雜訊,有效減少在人語音輸入同時其他雜訊的干擾和在人語音輸入間隙環境雜訊的影響,如下圖所示,降噪晶元可有效減少兩段語音輸入間隙雜訊頻率信號的幅度。用於遠場收音的降噪晶元通常與麥克風搭配一起使用。如科勝訊的語音交互產品「AudioSmart解決方案」,AudioSmart基本硬體是一個DSP(數字信號處理)晶元,搭配軟體演算法,可用來降噪、降回聲、降混響等,其特別之處在於只需搭配兩個到四個麥克風使用,而達到的效果跟市面上搭配五到八個麥克風一樣,可有效降低成本。演算法的有效可以降低對多麥克風的需求,我們產業鏈調研了解到目前國內創業公司南京朗逸銳科電子科技有限公司演算法較為突出,其單麥克風降噪&回聲消除演算法具備較高領先性。

固化到晶元或是寫入DSP,降噪需求帶來1-10元ASP提升:目前行業內語音降噪的解決方案主要分為兩種,一種是將演算法直接寫入ASIC晶元,應用的時候需要額外增加一塊晶元來配合使用做降噪和迴音消除等使用,此類晶元價格在3-20元人民幣不等;另外一種是將降噪的演算法寫到後端語音處理DSP晶元中,一般需要1-2元人民幣授權費用。我們認為隨著語音應用的增多對降噪演算法和麥克風需求會顯著提升,建議關注產業鏈相關機會。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新財富投研圈 的精彩文章:

背靠蘋果,5年平均營收增速高達57.5%,這家專註自動化設備的公司還能維持高速增長嗎

TAG:新財富投研圈 |