從Amazon Echo的拆解,讀懂智能音箱產業鏈
Amazon是智能音箱的開創者。自從2014年從官網上線第一代智能音箱Echo之後,到目前已經形成了多個版本:Echo、Echo Plus、Echo Spot、Echo Show和Echo Dot。低調的產品上線卻在隨後幾年內迎來了產品銷量的爆發。根據CIRP的數據,Echo已經佔據了美國智能音箱70.6%的市場份額,僅僅Echo dot一款產品在2017年的銷量就達到了2400萬部,覆蓋了大約三分之一的美國家庭。
隨後,國外幾大互聯網巨頭便開啟了快速圈地布局階段。市場上先後誕生了Google Home、Apple HomePod以及微軟的Invoke,四款產品均獨立搭載廠家自行研發的語音演算法和語音助手,各有優勢,野蠻生長。
Echo等產品的持續火爆也點燃了國內市場,自從2015年科大訊飛和京東合作推出的叮咚音響問世以來,國內智能音箱市場銷售增速就呈現穩定增長。天貓精靈X1、小米小愛同學、百度小度等爆款的出現點燃了國內居民的熱情,使得智能音箱銷售量有了質的飛躍。自從2017年以來,國內智能音箱市場呈現暴發趨勢,僅天貓精靈X1發布一年來銷售量就達到了500萬台,但距離美國市場無論是銷售量還是居民佔有率還存在著很大差距。總體來看,國內的智能音箱還處於培養用戶習慣階段,此階段晚於美國市場兩到三年,相信隨著用戶習慣的慢慢養成,國內市場有望複製美國市場的爆發態勢。
國內智能音箱市場零售量快速增長
來源:GFK
國內市場爆發的必然性
美國智能音箱市場爆發有其場景的合理性。西方消費者本身有客廳使用音箱的習慣,他們大多使用開放式廚房和客廳,由普通音箱升級換代為智能音箱成為必然趨勢。而對比國內消費者,中國廚房烹飪環境嘈雜、油煙重,廚房客廳相對封閉,家庭使用音箱頻次並不高,因此「音箱升級」並不是國內市場爆發的主要邏輯。
雖然國外市場發展迅速,但國外產品因為技術、使用場景和資源擁有權等因素影響,對國內廠商衝擊較小,類似於Google難以做好中文搜索一樣。對於中文語音識別和自然語言處理,以科大訊飛為代表的本土公司更具優勢;在資源整合方面,國內廠商更加了解本土用戶的使用習慣;在資源整合方面,音樂、有聲讀物等資源也掌握在國內互聯網公司手中;而電商、快遞物流、地圖、百科、即時通訊等資源,也全部在國內各大服務商麾下,因此智能音箱的國產化也就水到渠成。
相比美國僅僅有Apple、Google在大規模鋪設IoT設備而言,國內IoT智能家居市場迅猛發展,並形成了以阿里、百度、小米、騰訊為代表的互聯網陣營和以海爾、美的、華為為代表的家電、硬體製造陣營。他們憑藉海量資源內容優勢、互聯網服務或完善的家居產品生態搶佔市場。它們一方面利用線上影響力和粉絲優勢攻城略地,一方面憑藉龐大的IoT設備在線下進行場景營銷,可以說,智能音箱作為控制中樞是眾廠商智能家居生態的最後一塊拼圖。因此,通過布局智能家居生態來實現場景化銷售,成為國內智能音箱增長的主要推動力。
而智能音箱的語音交互,作為打通智能家居設備的突破口,可以解放人們的眼睛和雙手,是目前最為合理、便捷的人機交互形態。因此國內智能音箱產品爆發也成為必然。
接下來,我們就從Amazon Echo入手,通過拆解來分析產業鏈的受益方向。
智能音箱產業鏈
智能音箱的生產製造包含了硬體製造和自然語言處理演算法的編譯開發。從生產製造角度來看,整個智能音箱產業鏈從上到下包括了上游零部件製造商和晶元製造商、中游智能音箱製造商、AI演算法開發商和下游的內容供應商和渠道商。按照國外、國內的經驗,互聯網巨頭成為了智能音箱中游製造的牽頭者,並集成自己開發的AI語音演算法,承擔了一部分下游銷售場景。
智能音箱產業鏈
來源:億歐
Amazon Echo由結構件、電源驅動、LED、聲學器件以及主控晶元幾大部分組成。結構件負責構成整個智能音箱的結構,聲學器件主要由負責外放聲音的揚聲器和負責語音接收的麥克風陣列組成,主控晶元實現語音交互、自然語言處理演算法運行、聲音控制等核心系統功能。
Amazon Echo拆解
來源:iFixit
Amazon Echo組成詳述
來源:iFixit
智能音箱的行業爆發將會給傳統音響行業產業鏈帶來新的增量需求,產業鏈每個環節的需求將直接引致新的市場空間。
晶元端:普通音箱晶元更多起到功率放大的作用,和市面上的耳放功能無差。而智能音箱的晶元從功能上看不僅僅要將接收到的數字信號轉變為模擬信號再放大,還要進行自然語言處理演算法的儲存、計算和接收。從結構上看,智能音箱晶元類似於手機SOC,是在低功耗CPU基礎上擴展音視頻功能的晶元模組。與手機、平板電腦不同的是,智能音箱只需要音頻信息的計算和處理,不需要4G基帶、GPU的並行運算、圖形加速等功能,因此亞馬遜Echo選擇了TI的數字媒體應用處理器,節約成本而又滿足功能。因此,以音頻處理為主要功能的定製晶元有望迎來快速成長。
Echo 電路板主要晶元
來源:iFixit
晶元端正如手機晶元市場,高通、MTK繼續主導市場份額。相比於智能手機應用處理器,智能音箱應用處理器功能更為簡單,不涉及通信專利問題,國內企業中全志科技、瑞芯微能提供具備性價比的應用處理器產品,或將在智能音箱市場普及過程中獲得業績成長。
2015~2020年應用處理器市場佔有率
來源:DIGITIMES Research
聲學器件端:智能音箱比普通音箱多了需要收音的麥克風部分,而且大多數智能音箱採用陣列排布方式實現人聲採集和遠場收音。從結構來看,智能音箱採用的麥克風主要有兩種:一種是傳統的ECM(Electret Capacitor Microphone,駐極體電容麥克風),主要優勢是工藝成熟,成本低;另一種是MEMS麥克風,體積小、熱穩定性能好,可SMT直接貼裝PCB、抗干擾能力強,成本較ECM高,亞馬遜Echo採用7個MEMS麥克風陣列。
Echo的MEMS麥克風陣列
來源:iFixit
雖然ECM在成本方面有巨大優勢,但從產品小型化和性能方面綜合考察,MEMS將獨佔上風。MEMS的高信噪比性能將無視高溫、高濕、WIFI/藍牙射頻電磁信號的一切干擾,其獨特的金屬屏蔽罩封裝技術為晶元的穩定運行提供了保護罩。因此,MEMS麥克風將是大勢所趨。
據IHS的數據顯示,全球的MEMS麥克風市場幾乎被樓氏、歌爾、瑞聲科技和ST四家給壟斷,其中尤其以樓氏遙遙領先,其出貨量約佔了全球出貨量的43%。排名第二的歌爾聲學和第三的瑞聲科技的當年的市場份額分別約為18%和14%。緊隨其後的是ST,其在MEMS麥克風供應中約佔10%。其中歌爾、瑞聲科技為中國企業,全球市場份額超過三分之一,而歌爾聲學打入蘋果iPhone供應鏈,其營收的70%來自於蘋果,成為其傳奇的保證。
信號模組端:相比於普通音箱,智能音箱通過WIFI/藍牙協議接入互聯網,因此在結構上新增了WIFI/藍牙模組。Echo採用了高通的通訊模組,WiFi/藍牙天線均通過PCB電路板走線實現,並沒有外置天線模塊。由此看來,PCB電路板的高度集成和MEMS封裝等小型化技術將成為智能音箱元器件發展的主流趨勢。
軟體端:單從軟體角度來說,其產業鏈又分為上游的基礎的演算法模型;中游的基礎應用層,包括語音識別、自然語言理解、多輪會話管理和語音合成等;下游的軟體應用端,主要包括智能語音助手、提供聽書或音樂的內容軟體和設定鬧鐘等適用於智能音箱上的技能(類似於手機端的 app)。大多數智能音箱製造商自行開發演算法模型、交互邏輯和語音助手,交互邏輯的合理和自洽性將直接影響用戶體驗從而影響智能音箱產品的銷量。
智能音箱在使用過程中,主要包括7個過程。第一步通過麥克風矩陣遠場收音,第二步通過特定的聲音指令激活智能音箱,之後上傳雲端進入下一步流程,第三步將輸入的語音轉為文字,即語音識別,第四步理解用戶輸入的語義並輸入對話管理模塊中,即自然語言理解,第五步協調各個模塊的調用以及維護當前對話狀態,並將特定的回復方式交由自然語言生成模塊進行處理,即對話管理。第六步生成特定的回復文本,即自然語言合成。第七步將文字轉變為語音並通過揚聲器輸出,即語音合成。
智能語音交互過程
來源:雷鋒網
目前機器對句子的理解還只能做到語義角色標註層面,即標出句中的句子成分和主被動關係等,屬於淺層語義分析技術。自然語言理解技術發展相對不成熟,仍需完善。但是,自然語言處理的性能在近幾年得到了快速提高,深度學習、高性能計算和大數據的迅速發展,尤其是卷積神經網路(CNN)、循環神經網路(RNNs)以及使用連接時序分類(CTC)Loss等端到端神經體系結構的應用,大大提升了自然語言處理的水平和準確性,並減少了模型訓練的時間,使得智能語音的商業化落地成為可能。根據Gartner去年7月份發布的人工智慧技術成熟的曲線圖來看,自然語言處理將在2年內達到成熟期。涉及自然語言處理技術的智能家居市場有望率先迎來快速增長。
2017年人工智慧技術成熟度曲線
來源:Gartner
國內智能音箱大多為互聯網巨頭牽頭製造,並有少數創業公司參與。互聯網巨頭一般自研演算法模型服務自家品牌的智能音箱,而創業公司多數從演算法開發切入市場,並與傳統音響品牌合作,提供演算法共同開發智能音箱。在自研語言處理演算法上各家並沒有明顯優勢,但在中文語義理解上國產廠商明顯優於國外互聯網巨頭。
自然語言處理巨頭
來源:36氪
自然語言處理創業公司
來源:36氪
從硬體成本結構方面來看,應用處理器在整條產業鏈中居於大頭,佔據總成本的70%以上,而對於音頻解碼晶元、麥克風陣列的成本相對較低。高行業壁壘的應用處理器晶元將在整條產業鏈中獨佔鰲頭,享受技術壁壘帶來的高附加值。
智能音箱硬體成本結構
來源:Yole Developpement
總結與展望
中國的智能音箱行業相比美國起步較晚,但增長迅速。在美國智能音箱滲透率如此之高的今天,國內智能音箱市場可以說是方興未艾,此趨勢將直接帶動國內智能音箱產業鏈各個環節增量需求的提升。雖然國內智能音箱行業還處於消費者教育的初期階段,且普及率只有美國的十分之一,但隨著小愛同學等爆款的出現,行業市場增速已經開始抬升,此刻亟需更多的直擊消費者痛點的產品來培養用戶的使用習慣。而隨著自然語言處理技術的發展和人機交互的迭代,用戶體驗的提升和產品銷售增長定會呈現螺旋式上升。
因此,相對於傳統趨於飽和的音箱市場,隨著智能音箱滲透率的提高,擁有本土自然語言處理演算法的公司相對於國外廠商將率先受益,音頻處理專用晶元、聲學器件尤其是MEMS麥克風陣列、信號模組及晶元等幾個部分有望和智能音箱行業整體一起享受行業的高成長性,而作為產業鏈中的明珠,應用處理器晶元將獨佔鰲頭,憑藉技術壁壘攻城略地,搶佔利潤空間。
公號原創內容版權歸善金資本所有
未經授權不得轉載及二次修改
輕輕一掃
關注我們


TAG:善金資本 |