智慧家庭入口-智能音箱的前身、今世和未來
從亞馬遜的ECHO到谷歌的HOME,再到韓國的KT,以及國內的叮咚音箱,智能音箱行業面臨前所未有的爆發期。本文將從音箱的技術發展和技術實現兩方面來闡述筆者眼中的智能音箱。
音箱行業有著悠久的歷史,音箱技術的發展歷史可以分為電子管、晶體管、集成電路、場效應管四個階段。上世紀70年代中期,日本生產出第一隻場效應功率管。由於場效應功率管同時具有純厚、甜美的音色以及動態範圍達90dB、THD<0.01%(100kHz時)的特點,很快在音箱界使用。現今音箱的放大器多數採用了場效應管作為末級輸出。
智能音箱,是一個音箱升級的產物,其主要有以下三個特徵:
一、擁有WIFI,藍牙等聯網基本功能;
二、有語音交互的麥克風功能(語音語義理解);
三、有語音助手,能便捷的交互其他APP/服務的能力(服務直達)。
智能音箱的核心技術是自然語言處理(NLP)和媒體推薦演算法。在自然語言處理中,是否能理解用戶語言中的情緒,從而更個性地(千人千面)進行交互和推薦;媒體資源平台的推薦演算法雷同。
智能音箱作為物聯網在家庭場景下的一個重要入口,其未來發展方向一定是基於語音/視覺/身體姿勢/腦電波 等多種模式交互的可直達的、各種深度融合的內容和服務。
接下來,我們將從技術實現的角度來分析目前主流智能音箱的開發過程。
智能音箱的開發仍然屬於嵌入式產品的開發範疇。嵌入式產品的常規開發流程如下:
一款智能音箱產品的關鍵因素有:
1、外觀
2、結構
3、硬體
4、系統軟體
5、端APP
6、雲服務
7、供應鏈
8、生態圈
一、外觀
「好的設計是將我們與競爭對手區分開的最重要方法」,三星電子首席執行官尹鍾龍這樣表達對工業設計的理解。索尼、東芝以及韓國三星和LG,都把工業設計作為自己的「第二核心技術」,被許多廠商視為擺脫同質化競爭,實施差異化品牌競爭策略的重要手段。筆者也整理了一些知名的大品牌音箱圖,如下:
二、結構
結構設計是外觀設計的延續,其直接影響著產品的外觀、性能、材料、成本、製造技術的發揮,以及品牌的建設。由於音箱產品的特殊性,故結構設計決定了音箱產品的品質,從而影響了產品的優劣。
目前,基於智能音箱的融合產品越來越多。如IPTV和智能音箱的融合;攝像頭、麥克風和智能音箱的融合;IPTV、攝像頭、麥克風陣列和智能音箱的融合;IPTV、攝像頭、麥克風陣列、無線路由和智能音箱的融合等等。
隨著智能音箱功能的增加,音箱產品的功耗也大幅加大。故智能音箱產品的熱模擬和設計將是一個重要環節。根據筆者經驗,以前的基於結構設計軟體(Pro/E、Solid Works等)的熱模擬結果與Flowtherm軟體模擬結果有較大的差距,而Flowtherm模擬結果和實際場景差距較小。
三、硬體
隨著晶元的集成度和硬體設計模塊化程度越來越高, 硬體設計的主要組件分為:平台CPU、內存、存儲、電源、MIC陣列、MIC陣列處理、音頻功放、無線聯網、其他外設等。
這裡順便提下,由於音頻信號分為模擬和數字2種。模擬信號有單端和差分樣式;數字音頻信號的介面標準有PCM、I2S、PDM、TDM等格式。平台CPU支持的音頻信號類型影響技術架構的選擇。
1.平台CPU分為兩類。一類是功能一般的,運行基本操作系統(如Linux、Ucos等)的、弱GUI(圖形界面)的主晶元;另外一類是運行Android系統的主晶元。智能音箱的主要使用後者。
2.內存。內存根據使用場景分為PC和消費電子類型,這兩類的區別主要是介面數據的寬度不同。PC類型的數據寬度為8bit,而消費電子類型的一般為16bit。內存根據數據的速率標準又可分為DDR3、LPDDR3、DDR4等,不同速率標準的晶元,其IO電壓也是不同的。智能音箱的內存主要是由平台CPU決定的,而容量是根據實際場景規劃的。
3.存儲。這裡的存儲主要討論Flash。Flash分為Nor Flash、Nand Flash和eMMC Flash。容量從小到大的順序為Nor Flash < Nand Flash < eMMC Flash。運行基本操作系統的產品一般採用Nor Flash或Nand Flash,運行Android系統的產品往往採用eMMC Flash。
4.電源。電源晶元的種類很多,一般分為專用PMU和分立器件。由於主CPU往往需要多個不同的電壓/電流,而不同電壓往往上電的順序是不同的,故很多CPU都有自己專門的PMU。分立電源晶元的選擇可以根據電路設計的電源樹(Power tree)需求來定。
目前主流的消費電子產品的電源晶元分為LDO和DC/DC兩大類。LDO是低壓差線性穩壓器,其特點是紋波小、無干擾其他晶元問題、效率低。DC/DC是開關電源,根據電壓輸出和輸入不同,又分為Boost(升壓)、Buck(降壓)和Boost/Buck(升降壓)三類。我們常用的是Buck類。DC/DC晶元特點是效率高、輸出可調節、紋波較大(非連續流電源比連續流電源的紋波大很多,需外接處理dianl,具體請參閱其他文檔)、會干擾其他晶元。
5.MIC陣列。目前陣列技術主要有2MIC、4MIC、5MIC、6MIC和8MIC。MIC陣列有面殼安裝(Echo音箱)和非面殼安裝(叮咚音箱)兩種方式。
6.MIC陣列處理。目前陣列處理技術主要國內提供商有科大訊飛、思必馳、科勝訊等,具體請參閱各家公司的網站。
7.音頻功放。智能音箱目前主流的音頻功放為D類功放,主要提供商有TI,ADI等。
8.無線聯網。家庭無線聯網技術有WIFI和BT。WIFI分為2.4G和5G頻率。無線聯網晶元主要有Broadcom、Realtek、MTK等。
9.其他外設。隨之各種融合產品的問世,多種外設(如攝像頭、Zigbee模塊等)也越來越多的使用。
四、系統軟體
由於智能音箱操作系統的巨大差異,系統軟體主要分為 Linux 、 Linux +Android 和 iOS三大類。Linux +Android 是國內主流方向。
五、端APP
安卓系統強大的生態鏈提供了多種可以集成在智能音箱上的應用。如語音控制家電的應用。
六、雲服務
雲服務是智能音箱的重點,包括了人工智慧+各種服務。人工智慧是負責語意理解和內容搜索並回答的。
比如:你問今天天氣怎麼樣?
系統會先把你說的話通過本地處理完以後的語音音頻文件上傳到雲端的伺服器,伺服器將語音信息翻譯成文字,然後把文字的關鍵詞找出來,並通過了大數據的訓練以後明白這段文字的抽象意思,同時結合APP的位置信息。
然後幫你找到所在地對應的答案,這個答案又必須去調用如氣象信息的資料庫(這個資料庫也要支持語音搜索調取才行),最後反饋給系統,智能音箱播報出來——今天天氣晴轉多雲。
那麼這一系列的動作是人工智慧,天氣信息資料庫就是雲內容。
七、供應鏈
這裡的供應鏈不僅僅包含傳統意義的供應鏈,更重要的是包含了雲內容(服務也是一種可以運營的內容)。一個產品的成敗與其供應鏈有莫大的聯繫。小米之所以能打翻身仗與他的供應鏈有很大的關係。
八、生態圈
獨木不成林。智能音箱作為人工智慧和物聯網深度結合的家居類產物,其影響不局限於近場的產品(智能家居產品,如可以控制家電設備燈,門等------服務在家化),更影響了遠端的產品(家庭維修,快餐訂送,旅遊出行,安防服務等------服務到家化)。
智能音箱的未來將是一個能與智能家居、智慧醫療、智慧教育、智慧商城、智慧汽車、智慧旅遊、智慧安防等多種服務直通的、千人千面的關鍵家居入口產品。
----------------------------------------------------------------
作者簡介
朱青松
2004年畢業天津大學微電子專業,現在是一家人工智慧公司的技術專家,致力於人工智慧產品的工作。


TAG:全球大搜羅 |