從語音激活到空間音頻,讓聲音更加智能化
全文字數:707閱讀時間:3分鐘
在人機交互過程中,聲音總是最自然和最直觀的途徑,不久之後所有設備都將會支持隨時傾聽,等待著我們的命令。
文|Moshe Sheier
校對|樂川
圖源|CEVA
隨著新一代智能音箱和其它語音激活設備井噴式的發展,讓您可以更加舒適地和設備交談。如果在國外旅行時使用翻譯耳機的效果如何呢?雖然它們還不是很常見,但是Google剛剛發布的智能耳機Pixel Buds已經支持了這個功能。
在最近的一篇文章中,我回顧了智能音箱發展的第二次浪潮,以高效生產和批量上市為特徵。我推測這一階段將給市場領導者以壓力,促使他們進行技術創新和製造新的產品類型,同時進一步提高其它人的進入門檻。這正是我們這個月所看到的,谷歌、亞馬遜、蘋果等公司發布了很多新的音頻語音產品。
去年Google Home的推出對於之前大獲成功的Amazon Echo做出了回應。現在,谷歌正在擴大產品線,對抗包括Echo Dot,Apple HomePod和AirPods。谷歌語音激活助理因此可以有更多的使用場景,獲得更大的價格空間。
新的Google mini形狀像一個插針包,更小並且更便宜,是Google Home的替代品。對於那些尋找更好的聲音體驗而且願意花更多錢的用戶,Google Max提供了更加高端的聲音體驗,它也具備Google Home的全部功能。新的Pixel Buds 提供了活動式(on-the-go )體驗,通過與智能手機配對創建一個入耳式的私人助理,和Apple的AirPods類似使用的是藍牙音頻流。這些耳機最有趣的特點之一是集成了谷歌翻譯,如視頻中看到的一樣支持入耳式同聲傳譯功能。谷歌表示它將支持40種不同的語言,這個數字無疑會隨著產品演進而不斷增加。
[圖1 | 從上到下依次是:AirPods 和Pixel Buds,Echo Dot 和Home Mini,以及HomePod 和Home Max]
語音激活技術另一個激動人心的發展是新的Gopro Hero6運動相機可以通過語音命令開機。這是GoPro第二代支持語音界面的設備,最早引入的是Gopro Hero5。
大多數的語音命令和之前一樣,比如「GoPro 啟動/停止錄音」等等。
新機型的創新點體現在用戶可以使用語音命令——「GoPro開機」打開相機。這個功能是可選的,在相機關機後的8個小時內維持激活。儘管這還不是一台完全隨時傾聽(always-listening)的設備,但它朝這個方向邁出了重要的一步。可以語音激活的Gopro還例證了我們的另一個設想,語音將會成為主要的用戶界面。在人機交互過程中,聲音總是最自然和最直觀的途徑,不久之後所有設備都將會支持隨時傾聽,等待著我們的命令。
Alexa的下一個應用是汽車,然後是你的臉
亞馬遜正在讓這一願景成為現實,它仍在智能音箱市場上領先「新人」(谷歌)一步。在Google發布會之前,亞馬遜搶先發布了一系列新的Echo產品,包括採用了新外觀設計的一系列Echo產品和智能鬧鐘Echo Spot,延續了Echo Show開始的集成屏幕的風格。亞馬遜還透露Alexa很快就會整合到寶馬2018的車型中。
這可能是Alexa在成為最受歡迎的家庭智能音箱之後,再一次率先成為最受喜愛的公路旅行伴侶。
比任何官方消息都更有趣的是那些關於即將推出的亞馬遜眼鏡的推測。肆意蔓延的傳聞指出它是基於Alexa的非手持,電池供電的眼鏡。根據猜測,亞馬遜眼鏡不會提供視覺體驗,但作為一個可穿戴設備,將允許用戶隨時隨地和Alexa說話。這將是亞馬遜向前邁出的重要一步,進軍了可穿戴領域並且支持always-on功能。
很明顯為了釋放語音助手的全部潛能需要消除電源插孔,這裡有相關技術可以實現。
空間音頻可以產生或者打破虛擬/增強現實
隨著亞馬遜和谷歌的加入,將直接導致耳戴式設備(hearables)的全面改善。針對這種產品已經提出了很多有趣的概念,比如Kickstarter項目中名叫Vi的人工智慧私人教練,可以掌握用戶的生物識別特徵並由此定製化訓練,從而實現運動目標。現在想像一下,通過添加多維空間的音頻製造出Vi就在你身前或身後的感覺,是不是可以提供額外的動力幫助你打破個人記錄(參見10年前申請的專利)。
[圖2 | AR/VR應用大肆炒作視覺技術,但是要製造沉浸式的感覺,音頻是至關重要的]
在蘋果全新的手機中提出了最新的音頻創新理念。iPhone 8第一次包含了雙揚聲器。這是一件大事情,因為雙揚聲器可以啟用多維空間音頻,這意味著蘋果正在押寶到增強現實和虛擬現實(AR/VR)應用上。要創建一個沉浸式的AR/VR體驗,空間音頻是必須的。否則即使有令人驚嘆的畫面也不會產生一個足夠有說服力的真實空間。
下一步是神經網路使能的聲音感知
音頻發展的下一步是什麼? iPhone8和iPhoneX已經包含了一個專門的神經網路引擎。針對耳戴式設備和語音激活設備,神經網路可用於聲音感知和音頻分析。這一技術已經用來在家中識別某些特定的聲音,比如門鈴或者玻璃破碎,從而觸發適當的響應。它可以改善耳戴式設備使用時的安全性,比如Vi私人教練和其它沉浸式 AR/VR應用程序。神經網路可以感知到某些重要的聲音,並且通知用戶,如警報器或者狗叫。通過這種方式,無論安全性還是享受感都可以兼顧。
END
成為嘉賓的入口——填寫資料,了解更多峰會信息


※MLCC現在的問題是有沒有貨源;希望5G能讓中國芯縮小與歐美領先廠商的差距;全面屏肯定是智能機未來發展趨勢
※投資80億!華天科技落子南京建設集成電路先進封測產業基地
TAG:半導體投資聯盟 |