當前位置:
首頁 > 最新 > 大音頻時代即將到來,全產業鏈梳理

大音頻時代即將到來,全產業鏈梳理

編者按

關注不了「大公館」的新朋友,您請抓緊移步 「大公館2013"(新的公眾號:DGG-668)馬上保持同步關注。而,因為「你懂的」的原因,舊朋友您一旦取消了對「大公館」本號的關注,就不可以回來再關注了喲,因此,您的關注,也是一種難得的信息特權了喲。

大公館2013(新公眾號:DGG-668)會在次日清晨發布,內容基本與舊大公館的保持一致,但或有一點點的改變(多數情況下,會多一點視頻)。那裡,是我們的新館,那裡,我們將一如既往地與大家繼續保持同步交流。謝謝關注!

文:GY_GY / 源自:雪球

今天要分享的是最近一到兩個月一直在思考的,消費級科技產品的下一個階段,誰來主導?綜合最近的思考和產業巨頭的布局來看,一個以語音為核心的大音頻系統,似乎取得了先機。

我們在日常的聊天輸入、開車等場景中,越來越多的用到語音輸入,語音交互開始取代傳統觸屏方式成為新的交互方式,而兩大切入點目前來看已經明晰。

一是以亞馬遜ECHO為首,包括蘋果剛發布的homepod在內的智能音箱,以及未來更多的智能硬體,他們主打的是家庭是客廳,試圖佔據用戶在家的時間。

二則是以蘋果在iPhone7開始應用的雙藍牙耳機——Air Pods以及未來更多移動端創新產品,在這款耳機發布後,市場中似乎是風平浪靜,全球包括國內的各大廠商一改過去蜂擁跟風策略,選擇了觀望,當所有人都認為Air Pods是一枝獨秀,將成為絕唱的時候,產業內早已是風波暗涌。

總結以及順延趨勢來看,人機交互將按照鍵盤滑鼠、觸控、全語音、腦電波的路徑發展,微軟的Windows系統統治了鍵盤滑鼠時代,蘋果統計了觸控時代,那麼下一個全語音時代呢?會是亞馬遜這類攜上游技術過度到下游硬體呢,還是喜馬拉雅這類攜中游內容平台過度到下游硬體呢?

大音頻上游——語音識別技術

語音交互在目前技術條件下還停留在識別層面,可以說語音識別是人機交互的入口,大公司都希望使用自己的語音識別引擎,以便在應用過程中可以收集到大量有價值的用戶數據。 ——這也是為什麼科大訊飛願意讓廠商免費使用自己的語音識別軟體,未來的大數據時代,語音數據分量不會低。

美國語音技術公司巨頭 Nuance 的產品支持超過 50 種語言,在全球擁有 20 億用戶。蘋果最早就使用了 Nuance 的技術,但並未減少在自己 Siri 上的投入,而且將 Nuance 和微軟的部分高級人才挖了過來,組建了自己的技術團隊, 在 Siri 逐步成熟後棄用外部引擎。

谷歌早期通過收購 SayNow 和 Phonetic Arts 進入語音識別領域,後來又藉助一系列其他收購逐步完善了語音識別的技術積累, 2016 年穀歌發布語音助手 Google Home 和內置的語音助手 Google Assistant,可識別四種語言。

Facebook 在 2013 年收購了語音識別公司 Mobile Technologies,其產品 Jibbigo 支持多種語言互譯,成為出國旅遊的常用工具。不久後又收購了語音識別公司 Wit.ai,該公司的技術是通過語音控制移動應用程序、穿戴設備和機器人等智能硬體。 2015 年 Facebook 還測試了旗下智能語音助手「 Moneypenny」。 Facebook 在智能語音行業布局的戰略是通過語音交互數據支持其廣告投放效率, 並將語音技術用到其將來的 AR/VR 等智能硬體產品中。

亞馬遜於 11、 12、 13 年分別收購 Yap、 Evi、 Ivona Software 三家語音識別技術公司, Kindle Fire、 ECHO 智能音箱以及個人助手 Alexa就是基於這些技術。 2016 年亞馬遜也積極擴展智能語音助手系列產品線,推出了 Tap 和 Dot 兩款新產品。

微軟在 skype 時期就著手積累語音識別技術,目前在個人助理Cortana 和微軟小冰上實現了應用。 2016 年底微軟將詞錯率降低至5.9%,首次達成與專業速記員持平而優於絕大多數人的表現。

與國外互聯網巨頭相比,國內的互聯網巨頭在語音識別上再次走在了後面,因為國內優秀的語音識別公司極為稀缺,即使有錢也找不到目標。

雖然騰訊、阿里、百度等巨頭都有自己的語音識別技術,百度還專門從 Google 挖來了人工智慧泰斗吳恩達,但是它們在語音識別領域仍然和科大訊飛有明顯的差距。

2015 年的「寶馬全球中文語音技術測試」中,科大訊飛以車載環境下識別率超過 85%的公司的成績拔得頭籌,比第二名 Nuance 領先很多。

可能很多朋友都會說,國內搜狗、百度和科大訊飛差不多呀,其實這裡有一個誤區,平常大家在手機上使用的語音識別基本屬於近場識別,目前國內優秀的語音識別公司近場識別的準確率基本都能達到 95%-99%, 沒有很大差距。

業內共識是遠場識別技術難度高,家居場景中格外需要其應用;相對成熟的產品只有訊飛和京東合資生產的叮咚智能音箱,同類產品在用戶體驗上相比其它公司明顯領先(據說也不怎麼樣)。

而在遠場識別的基礎上,語音識別還需要向全聲控去發展,目前市面上的所有語音輸入軟體、智能音箱也好,在進行輸入之前,都需要按下語音輸入鍵或進行其他相應操作。

而我想要的是,在廚房忙活著做頓好吃的,手上沾滿了油腥,手機放在廚台另一端,我想給回家路上的老婆打個電話讓她帶瓶醋回來,怎麼操作?

只需要憑空喊一聲:XX,給老婆打電話,打開免提(或帶著藍牙耳機),在廚台另一半的手機則自動識別並撥通電話,完成操作。

全聲控場景的實現基礎是遠場識別技術,即設備與人相距 3-5 米甚至更遠距離下的語音識別。相比手機放在嘴邊的近場識別,遠場識別具有很高的技術壁壘,首先需要利用麥克風陣列、回聲消除等技術將目標說話人的聲音增強,同時抑制周圍的雜訊和回聲;其次通過語音識別引擎針對麥克風陣列處理後的數據進行收集、訓練,逐步提升識別率。

15 年 3 月科大訊飛全球首發了自己的遠場識別技術,在業內處於領先。

從上游來看,國內的科大訊飛可以說是一枝獨秀了,也是老生常談了,問題還是那些問題(變現),語音交互技術企業變現在移動端是很難實現的,重點還是應該放在行業的語音交互應用,如教育、醫療等等,以及下游的智能硬體,這兩者更為容易。

一生好運,獨尊武神趙子龍!

百戰不殆,當成功已成為習慣。

大音頻中游——內容平台

歐美國家在音頻內容的發展相對較早,已取得一定規模:德國 2013 年購買過有聲書的人數佔總人口的 7%;美國 2014 年有聲書市場為 20 億美元,英國 2015 年達 9100萬英鎊 ,分別約合人民幣 135 億元、 8.56 億元。

而國內隨著2016年至今的自媒體之風,文化產品的豐富程度和個性化程度也大大提升,迅速吸引了大量用戶,梁宏達的自媒體欄目《老梁故事匯》在優酷網上一期點擊率即可破 500 萬。

對用戶而言,聽音頻比閱讀和看視頻輕鬆的多,同時更適合利用碎片時間;許多視頻內容都同步推出了音頻版本,並快速取得了成功;《羅輯思維脫口秀》在喜馬拉雅 FM 已獲 18971.2 萬次播放,《吳曉波頻道》擁有 124 萬粉絲,收聽累計 18365.9 萬次。

平台類公司中喜馬拉雅在音頻行業成長最快, 2016 年 6 月估值就已超 8 億美元, 2016 年 9 月用戶量超過 3 億,活躍用戶日均使用時長達 111 分鐘。作為一代文青的啟蒙電台——豆瓣FM挺可惜的。

而作為內容平台必然不會甘心於純內容,未來還將把觸角向下游延伸,從鍵盤滑鼠時代到觸控時代的經驗來看,我們可以知道只有最接近消費者才能獲益最大。

從大音頻時代的中游來看,國內形成喜馬拉雅等為首,其中城市傳媒(600229)持有喜馬拉雅1.45%左右的股份,相信在不遠的將來,喜馬拉雅將登上國內資本市場。另外一家蜻蜓FM登上A股的意願同樣強烈,暫無A股上市公司參股資料。

大音頻時代下游——智能硬體

既然是智能硬體,就說明不再僅僅是指智能音箱,還包括前面提到的雙藍牙耳機,汽車、電視等,總的來說就是三個場景,把用戶每天的二十四小時一網打盡。一個是在家的時間,一個是在開車的時間,一個是到了公司到下班的時間。

在智能家居這兩年火了起來,家電企業、互聯網企業、通信設備企業紛紛進入,都試圖打造自己的智能家居生態圈,然而現今還沒有企業真正成功搭建智能家居的生態圈。

而目前看得到的是智能音箱和雙藍牙耳機,智能音箱需要遠場識別,即需要更多的麥克風,所以對聲學的巨頭——歌爾股份仍是利好。而我一直耿耿於懷的是國產音箱廠商——漫步者的停滯不前,上市7年市值仍在60-70億。

從公司的互動平台信息來看,在智能音箱的布局上似乎也不是很上心,更不用說技術含量更高的雙藍牙耳機。

智能音箱還需要更多的產品出現,未來主要關注蘋果的Homepod的銷量,繼續深挖除歌爾股份以外的產業鏈。

剩下的就是雙藍牙耳機,有的朋友會說,這有什麼技術含量?你還真別小看了,除去蘋果的Air Pods之外,我們常用的運動耳機也好,其他藍牙耳機也好,要麼只有一個,要麼兩個耳機之間總會有連接線。

大家在用無線藍牙耳機的時候有沒有想過,為什麼過去的藍牙耳機只有一個?在今年年初的CES上,索尼和三星都在耳機領域重點展出了相應成功,下圖為索尼在CES上展出的雙藍牙耳塞。

而這一項技術的提供者則是被高通收購的CSR,而無線雙藍牙耳機的未來必然還需要降噪,真正實現電影《her》里的劇情。CSR前兩天在深圳召開了音頻開發者大會,發布了5套產品,分別針對語音識別智能藍牙揚聲器、主動降噪type c耳機、雙耳藍牙耳機、條形音箱等多個市場。

而在國內,能夠解決雙藍牙耳機技術的公司不多,其中一家在2015年底才成立的恆玄科技似乎取得了不錯的進展,據電子行業分析師孫昌旭老師的消息來看,恆玄科技已經實現了大批量的出貨,希望能快點有體驗不錯的產品上市。

一篇沒有太多代碼的文章,是不是意味著滿滿的水呢?見仁見智吧。

如果我是風投,我會舔著臉去找喜馬拉雅這類平台公司。如果我是創業者,我會在自媒體音頻領域、智能硬體領域獨闢蹊徑。如果我是@不明真相的群眾 ,我會開設雪球FM,全天十二小時嘮股票,開音頻講座、課程、在線見面會、在線策略會(請優先考慮我)。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 大公館 的精彩文章:

不明覺厲!許老闆,超人也
金融的本質是價值的跨時空交換
經濟學家的底色:有多少預測被市場「打臉」
上證50再創新高,是接軌成熟市場的前奏?
重慶,早已向成都武漢公開較勁!

TAG:大公館 |

您可能感興趣

5G對音頻的賦能到底是怎麼發生的?
移動音頻全場景時代,喜馬拉雅的「強伴隨」功能凸顯
飛傲推出七款音頻新品,音樂播放器開始全面屏時代?
AI技術突破音頻內容生產瓶頸,文字時代加速轉向聲音時代
拍照第一還不夠,華為收編原索尼音頻部門大將,音頻也要第一!
藍牙音頻的未來:今年晚些時候將迎來又一次革命
耳機、音響都來了,索尼推出秋季音頻新品
新品發布在即 華為或將推出全新音頻產品
直播、音頻、視頻網站入局短視頻,沒有產品就贏不了
卜凡為罵人音頻致歉:當時除了嗓門大,想不出別的方法
中協智能告訴你超聲波應用於音頻行業的幾大好處
人工智慧時代下的音頻行業態勢發展
VR回春關鍵在於3D音頻技術,一起來了解這個VR體驗背後的功臣
音頻處理中的「監聽」到底是什麼
服務周到,美陸軍條令出音頻版,隨時隨地學習
盤點抖音頻頻發生的負面事件,最後一件真的是毀三觀了
這個時尚音頻播放器讓你用更便宜的價格聽到AK的聲音
高曉松在一次音頻直播中,聊了自己的情懷,也談了談風月
五音不全也能唱出「中國好聲音」,音頻版的PS,麥霸專用
宜家創始人……完整版。是的,這是之前欠大家的音頻,小編補齊了,各位聽起來!