當前位置:
首頁 > 科技 > 「極客公開課」微鯨科技副總裁汪正賢談智能電視的人機交互

「極客公開課」微鯨科技副總裁汪正賢談智能電視的人機交互



微鯨科技副總裁汪正賢談人機交互如何應用於智能電視。



6 月 10 日,「極客公開課」再次開課。這一次我們邀請到了微鯨科技副總裁汪正賢先來,來和大家一起分享了目前智能電視行業的發展的現狀以及未來的趨勢、智能電視交互的關注點、應用技術開發流程及對電視的技術展望、微鯨 AIR 的技術特點等四個方面的內容。


什麼是「極客公開課」?


1 位技術產品大牛和 10 位優秀技術產品人圍繞技術產品相關話題,面對面深度分享和討論,共同創造更優的知識與更高的學習效率。


而現在,這種深度的交流方式屬於每一個人,知乎 Live 同步線上實時問答,隨時隨地參與提問互動,與數百人共創一本知乎 live 版的「課堂筆記」。


每周 1 次,全年 50 場,極客公開課,推動產品人的自我迭代。


以下為本期課堂筆記精華摘要:


智能電視行業的發展的現狀以及未來的趨勢


大家看到電視實際上是兩個層面的含義:一個是電視機本身(硬體),另外一個是電視內容。那麼電視機發展到今天,會不會消失呢?來看看它的發展史。2004 年以前基本上都是 CRT 時代。一直到 2005 年,開始出現了 LCD,稱為液晶電視,其實是以燈管做背光。到了 2009 年,出現了 LED 做背光的液晶電視,一直延續至今。


實際上到今天為止,已經開始出現 OLED,但這麼多年過去了,顯示部分其實沒有太多發展,都是在強調畫質、形態。電視機本身可能不一定會以實體形式存在,但用戶通過電視機來獲取資訊的過程依然會存在,只是更加的便捷化、無形化了。


電視行業發展了這麼多年,從相關數據來看,中國大概有 6000 萬台左右的出貨。全球大概 2 億台,而中國承擔了近 80% 的電視機的生產,無論是出口還是內銷,80% 都是在中國做的,大概 1.6 億台左右,市場非常龐大。國內包括海信、創維、海爾、長虹、康佳、TCL 六大電視企業競爭了 30 年,但電視到今天為止沒有產生非常大的寡頭,整個行業的競爭十分激烈。



有關電視行業的發展趨勢,我們總結成四個字:「薄大精深」。薄是什麼?簡單理解就是,邊框做的更窄了,厚度也更薄了。大是尺寸越來越大,今年的入門機尺寸應該是 60 寸,去年是 55 寸。那麼這種入門機尺寸怎麼來的,有兩個動向:一是消費者有需求,另外一個則是從供應鏈角度出發的。


眾所周知,供需需要達到一定平衡。產能過剩就會導致價格下跌,而這是不被供應鏈端所接受的。想要保值,就需要將尺寸切大,來消化小尺寸產能。而一條 8.5 的線投資額是 200 億人民幣,每增加 1 寸,48 寸到 49 寸就會吃掉一條生產線的產能。所以 200 億就這樣被吃掉,供需又再次達到平衡。


那麼大家都會轉向做什麼呢?微鯨會去做軟體,做 AI。從微鯨的角度出發來講,為了達到消費者快速獲得資訊的目的,需要把軟體、硬體調試到最佳的狀態,

所以說軟硬一定要實現很好的結合


智能電視交互的關注點


智能電視交互的關注點,微鯨放在了三個方面:

語音、圖象、動作。

以上講到的三個方面,其實很多廠商也在做,但是我們要把所謂的 AI 去聚焦化,去關注語音的互動、語音搜索、語音的交互、語音的識別以及語音的控制。


其實微鯨成立兩年多,從推出第一代產品開始就在做語音。現在有很多做語音、語譯的公司,比如說科大訊飛、搜狗等等,但是它們都是在做模塊,我們要做的除了把這些模塊整合應用之外,還要根據自己的定義去優化這些模塊。


比如,我們跟科大訊飛深度做方言。科大訊飛去做一部分的語譯,叫做詞庫的收集、整理。但是實際到最後下放到用戶層面,還是要通過語音的輸入、輸出、反饋。把這些做優化,才有機會做得更好,否則很可能出現可以識別,但反應速度很慢。


圖象,之於人臉識別,它可以做加密,之於表情,它可以識別你的表情,識別你的心情。人臉識別這部分,我們和微軟合作,已經走到了商用階段。這部分技術研究微軟做得比較好,他們把人的表情定義成 24 種,定義完之後,圖象隨著表情在動,它就會看你的心情是什麼狀況,來給出回饋,這實際上是交互的一個重點。



我們是做應用技術的,我們不做技術開發。同理,我們也不做晶元,我們拿到晶元之後,要解決的是如何能把晶元很多性能發揮到極致。我們的強項是了解消費者,知道如何通過數據的採集,反饋回來,去定義對晶元的訴求。


動作交互為什麼這幾年會提的特別多?因為包括電視機在內的很多設備已經標配攝像頭。攝像頭除了可以拍照,還可以拍視頻。視頻可以捕捉動態動作,拍照可以捕捉靜態的表情,不斷地拍、不斷地算,機器就會知道你的動作變化。



動作交互有什麼用?大家經常在講話當中有手勢,彎腰、握手這樣的動作,這樣有一個好處就是把場景更自然化。語音是最自然的交互方式,而動作也是一個非常自然的交互方式。


應用技術開發流程

微鯨的產品定義和開發流程,有兩個重點:

三角形研究

供應鏈研究


做消費類電子的廠家都要設計比較多的幾部分研究,為什麼會這樣?因為消費電子競爭非常激烈。你的對手是誰,這個市場怎麼樣?你的增長空間在哪裡,你的紅海、藍海在哪裡?你的用戶畫像、定位在哪裡?你所掌握的供應鏈資源是什麼?


只有把握好這些,才有機會做一個完整的定義,這就會涉及到整個產品類的研究。包括輸出一個關於產品模型的討論,無論是軟體、硬體還是軟硬一體化整體產品的定義,微鯨都是遵照這樣的方式做的。


看上去很複雜,其實不複雜,把前面的研究做好,自然會有一個模型輸出。有模型輸出就會有模型論證,但是整個論證過程是跟供應鏈密切相關的,不會單獨存在。比如對於合作的晶元廠商,我們要關心它的供需關係平衡,是否能達到我們的訴求。


不懂技術其實很難做產品經理,同樣的不懂市場也很難做產品經理。入行做產品經理,到最後重點一定是產品。至於產品是何種形態,其實並不重要。重要的是要把它闡述出整體的模型來,要把它做成什麼樣子,你怎麼畫等號等等。所以會有一個對應的流程。


對電視的技術展望


對於電視硬體的一些技術展望,微鯨認為這幾年應該會走四條路:

輕薄化、無邊框、新型顯示、

遠場語音


輕薄化,就是產品做的輕了、薄了。這涉及到大量關於材料和工藝的研究,比如說電視機做薄,薄 0.1 毫米會怎樣,薄 1 毫米會怎樣,這裡面有大量的應用技術做開發。無邊框技術與上游關係特別大。做無邊框會帶來很多難題,邊框都沒了,對它的保護、漏光的控制等都需要很多技術性的開發去支持。



新型顯示可能會誕生出一些不同的技術流派。CRT 跟 LCD 是兩個技術方向,一個是示顯管,一個是液晶,是不同的流派。而 OLED 和 LCD 也是兩個不同的方向,不同的流派。


輕薄化帶來的是材料革命和結構設計的革命,以及光學的革命。比如用航空級的材料,可以更薄,而且強度更好。列舉三種新型顯示包括:現在常見的 LCD,比較貴的 OLED,已經在開發但還沒有完全產業化的 Micro LED。其中 LCD 是被動發光,而 OLED 和 MicroLED 是主動發光。MicroLED,就是小間距的 LED,它的工作過程,需要大量的硬體和軟體演算法的組合。


OLED 是現在還沒有完全普及的技術,OLED 存在的一大問題是良品率。手機產品也有很多採用 OLED 屏幕,而它的屏幕相對較小,在產線上切割的時候,可以把 OLED 的壞點切掉。但是液晶電視屏幕要大很多,要避開壞點,產能就會受極大的影響,所以導致 OLED 現在成本居高不下。


最近又出現了 3D 列印的技術,把 OLED 列印到平板上,哪個點壞了就把它拿掉再列印上去,這是提升良率的方法,但還停留在實驗室的階段,沒有正式的產業化。當然 OLED 這幾年走過來以後比以前的良率提高不少,但還是很低,所以到平民化的水平還有一段時間。


MicroLED 初期的設計是解決了產能的問題。但是像素很小,如何在一個像素當中集成三隻燈,是一件非常困難的事情,這個問題還沒有徹底解決。不過隨著三星以及 LG 分別在 MicroLED 以及 OLED 上投入重金,我們認為以上者兩塊技術將突飛猛進。


有關遠場語音 微鯨是怎麼做的


微鯨認為,通過遙控器來實現語音交互,能解決很多問題(比如遙控器的成本並不高),但藉助遙控器屬於不自然的交互方式。因此,遠場語音成為未來的發展趨勢。遠場語音的一大難點在於,當環境聲音比較複雜的情況下,如何來實現聚焦識別。另外,如何應對網路狀況比較差的情況同樣是目前存在的問題。

提及應用,語音交互在開關機這個動作上同樣很重要。實際上,在開機狀態下,利用語音控制關機很容易做到,但如果在待機狀態下,你想要通過語音來將電視喚醒很難。


為什麼後一項很難?根據我國的能耗規定,電視待機功耗要小於 0.5W。這種情況下,所有的主系統基本上都會停止工作,如何在待機的低功耗下把電視喚醒,是微鯨目前在做的。和以往的做法不同,我們在

硬體部分做了改變

,而不是僅僅依靠軟體去實現。


微鯨的語義識別由硬體來做,當然這裡有個模型。我們先會做軟體,來完成樣本採集。之後要做處理,通過不同的演算法測試,建立一個深水的模型。然後開始模擬,模擬了以後,會把它變成硬體,繼而變成電路。


我們做以上這些工作的目的,就是為了解決功耗問題。利用硬體的改變,實現通過所接收到的信號來喚醒主系統。另外,像 Facebook、亞馬遜在做的把軟體的演算法變成硬體的電路這件事情,我們現在也已經可以做到。


那麼,為什麼軟體可以變成硬體?實際上聲音就是一個信號,只要把這個信號轉變成機器可以識別的語言,就變成硬體了。這部分,我們是和晶元廠商一起來定義的。簡單來講,我們在主系統之外,又加了一塊小晶元。


新增這塊小晶元之後,目前實驗室測試結果顯示,待機的時候是 0.37W,完全符合國家的要求。而量產的時候應該能夠達到 0.43W,可應用性非常強,這些就是關於原創語音的內容。


其實遠場語音存在諸多難點。首先是需要盡量做很多的聲道,尤我們現在做四隻麥克風,待機狀態下要實現喚醒操作,有效距離為 3.5 米。但如果要把有效距離增加都 8 米,可能就需要 8 支麥克風,才能做到。


另外多麥克風所面臨的問題是,接收到聲音信號,其實是 8 個聲道在輸入,每個聲道的方向不一樣的,需要消除回聲。而多個聲源,怎麼分別把捕捉出來也是一件很難的事情。微鯨不太去強調人工智慧,我們強調一個個環節,只要把這些環節一個個去解決了,才有機會說,你做得非常好,比較自然,自然而然就變成人工智慧了。


微鯨 AIR 的技術特點

微鯨把 A 系列形容為空氣,它非常薄(醉薄 A 系列新品最薄處只有 4.9 毫米)。為什麼要將電視做這麼薄?我們當時定義的一個初衷,「薄」是一個大趨勢。除了展示科技之外,大家眼前還是會覺得挺炫的,很有科技感。另外,不做最薄的產品或者是更加薄的技術演練,是沒有辦法把普通產品做薄的。需要有一些難度更大一點的設計和工藝,以後才有幾乎把普通產品做得更順。



而增光邊、保光板、反射片,就是超薄的基本架構。實際上把產品做薄,並不算一件容易的事情。要將電視做薄,意味著從材料到工藝都要進行變更,這就涉及到了硬度非常高的玻璃導光板的使用。


但它只是材料而已,微鯨要做的事情還很多。首先我們需要根據圖紙算它的印刷網點,繼而進行大量的印刷工作。但印刷也並不是每個廠家都能做,需要找合適的供應商去做。從架構來說,把塑料換成玻璃,保證硬度的同時,厚度也可以做到更薄。


除了上邊提到的強度需要得到保障,做薄之後的可靠性也是需要去考量的。特別是長時間觀看的情況下,如何保障散熱性能,是一個難題。在材料的選擇上面、在結構事實上面,甚至包括散熱設計上面,微鯨都有自己獨到的地方。我們量產的產品熱量控制表現的非常出色,連續開機 4 個小時,變型量僅為 1.5 毫米,非常小。


機身做薄之後,帶來的另外一個問題是,如何能把聲音控制的相對比較好?在較小的空間裡面聲音比較難處理,我們做了一個厚度只有 12 毫米的揚聲器陣列,堪稱電視音響界的杜蕾斯。



我們產品經理定義我們要做一個三極限超薄的產品。最厚的地方是從後面屁股背板到玻璃前面 25 毫米,最薄的地方是上部的屏幕 4.9 毫米,離牆的間隙 3 毫米,加上 25 毫米,最厚的地方只有 28 毫米。而三極限超薄產品還要能夠掛牆,掛牆以後離牆的距離只有 3 毫米。


一旦有聲音出就會碰到牆壁的反射,所以這裡面就有很多聲音很亂,通常來講音效很難得到保障。我們知道,揚聲器需要通過膜的振動來發出聲音,機身太薄沒有振動的空間或者是振動的空間很小。為了解決以上問題,微鯨花了很多時間來研討模型。


機身做薄之後,低音如何保證又是一個難點。微鯨做了一個揚聲器的陣列,做了等壓空氣流,振動的時候會同時壓縮空氣,讓它推動被動盆。通過技術突破,來保證空氣氣流過去全部一致。傳統的設計會有一些衰減,用了揚聲器陣列了之後,衰減會更小。此外還需要進行技術調整。例如靠牆近了以後聲音散、脆,要把它調回來,使得聲音自然反射到牆上不會太脆,變成渾厚。

揚聲器的選材同樣很重要。微鯨從創立到現在,中低音一直選擇羊毛紙盆或者蠶絲膜兩種材料。這兩種材質所帶來的好處是,聲音很脆就脆,高音更尖,低音更沉。但做極薄的設計,我們選了稀土。這樣它的磁性是普通的 10 倍,磁性大了以後給適當的功率,強度大就會增大。


通過以上技術攻關,前面講到的諸多難點獲得了比較好的解決。我們將它與索尼 9300 進行了對比測試。整體來說,我們的 A 系列產品低音生成有利,中音很飽滿,高音很通透。不能說完勝索尼 9300,但是跟索尼 9300 相比,確實在軟硬體的調試方面更出色一些。


總結


我們始終相信技術能夠改變生活,所以很多技術都應該是服務於整個生活的形態。微鯨是一家媒體公司,我們在做媒體的過程當中,更多是從內容出發。但是總體上,我們要把軟體、硬體做得非常順。


微鯨背後有一個人工智慧團隊,我們請了德國的專家,也在牽頭做很多大家比較關注的交互形態。今年 6 月份我們會在北京做「未來之家」,當中也將有很多關於智能家居的 Demo,來向大家展示我們的一些技術以及想法。


以上就是本次公開課的所有關鍵內容。



本文由極客公園原創

轉載聯繫 wangxue@geekpark.net






喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 極客公園 的精彩文章:

別再空談 AI 了,來 Rebuild 大會啟動「下一步」
Surface Book 增強版體驗:最好的 Windows 二合一電腦?
榮耀暢玩 6A 圖賞:驍龍 430+799 元起售價
從腦機介面到黑客帝國,你需要提前知道的真相
小米筆記本 Air 13.3 指紋版圖賞:除了第七代酷睿處理器,還帶來了 MX150 獨顯

TAG:極客公園 |

您可能感興趣

達闥科技副總裁汪兵:用智能柔性執行器解開世界服務機器人行業的「結」
微軟全球執行副總裁沈向洋:人工智慧的機遇和挑戰
曠視科技副總裁謝憶楠:中國人工智慧的系統與準繩
計算機視覺技術也能發電?這家前微軟大中華副總裁創立的公司有一雙「電眼」!
新松機器人總裁曲道奎:機器人+AI將使製造業更柔性化智能化
螞蟻金服副總裁彭翼捷:「暖科技」是大數據智能化產業「新風口」
智能製造專家龔峻加盟華人運通 出任副總裁
對話樹根互聯技術總裁張昕:工業互聯網賦能商業模式創新
專訪科大訊飛副總裁李傳剛:技術革新與消費升級雙輪驅動
網聯總裁董俊峰:金融基礎設施服務監管科技的幾點思考
微軟副總裁鄒作基:未來每家公司都是人工智慧公司
HTC智能手機業務總裁張嘉臨辭職
金風科技發布聘任副總裁、首席財務官及總工程師公告
老闆電器副總裁何亞東:廚電行業未來是發展語音智能連接
英飛凌副總裁徐輝:半導體技術如何促進電動汽車的發展?
小米人工智慧與雲平台副總裁崔寶秋:智能手機+IoT為AI 打造無限生態
卡梅隆公開嗆聲超級英雄電影,漫威總裁回應很機智
卧龍控股集團副總裁朱亞娟:讓數據和計算成為電機研發新引擎
添田武人卸任索尼互動娛樂上海公司總裁一職
阿里巴巴集團副總裁劉松:互聯網公司能給製造業兩條平行線