2 億條視頻,Google Brain 如何讓 YouTube 煥發生機
Brain 帶來巨大變化。70% 的用戶在線觀看視頻時間都由演算法推薦驅動。每天,網站會給用戶推薦 2 億條、76 種語言視頻內容。在線觀看時間比三年前提升了 20 倍。
編譯 | 微胖
來源 | The Verge
作者 | Casey Newton
去年,我正在玩《羞辱 2》。和往常一樣,上 YouTube 搜索某個遊戲關卡的闖關秘訣視頻。問題解決了。但是,當我第二次登陸網站時,被眼前的景象驚到了:網站為了提供了大量相關視頻盛宴:玩家無需保護即可通關的視頻、以相當具有創造力的方法擊敗敵人的視頻...... 我只不過問了一個問題,但 YouTube 給了我一個世界。
接下來,我訪問網站次數明顯增多。大多數時候,並無特定目的——我已經習慣自發上那兒溜達。今年春天,我在家做飯的次數變多了。在我搜索過如何做份沙拉的視頻後,YouTube 迅速為了介紹了一幫「主廚大師傅」。
2005 年,YouTube 誕生。這個網站一直很有用,也是互聯網的重要支柱之一。但是,過去幾年來,網站表現的出乎意料地贊。它可以相當準確地預測我感興趣的視頻,比以前強太多。
背後發生了什麼?過去 12 年來,YouTube 已經從一個搜索驅動的網站變成一個「終點」。期間,經歷了幾百次測試、重新設計以及 AI 技術的飛躍。
不過,網站真正的「升級」在於:它變成了一個 Feed。(網路中的 feed,一種用來提供信息的方式。feed 其實是一種網路廣播,只要你記錄下這個廣播電台的頻率,也就是feed 地址,當你打開收音機,也就是feed 閱讀器的時候,你就可以及時獲取所有新的消息了。編譯著)
或許你不記得 YouTube 最初的樣子了。當時,它無非是一個基礎架構:提供一種簡單的方式,將視頻嵌入其他用戶最有可能看到這些視頻的網站。隨著網站逐漸變大,YouTube 變成了一個電視視頻檔案館。YouTube,連同維基百科,可謂互聯網世界裡最可怕的兔子洞:如果同事偶爾在飲水機邊提到了哈林搖(Harlem Shake),整個晚上你可能就耗在網站上追視頻了。
當時,Facebook 推出了一種典型服務模式:News Feed,根據你的個人興趣,不斷更新定製化服務。Feed 接管了整個互聯網。YouTube 的早期定製化服務十分有限:請用戶訂閱頻道。這個比喻借鑒了電視。ComScore 數據顯示,2011 年,訂閱服務取得了一些成功,不過每個人花在 YouTube 上平均時間很一般。
如今,頻道不復過去的風光。打開手機應用,它隱藏在了一個獨立的標籤里。湧現在用戶面前的是一系列根據你的喜好定製的推送內容。這些內容都來自你訂閱的頻道,但是也有你之前從未見過頻道里的相關內容。YouTube 的武器不僅可以推送內容,而且準確率還特別高,效果就是用戶觀看時間的延長。
「當用戶知道自己要找什麼時,他們會來我們這裡。」YouTube 推薦技術總監 Jim McFadden 說。他是 2011 年加入公司。「我們也希望滿足一些可能用戶自己都未必清楚的需求。」
2015 年,YouTube 開始使用 Google Brain 的技術。不過,這並非網站首次嘗試 AI。之前,YouTube 就將機器學慣用於內容推薦方面,當時用的谷歌打造的系統——Sibyl。Brain 的不同之處在於採用了無監督學習。這種演算法可以找到工程師可能都無法猜到的關係。
「重要的功能之一是泛化(generalize)」,McFadden 說。「如果我看來一部喜劇演員的視頻,之前的推薦系統很善於推薦另一部這樣的視頻。Brain 不同之處在於,他可以計算出其他類似但並不雷同的喜劇演員的視頻,毗鄰的視頻內容。它可以發現不那麼顯而易見的關係。」
Brain 演算法開始針對手機用戶推出更短的視頻內容,但是會為電視用戶推薦更長的視頻。平台不同,推薦視頻類型也不同,用戶觀看時長也更長些。2016 年,YouTube 大概進行了 190 多個類似變更,今年就增至 300 多個。網站發現組的團體產品經理 Todd Beaupre 說,「積少成多。一般嘗試 10 次後才能發布一個。」
另外,Brain 的演算法也比之前使用的演算法更快些。過去,用戶的行為幾天後才會被納入未來推薦中。這樣,就很難識別一些流行主題。延遲的單位不應該是天數,而是小時或者分鐘數。Beaupre 說。
Brain 帶來巨大變化。70% 的用戶在線觀看視頻時間都由演算法推薦驅動。每天,網站會給用戶推薦 2 億條、76 種語言視頻內容。在線觀看時間比三年前提升了 20 倍。
這和我的體驗大致吻合。幾年前,我只是在午飯期間去 YouTube 逛一下,為了吃飯時有事可干。但是,推薦的東西更懂我之後,一周當中我會更規律地騰出時間瀏覽網站,而且是在我的 PlayStation 4 上,這樣可以在最大的屏幕上看這些視頻。
這確實是真正的個性化推薦。而且,在給我的數字化生活充電方面,這個網站也不同於其他網站。比如,Facebook 的 Feed 主要基於好友的博文內容以及我喜歡的頁面。在獲知某人訂婚、懷孕生子方面,這確實挺在行;推特的內容主要來自你收聽的對象,以及這些人轉推的內容。記者出身的我離不開推特。
每一種推送都有自己的閃光點,不過 2017 年,這些閃光點都被埋沒了。推特上,政治討論大行其道。Facebook 對諸如事件(event) 等功能的短暫狂熱以一種不和諧的方式讓 Feed 變味,我反而更少聯繫朋友了。(重圖片的 Instagram 感覺仍然是綠洲,也難怪它的應用程序用戶量仍在快速增長)。
所有這些網站都需要用戶為它們做貢獻。但是,YouTube 用戶中只有少數曾經上傳過視頻。這個網站不給你壓力去做些什麼。你可以僅僅被動地享受,就像看電視一樣。
YouTube 對相關內容的強調意味著,較之競爭對手,其 Feed 的內容範圍越來越寬,也越來越讓人好奇。你搜尋得越深,就越會感覺這是一塊躲避其他網站推送內容的避難所。
2013 年,Alexis Madrigal 在《大西洋月刊》的一篇文章中寫道,Feed 的巔峰時刻已經過去。未來屬於有限體驗:電子郵件新聞;Medium 集錦,10 劇集的 Neflix 系列。沒完沒了的內容流服務會讓人感覺精疲力竭。未來需要的是「更快!更多!」他寫到。
四年過去,YouTube 的經驗告訴我們,Feed 會變得更加重要。不斷增長的視頻存貨,更加精準的內容匹配技術,這些都是無法抗拒的事實。現在,網站還會調查用戶對推薦視頻的感受,隨著時間的推移,推薦效果會越來越智能,進而增加內容的消費量。
Beaupre 將這一過程形容為跨過鴻溝。「一邊是與用戶喜歡內容緊密相關的內容,一邊是有流行趨勢的內容。兩者之間是一塊神奇地帶。」如果對手找不到辦法跨越兩者之間的地帶,那麼,他們會很難戰勝 YouTube。


※三問 Christopher Manning:超越模型存在的語言之美
※谷歌全新神經網路架構Transformer:基於自注意力機制,擅長自然語言理解
※超少量數據訓練神經網路:IEEE論文提出徑向變換實現圖像增強
※PyTorch和TensorFlow:九項對比讀各自長項短板
※英特爾發布Movidius Myriad X VPU:提出神經計算引擎
TAG:機器之心 |
※德國Festo推出仿生機器人BionicWheelBot
※Patta x Nike再出新!青草綠Air Max 90 「Homegrown」生機勃勃!
※多款Lumia手機煥發生機:為其裝上Windows RT
※德國Festo推出仿生機器人BionicWheelBot 靈感來自摩洛哥後翻蜘蛛
※Apple Arcade有望為Mac遊戲注入一線生機
※Nat Cell Biol:揭示Rspo3-Lgr5軸同時調節抗菌防禦和粘膜再生機制
※ARtGlass藉助AR賦予文化遺迹生機,區塊鏈遊戲《Etheremon》接入VR
※BulingBuling的指甲秀,給早春帶來一絲生機
※Humble Bundle免費領射擊遊戲《特殊行動:一線生機》 原價95元、Steam好評率93%
※波蘭畫家 Gra?yna Smalej 筆下的鮮艷,飽滿,充滿生機的夏天。
※CMU教授Metin Sitti:產學雙棲的仿生機器人專家
※Nat Immunol:科學家們揭示膿血症的發生機制
※李力游入主或可為Imagination求得一線生機,中國市場成關鍵
※CMU教授Metin Sitti:產學雙棲的仿生機器人專家 | CCF-GAIR 2018
※偶像練習生機場合體,Nine Percent終於查有此人!
※義大利Youbionic公司推出兩款智能化3D列印仿生機器人
※華為領銜,三款學生機新鮮出爐,oppo vivo終於良心了
※Science:揭示反安慰劑效應產生機制
※Facebook再進軍遊戲直播,中國學生機會在哪裡?
※【繪畫】春的氣息 生機盎然(Jo Grundy 英國畫家)