Facebook：以技術為支點，撬動20億用戶社交平台的內容運營

最新 05-05

Facebook作為全球最大的社交平台，其影響力毋庸贅言。它從誕生之初發展成如今的社交帝國，早已不是簡單的用戶交流平台，其平台內容集用戶狀態、新聞、廣告、視頻節目甚至用戶服務等於一身，並形成交互聯動。Facebook正在改變著內容產業形態，創造新的盈利途徑。

2017年，Facebook月活躍用戶數量突破20億，龐大的用戶規模背後是每天大量產出的內容與數據資源。成立十年至今，Facebook獨佔社交鰲頭，藉助其背後可觀的大數據資源，將技術作為一有力支點，撬動其龐大的內容體系運行。

信息流

平台內容的百川歸海

2006年，Facebook的信息流功能（News Feed）開發並應用，成為匯聚其社交平台上各類核心內容如好友狀態更新、熱點新聞推送、廣告等的主要載體。它收集用戶、企業等的信息和數據，藉助演算法調整用戶page展示內容，影響著用戶的在線行為習慣。隨著內容形式逐漸增多，以及Facebook對技術的逐年優化，信息流內容展示也隨時發生著變化。

Facebook信息流頁面

10萬個參考變數下的好友動態展示排名

起初，對於好友每天發布的更新，Facebook用戶頁面呈現的總是按時間排序的最新內容。2010年Facebook在F8開發者大會上提出對信息流排序的新演算法EdgeRank，用於區別默認的按時間逆序的Timeline。從此，Facebook社交內容展示開始走上「個性化」道路。

EdgeRank收集每位用戶發布的內容（包括分享的內容）、關注好友的狀態更新、加入的群組以及點贊、評論、分享等用戶行為數據，並從這些數據中產生該用戶的「權重評級標準」。之後根據權重對監測到的用戶頁面內容進行評級，將評級高的內容——也即用戶最感興趣的內容展現在信息流的前列。

EdgeRank的早期權重評級標準，是在「時間」的基礎上加上「親密度」、「互動」、「興趣」等因素。以「互動」為例，考慮到用戶間的連接強度，他們可能是點贊之交、評論之交，或是私信之交，強度不同，權重參數不同，展示內容不同。

隨著產品迭代，Facebook加入更多功能特性。諸如視頻、鏈接等內容形態因素，點贊、取關、隱藏、閱讀時間等用戶行為因素，都成為演算法考慮的變數，總計多達10萬個。AI技術爆發使Facebook對圖片與文字識別理解能力增強，排序考量因素更加複雜，結果也更加智能。

Reactions表情功能——點贊功能的延伸

其實，在演算法推出的早期，對Timeline已經產生使用習慣的用戶對新的信息流排序方式產生很大質疑。但是隨著Facebook用戶數量劇增，更多內容生產機構與內容形態參與其中，個性化排序方式就顯得尤為重要。

2018年1月，扎克伯格公開表示，來自品牌和媒體內容充斥信息流，廣告、新聞和視頻等阻礙了Facebook作為社區的活躍性。據此，Facebook將再次通過演算法對內容比重進行調整，從而幫助用戶回歸到更多的社交體驗中。

新聞熱點話題，尋求人工與演算法的平衡

社交網站早已成為人們獲取熱點新聞的主要入口之一，Facebook通過其強大的演算法機制和病毒式擴散模式，為內容創業公司賺取大量流量，甚至改變了歐美新聞業內容分發模式，形成中心化的新聞消費。以美國著名新聞聚合網站BuzzFeed為例，其內容每月在 Facebook 上獲得的流量超過百億，網站訪問流量超過五千萬。

2013年，Facebook開發了熱點話題（Trending）功能。熱點話題區彙集了一段時間內的熱門標籤或話題，是用戶獲知當下熱點的主要入口。推送熱門話題的過程大致為三步。

首先，Facebook使用程序監控網站內部話題的分享和評論，同時，爬蟲抓取用戶還沒有開始分享的外部新聞。

接著，當這些新聞話題出現在Facebook的網站上時，系統會在1000家媒體上進行認證，並匹配標題、圖片和地點人物等相關數據。

最後，另一個系統將已經通過認證的熱門話題，經過演算法篩選後，推送少於10條符合用戶個性化選擇的內容推送到桌面和移動端的首頁。Trending將新聞熱點集中起來，聚集用戶參與討論，推動平台快速形成規模話題，但隨即也產生了一些問題。

Facebook規定，熱門話題欄目的編輯只對話題內容進行基礎的格式修改，而非提煉新聞要點或選擇新聞內容，並由此幫助訓練演算法。然而，在2015年Facebook解僱數十名新聞編輯，將熱門話題的編輯、推薦和排名全部交給機器演算法後，產生了嚴重的問題。

一篇關於美國著名新聞主播Megyn Kelly因力挺希拉里而被東家福克斯開除的假新聞，被頂到 Facebook 熱門話題榜的首位。事後Facebook總裁扎克伯格也不得不承認，完全依賴演算法的做法並不可取。

然而，在Facebook對其加入人工審核後，熱點話題內容依舊受到質疑，例如編輯存在政治偏見、話題選擇影響選舉結果等。

在「演算法」與「人工」之間尋找平衡，同時也是Facebook在履行社會責任、尊重新聞事實與保持平台社交話題活躍度、形成規模話題之間尋找平衡。對此，2018年2月，Facebook對部分地區熱點話題進行升級，擴大專業新聞出版機構內容，將權重由原來「互動程度高」加入「被新聞出版商報道更多」，保證話題質量的同時減少了人工參與的影響。

熱點話題升級前後對比

個性化管理平台，讓廣告更「有機」

2017年Facebook廣告業務在公司總營收中佔比近98%。通過用戶在其社交平台上分享的內容、帳戶的其他個人信息、廣告主和市場營銷合作夥伴提供的用戶信息，Facebook收集用戶數據，並在廣告投放時進行有效匹配。

作為全球數字廣告市場的一種重要力量，Facebook促進在線廣告領域發生的最大變化在於，廣告和「有機內容」之間的界限越來越模糊。尤其對於Facebook龐大的社交用戶來說，信息流廣告已經成為融入社交平台的內容組成部分。

近年來，Facebook信息流廣告形式不斷豐富，除了普通的圖文廣告，還增加了視頻、全屏、精品欄、輪播、幻燈片等富媒體廣告形式。對於這些多樣的廣告內容生產和選擇，Facebook考慮到其與「有機內容」的相關性與競爭程度，為用戶提供各類工具，優化廣告內容與投放。藉助Facebook廣告系統工具的引導，客戶可以自主選擇適合品牌內容的廣告形式，廣告內容質量大大提升。

Facebook為廣告客戶在社交平台上的廣告投放及管理提供了三種工具，Ads Manager（廣告管理工具），Power Editor，以及Business Manager（商務管理平台）。

Facebook廣告管理工具Ads Manager可用於創建廣告、管理廣告投放時間和版位，以及追蹤營銷活動表現。使用廣告創建工具，廣告用戶可以自行選擇廣告目標、選擇受眾群體、撰寫廣告文案、上傳廣告創意，查看廣告在不同設備上的展示效果。

Power Editor的特點在於批量更改廣告系列的功能，簡化大規模投放廣告的複雜任務。Business Manager則是允許客戶與多個用戶或團隊共享 Facebook 資產的重要工具，使用者可以通過它管理用戶訪問許可權、上傳商品目錄、創建帖子等。

此外，Facebook廣告平台上還為客戶提供了單獨的數據化分析工具，比如Audience Insights受眾分析工具。用戶在平台上選擇想要查看的一組受眾，生成分析結果後使用篩選條件確定受眾組，命名保存。之後可以專門針對該組受眾在 Power Editor 中創建廣告。Facebook提供的受眾分析數據包含生活方式、家庭收入、消費方式、網購情況等，幫助廣告主提高投放人群定位的精準度。

輪播廣告

反垃圾系統

貫穿內容優化始終

對於一個社交平台而言，伴隨其內容產出誕生的是難以避免的大量垃圾信息。對於Facebook，惡意的廣告、病毒，低級趣味的圖文、視頻，虛假新聞，騷擾私信，都會影響網站的正常運營，降低用戶體驗，這些都屬於垃圾信息的範疇。處理垃圾信息，提升內容質量，貫穿平台建設始終。

Facebook針對內容本身和用戶帳號進行識別，來實現反垃圾信息的目標。以其反垃圾系統Immune和Sigma為例，Sigma系統對用戶行為進行監測，阻止或清除問題請求，Immune系統則通過對垃圾信息核心特徵進行識別，不斷優化系統對抗能力。

Sigma系統：監測用戶行為

Facebook用於垃圾信息過濾和清理的Sigma系統，部署於2000多台伺服器之上。該系統將規則和機器演算法相結合，判斷所有用戶的評論、鏈接、朋友請求等行為是否正常，日均處理信息數量達百億級。

利用用戶行為的歷史數據產生的大量樣本，Sigma不斷訓練模型，預測某個行為、信息是否存在問題，從而進行攔截或刪除。

具體來講，首先它會對每個用戶在網站上的行為，如發帖、點贊、評論、私信、好友申請等，實時預測其「可疑」程度。這個「可疑」程度具體又分為多個子維度，包括假帳號、被盜號、刷榜刷贊等。

針對每個維度，Sigma都會基於機器學習生成一個可疑值，數值高的就會自動觸發對應的規則系統：刪號，刪帖，發郵件或簡訊來要求用戶確認帳號。

在Sigma系統的監測下，Facebook 用戶做的任何事情被這個系統進行判斷，是正常行為、濫用行為還是有問題的行為。舉例來說，如果某個賬號的好友申請經常遭到拒絕，那麼該賬號經過系統攔截後，發送好友申請的請求將不再被批准。

發送失敗的消息

Immune系統：對抗與進化

當系統不斷與垃圾信息進行對抗時，攻擊者也會不斷做出針對性調整，偽裝自己。因此，反垃圾系統應該做到根據變化快速反應和優化。

區別於Sigma系統，Immune系統的一個重要能力，是對垃圾信息的核心特徵的識別，包括能夠迅速識別新特徵，並支持在線加入新特徵、新模型以實現系統自身的進化。

Immune系統對抗流程

Immune系統與垃圾信息的對抗流程，包括攻擊、察覺、防禦、變異四個環節，又可以分為攻擊者控制和防禦者控制兩大階段。

在攻擊者控制階段，系統還沒有響應能力，攻擊者可以發布大量的垃圾信息，受攻擊對象都會受到垃圾信息的影響。在防禦者控制階段，垃圾信息才會受到控制。因此對Immune系統來說最重要的就是要減少前一階段的時間，延長後者的時間。如今Immune系統已經能較好地做到這兩點。

在縮短攻擊者控制時間上，第一建立更好的用戶反饋通道，如舉報、刪除功能；第二即異常檢測，能夠快速識別新特徵，部署檢測模型。在延長防禦者控制時間上，Immune系統則要做到識別處理方法讓攻擊者難以了解，或者即使了解了也難以避免。在對抗過程中，Immune系統雖然處於一個比較被動的地位，但是它的快速響應能力、優化更新能力使其在處理垃圾信息時發揮著重大作用。

更加智能的內容識別與交互

AI是Facebook未來戰略發展的一大方向。相較於谷歌、亞馬遜等公司，其入局時間相對較晚，但面對月活20億的龐大用戶資源及內容生產，Facebook的AI技術開發不可迴避。

目前，Facebook對AI技術的探索，主要聚焦於其社交平台圖片、文字、視頻等內容的識別與交互開發上。通過使用AI技術掃描用戶發布的文字內容、上傳的圖片、視頻，甚至是 Linked Apps（連接應用）等相關數據，Facebook 能夠生成用戶的數據檔案和用戶畫像，從而實現內容智能投放；另一方面，在內容識別技術基礎上開發的交互功能，如智能機器人、圖片搜索等，為用戶帶來更好的使用體驗，最大化實現內容價值。

AI實現多維度內容識別

內容識別是AI技術研發及深入推進機器學習的基礎技術之一，目前，Facebook在文字識別、圖片識別與視頻識別能力上均有突破。

就文字識別而言，Facebook開發了基於深度學習技術的文字理解Deep Text系統，可以精確地理解文字的上下文情境，每秒可以分析 20 種語言的上萬條信息，每日完成40億次以上的翻譯功能的處理。對於Facebook而言，文字識別用於理解用戶發布的信息，監測垃圾內容，將平台內容與用戶進行有效匹配等方面上，發揮著重要用途。

針對平台上所有圖片內容，Facebook建立了Lumos機器學習視覺平台，每天處理圖片超過100萬張，同時應用於其旗下Instagram、Messenger等產品。該系統深度學習的進展在圖像分類上，已經可以精準回答「圖像中是什麼」和「物體在哪裡？」這樣的問題。

另外，通過分割圖像並識別其中物體和場景的技術，Lumos給照片附上更多的意義，並形成豐富的數據集，供Facebook的其他產品或服務使用。目前Facebook正在將這個圖像理解成果應用到將照片自動轉換成文本的功能上，以幫助盲人「看到」圖片。此外，圖片識別技術在檢測敏感內容，過濾垃圾郵件、提升用戶圖片搜索準確性等用處上效果更加明顯。

2017 年 12 月 29 日，Facebook 與麻省理工學院計算機科學與人工智慧實驗室（CSAIL）合作公布了一個帶有標籤的大型視頻數據集 SLAC（Sparsely Labeled ACtions），包括200個動作類別、52萬個未剪輯的視頻以及175萬個剪輯注釋，可幫助研究人員更快速、有效率的訓練機器識別各種動作。多年來視頻識別都是機器學習研究人員面臨的巨大挑戰，該數據集的發布，代表Facebook AI在視頻識別技術上的一項突破。

圖片識別分析技術

AI實現人與內容智能交互

Facebook的AI部門，將內容識別技術作為核心，增強研發實力的同時，也著力將AI融合於實際的業務、服務上，通過實現用戶與內容之間的智能交互，充分發揮平台內容的價值。

2015年，Facebook社交平台智能聊天機器人M上線。當用戶向M發送信息時，它可以立即通過演算法判斷用戶需求並做出回應。例如當用戶輸入「食譜」後，M聊天窗口會彈出Food Network（美國美食廣播網）的頁面，引導用戶瀏覽食譜相關訊息。後來M加入的suggestions（建議）功能，還可以智能識別用戶之間的聊天內容，發現用戶聊天中的興趣點，並做出相應的任務回應或內容推薦，例如約會提醒、收發紅包、點單、位置分享、叫車、預訂電影票、播放音樂等。利用智能演算法與機器學習技術，用戶使用 M 的次數越多，它會越智能，建議越精準。

2016年F8開發者大會上，Facebook發布了chat bot（智能聊天機器人）的開發者平台，並提出類似「bot商店」的概念。通過這個平台，Facebook機構用戶可以開發自己的聊天機器人，以實現不同的用途。

目前，Facebook上有超過10萬個bot，遍及新聞、電商、娛樂等不同領域。聊天機器人已經變成商家、媒體與其客戶互動的主要渠道，提供電商銷售、客戶支持或媒體的業務、內容服務。通過增加用戶與平台的互動，bot一方面將已有資源分發給所需用戶，同時收集更多內容信息反哺技術發展。

AI在Facebook平台上優化交互體驗的另一大貢獻是提供了描述性的照片搜索能力。通過Lumos機器學習視覺平台，Facebook構建了一個全新的搜索系統，它可以利用圖理解序大量信息，幫助用戶順利搜索到想要的圖片，哪怕圖片在發布時並沒有貼上相關的文字標籤。

智能聊天機器人M

（圖片來自網路）

編輯：張熙悅

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 媒介研究 的精彩文章:

※特斯拉：汽車智能化時代的「新物種」

TAG:媒介研究 |