當前位置:
首頁 > 最新 > Facebook:以技術為支點,撬動20億用戶社交平台的內容運營

Facebook:以技術為支點,撬動20億用戶社交平台的內容運營

Facebook作為全球最大的社交平台,其影響力毋庸贅言。它從誕生之初發展成如今的社交帝國,早已不是簡單的用戶交流平台,其平台內容集用戶狀態、新聞、廣告、視頻節目甚至用戶服務等於一身,並形成交互聯動。Facebook正在改變著內容產業形態,創造新的盈利途徑。

2017年,Facebook月活躍用戶數量突破20億,龐大的用戶規模背後是每天大量產出的內容與數據資源。成立十年至今,Facebook獨佔社交鰲頭,藉助其背後可觀的大數據資源,將技術作為一有力支點,撬動其龐大的內容體系運行。

信息流

平台內容的百川歸海

2006年,Facebook的信息流功能(News Feed)開發並應用,成為匯聚其社交平台上各類核心內容如好友狀態更新、熱點新聞推送、廣告等的主要載體。它收集用戶、企業等的信息和數據,藉助演算法調整用戶page展示內容,影響著用戶的在線行為習慣。隨著內容形式逐漸增多,以及Facebook對技術的逐年優化,信息流內容展示也隨時發生著變化。

Facebook信息流頁面

10萬個參考變數下的好友動態展示排名

起初,對於好友每天發布的更新,Facebook用戶頁面呈現的總是按時間排序的最新內容。2010年Facebook在F8開發者大會上提出對信息流排序的新演算法EdgeRank,用於區別默認的按時間逆序的Timeline。從此,Facebook社交內容展示開始走上「個性化」道路。

EdgeRank收集每位用戶發布的內容(包括分享的內容)、關注好友的狀態更新、加入的群組以及點贊、評論、分享等用戶行為數據,並從這些數據中產生該用戶的「權重評級標準」。之後根據權重對監測到的用戶頁面內容進行評級,將評級高的內容——也即用戶最感興趣的內容展現在信息流的前列。

EdgeRank的早期權重評級標準,是在「時間」的基礎上加上「親密度」、「互動」、「興趣」等因素。以「互動」為例,考慮到用戶間的連接強度,他們可能是點贊之交、評論之交,或是私信之交,強度不同,權重參數不同,展示內容不同。

隨著產品迭代,Facebook加入更多功能特性。諸如視頻、鏈接等內容形態因素,點贊、取關、隱藏、閱讀時間等用戶行為因素,都成為演算法考慮的變數,總計多達10萬個。AI技術爆發使Facebook對圖片與文字識別理解能力增強,排序考量因素更加複雜,結果也更加智能。

Reactions表情功能——點贊功能的延伸

其實,在演算法推出的早期,對Timeline已經產生使用習慣的用戶對新的信息流排序方式產生很大質疑。但是隨著Facebook用戶數量劇增,更多內容生產機構與內容形態參與其中,個性化排序方式就顯得尤為重要。

2018年1月,扎克伯格公開表示,來自品牌和媒體內容充斥信息流,廣告、新聞和視頻等阻礙了Facebook作為社區的活躍性。據此,Facebook將再次通過演算法對內容比重進行調整,從而幫助用戶回歸到更多的社交體驗中。

新聞熱點話題,尋求人工與演算法的平衡

社交網站早已成為人們獲取熱點新聞的主要入口之一,Facebook通過其強大的演算法機制和病毒式擴散模式,為內容創業公司賺取大量流量,甚至改變了歐美新聞業內容分發模式,形成中心化的新聞消費。以美國著名新聞聚合網站BuzzFeed為例,其內容每月在 Facebook 上獲得的流量超過百億,網站訪問流量超過五千萬。

2013年,Facebook開發了熱點話題(Trending)功能。熱點話題區彙集了一段時間內的熱門標籤或話題,是用戶獲知當下熱點的主要入口。推送熱門話題的過程大致為三步。

首先,Facebook使用程序監控網站內部話題的分享和評論,同時,爬蟲抓取用戶還沒有開始分享的外部新聞。

接著,當這些新聞話題出現在Facebook的網站上時,系統會在1000家媒體上進行認證,並匹配標題、圖片和地點人物等相關數據。

最後,另一個系統將已經通過認證的熱門話題,經過演算法篩選後,推送少於10條符合用戶個性化選擇的內容推送到桌面和移動端的首頁。Trending將新聞熱點集中起來,聚集用戶參與討論,推動平台快速形成規模話題,但隨即也產生了一些問題。

Facebook規定,熱門話題欄目的編輯只對話題內容進行基礎的格式修改,而非提煉新聞要點或選擇新聞內容,並由此幫助訓練演算法。然而,在2015年Facebook解僱數十名新聞編輯,將熱門話題的編輯、推薦和排名全部交給機器演算法後,產生了嚴重的問題。

一篇關於美國著名新聞主播Megyn Kelly因力挺希拉里而被東家福克斯開除的假新聞,被頂到 Facebook 熱門話題榜的首位。事後Facebook總裁扎克伯格也不得不承認,完全依賴演算法的做法並不可取。

然而,在Facebook對其加入人工審核後,熱點話題內容依舊受到質疑,例如編輯存在政治偏見、話題選擇影響選舉結果等。

在「演算法」與「人工」之間尋找平衡,同時也是Facebook在履行社會責任、尊重新聞事實與保持平台社交話題活躍度、形成規模話題之間尋找平衡。對此,2018年2月,Facebook對部分地區熱點話題進行升級,擴大專業新聞出版機構內容,將權重由原來「互動程度高」加入「被新聞出版商報道更多」,保證話題質量的同時減少了人工參與的影響。

熱點話題升級前後對比

個性化管理平台,讓廣告更「有機」

2017年Facebook廣告業務在公司總營收中佔比近98%。通過用戶在其社交平台上分享的內容、帳戶的其他個人信息、廣告主和市場營銷合作夥伴提供的用戶信息,Facebook收集用戶數據,並在廣告投放時進行有效匹配。

作為全球數字廣告市場的一種重要力量,Facebook促進在線廣告領域發生的最大變化在於,廣告和「有機內容」之間的界限越來越模糊。尤其對於Facebook龐大的社交用戶來說,信息流廣告已經成為融入社交平台的內容組成部分。

近年來,Facebook信息流廣告形式不斷豐富,除了普通的圖文廣告,還增加了視頻、全屏、精品欄、輪播、幻燈片等富媒體廣告形式。對於這些多樣的廣告內容生產和選擇,Facebook考慮到其與「有機內容」的相關性與競爭程度,為用戶提供各類工具,優化廣告內容與投放。藉助Facebook廣告系統工具的引導,客戶可以自主選擇適合品牌內容的廣告形式,廣告內容質量大大提升。

Facebook為廣告客戶在社交平台上的廣告投放及管理提供了三種工具,Ads Manager(廣告管理工具)Power Editor,以及Business Manager(商務管理平台)

Facebook廣告管理工具Ads Manager可用於創建廣告、管理廣告投放時間和版位,以及追蹤營銷活動表現。使用廣告創建工具,廣告用戶可以自行選擇廣告目標、選擇受眾群體、撰寫廣告文案、上傳廣告創意,查看廣告在不同設備上的展示效果。

Power Editor的特點在於批量更改廣告系列的功能,簡化大規模投放廣告的複雜任務Business Manager則是允許客戶與多個用戶或團隊共享 Facebook 資產的重要工具,使用者可以通過它管理用戶訪問許可權、上傳商品目錄、創建帖子等。

此外,Facebook廣告平台上還為客戶提供了單獨的數據化分析工具,比如Audience Insights受眾分析工具。用戶在平台上選擇想要查看的一組受眾,生成分析結果後使用篩選條件確定受眾組,命名保存。之後可以專門針對該組受眾在 Power Editor 中創建廣告。Facebook提供的受眾分析數據包含生活方式、家庭收入、消費方式、網購情況等,幫助廣告主提高投放人群定位的精準度。

輪播廣告

反垃圾系統

貫穿內容優化始終

對於一個社交平台而言,伴隨其內容產出誕生的是難以避免的大量垃圾信息。對於Facebook,惡意的廣告、病毒,低級趣味的圖文、視頻,虛假新聞,騷擾私信,都會影響網站的正常運營,降低用戶體驗,這些都屬於垃圾信息的範疇。處理垃圾信息,提升內容質量,貫穿平台建設始終。

Facebook針對內容本身和用戶帳號進行識別,來實現反垃圾信息的目標。以其反垃圾系統ImmuneSigma為例,Sigma系統對用戶行為進行監測,阻止或清除問題請求,Immune系統則通過對垃圾信息核心特徵進行識別,不斷優化系統對抗能力。

Sigma系統:監測用戶行為

Facebook用於垃圾信息過濾和清理的Sigma系統,部署於2000多台伺服器之上。該系統將規則和機器演算法相結合,判斷所有用戶的評論、鏈接、朋友請求等行為是否正常,日均處理信息數量達百億級。

利用用戶行為的歷史數據產生的大量樣本,Sigma不斷訓練模型,預測某個行為、信息是否存在問題,從而進行攔截或刪除

具體來講,首先它會對每個用戶在網站上的行為,如發帖、點贊、評論、私信、好友申請等,實時預測其「可疑」程度。這個「可疑」程度具體又分為多個子維度,包括假帳號、被盜號、刷榜刷贊等。

針對每個維度,Sigma都會基於機器學習生成一個可疑值,數值高的就會自動觸發對應的規則系統:刪號,刪帖,發郵件或簡訊來要求用戶確認帳號。

在Sigma系統的監測下,Facebook 用戶做的任何事情被這個系統進行判斷,是正常行為、濫用行為還是有問題的行為。舉例來說,如果某個賬號的好友申請經常遭到拒絕,那麼該賬號經過系統攔截後,發送好友申請的請求將不再被批准。

發送失敗的消息

Immune系統:對抗與進化

當系統不斷與垃圾信息進行對抗時,攻擊者也會不斷做出針對性調整,偽裝自己。因此,反垃圾系統應該做到根據變化快速反應和優化

區別於Sigma系統,Immune系統的一個重要能力,是對垃圾信息的核心特徵的識別,包括能夠迅速識別新特徵,並支持在線加入新特徵、新模型以實現系統自身的進化。

Immune系統對抗流程

Immune系統與垃圾信息的對抗流程,包括攻擊、察覺、防禦、變異四個環節,又可以分為攻擊者控制防禦者控制兩大階段。

在攻擊者控制階段,系統還沒有響應能力,攻擊者可以發布大量的垃圾信息,受攻擊對象都會受到垃圾信息的影響。在防禦者控制階段,垃圾信息才會受到控制。因此對Immune系統來說最重要的就是要減少前一階段的時間,延長後者的時間。如今Immune系統已經能較好地做到這兩點。

在縮短攻擊者控制時間上,第一建立更好的用戶反饋通道,如舉報、刪除功能;第二即異常檢測,能夠快速識別新特徵,部署檢測模型。在延長防禦者控制時間上,Immune系統則要做到識別處理方法讓攻擊者難以了解,或者即使了解了也難以避免。在對抗過程中,Immune系統雖然處於一個比較被動的地位,但是它的快速響應能力、優化更新能力使其在處理垃圾信息時發揮著重大作用。

AI

更加智能的內容識別與交互

AI是Facebook未來戰略發展的一大方向。相較於谷歌、亞馬遜等公司,其入局時間相對較晚,但面對月活20億的龐大用戶資源及內容生產,Facebook的AI技術開發不可迴避。

目前,Facebook對AI技術的探索,主要聚焦於其社交平台圖片、文字、視頻等內容的識別與交互開發上。通過使用AI技術掃描用戶發布的文字內容、上傳的圖片、視頻,甚至是 Linked Apps(連接應用)等相關數據,Facebook 能夠生成用戶的數據檔案和用戶畫像,從而實現內容智能投放;另一方面,在內容識別技術基礎上開發的交互功能,如智能機器人、圖片搜索等,為用戶帶來更好的使用體驗,最大化實現內容價值。

AI實現多維度內容識別

內容識別是AI技術研發及深入推進機器學習的基礎技術之一,目前,Facebook在文字識別、圖片識別與視頻識別能力上均有突破。

文字識別而言,Facebook開發了基於深度學習技術的文字理解Deep Text系統,可以精確地理解文字的上下文情境,每秒可以分析 20 種語言的上萬條信息,每日完成40億次以上的翻譯功能的處理。對於Facebook而言,文字識別用於理解用戶發布的信息,監測垃圾內容,將平台內容與用戶進行有效匹配等方面上,發揮著重要用途。

針對平台上所有圖片內容,Facebook建立了Lumos機器學習視覺平台,每天處理圖片超過100萬張,同時應用於其旗下Instagram、Messenger等產品。該系統深度學習的進展在圖像分類上,已經可以精準回答「圖像中是什麼」和「物體在哪裡?」這樣的問題。

另外,通過分割圖像並識別其中物體和場景的技術,Lumos給照片附上更多的意義,並形成豐富的數據集,供Facebook的其他產品或服務使用。目前Facebook正在將這個圖像理解成果應用到將照片自動轉換成文本的功能上,以幫助盲人「看到」圖片。此外,圖片識別技術在檢測敏感內容,過濾垃圾郵件、提升用戶圖片搜索準確性等用處上效果更加明顯。

2017 年 12 月 29 日,Facebook 與麻省理工學院計算機科學與人工智慧實驗室(CSAIL)合作公布了一個帶有標籤的大型視頻數據集 SLAC(Sparsely Labeled ACtions),包括200個動作類別、52萬個未剪輯的視頻以及175萬個剪輯注釋,可幫助研究人員更快速、有效率的訓練機器識別各種動作。多年來視頻識別都是機器學習研究人員面臨的巨大挑戰,該數據集的發布,代表Facebook AI在視頻識別技術上的一項突破。

圖片識別分析技術

AI實現人與內容智能交互

Facebook的AI部門,將內容識別技術作為核心,增強研發實力的同時,也著力將AI融合於實際的業務、服務上,通過實現用戶與內容之間的智能交互,充分發揮平台內容的價值。

2015年,Facebook社交平台智能聊天機器人M上線。當用戶向M發送信息時,它可以立即通過演算法判斷用戶需求並做出回應。例如當用戶輸入「食譜」後,M聊天窗口會彈出Food Network(美國美食廣播網)的頁面,引導用戶瀏覽食譜相關訊息。後來M加入的suggestions(建議)功能,還可以智能識別用戶之間的聊天內容,發現用戶聊天中的興趣點,並做出相應的任務回應或內容推薦,例如約會提醒、收發紅包、點單、位置分享、叫車、預訂電影票、播放音樂等。利用智能演算法與機器學習技術,用戶使用 M 的次數越多,它會越智能,建議越精準。

2016年F8開發者大會上,Facebook發布了chat bot(智能聊天機器人)的開發者平台,並提出類似「bot商店」的概念。通過這個平台,Facebook機構用戶可以開發自己的聊天機器人,以實現不同的用途。

目前,Facebook上有超過10萬個bot,遍及新聞、電商、娛樂等不同領域。聊天機器人已經變成商家、媒體與其客戶互動的主要渠道,提供電商銷售、客戶支持或媒體的業務、內容服務。通過增加用戶與平台的互動,bot一方面將已有資源分發給所需用戶,同時收集更多內容信息反哺技術發展。

AI在Facebook平台上優化交互體驗的另一大貢獻是提供了描述性的照片搜索能力。通過Lumos機器學習視覺平台,Facebook構建了一個全新的搜索系統,它可以利用圖理解序大量信息,幫助用戶順利搜索到想要的圖片,哪怕圖片在發布時並沒有貼上相關的文字標籤。

智能聊天機器人M

(圖片來自網路)

編輯:張熙悅

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 媒介研究 的精彩文章:

特斯拉:汽車智能化時代的「新物種」

TAG:媒介研究 |