當前位置:
首頁 > 最新 > 決定「今日頭條」演算法價值觀念的四個要素

決定「今日頭條」演算法價值觀念的四個要素

演算法分發逐漸成為網路新聞主要的分發方式。鄭州大學新聞與傳播學院王茜以演算法分發模式的先行者——今日頭條為研究對象,運用內容分析法考察了演算法自動化選擇和衡量新聞價值客體的標準。通過分析鄭州大學77位用戶的8000多條新聞推送後發現,今日頭條演算法價值觀念主要包括四個要素:場景、內容、用戶偏好和平台優先順序。這些標準內嵌於代碼編寫與設計之中。

1.場景

移動傳播的本質是基於場景的服務,即對場景(情境)的感知及信息(服務)適配。在本文中,場景因素主要表現為本地新聞的高覆蓋率。如表1所示,覆蓋率50%以上的新聞中,本地新聞佔一半以上。「洛陽原書記被控收受1.48億」這條新聞被推送給52名參與者,覆蓋率最高。

覆蓋率50%以上的新聞推送

接近性是新聞價值五要素之一,而LBS(基於地理位置的服務)、物聯網等技術為更精準的信息適配提供了技術支持。今日頭條推送了九條有關鄭州大學的新聞,其中「鄭州大學校運會開幕式大觀」「鄭大與鄭州艦簽訂雙擁協議」,以及「鄭大校內柳絮紛飛」的覆蓋率分別達到48.05%、42.86%和33.77%。此外,42位參與者曾在晚間收到今日頭條推出的「夜宵」新聞,即一組當天發生的要聞集錦。這也是根據場景因素,即用戶的作息習慣,而進行的演算法分發。

2.內容

儘管今日頭條聲稱其沒有價值觀,然而,本文研究發現,具有重要性、衝突性以及流行度的內容更容易通過演算法篩選過程並進入用戶視野。

媒體人吳晨光曾介紹新聞客戶端的推送規則:「當新聞足夠重大時,可從不同的角度Push多條,形成持續關注度」。重要性是新聞推送的準則之一。在為期三周的時間裡,參與者收到最多的新聞類型是軍事新聞(28.63%)。筆者把所有軍事新聞標題導入「清博詞頻統計工具」,導出結果顯示「朝鮮」一詞出現頻次最高。在記錄期間,朝鮮核問題、薩德問題是國際社會關注的熱點議題,今日頭條對各方回應、事件發展動態進行了持續推送。

參與者收到的社會新聞(27.67%)排名第二,其次是時政新聞(13.59%)。筆者分別統計了這兩類新聞標題的詞頻。如圖2和圖3所示,有關兇殺、強姦、車禍的社會新聞,以及有關官員落馬、貪污腐敗的時政新聞更易得到今日頭條演算法的推薦。這些新聞都具有較強的衝突性,包括人與人之間的衝突、官員落馬前後形成的反差等,易吸引人眼球。

娛樂新聞(10.76%)佔比排在第四位,餘下的新聞類型佔比均在10%以下。如表1所示,今日頭條為50%以上的參與者接連推送了「白百何出軌」事件。在為期三周的時間裡,每位參與者平均收到5條有關該事件的新聞推送,最高者收到12條相關推送。由此可見,具有流行度的新聞也會得到今日頭條的優先推薦。這一發現與傑姆斯·韋伯斯特 (James G. Webster)的研究結果相符,即搜索引擎、社交網路、協同過濾系統等在進行信息推薦時都傾向於把「流行度」(popularity)作為消費指南。

3.用戶偏好

「你關心的,才是頭條」這一廣告語顯現了今日頭條對用戶偏好的注重。受尼爾·瑟曼(Neil Thurman)研究的啟發,本文把用戶偏好分為兩種類型:第一種是用戶主動表達的偏好(explicit preference),包括點贊、評論、收藏、關注、轉發、搜索、屏蔽。第二種是指用戶含蓄表現出的偏好(implicit preference),主要是指媒介組織通過搜集和分析用戶數據而推導出的偏好。這些數據包括用戶的註冊信息、社交賬號、GPS定位、IP地址、使用的手機型號等。分析結果顯示,今日頭條給每位男生平均推送了18.38條體育新聞,給女生則推送了1.53條。由此可見,性別等人口統計學特徵也被用於推測用戶偏好。

值得指出的是,將於2018年5月在歐盟正式實施的《一般數據保護條例》(General Data Protection Regulation,簡稱GDPR)第22條規定:「數據主體應該擁有以下權利,即不受僅僅基於自動化處理(包括畫像)所做出決策的制約,如果該決策會為他或她帶來法律後果或其他顯著影響。」本文認為,今日頭條所進行的畫像顯著影響了用戶的信息消費。GDPR條例第4條對「畫像」(Profiling)進行了明確定義:「指任何通過自動化方式處理個人數據的活動,該活動服務於評估個人的特定方面,或者專門分析及預測個人的特定方面,包括工作表現、經濟狀況、位置、健康狀況、個人偏好、可信賴度或行為表現等。」在本研究中,參與者收到的新聞推送在很大程度上反映了今日頭條演算法對「用戶特定方面」的評估,包括位置、個人偏好、性別等。

今日頭條有多了解我們呢?曾經有研究者分析了5.8萬名志願者Facebook上的點「贊」,據此推測出了一系列高度隱私的個人特質,包括性取向、種族、政治觀點、個性特徵、智力情況、快樂程度、上癮物的使用、父母離異、年齡和性別。可以預見的是,隨著物聯網、人臉識別等技術的快速發展,演算法將積累越來越多的用戶數據,變得越來越「智能」。與此相伴隨的是「誰來約束演算法」的問題。

4.平台優先順序

德維托分析指出,平台優先順序(Platform priorities)是影響Facebook信息流呈現的因素之一,例如Facebook會在用戶信息流中優先呈現自己平台上的視頻而非YouTube上的視頻。分析發現,平台優先順序也是今日頭條演算法價值觀念的要素之一。

如前所述,今日頭條把一些非新聞類資訊也推送給了用戶,共有47條。這些資訊涵蓋了以下類型:頭條問答(例如「為什麼說千萬不要一個人吃海底撈?」)、圖片(例如「老照片:30年前的河南嵩山少林寺」)、短視頻(例如 「找些廢品,在家動動手,這麼高大上的東西你也可以擁有」)、人物故事(例如「數學天才18歲被保送北大,三次創業三次成功,連追女友都是算概率」)。這些非新聞類資訊均來源於今日頭條的自媒體平台——頭條號。

張一鳴曾表示:「傳統媒體是把觀點告訴別人,今日頭條是提供實用信息,比如給養豬專業戶提供更好的養豬信息,告訴強直性脊柱炎病人如何治療。傳統媒體是傳遞價值觀,我們只是讓有益的信息到達個體。」作為一家商業公司,今日頭條的運轉核心——「一套由代碼搭建而成的演算法」——會受到公司整體戰略布局的導向和影響,並優先推薦本平台生產的內容,無論內容本身是不是傳統意義上的新聞。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新聞記者 的精彩文章:

社交網路上曬的「白日夢」
數字時代攝影記者的生存境況:身份結構與收入

TAG:新聞記者 |