當前位置:
首頁 > 最新 > 信息過載與智能內容服務問題探析

信息過載與智能內容服務問題探析

作者:王因傳,藍海長青智庫特邀研究員

由於信息技術的飛速發展及廣泛應用,使得信息生產、傳播、加工、處理、存儲的方式方法產生了根本性變化,由此造成了信息密集化、多樣化、高速化傳播,使得人們所處的信息環境日趨稠密。比如現代社會人們常用的今日頭條、知乎日報、微信朋友圈等信息獲取工具,雖然為人們提供了快速及便利的信息渠道,但也將信息篩選、甄別和處理的困難延伸用戶面前,致使信息用戶在遠遠超過自己認知能力的巨量信息面前手足無多,信息過載的現象普遍存在。此時,在現有工具手段和用戶使用習慣基礎上,綜合利用人工智慧消解信息過度膨脹、用戶認知效率降低的問題,探索高效、穩定、個性化的智能信息服務模式,是解決信息過載困境,提高新一代網路信息體系環境下信息利用效率和用戶認知效率的關鍵所在。

01

信息過載與信息過載悖論

信息用戶個體和應用系統接受到超過自身能接受、處理限度的大量信息,無法有效將其整合、組織及內化為自己所需的信息,以致對用戶、系統產生了了很多負面的影響,也就是所謂的「信息過載」。信息過載讓用戶難以獲取信息的主要困難在於:

(一)信息渠道急劇增多。隨著網路信息體系建設持續推進,用戶獲取信源渠道和手段快速增加。信息用戶在拓展信息邊際成本越來越低,用戶甄別信息真假的難度越來越高。另外,基於渠道的信息交流的數量和交流過程的中斷都可能導致信息過載,其中信息交流的中斷可能影響信息處理過程的效率。

(二)信息質量參差不齊。由於信息產品的產生主體、深度、廣度和效度不同,致使信息本體的質量參差不齊,加上發布平台暫無自動鑒別的手段,致使有用信息的時間成本越來越高。

(三)人工篩選信息困難。由於信息篩選的專業人員技能特徵、業務範圍、知識結構和任務情境了解程度不同,在尚沒有一個固定的信息篩選標準的情況下,對同一信息往往產生不同的認識,甚至會造成甚至造成曲解、衰竭、變異和紊亂,給後續的信息綜合利用帶來不同程度的消極影響。

(四)更新維護機制性冗餘。信源單位為了維持信息新穎性及正確性,要不定期的對信息進行修訂,造成修訂內容與舊版的信息重複度較高。

另外,我們在解決信息過載困境時,往往會遇到兩個方面的新困境:一方面,我們在不斷提供新的信息過載解決方案時,往往又會造成新的信息過載;另一方面,我們在運用各種演算法對信息進行過濾和個性化推薦的同時,卻又剝奪了用戶獲取其他信息的權力—而這些信息有可能就是他需要的。這就是信息過載悖論。

02

信息過載的內在機理分析

在信息服務活動中,信息用戶的知識結構和技能特徵影響信息過載的發生,因為與工作相關的知識和技能的增加會提高人們接受和處理信息的能力,而相關知識和技能的不足則會導致處理信息時發生困難。經過調查研究,我們發現,現階段信息過載現象的主要原因有以下幾點:

(一)傳遞工具方面的缺陷。人與人之間的信息溝通大多是藉助語言、文字,而語言、文字在表達方面很可能存在語義不清、措辭不當等方面的信息交流的障礙。還存在著信息傳遞工具在加工、傳播信息過程中因技術不穩定、不完善問題而造成的信息混亂無序。

(二)組織結構上的缺陷。如組織層次過多,機構過於龐大,信息經過層層傳遞必然要遇到障礙,甚至造成曲解、衰竭、變異和紊亂,致使越接近末端用戶,信息的偏差越大。當信息產品達到末端信息用戶時,已無法完整追溯信息內容的來源、確定中間加工主體、具體的加工過程,更不用說還原信息的本來面目。

(三)信息堆積帶來的「臃腫」。隨著時間的推移與內容的持續堆積,群體關注度比較高的信息正在變得越來越「臃腫」,直接閱讀太過「臃腫」的東西,一定會對用戶造成心理上的負擔,這是一種極其不佳的用戶體驗。

(四)用戶心理狀態的缺陷。信息是決策的基礎,在搜集處理信息時,個體會強迫自己去了解全面的信息,產生害怕信息被遺漏的心理現象,使信息選擇面臨壓力和困難。因此個體應當學會了解自身信息需求,做好優先順序排列。在信息交流過程中,因個人見解、立場、態度的差異,人們在傳遞信息時會出現各種不同「噪音」。這種信息傳播中的缺陷和障礙最有力而常見的體現就是搜索引擎的局限性。

03

常見的信息過載解決方法

為了對抗海量信息帶來的信息過載的問題,業界採用了不同的組織方法和服務模式,比較有效的可以歸納為三種:一是靠機器推薦的頭條模式,二是靠專家推薦的知乎模式,三是靠關係推薦的微信模式。

(一)頭條模式——機器推薦

今日頭條作為一款資訊類產品,在內容的各個維度上都不佔什麼優勢。唯一有一點不同的是:你會發現它越用越好用。

今日頭條主要依賴一套演算法,在經過一段時間的使用之後,它會越來越了解你的個性,因此推薦內容給你的準確度也會越來越高。它的演算法主要考慮以下幾個因素:

(1)用戶主動選擇的主題分類;

(2)點開查看的文章類型;

(3)在文章頁面停留的時間;

(4)點贊和收藏;

(5)評論和轉發。

通過以下四個策略來實現內容篩選和排序:

(1)過濾雜訊。通過停留時間短的點擊,過濾標題黨。

(2)熱點懲罰。對用戶在一些熱門文章(如前段時間PGOne的新聞)上的動作做降權處理。理論上,傳播範圍較大的內容,置信度會下降。

(3)時間衰減。用戶興趣會發生偏移,因此策略更偏向新的用戶行為。因此,隨著用戶動作的增加,老的特徵權重會隨時間衰減,新動作貢獻的特徵權重會更大。

(4)懲罰展現。如果一篇推薦給用戶的文章沒有被點擊,相關特徵(類別,關鍵詞,來源)權重會被懲罰。當然同時,也要考慮全局背景,是不是相關內容推送比較多,以及相關的關閉和dislike信號等。

(二)知乎模式——專家推薦

知乎的讀讀日報就是一個讓其他人來幫你挑選優質內容的產品,但請注意,這不再是你以為的那個「靠人推薦」。其實,是讓很多水平沒到那個段位的普通讀者無需再參與知乎繁複的內容生產和分發流程,直接消費就可以了。

最早的知乎日報是知乎創世人黃繼新帶著兩位編輯開始做的,每天選擇知乎社區里的熱門內容進行推薦。然後,知乎把推薦這件事的許可權開放,從自己人變成從知乎社區邀請了40多位專業人士做主編,推薦各種他們認為好的文章,並且內容選擇範圍也從知乎社區擴大到了整個互聯網上。這就是知乎日報的2.0版本。讀讀日報就是知乎日報的3.0版本。到了這時,知乎將內容推薦的權利完全交給了用戶,你看到的所有內容都來自於用戶的推薦。知乎個性閱讀模塊與「知乎日報」模塊類似,獨立於主體模塊之外,與主體模塊採用松耦合的架構模式。個性閱讀模塊主要架構在話題模塊之上,對用戶提供基於興趣話題的個性化閱讀服務。

個性化閱讀模塊與知乎日報的區別主要在以下兩個方面:一是個性化訂閱服務中由用戶決定其閱讀內容,而知乎日報的內容由運營人員推送;二是個性化訂閱服務架構在話題模塊之上,而知乎日報架構在整個知乎主體模塊之上。

個性化閱讀實際上就是用戶個性定製的過程:一方面,個性化閱讀模塊和「知乎日報」一樣獨立於知乎主體模塊之外。另一方面,在個性化閱讀模塊中,用戶可以利用一套完整的「個性化閱讀內容生成工具」製作完全屬於自己的個性化閱讀內容。製作個性化閱讀內容的過程,事實上就是用戶按自己的喜好設置一組篩選參數,讓系統篩選出滿足用戶個性需求的閱讀內容。

(三)微信模式——社交關係推薦

微信以社交為核心,經過六年的高速發展,成為了中國移動互聯網的國民級應用,我們認識世界和維護人際關係的方式因它的出現大大改變,微信上的社會交往也呈現出特有的屬性。基於社交關係鏈的推薦是微信朋友圈消息傳播的主要方式,這種推薦指的並不只是你的好友在微信群和朋友圈裡分享(相當於二次過濾)有價值的信息給你,還是憑藉海量的用戶群體和大力發展起來的公眾號「主動」給大家進行一些內容推薦的方式。

微信的主動推薦現在雖然標籤很少,入口較深,但在關係鏈的背後甚至體現出了一些演算法推薦的思路,由於用戶在微信上本身已經能獲取淺度的資訊和深度的解讀,如若加上精準的推薦,對今日頭條的原來的資訊業務反倒是不小的衝擊。這可能是有史以來微信第一次「主動」利用你的「關係鏈」來推薦給你相關內容,讓訂閱號和朋友圈重新有效起來。

04

智能內容服務的關鍵問題

結合對頭條模式、知乎模式和微信模式的內容服務研究,我們認為,智能內容服務的關鍵問題是需求智能分析、信息智能過濾、用戶智能建模、關係智能挖掘和信息智能分發。

(一)需求智能分析

現有的內容服務平台中有相當一部分是建立在詞語而非概念的基礎上,系統對於用戶需求的表達以及信息的匹配和推送都是基於詞語的外在形式而非它們所表達的概念,所以常常推送給用戶無關的信息,產生新的信息過載,要在語義層次上實現對用戶需求的理解、信息匹配和推送,提高信息過濾效率,仍待技術的進一步發展。

(二)信息智能過濾

信息過濾就是根據用戶的信息需求,運用一定的標準和工具,從動態的信息流中抽取出符用戶個性化需求,為用戶提供相關信息子集的技術。根據用戶信息需求的變化提供長期的信息服務,節約用戶獲取信息的時間,剔除用戶不需要的信息,提高用戶獲取信息的效率,減輕用戶的認知負擔,從而克服網路信息用戶所面臨的信息過量。

(三)用戶智能建模

用戶智能建模的主要分為屬性建模和行為建模。屬性建模是識別用戶屬性、構建文本向量空間模型,進行用戶模板與文本的匹配和信息推送,再利用反饋機制,不斷改進需求模型,改善信息過濾效果;行為建模主要是根據用戶的事件,分析出一些典型的行為,再通過採集用戶的事件來匹配這些行為。由於行為的發生會再影響到用戶的個性化的標籤,標籤匹配度會由於行為的不同有增有減,而不是一旦賦予終身不變,這符合人性變化的特點,經過一段時間的數據積累,將逐漸清楚用戶各方面的特徵。

(四)關係智能挖掘

讓服務平台認知信息與用戶之間的關係,是智能內容服務構建的基礎。標記與屏蔽和用戶毫不相關的信息,已成為避免信息過載的重要途徑。為了幫助用戶查找真正需要的信息,標記與屏蔽和用戶毫不相關的信息,已成為避免信息過載的重要途徑。通常,在信息檢索時,可以藉助協同過濾理論實現相似用戶的檢索評分記錄為用戶提供個性化推薦;在信息推薦時,社會網路分析模型及中心度、密度等概念有助於我們更好地刻畫用戶之間的社會聯繫,從中發現有價值的規律和知識。

(五)信息智能分發

智能分發的最大優勢在於精準投放,實時考慮用戶所處的網路、終端和系統環境,保證信息的快速、可靠、安全地送達用戶。

05

智能內容服務發展建議

現階段,人工智慧技術畢竟是目前內容服務領域對抗信息過載最為有效的解決手段。在發展智能內容服務上,還需在以下幾個方面加強理論研究、工具研製和運用流程機制探索工作。

(一)加強用戶畫像,實現動態用戶模型構建

精細的用戶模型是實現智能內容服務的基礎,用戶畫像是構建用戶模型的具體技術。我們認為,用戶畫像需要輸入三個維度的變數:

(1)維度一:內容。需要構建一個綜合內容平台,囊括所有圖文、公共視頻、UGC視頻、問答等。而每種內容有很多自己的特徵,需要考慮怎樣提取不同內容類型的特徵做好推薦。

(2)維度二:用戶特徵。包括各種用戶興趣標籤,根據其任務、崗位、業務、環境等,創建出關聯模型刻劃用戶隱性需求等。

(3)維度三:環境特徵。用戶隨時隨地移動,在工作場合、通勤、任務等不同的場景,信息偏好有所偏移。

目前,需要結合三方面的維度,模型會給出一個預估,即推測推薦內容在這一場景下對這一用戶是否合適。

(二)加強特徵研究,實現用戶信息智能匹配

我們認為,主要有四類特徵會對推薦起到比較重要的作用:

一是相關性特徵。就是評估內容的屬性和與用戶是否匹配。顯性的匹配包括關鍵詞匹配、分類匹配、來源匹配、主題匹配等。像FM模型中也有一些隱性匹配,從用戶向量與內容向量的距離可以得出。

二是環境特徵。包括地理位置、時間。這些既是bias特徵,也能以此構建一些匹配特徵。

三是熱度特徵。包括全局熱度、分類熱度,主題熱度,以及關鍵詞熱度等。內容熱度信息在大的推薦系統特別在用戶冷啟動的時候非常有效。

四是協同特徵。它可以在部分程度上幫助解決所謂演算法越推越窄的問題。協同特徵並非考慮用戶已有歷史。而是通過用戶行為分析不同用戶間相似性,比如點擊相似、興趣分類相似、主題相似、興趣詞相似,甚至向量相似,從而擴展模型的探索能力。

(三)加強實時訓練,實現行為場景快速適配

實時訓練顯著優勢是省資源、反饋快,這對信息流產品非常重要。需要在數據模型的訓練上持續改進和優化。用戶需要行為信息可以被模型快速捕捉並反饋至下一屏的推薦效果。基於集群實時處理樣本數據,包括點擊、展現、收藏、分享等動作類型。模型參數伺服器是內部開發的一套高性能的系統,因為行為數據規模增長太快,需要完善相關的運維工具,以適配現有不同的業務場景。

(四)加強人機協同,實現泛低質信息識別

泛低質信息識別涉及的情況非常多,像假信息、黑稿、題文不符、標題黨、內容質量低等,這部分內容由機器理解是非常難的,需要大量反饋信息,包括其他樣本信息比對。目前低質模型的準確率和召回率都不是特別高,還需要結合人工複審,將閾值提高。同時需要再次基礎上完善信息召回機制。目前最終的召回已達到95%,這部分其實還有非常多的工作可以做。

(五)持續完善生態,實現全壽命管理機制

可借鑒知乎的UGC(UserGeneratedContent,用戶生產的內容)模式,主要是用戶激勵機制,讓用戶產生高質量內容。從信息結構角度來看,用戶生產高質量內容激勵機制提供一種全新的信息「駐留」與「逆流」的機制,完善了知乎產品生態系統,它能夠使內容中的優質內容的作用時間半徑擴大,增大了信息半衰期,從而提升信息利用率。

總之,瞬息萬變的信息時代,人們內在的焦慮感,轉化成了對外部動態的高度關注,從而培育出了高頻的資訊瀏覽習慣,利用碎片化的時間去了解更多信息,從而提升認知效率以及臨機決策的質量。

歡迎轉載,請註明轉自藍海長青智庫軍民融合科技創新資訊平台。共鑄強軍夢,共贏中國夢

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 藍海長青智庫 的精彩文章:

美軍研發減重塑料頭盔可防9毫米子彈
如何應對沒有硝煙的科技戰

TAG:藍海長青智庫 |