當前位置:
首頁 > 科技 > 圖靈獲 NLPCC2018 競賽用戶畫像和推薦任務第1名

圖靈獲 NLPCC2018 競賽用戶畫像和推薦任務第1名

圖靈在用戶畫像和智能推薦上已經達到行業頂尖的水平,並賦能到國內 Top 50 的兒童玩具品牌,幫助他們實現智能化的產品體驗。

近日,NLPCC 2018 競賽公布評測結果,圖靈機器人NLP研究員在用戶畫像與好友推薦任務中均獲得第 1 名!

另據悉,用戶畫像與好友推薦這兩項新技術將在7月1日隨著圖靈OS新版正式上線!

NLPCC 是國內首個 NLP 領域的國際會議,是國際上中文計算領域的頂尖會議。會議由中國計算機學會(CCF)主辦,CCF 中文信息技術專業委員會(CCF TCCI)及高校(每年通過投票選舉)承辦。會議內容主要圍繞自然語言處理(NLP)和中文計算(CC)兩方面來進行。

本次競賽,包含 8 項任務評測,涉及情緒識別、語法糾錯、自動文摘、對話系統中的口語理解、多輪人機對話、知乎問題標註、智能問答、用戶畫像與推薦等。憑藉多年的技術和數據積累,圖靈參加並拿下了用戶畫像與好友推薦任務第一名。

用戶畫像和好友推薦是什麼?

用戶畫像是在給定了用戶的一些基本信息,例如:性別、地理位置、好友關係、微博信息,以及用戶的標籤信息,需要根據用戶的基本信息來預測用戶的標籤。

好友推薦任務目的是基於用戶歷史好友、用戶的個人信息、微博文本、到過的地點等,為用戶推薦新的好友。該任務中一個用戶可能和多個標籤相關聯,是一個典型的多標籤分類任務,目前比較流行的有三類方法來解決多標籤分類問題:

(1) 問題轉換,該方法的思想是將多標籤問題轉換為單標籤問題,例如二元關聯、分類器鏈、標籤Powerset等方法都是早期提出的方法,但是該方法沒有考慮標籤之間的相關性。

(2) 改編演算法,該方法的思想是將多標籤分類問題轉化為多分類問題。該方法跟問題轉換方法一樣沒有考慮標籤的相關性,而且當標籤數量比較大的時候,分類組合的數量會很大,增加了模型的複雜性,並降低了精確度。

(3) 集成方法,該方法的思想通過組合多個模型,以獲得更好的效果,使集成的模型具有更強的泛化能力,但是該方法需要大量的維護工作。

由於之前的方法都有各種各樣的缺點,考慮到任務中標籤之間有比較強的關聯性,利用深度學習能夠自主學習特徵的特性,我們提議了新的模型,考慮到用戶基本信息的組合特徵和標籤之間的相關性,從而提高了預測的準確率。

好友推薦任務在大部分研究好友推薦的文章中,大部分是基於特徵挖掘實現的,需要充分的用戶和好友的微博文本,個人信息,興趣愛好甚至生活習慣等信息,還有一些基於社交信息進行圖挖掘。

在準備過程中,我們首先尋找了相似的數據,並嘗試了從專門用於好友推薦的多種,包括傳統的FOF、協同過濾、矩陣分解等。在發布正式數據後,對適用各類特徵的方法進行了評估和比較。最終根據用戶歷史社交信息的多少,分別選擇了合適的方法。

就像人類的智慧行行程需要依賴於知識和經驗,機器人想要聰明也需要有足夠豐富的「知識」和「經驗」。

為此,圖靈建立了大量的知識圖譜——在這其中,圖靈不僅有知識圖譜數量上的累積,更強調圖譜中每個節點的關聯性和跳躍性。在對話過程中,機器利用知識圖譜來理解人的話題,並找到話題圖話題的關聯性,實現在相互關聯的話題之間自然跳轉。

你是誰?我們發生過什麼?

搭載了圖靈大腦的機器人,可以把每一個用戶作為一個實體,在使用中不斷關聯與用戶相關的信息,反向刻畫出精準的用戶畫像。基於和人的交互數據,機器人會再形成新的知識圖譜,並完成跨越間維度的上下文對話。

——換句話講,你家的機器人不再是個沒有故事的「傻孩子」,它不僅知道自己是誰,也知道你是誰,甚至記得你喜歡什麼、你說過什麼話,並有可能在日後的對話中,用你的說過的話「懟」回你。

你喜歡什麼?我能為你做什麼?

在解決「我是誰」、「你是誰」這樣的認知問題之後,接下來就需要考慮「聊得來」的問題了——機器人需要知道你喜歡什麼,並根據你的興趣向你主題推薦聊天話題和內容服務。

在對話狀態下,基於前面的精準用戶畫像,圖靈會通過智能推薦演算法,按照用戶的特徵來選擇其感興趣的話題。而在非對話狀態下,圖靈則會主動篩選內容和服務,幫助用戶快速找到。

簡單來講,就是同一款搭載了圖靈大腦的產品,在不同用戶的家裡可能會有完全不一樣的表現——小女孩的機器人喜歡講白雪公主和哆啦A夢的故事;小男孩的機器人對超級飛俠和奧特曼的故事如數家珍。

在人機交互的過程中,精準的用戶畫像可以為機器「理解」用戶打下基礎,幫助機器更加清晰地了解用戶的意圖;同時,通過智能推薦的方式,在操作層面上,可以減少用戶的操作成本,而在對話過程中,可以預先圈定意圖範圍,避免了「答非所問」之類的尷尬。

憑藉圖靈在人工智慧領域多年的積累,圖靈在用戶畫像和智能推薦上已經達到行業頂尖的水平,並賦能到國內 Top 50 的兒童玩具品牌,幫助他們實現智能化的產品體驗。

本文來自鎂客網,創業家系授權發布,略經編輯修改,版權歸作者所有,內容僅代表作者獨立觀點。[ 下載創業家APP,讀懂中國最賺錢的7000種生意 ]


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 創業家 的精彩文章:

華興資本包凡:互聯網下半場是用數據重塑現實世界
中國L4級無人駕駛車輛首次面向公眾試乘

TAG:創業家 |