情感分析:利用上下文語義搜索演算法獲得更深入的信息
AiTechYun
編輯:xiaoshan
情感分析是文本的上下文挖掘,它識別和提取源材料中的主觀信息,並幫助企業了解其品牌、產品或服務的社會情感,同時監控在線對話。然而,對社交媒體流的分析通常僅限於基本的情感分析和基於指標的度量。這類似於僅僅觸及表面,錯過那些等待被發現的高價值洞察力。那麼,一個品牌應該怎樣做才能輕鬆實現這個目標呢?
隨著近年來深度學習的發展,演算法的文本分析能力有了很大的提高。先進人工智慧技術的創造性利用,成為深入研究的有效工具。我們認為,根據以下幾方面來對一個品牌的客戶對話進行分類是很重要的:
顧客關心的品牌產品和服務。
用戶對這些方面的潛在意圖和反應。
這些基本概念在結合使用時,成為分析數百萬品牌對話的一個非常重要的工具。在這篇文章中,我們以Uber為例,展示了它是如何運作的。
文本分類器——基本構件
情感分析
情感分析是最常見的文本分類工具,它分析傳入的信息,並說明潛在的情感是正面,負面還是中立。你可以輸入你選擇的句子,並通過在演示來判斷潛在的情感。
演示地址:https://www.paralleldots.com/sentiment-analysis
意圖分析
意圖分析通過分析消息背後的用戶意圖並識別其是否與意見、新聞、營銷、投訴、建議、欣賞或查詢相關,從而進行改善。
上下文語義搜索(CSS)
為了獲得有用的結論,了解用戶討論的關於品牌各方面的內容是很重要的。例如:亞馬遜想隔離的相關消息:晚交貨,計費問題,推廣相關查詢,產品評論等。另一方面,星巴克想要根據員工行為分類信息,新咖啡口味、衛生反饋、在線訂單、商店名稱和位置等。但一個人怎麼能做到呢?
我們引入了一種智能的智能搜索演算法,稱為上下文語義搜索(又叫CSS)。CSS的工作方式是,它需要數千條消息和一個概念(比如價格)作為輸入,並過濾所有與給定概念緊密匹配的信息。下面的圖表展示了CSS是如何對現有的方法進行改進的。
常用的過濾所有價格相關信息的方法是在價格和與價格相關的其他詞(定價,收費,支付)上做關鍵詞搜索。然而,這種方法並不是很有效,因為幾乎不可能想到所有相關的關鍵詞及代表其特定的概念的變體。另一方面,CSS只是將概念(價格)的名稱作為輸入,並過濾所有語義相似的內容,即使沒有提到概念關鍵詞的明顯變體。
運行過程是這樣的,用人工智慧技術將每個詞轉換成超空間中的一個特定點,用這些點之間的距離來識別與我們正在探索的概念相似的信息。下面是一個可視化的例子:
在下面的例子中,我們可以看到上下文語義搜索演算法如何處理與Uber相關的評論。
同樣,看看這條評論:
在上述兩種情況下,演算法將這些消息分類為與「價格」概念相關,即使在這些消息中沒有提到價格。
Uber:深度分析
Uber是世界上估值最高的初創企業,它一直是共享經濟的先驅。Uber在全球500多個城市運營,服務於龐大的用戶群,每天都要收到大量用戶的反饋、建議和投訴。通常,社交媒體是註冊該賬號的首選。 大量的傳入數據使分析,分類和生成具有挑戰性的見解成為可能。
我們分析了數字媒體上關於一些產品主題的在線對話:取消、付款、價格、安全性和服務。
對於廣泛的數據來源,我們從Uber官方Facebook頁面上的最新評論,Twitter上提到Uber,以及Uber的最新新聞中獲取數據。這是所有渠道的數據點分布:
Facebook: 34,173 條評論;
Twitter: 21,603 條推文;
新聞: 4,245 篇文章。
分析用戶對話的情感可以讓你了解總體的品牌感知。為了深入了解,在上下文語義搜索演算法的幫助下進一步對數據進行分類是很重要的。
我們在同一數據集上運行上下文語義搜索演算法,將上述分類(取消、付款、價格、安全性和服務)考慮在內。
情感分析
引人注目的是,與所有類別相關的評論都有負面情感。與價格相關的正面評論數量超過了負面評論的數量。Facebook是一個社交平台,評論充斥著隨機的內容、新聞分享、營銷和宣傳內容以及垃圾郵件/垃圾/不相關的內容。看看Facebook評論的意圖分析:
Facebook評論的意圖分析
因此,我們刪除了所有這些無關的意圖類別,並複製了結果:
每個類別的情感都有明顯的變化。特別是在價格相關的評論中,正面評論的數量從46%下降到29%。
這讓我們看到了上下文語義搜索演算法如何從數字媒體中產生深入的見解。一個品牌可以分析推文,並從他們的正面觀點或從負面觀點中得到反饋。
情感分析
對獲得的推文也做了類似的分析。在最初分析的付款和安全相關的推文中有一種複雜的情緒。
為了了解真實的用戶意見、投訴和建議,我們必須再次過濾無關的推文(垃圾郵件、垃圾信息、市場營銷、新聞和隨機信息):
正面支付相關推文的數量顯著減少。此外,對於安全等級(以及相關的關鍵字)的正面推文數量也有顯著下降。
此外,取消、支付和服務(以及相關辭彙)是Twitter評論中談論最多的話題。似乎人們談論最多的是司機取消了他們的行程和取消了他們的費用。看看這條推文:
像Uber這樣的品牌可以依賴於這樣的意見,並對最關鍵的話題採取行動。例如,與服務相關的推文中,正面推文的百分比最低,而負面推文的百分比最高。Uber可以分析這些推文,並採取行動提高服務質量。
新聞
安全問題一直是新聞中談論度最高的話題。新聞內容的情緒總體上是正面的,也單獨的分成了很多類別。
我們也根據新聞的受歡迎程度來分類新聞。受歡迎程度是根據文章在不同的社交媒體上的分享次數。以下是一些頭條新聞:
被批評之後,Uber首席執行官離開特朗普顧問委員會。
#DeleteUber:用戶對川普簽發穆斯林禁用這一應用程序感到憤怒。
Uber員工也討厭自己的企業文化。
每次我們使用Uber,我們都在傳播它的社會危害。
憤怒的顧客正在刪除Uber應用程序,因為司機在抗議和罷工期間去了JFK機場。
結論
從社交媒體數據獲取有意義的見解的時代已經隨著技術的進步而到來。Uber案例研究讓你看到了上下文語義搜索演算法的威力。各公司最近一直在利用數據的力量,但要想獲得最深入的信息,你必須利用人工智慧、深度學習和智能分類器的力量,比如上下文語義搜索演算法和情緒分析。
TAG:ATYUN訂閱號 |