當前位置:
首頁 > 最新 > 五大性格特徵分析

五大性格特徵分析

神經網路技術起源CNNvs.RNN

神經網路技術起源於感知機(perceptron),由輸入層,輸出層和一個隱含層構成。這種單個隱含層的感知機無法處理較為複雜的函數,所以擁有多個隱含層的多層感知機隨之問世。

CNN(Convolutional neural network,卷積神經網路)是一種前饋神經網路,參數從輸入層向輸出層單項傳播。CNN是一個多層的神經網路結構,和多層感知機相似,也是由輸入層,輸出層和多個隱含層構成。其基本運算單元包括卷積運算,池化運算,全連接運算和識別運算。卷積神經網路在影像識別有其優勢,這得益於卷積神經網路的權值共享網路結構降低了網路模型的複雜度也減少了權值的數量。RNN(Recurrent neural network,遞歸神經網路)不同於前饋神經網路,RNN可以將狀態在自身網路中循環傳遞,這種特性使其善於處理序列數據,而其在處理圖像輸入方面則遠遜於CNN。

Five personality traits五大性格特質

Openness to experience

經驗開放性:得分高者創造力強好奇心重,得分低者持之以恆小心謹慎。

Conscientiousness

盡責性:得分高者做事有效率且有條理,得分低者較為隨意和放鬆。

Extraversion

外向性:得分高者外向有活力但容易過分在乎別人的注意,得分低者孤僻保守但善於和自己相處。

Agreeableness

親和性:得分高者友好有同情心但容易太看重別人的感受,得分低者冷漠不平易近人但會比較強勢。

Neuroticism

情緒不穩定性:得分高者容易敏感和緊張但富有激情,得分低者平靜穩定但會對一些事情漠不關心。

利用CNN進行五大性格特徵分析

這裡將介紹新加坡南洋理工大學和墨西哥國立理工學院的四位學者所研究的方法。

這個項目採用了2467個匿名短篇文章作為數據組,運用一個7層結構的CNN對每一篇文章的作者進行五大性格特徵分析(即對每一項性格特徵進行Yes/No判斷)並與真實結果進行對比來得出準確率。這個方法主要分為五個步驟;

Preprocessing:對文本進行分割,除去對性格分析無用的標點符號和特殊符號,並將所有字母小寫化。

Document-level feature extraction:用Mairesse baseline特徵集進行文獻級的特徵提取,例如單詞數和句子平均長度。

Filtering:將一些對性格分析貢獻很小的句子去除,這樣既減少了對分類器的干擾同時也減短了訓練的時間。

Word-level feature extraction:把每一個單詞用詞嵌入(word embedding)來表示,即把單詞矢量化,這個項目使用了Google推出的詞嵌入工具word2vec。

Classification:在分類上使用了一個深度CNN,它的第一層對文本進行分級處理 用word2vec將單詞表示為固定長度的特徵矢量,並把句子表示為單詞矢量的組合。同理在下面一些層中會出現句子嵌入(sentence embedding), 即把句子表示為固定長度的矢量,文獻表示為句子矢量的組合。在最後的幾層中會把文獻表示為固定長度的矢量並用於最終的分類(Yes/No)。在這個項目中有五個神經分類器對五種性格特徵分別進行分類。

結論

CNN能處理多種不同類型輸入的特質使其成為當前炙手可熱的神經網路模型之一。日本會津大學的一項實驗表明了CNN相對於RNN在性格特徵分析上有更高的準確度。

在對輸入文本進行性格分析時,一個重要的步驟是詞嵌入。詞嵌入將單詞矢量化,並與感情相近單詞的矢量進行對比得出一個接近程度,例如使用餘弦值來表示。同樣地,我們可以進行句子嵌入,文獻嵌入,得到文獻矢量進行最終的文類。五個分類器對五種性格特徵分別分類的方法避免了干擾。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 astromind 的精彩文章:

TAG:astromind |