Deezer的AI可以根據情緒強度歸類歌曲
VentureBeat稱,Deezer研究員已經研發出了能夠將某些歌曲與情緒和強度聯繫在一起的AI系統,其發布在Arxiv.org新出版的一篇名為《基於深度神經網的音頻歌詞音樂情緒檢測》的論文里。
為了判斷一首歌的情緒,該團隊考慮了音頻信號和歌詞。一開始,他們把音頻信號投入一種帶有重建語言語境模型的神經網路。然後,通過使用一種存儲超過100萬首當代歌曲的元數據集——音樂推薦數據集( Million Song Dataset MSD),來教它怎樣判斷一首歌的情緒。再用Last.fm數據集,這個數據集可以分配標識給來自50多萬個獨一無二標籤的軌跡。許多標籤都是和情緒相關的,從這些標籤中,超過1萬4000多個英文單詞被賦予兩個刻度等級,和一個詞是多麼的積極、消極、安靜、活躍聯繫在一起,來訓練這個AI系統。
MSD只是包含歌曲元數據,而不是歌曲本身,所以該團隊用些像歌名、藝術家、專輯名一樣的身份標識,將所有信息給Deezer的目錄羅列出來。約有60%的結果數據集(18,644條軌跡)用來訓練AI,剩下的則用來驗證和進一步測試該系統。
人們認為這種系統可以進一步觀察音樂、歌詞和情緒如何聯繫。
最後,研究員稱,AI相比於更傳統的方式,能夠更好地檢測出歌曲是多麼平靜和活躍,但當檢測歌曲有多麼積極或消極時,卻和傳統方式表現無異。「似乎這次的收穫就是我們的模型,尤其在預測「價」時,能夠揭曉利用音頻和歌詞之間的中間聯繫。」研究員在論文中寫道。
論文中也提到過,為了真的藉助這個產品,一個帶有同步歌詞和音頻的資料庫將會大有幫助。如果這樣的資料庫存在,那麼該團隊認為他們可以更精確的判斷模糊不定的音軌情緒,因為「某些情況,聽眾之間會有很大的波動。」(比如人們不會總是覺得一首歌是積極的還是消極的)。最後,研究員認為,這種系統可以進一步研究音樂、歌詞和情緒是如何聯繫的,還有可能區分和發現高音量時未貼標籤的數據的深度學習模型。
這與Deezer之前第一次試圖用AI區分歌曲來看,相去甚遠。去年,Deezer用在Sónar festival的一項挑戰回答了這個問題:「用戶在家時,我們怎樣檢測他們是在聽歌還是恰好在推薦歌曲呢?」。理論上,在未來學習中,Deezer能夠使用這類機器自動地區分和歸類歌曲——不僅僅是用藝術家的名字或音樂種類這種基礎的元數據,而是一些更細緻入微的東西,比如情緒。
本文譯自 theverge,由譯者 Ayeshanyoga 基於創作共用協議(BY-NC)發布。


TAG:煎蛋 |