當前位置:
首頁 > 科技 > 《邪不壓正》評分持續走低,上萬條網友評論揭秘,是救救姜文還是救救觀眾?

《邪不壓正》評分持續走低,上萬條網友評論揭秘,是救救姜文還是救救觀眾?

萬眾期待的《邪不壓正》已上映有一周時間。

但上映當日早上開畫8.2,上映不到一天閃崩到7.1的評分好像已經給這部片子本該大展拳腳的片子,戴上了一個結結實實的囚具。

首日票房雖然過億,卻依舊不敵多日日票房冠軍《我不是葯神》;難道姜文又搞砸了?不管如何,姜文的電影總能掀起影評人高漲的評論熱情。

本文就看看網友對這部姜文電影的感受到底怎麼樣。接下來,筆者將會用貓眼上萬條評論數據來分析,網友對這部電影的反響究竟如何?整體思路,將會從數據獲取、數據處理、數據可視化三部曲來進行:

數據獲取

關於如何獲取網頁的數據,筆者一直也是推薦三步走:下載數據、解析數據、保存數據。在下載數據之前,我們看看貓眼官網的網頁結構,看看網友的評論數據介面究竟在哪?

然而,打開貓眼網頁(http://maoyan.com/films/248566)只有寥寥幾個評論,那它的數據會不會是通過json格式保存到伺服器中呢?無奈只能通過抓包貓眼APP來找其數據介面。

最後,發現其數據介面為:http://m.maoyan.com/mmdb/comments/movie/248566.json?_v_=yes&offset=1,其中258566屬於電影的專屬id,offset代表頁數

最後檢驗,這個介面只給展示1000頁數據,如下:

介面找到後,開始寫爬取數據代碼,詳情代碼如下:

數據處理

獲取數據後發現,會有一些數據重複,如下圖:

因此需要腳本批量對數據進行去重處理,詳情代碼如下:

每天可以不定時(每隔四五小時獲取一次數據,基本每次可獲取900多條數據),最終筆者獲取到7/15-7/18之間上萬條來作為數據集分析。

數據可視化

今天我們就用pyecharts將清理過後的萬條評論數據來實現可視化。pyecharts 是一個用於生成 Echarts 圖表的類庫。Echarts 是百度開源的一個數據可視化 JS 庫。用 Echarts 生成的圖可視化效果非常棒,pyecharts 是為了與 Python 進行對接,方便在 Python 中直接使用數據生成圖。(詳情請看:http://pyecharts.org/)。

粉絲北上廣及沿海一帶居多。

由上圖,可以看出北上廣一帶的用戶相對較多,這些地方的互聯網用戶基數本來就大,同時沿海一代的三四線城市也成為票房貢獻者的一部分。

詳情代碼如下:

評論兩極分化相對嚴重

獲取到近幾日的網友上萬條評論數據後,我們切換到今天主題,看看網友對這部電影究竟評論如何?

我們將數據集中的評論內容提取出來,將評論分詞後製作如下詞雲圖:

可以看出,排名靠前的熱詞分別是姜文、不錯、好看、彭于晏、劇情、看不懂等,可以看出大家對電影的評價還不錯,同時估計還有一大部分粉絲是專門看國民老公彭于晏的裸奔與八塊腹肌的(哈哈哈)。

至於劇情方面,相對於《讓子彈飛》,《邪不壓正》用了更「姜文」更癲狂的方式來講了一個相對簡單的故事。

從砰砰砰幾槍打出片名的那一刻起,影片就在一個極度亢奮的節奏之下不停向前推進著,伴隨著應接不暇的戲謔台詞,姜文無時無刻不在釋放自己的任性,太瘋了,甚至有些極端。對於普通觀眾來說,太難消化了,上一秒還沒琢磨明白,下一秒又迎來了一個亢奮且莫名的環境和台詞中(也驗證評論中一部分網友對劇情看不懂的評價)。

詳情代碼如下:

一星級影評佔比高達20%

圖中可以看出,五星級比例接近40%,而一星級比例與四星級比例幾乎差不多,幾乎為都為20%。(備註:一星級數量等於1與0.5的總和,以此類推)

很明顯,姜文再次掀起了影評人和觀眾的論戰,儘管姜文對影評人並不友好,但影評人還是願意去袒護姜文。其實,姜文的電影關鍵在於你期待什麼?類型片?姜文拍的從來都不是類型片。藝術片?姜文的電影里的藝術不是一遍就可以看懂的。他的電影就是帶著一種「後搖風格」,濃烈、生猛。

姜文和觀眾都很自我,姜文端著,不肯向市場低頭;觀眾正是因為沒端著,所以看姜文的電影過於疲憊。誰都沒錯,誰都不用救。

詳情代碼如下:

關於《邪不壓正》網友評論數據就分析到此結束!

你覺得《邪不壓正》不好看是對的,因為它太姜文了。你若覺得《邪不壓正》好看也是對的,因為它真的太姜文了。成也姜文,敗也姜文!但這也許就是他孤傲的世界吧。

聲明:本文轉載自戀習Python,版權歸對方所有。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 CSDN 的精彩文章:

掉隊的魅族還能和小米平起平坐嗎?
我竟然被機器強行解僱了!

TAG:CSDN |