淺談《基於神經網路的電影票房預測建模》
首先,模型結合中國內地電影市場的實際情況,確定電影票房的影響因素;其次,對這些影響因素進行量化處理,形成神經網路能夠接受的數據格式;此外對電影歷史數據去噪處理,構建反饋神經網路(BPNN)的訓練集,由此初步確定神經網路的預測模型以及輸入——輸出的映射結構;最後,在BPNN預測結構基礎之上通過預測演算法以及流程的改進,確定最終的基於多層反饋神經網路的票房預測模型(BRP模型)。
變數選取:
模型選取的影響因子:導演、第一主演、第二主演、第一類型、第二類型、發行地區、上映檔期。將前5周的累計票房作為電影的總票房。
票房:考慮到每部影片的上映天數不盡相同,模型選取每部電影上映前5周的累計票房作為該部影片的上映期的累計票房收入。因為動畫類型電影特殊性,基礎數據中剔除了動畫類型電影數據。
導演:導演i的票房影響力指標為Dir(i):
其中:i表示導演序號;j表示導演i參與拍攝的的第j部電影;k表示上映的周次;m表示導演i參與拍攝的所有電影中,上映時間距離現在時間最近的m部電影;表示最近第j部電影的上映的第k周內產生的票房。即用導演最近m部影片的平均票房作為衡量導演的影響力。
為進一步得到導演對其執導電影的影響權值,該模型選取DriectorWeight作
為衡量指標,其中
i表示導演的序號,表示第i個導演的影響力。
演員:演員的衡量指標採用來表示。
i表示演員的序號,j表示主演i參與拍攝的第j部影片,k表示上映的周次,m表示主演i參與拍攝的所有電影中,上映最近的m部電影,表示最近上映的第j部電影在上映的第k周產生的票房。
為演員i參與的最近第j部電影的參演係數,
n為正整數,表示演員i在第j部電影中主演的名次順序。
其中主演i的影響力對參與的電影的票房影響力權值用ActorWeight表示,其中
電影類型:電影類型參考的是IMDB的分類,將影片劃分為:愛情片、災難片、懸疑片( 冒險、犯罪) 、恐怖片( 驚悚) 、戰爭片、紀錄片( 傳記、歷史) 、家庭片、戲劇( 音樂、戲曲) 、科幻片( 魔幻、奇幻) 、喜劇片、動作片( 武俠、古裝) 、劇情片( 故事)12種類型。
電影類型i的票房影響力指標其中i表示類型序號,k表示上映的周次,m表示類型i的電影總量,j表示屬於類型i的第j部電影,表示內容類型為i的第j部電影在上映的第k周內產生的票房。
同時採用GenreWeight作為該類型電影的票房影響力權值,
國家地區:模型將電影製片公司所在國家或地區將電影分為歐美、日韓、港台、中國內地和其他地區五個類型。
其中用表示國家或地區i的票房影響力,,i表示發行地區的序號,i的取值和地區相對應,k表示上周的周次,m表示發行地區屬於地區i的電影總數,j表示發行地區屬於地區i的第j部電影,表示發行地區i的第j部電影上映的第k周內產生的票房。
發行地區i的影響力對發行地區屬於該類型的電影的票房影響力權值。i表示發行地區序號,,表示發行地區i的影響力,表示發行地區的j的影響力權值。
上映檔期:該模型根據我國假期特點,將假期分為5個,分別為:五一檔(4月27日至5月10日),暑期檔(7月1日至9月1日),國慶檔(9月27日至10月10日),賀歲檔(正月初一至正月十五)和其他檔期。
檔期i的票房影響力指數用,其中,i表示檔期的序號,i的取值和檔期相對應;k表示上映的周次,m表示上映日期在檔期i的電影總數,j表示上映日期在檔期i的第j部電影,表示上映檔期在檔期i的第j部電影上映的第k周內產生的票房。
電影票房的影響權值其中,,其中,,i表示上述檔期序號,表示檔期i的影響力。
神經網路演算法:
該模型採用的是神經網路演算法,將這七個因素作為輸入層的七個神經元,激活函數採用Sigmoid函數,x表示上一層的所有神經元對本層神經元的凈輸入。歸一函數採用,j表示電影序號,k表示上周的周次,表示第j部電影在上映的第i周內產生的票房,表示可用於BPNN訓練的第j部電影上映截止到第k周階數時的累計票房,。最後模型在BPNN預測結構基礎之上通過預測演算法以及流程的改進,確定最終的基於多層反饋神經網路的票房預測模型(BRP模型)。
神經網路模型的優缺點:
本模型的不足之處:
1、模型中每個變數僅選取平均票房作為衡量指標,衡量方法過於單一。衡量導演和演員等因素也需要考慮影響火熱程度等。
2、檔期的劃分存在一定不足之處。每年各個檔期的放假時間基本上不太相同,尤其春節檔等按陰曆放假的檔期,該模型把檔期固定在每年固定的時間段應該是不太合理的。
3、模型僅引入導演、演員、類型、檔期和發行檔期這些因素,並未考慮更多因素,例如:發行公司和宣傳公司,影人之間的合作交叉效應等。
本模型的優點:
1、該模型對每個變數都進行了一個加權,而非一個簡單的引入。模型給出了各個變數的權重,權重的計算方法值得參考。
2、模型採用的演算法為神經網路,相對於多元回歸等模型更先進,預測精度更加高。
3、該模型對演員的衡量時,採用票房和演員在該部影片順序加權,這種衡量演員對票房的貢獻方法值得參考。
參考文獻:
[1] 鄭堅,周尚波. 基於神經網路的電影票房預測建模[J]. 計算機應用,2014,(34):742—748


TAG:廣義禎 |
※「類傳銷」的互聯網升級版?電影《壞爸爸》預售票房模式被質疑
※《閃電俠》大電影導演敲定!
※粵語電影:經典香港電影(一)
※電影《水形物語》預熱
※裴秀智電影《建築學概論》:精彩電影不容錯過!
※《海盜電台》主演加盟萌神電影《大偵探皮卡丘》
※《不良街區》亮相東京電影節,電影品質加網感細節成就「中國網大代表作」
※《神秘巨星》單日票房穩居第一 印度電影成中國電影市場新票倉
※電影推薦與評論《正午》
※都市懸疑題材正當紅,網易雲閱讀小說《詭當》改編系列電影
※【電影】戀愛迴旋
※《夜不語》曝光先導預告 懸疑科幻電影風格初探
※網路電影《愛在你消失之後》開機 青年導演觸電閃婚現實題材
※電影視界 《情書》
※日本電影《戀愛迴旋》以運動題材的電影 即將上映國內影院
※《蜘蛛俠 英雄歸來》導演跳槽DC,執導電影《閃電俠》
※新武俠電影《白夜俠》在京舉行發布會;港式經典武俠電影回來了
※看文章送《紅海行動》的電影票啦
※商業化式的電影票房
※《捉妖記2》年度垃圾電影 高票房 《紅海行動》國產良心電影 拍片量低 可悲