「深度學習創作」用《權力的遊戲》前五部訓練RNN生成第六部（原理解析）

新聞 08-25

1新智元報道

「深度學習創作」用《權力的遊戲》前五部訓練RNN生成第六部（原理解析）

《權力的遊戲》（英語：Game of Thrones）是一部中世紀史詩奇幻題材的美國電視連續劇。該劇以美國作家喬治·R·R·馬丁的奇幻文學《冰與火之歌》系列作為基礎改編創作。

按照作者計劃，《冰與火之歌》系列將有7部，目前出版至第5部。

「深度學習創作」用《權力的遊戲》前五部訓練RNN生成第六部（原理解析）

也就是說，從2011年開始，讀者對第六部《凜冬的寒風》的等待已經超過了6年。

近日，一位名叫Zack Thoutt的工程師在開源社區Github上發起了這樣一個項目：基於《冰與火之歌》前面五部作品，訓練RNN（循環神經網路）模型，進而生成第六部作品。

「深度學習創作」用《權力的遊戲》前五部訓練RNN生成第六部（原理解析）

訓練：你可能需要一塊GPU和TensorFlow1.0.

Zack在Github頁面上說：你是否已經受夠了一直在等待下一本《權力的遊戲》（GOT）圖書的出版？至少我是這樣的。所以我決定根據前五本《權力的遊戲》圖書訓練一個RNN模型，使用該神經網路的預測生成第六部。

他也表示，如果大家想訓練這一模型，你可能會需要一塊GPU和TensorFlow1.0.

他使用的是FloydHub和以下命令：

「深度學習創作」用《權力的遊戲》前五部訓練RNN生成第六部（原理解析）

用於訓練的前5部作品的文字資料在網上都能找到。

在這部由深度學習模型完成的「新作」中，還有許多問題沒有回答：瓊恩真的是一個蘭尼斯特-坦格利安人？那些狗如何統治7國？為什麼瓦里斯要毒害丹妮莉絲？

作者在項目介紹的最後也歡迎大家都一起來參與制作，共同唱響「冰與火之歌」。開源地址：https://github.com/zackthoutt/got-book-6。

為什麼是RNN？深度學習的基礎模型之一

RNN無疑是深度學習的主要內容之一，它允許神經網路處理序列數據，如文本、音頻和視頻。它們可以用於將序列編碼至不同層級的理解（抽象層次不同的知識表示）、標註序列，甚至從頭開始生成新序列。一個 RNN cell在處理序列數據時一直被重複使用，Share Weights。

RNN的核心特徵是「循環」，即系統的輸出會保留在網路里，和系統下一刻的輸入一起共同決定下一刻的輸出。

這一點符合著名的圖靈機原理。即此刻的狀態包含上一刻的歷史，又是下一刻變化的依據。這其實包含了可編程神經網路的核心概念，即，當你有一個未知的過程，但你可以測量到輸入和輸出，你假設當這個過程通過RNN的時候，它是可以自己學會這樣的輸入輸出規律的，而且因此具有預測能力。

「深度學習創作」用《權力的遊戲》前五部訓練RNN生成第六部（原理解析）

這裡A被稱作 controller（圖中是在處理序列數據，有個錯誤，最後應該是x3，y3）, 可以是FNNs（feedforward neural networks），也可以是RNNs，但RNNs能實現更多操作，因為它是 Turing Complete 的。

上文提到，RNN具有「記憶」能力，這也是為什麼它能實現預測的重要原因。具體到《權力的遊戲》圖書的生成，正式因為在前5部作品的訓練過程中的「循環」和「記憶」，讓模型具備「預測」第六部作品的能力。

RNN在語言研究中得到廣泛的採用。去年，谷歌就曾發布了一項名為「探索RNN極限」的研究，開源大規模語言建模模型庫，含有大約 10 億英語單詞，辭彙有 80 萬，大部分是新聞數據。

精彩內容分享：奈德依然活著，瓊恩是蘭尼斯特人！

這本由RNN生成的圖書的前五章目前已經公開，書中的情節與我們此前熟悉和喜愛的前五本一樣：包含了許多的轉折。

「深度學習創作」用《權力的遊戲》前五部訓練RNN生成第六部（原理解析）

以下是一些對話的摘錄：

珊莎實際上是拜拉席恩家族的人，詹姆很怕她，因為她是次子團的成員之一：

我害怕珊莎主人，大人」，詹姆提醒她說。「他們拜拉席恩家族是要道之一。也就是你的次子團。」

里克仍然是一個煩人的人：

「對你來說，有些事情是必須的」，一個女人慵懶的聲音響起，「天吶，里克。」

一個名叫Greenbeard的新主角出現在了劇情中：

「是的，佩特」，高大的男人舉起劍，將他擋在身後，並將巨大的鐵王座推向女孩衝過來的方向。

阿多回來了，現在，他除了「Hodor」，還會說一些新的單詞。

阿多看著他們低聲吼道，「你回家要走哪條路。」

奈德依然活著，並且瓊恩是蘭尼斯特人！

雙方都回來之後，他們立刻想到了希望他回答問題的方式。當瓊恩緩慢後退時，奈德在腦海中看到了他的斧頭和左手。

瓦里斯毒死了丹妮莉絲和另外一個人：

瓦里斯毒死了丹妮莉絲和另外一個人。當他醒來時，聽到一首舒緩的歌曲。

瓊恩騎著一條龍，開始變得有些狂躁：

瓊恩騎著龍，在天空極速繞圈。龍噴出的火焰在沙漠中形成一個個燃燒的大坑。

詹姆殺掉了瑟曦，瓊恩變成狼：

詹姆殺死了瑟曦，他非常冷血，一直在自言自語，瓊恩認為他是現在的狼……

他們決定讓狗來做決定：

「問那些狗。」

整本書以一段怪異的描述結尾：

在一場冬季的暴風雪中，瓊恩作為坦格利安人的一面得到全面的展示 ……

正如開源項目作者本人在提到，在這部由深度學習模型完成的「新作」中目前只完成了前五章，還有許多問題沒有回答：瓊恩真的是一個蘭尼斯特-坦格利安人？那些狗如何統治7國？為什麼瓦里斯要毒害丹妮莉絲？……

如果你想嘗試一下，去Github找他，或許你可以生成《紅樓夢》的續集呢？

點擊閱讀原文可查看職位詳情，期待你的加入~

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※「融資愈艱」初創公司必須考慮的三件事，1萬多輪融資數據分析
※深度學習創作：用《權力的遊戲》前五部訓練RNN生成第六部
※如何評價馬斯克等116名AI專家呼籲禁止「殺手機器人」？衛報：太晚了
※融資愈艱：初創公司必須考慮的三件事，1萬多輪融資數據分析
※「專訪」KDD2018主席熊輝教授：數據挖掘與深度學習結合新趨勢

TAG:新智元 |

您可能感興趣

※帶你用4行代碼訓練RNN生成文本
※文本挖掘：LDA文檔主題生成模型
※世界首創！CRISPR 調控單一基因位點生成幹細胞
※結合通用和專用NMT的優勢，CMU為NMT引入「語境參數生成器」
※「九歌」——基於深度學習的中國古典詩歌自動生成系統
※PHP生成推廣海報的方法
※五臟生成篇第十（四）
※清華大學矣曉沅：「九歌」——基於深度學習的中國古典詩歌自動生成系統｜AI研習社69期大講堂
※五臟生成篇第十（三）
※五臟生成篇第十（二）
※RNN-生成古詩
※PHP 生成 CSV 文件
※《殭屍世界大戰》AI程序化生成核心特色解釋
※五臟生成篇第十（六）
※五五開穢土轉生成功？盧本偉成功報名CSGO的DH大師賽！
※《看門狗：軍團》開發者解釋遊戲NPC生成系統
※五臟生成篇第十（七）
※無需預訓練超越經典演算法，上交大提出合作訓練式生成模型CoT
※Chatito-使用簡單的DSL為AI聊天機器人、NLP任務、命名實體識別或文本分類模型生成數據集
※深化中國詩歌語言藝術原理及生成規律研究