當前位置:
首頁 > 新聞 > AI發現莎士比亞經典劇作有代筆,幾乎一半場景由他人寫就

AI發現莎士比亞經典劇作有代筆,幾乎一半場景由他人寫就

5G 極化碼之父

埃爾達爾·阿里坎教授

確認出席 EmTech China 全球新興科技峰

文學分析家們早就注意到,莎士比亞戲劇《亨利八世》中有另一位作者的痕迹。現在,神經網路已經識別出了這些特定場景,以及這些場景是誰寫的。

圖|莎士比亞《第一對開本》戲劇集(來源:AP)

在威廉·莎士比亞的一生中,他大部分時間都是 King』s Men 劇團的劇作家,該劇團在倫敦泰晤士河岸邊演出莎士比亞戲劇。1616 年,莎士比亞去世後,劇團需要一個人來接替他的工作,於是他們請來了當時最多產、最著名的劇作家之一約翰·弗萊徹(John Fletcher)。

自此之後,弗萊徹銷聲匿跡。

但是在 1850 年,一位名叫 James Spedding 的文學分析家注意到,弗萊徹的劇本和莎士比亞的《亨利八世》中的段落有驚人的相似之處。Spedding 斷定弗萊徹和莎士比亞在劇本中一定有過合作。

Spedding 的證據來自他對兩個作者的語言特質研究,以及這些特質是在《亨利八世》中哪些地方體現的。例如,弗萊徹經常寫 ye 而不寫 you,寫』em 不寫 them。他還傾向於在標準的五音步詩行中加上 sir 、 still 或者 next 這些詞,這樣就多了一個額外的第六音節。

這些特徵使得 Spedding 和其他分析者認為,弗萊徹一定參與了劇本創作。但是,對於該劇本究竟是如何分配的,仍存在很大爭議。還有一些評論家認為,另一位英國劇作家菲利普·馬辛格(Philip Massinger)實際上也參與了莎士比亞的劇本創作。

分析人士和歷史學家都很想確定,是誰參與了《亨利八世》創作,寫了哪些部分。

然而現在,捷克科學院的 Petr Plechá?表示,他已經解決了這個問題。他使用機器學習來識別劇本的每一行文字,然後判斷作者是誰。「我們的結果高度支持 James Spedding 提出的經典推斷,即威廉·莎士比亞和約翰·弗萊徹共同創作了《亨利八世》」,Plecha?說。

從原則上來看,這種新方法直截了當。多年來,人們一直使用機器學習演算法來識別作者獨特的寫作模式。

機器學習使用作者的大量作品來訓練演算法,並使用一個不同的、更小的作品來測試演算法。然而,一個作家的文學風格在其一生中是有可能產生變化的,所以,確保所有作品都有相同的風格是很重要的。

圖 |《亨利八世》中莎士比亞和弗萊徹的貢獻比例(來源:論文)

只要演算法學會了作者最常用的單詞和語句模式,它就能在從未見過的文本中識別出這種風格。

Plecha?採用的就是這種技術。他首先訓練演算法,使用與《亨利八世》同時期創作的其他劇本,如《科里奧蘭納斯的悲劇》《辛白林的悲劇》《冬天的故事》和《暴風雨》等來識別莎士比亞的風格。

然後,他訓練演算法識別約翰·弗萊徹的作品,使用的是弗萊徹當時寫的劇本——Valentinian, Monsieur Thomas, The Woman』s Prize, 以及 Bonduca。

最後,他在《亨利八世》上運行演算法,並讓它通過滾動窗口技術來瀏覽劇本,從而確定劇本的作者。

結果很有趣。演算法印證了 Spedding 的分析,即弗萊徹寫了戲劇中幾乎一半的場景。同時,該演算法允許能使用更細粒度的方法來揭示作者在新場景中,甚至在前一場景結束時是如何改變風格的。例如,在第 3 幕第 2 場,演算法顯示在第 2081 行之後出現了不同作者的風格,隨後莎士比亞在第 4 幕第 1 場開始之前的第 2200 行完全取代了之前的風格。

Plecha?也訓練演算法來識別 Philip Massinger 的作品,但發現幾乎沒有證據表明他參與了創作。Plecha?總結道:「Philip Massinger 不太可能參與劇本創作。」

這是一項有趣的工作,它展示了語言學家和文學分析家如何使用機器學習來幫助我們更好地了解人類的文學歷史。

然而,在這之前還有許多工作要做。例如,機器視覺演算法能識別藝術風格後,計算機科學家很快就想出了如何提取一種藝術風格並將其應用到其他圖像上,這使用的是一種稱為「神經風格轉換(neural style transfer)」的技術。於是,一夜之間,一張普通的照片就可能被賦予梵高或莫奈的風格。

這就提出了一個問題,類似的技術是否也適用於文本。有沒有可能把一篇散文,或者是《麻省理工科技評論》的一篇文章,變成莎士比亞或者約翰·弗萊徹的風格?

可惜的是,現有的演算法除了用 them、』em 之類的詞來識別文字風格之外,還沒有更好的識別能力。這主要是因為語言學家或他們的演算法沒有很好地理解文字的底層結構。

-End-

參考:

arxiv.org/abs/1911.05652

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

數據的變化正驅動計算革命,晶元巨頭為何押注這兩大突破性方向?
三千餘人都現場參加過的科技峰會到底有什麼魅力?