當前位置:
首頁 > 最新 > 人工智慧並沒有解碼伏尼契手稿 卻增加了更多神秘

人工智慧並沒有解碼伏尼契手稿 卻增加了更多神秘

▲2016年在西班牙進行質量控制的伏尼契手稿的臨摹。圖片來源:GettyImages

如果你正在編製一份世界上最奇怪的100件物品的清單(人類幾千年文明以來最怪異的東西),那麼你就得為伏尼契手稿留出空間了。它有600年的歷史,用一種沒人能讀懂的語言寫成。這是一個真正的世界級的秘密。這大概就是為什麼本周世界各地的新聞編輯室都爭先報道「人工智慧破譯伏尼契手稿」的故事,他們抓住了這個機會。

當然,人工智慧並沒有破譯。根據專家的說法,伏尼契手稿保持著一如既往的神秘莫測。但是,弄清楚為什麼人工智慧不能「解碼」這篇手稿,以及它究竟在什麼程度上增加了伏尼契時代的歷史,倒是有自身的價值。它還強調(如果需要進一步強調的話),這份手稿是一個極其古怪的東西。

引發這些報道的研究是一篇名為「解碼用未知語言和文字寫的迴文構詞法文本(Decoding Anagrammed Texts Written in an UnknownLanguage and Script)」的論文。它是在2016年出版的,但它是在去年的一次會議上被提及的,在本月早些時候被一些記者發現。在這篇文章中,計算機科學教授Greg Kondrak和研究生Bradley Hauer描述了一種找到密碼文本源語言的方法,然後將該方法轉化為手稿本身,並認為它最初是用希伯來語寫成的,然後在縮寫為現在的形式。

這是一種說法,如果屬實,那就真的是揭開世界未解之謎的神秘面紗了。這篇240頁的伏尼契手稿是用一種未知的字母寫成的,這是從未見過的。這個手稿由大約25到30個不同的人物組成(解釋不同),全文從左到右,用一種優雅的方式書寫。這本書共有130多幅精美的奇異植物插圖,都是無法辨認的植物,還有一些占星圖、城堡和龍的塗鴉,還有一個特別奇怪的部分,那就是裸體女人沐浴在由流動管道連接的水池中。它看起來像一個古代水上公園的地圖,但學者們認為它可能有醫學或鍊金術方面的意圖。

▲在所謂的「balneological」一節的眾多插圖中,有一幅描繪了許多裸體女人沐浴在一種未知的液體中。圖片來源:creative common

大多數人認為手稿是用替代密碼寫成的。這是最簡單也是最古老的一種編碼方式,在這類代碼中,字母表中的字母被替換為虛構的字母。問題是,幾百年來的研究一直無法找出伏尼契手稿最初是用哪一種語言書寫的。

「從來沒有人對(伏尼契手稿屬於)任何一種特定的語言提出過令人信服的理由,我看到了一些建議,比如阿拉伯語、阿茲特克語、羅馬語、拉丁語、義大利語。美國中世紀學院的執行理事、專於伏尼契的Lisa Fagin Davis說。Davis認為人們傾向於研究「古地理、法醫和藝術相關的證據」,來找到來源於那一個國家,使用哪一種源語言,但她補充說人們也使用了計算分析。

計算分析是Kondrak和Hauer試圖解構手稿的工具。他們認為,就像之前的許多密碼學家一樣,通過計算文本的某些特性 -- 比如,每封信的頻率和字母組合的出現頻率 -- 他們可以創造出一種統計指紋,可以與其他語言進行比較。

每一種語言都可以基於這樣的統計數字「指紋」

因此,他們訓練了大量的演算法來挑選這些指標,並將《世界人權宣言》(使用了多達380種語言)作為他們的樣本。儘管有些報道指出,這一過程並不涉及神經網路或深度學習,僅僅是老式的統計分析,即大量的計數和百分比。但它成功了!根據伊利諾斯理工學院的計算語言學家Shlomo Argamon教授的說法,初步的測試結果「也許有點值得懷疑,但比在科學文獻中經常發表的許多其他結果更好一些。」因此,憑藉他們的演算法模式對應的訓練和測試,Kondrak和Hauer轉向了伏尼契手稿。專家們說,這有很多漏洞。

問題並不是任何一個單一的錯誤,而是一系列的假設和遺漏,使Kondrak和Hauer在解釋他們的結果時更落後了一些。

第一個很簡單:他們的演算法接受了現代語言的訓練,但手稿的碳含量可追溯至15世紀。所以,如果它最初是用希伯來語寫成的,它應該是用15世紀的希伯來語寫成的。「語法、拼寫和辭彙會有很大的不同,特別是對於像伏尼契手稿(與聖經或禮拜儀式不同)這樣的科學的手稿。」Davis說。

第二,儘管Kondrak和Hauer的演算法可以為密碼文本的源語言提出建議,但它不能評估這些匹配的可能性。所以當他們說希伯來語是手稿中得分最高的,而沒有對可能性進行評級時,這是一種毫無意義的吹噓。「總得有人得到最高的分數,他們提到了其他一些排名很高的語言。我記得,一個是馬來語,這是一種非常不同於希伯來語的語言。」 Argamon說。

第三個假設可能是問題最大的:Kondrak和Hauer聲稱,除了作為替代密碼,伏尼契手稿也存在字母顛倒的寫法,所以每個單詞的字母都是亂寫的。這並不是伏尼契學的一個新建議,但它遠非一個既定事實。它也完美地建立了Kondrak和Hauer的研究的最終「成功」:將伏尼契手稿的開頭句翻譯成英語。

▲一頁的伏尼契臨摹,手稿中許多植物插圖。圖片來源:Getty Images

這句話的意思是:「她向神父、眾議院的人、我和人民提出了建議。Kondrak說:「一份手稿最開始的一句話是一種奇怪的句子,但它確實是有意義的。」但即使是在論文中,他和Hauer也描述了他們是如何編造翻譯來產生這個結果的。他們的第一次嘗試「不太連貫」,一位現代希伯來語的發言人說,他們必須在把這些字元輸入谷歌翻譯之前做出「幾個拼寫糾正」來產生上述結果。(「任何時候你不得不求助於谷歌,而不是那些真正研究過這種語言的人,所以你會失去一些可信度,」 Fagin說。)

但是,用字謎寫出的手稿變得更加重要。Argamon指出,希伯來語是一種「abjad」,意思是沒有母音的腳本。如果你假設手稿是用希伯來語寫成的,並且手稿是用字謎寫的,那麼它就會變得更容易「翻譯」。你不僅可以重新排列單詞中的所有字元,以找到有意義的東西,還可以添加自己的母音。這意味著「大量隨機的字母組合形成了連貫的單詞,」Argamon說。再加上Kondrak和Hauer做了拼寫糾正,並依賴谷歌翻譯(這是一款看起來對內容沒有什麼意義的軟體,它經常會把胡言亂語變成連貫的句子),你就能明白為什麼專家們對此持懷疑態度了。

Argamon說。「關鍵是他們的方法…給他們很大的自由度來做這種印象派的解釋,」Nick Pelling,一個在這個問題上寫過大量文章的伏尼契專家,更加直接的表示「他們把這個被解碼的句子,用厚厚的眼鏡斜視著,然後告訴我們這對我們來說已經夠好了。」當The Verge問到他認為論文的結論正確可能性時,他說:「基本上接近於0%」

那麼,「人工智慧可以解碼神秘的600年前的手稿」?並非如此。

對於Kondrak和Hauer這件事上(這些故事經常是這樣的),媒體當然應該為這種誇張的行為承擔大量的責任。Kondrak和Hauer承認他們的研究只是一個「起點」,我們採訪的專家們也承認可以認識到他們潛在演算法的效用。專家們只是說,有太多錯漏的步驟,以至於不能對手稿本身提出結論。

在很多方面,用「人工智慧」來破解伏尼契手稿的嘗試是有意義的。The New Yorker的一篇關於手稿歷史的文章將其描述為「一幅完美的畫布,用來表達我們對困難、恐懼和神秘的擔憂」,同樣這也可以用來形容人工智慧。在當代的媒體環境中,這些多樣化和複雜的技術團隊經常被用來作為對自動化和無法控制的機器智能的恐懼的代替者。AI解碼伏尼契手稿就像是觀看哥斯拉與摩特拉的戰鬥:這一場面太有趣了,我們根本不關心,也不在乎細節。

儘管如此,對於專家來說,手稿仍然無法被解析的事實可能是一種解脫。畢竟,如果你花了數年的時間試圖破解一份神秘的文件,而某個不流血的機器在一夜之間就能破解它,那將對你是一種打擊。

正如Pelling在最後一封電子郵件中所說:「通過我的書…和我的博客,我可能寫比任何一個在世人更多關於伏尼契的實際歷史研究:我為此做了演講,在廣播和電視紀錄片中做過很多次採訪…但懂我仍然不能讀它。:-)」

神秘還在繼續,未解之謎仍未解開。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雅昌藝術網 的精彩文章:

倫敦蘇富比重要晚拍焦點拍品畢加索非凡肖像畫率先亮相香港
朱中原:書壇時流不等同於書法學術

TAG:雅昌藝術網 |