AI進軍筆跡鑒定:「你寫的每個字都將成為呈堂證供」
By 超神經
在刑偵探案的影視劇里,經常能看到有「筆跡鑒定專家」的出現,這些人會通過現場留下的字跡,來初步判定一個人的身份、年齡、心態。
現在通過 AI 手段就可以直接判定出,寫作人的國籍身份,從而免去了更多調查取證的工作。
在 20 世紀 80 年代,一個所謂的納粹收藏家帶著 60 本「希特勒日記」來到了德國的一家出版社。
該出版社花費 230 萬美元買下了這些日記,並把轉載權賣給了多家外國報社。
其中《泰晤士報》邀請了多名專家,以一份希特勒的手稿為樣本,進行了筆記鑒定,專家們得出的結論是:真的!這就是希特勒的字跡!
不過隨後的紫外線檢測中發現,這套日記的紙張中,出現了一種特殊的配料,而這種配料其實在 1954 年才開始使用。
這套日記肯定是偽造的了,那麼專家對於筆跡鑒定的結果也都錯了嗎?
其實也沒有,最後調查中發現,因為那些用於對比的真實數據集,也就是所謂「手稿」。其實也是那個騙子收藏家偽造的。
筆跡鑒定很重要
筆跡是一種能反映本人特有的書寫動作習慣的一種特殊痕迹。而筆跡鑒定,則是通過對兩部分或多部分筆記之間的比較鑒別,來判斷是否為同一人所寫。
筆跡鑒定也常用於處理一些藝術品、合同書、遺囑之類的糾紛,現在通過 AI 手段就能直接進行筆跡鑒定確認其國籍。
暫時只針對五個國家
通過該演算法,AI 可以對一個人的手寫英文文本進行分析,從而確定其國籍。
目前該技術僅能判斷參與人員的國籍是否屬於馬來西亞、伊朗、中國、孟加拉國和印度這五個國家。
研究人員選擇了 100 位來自這些國家的人作為實驗對象,讓他們手寫一篇 500 行的英文文章,以此作為機器學習的數據集。
通過名為「」Cloud Of Line Distribution(譯作線分布雲,簡稱 COLD)」的工具,研究人員可以將每個字母分解成線條,通過測量線條的直線度或彎曲度來判斷他們的國籍。
實驗證明,COLD 能很好地兼容機器學習演算法。在確定國籍方面,比現有的大部分方法都要有效,對部分國家的預測準確率甚至提高了一倍不止。
不同國家的寫字習慣,是 COLD 能夠判斷國籍的關鍵。
比如中國人習慣寫方塊字,在手寫過程中會用更直的線條書寫英文字母,而印度人習慣帶有曲線的書寫手法,因此在字母拼寫時會有更多曲線部分。
COLD 如何工作?
COLD 是一種專門用於文本分析的工具,除了應用在字跡分析上,還被廣泛運用於視頻、車牌圖像等領域的任意文本檢測。
該方法能夠對文本特徵進行分析,然後基於隨機森林對文本進行歸類,並在相應的極坐標域中生成密集的點。
這些點並非隨機分布,而是無限靠近與之相似度最大的國家。所以,隨著字元分布的變化,國民分布也會發生變化,只要數據足夠豐富,就能很容易的通過 SVM(Support Vector Machine)得出結論。
AI 分析的結果尚不能完全採信
此前,很少聽到有關於字跡分析的研究,可能是沒有確定它的應用場景。
不過,來自中國、印度和馬來西亞的研究人員認為,這項技術有利於警方進行犯罪調查,而且比一般的圖像識別技術更有效。
傳統司法鑒定方式
其實,警方已經在很多調查領域使用生物識別技術,人臉識別就是最常用的辦法之一。而字跡識別的出現,也將在一定程度上成為該技術的有力補充。
不過,這項技術目前尚處於實驗階段,能否進入實際場景,還有待考量。
就像大多數生物識別技術一樣,字跡識別同樣面臨一些由這類技術或類似技術帶來的隱私或民權問題。
另外,如何保證用於機器學習的數據,不會因偏見做出錯誤的決策,也是一個亟待解決的問題。
本文經授權轉載自
超神經HyperAI(ID:HyperAI)
果殼網
ID:Guokr42
果殼整天都在科普些啥啊!
嚇得我二維碼都屈光不正了!


※卧槽,居然有人相信地球是平的!他們說得竟然還挺有道理?
※歷史書又得改了!黃土高原發現全亞洲最早人類遺址
TAG:果殼網 |