壞人,敢不敢寫個字給AI看看
小鹿創萌
聚焦「雲物大智」,提供前沿科技報道。
俗話說「字如其人」。
可能意思是說,如果字寫得難看,就會暴露你長得難看的事實。
在刑偵類的影視作品中,你一定見過用筆記確定嫌疑犯的橋段。
電影《大偵探福爾摩斯》中,福爾摩斯能夠根據兩個英文字母的筆跡,判斷書寫者的才能與性格特點,識破對手的偽裝。
僅憑字跡就能破案,如此玄學的推理,估計也只有福爾摩斯本斯能辦到了。但是,你知道如今AI也能像偵探一樣識別筆跡了嗎?
一個跨國研究團隊通過機器學習的演算法,讓機器從英文手寫的字跡中判斷書寫者來自哪個國家。
這個團隊包含中國、印度和馬來西亞研究人員,其中兩名中國研究者分別來自河海大學和南京大學。
該演算法所做的正是機器學習技術最擅長的事情:發現模式。
100 名來自馬來西亞、伊朗、中國、印度和孟加拉國的被試者,被要求手寫同樣的英文。
研究團隊使用一種線性分布(COLD)識別工具,分析獲取的500分樣本的字體的形狀分布特徵,如直線度、彎曲度等。
結果顯示,國籍相同的被試者,筆跡呈現出明顯的國籍特徵。
比如,中國人寫英文就像寫漢字,橫平豎直,尤其是在「f」、「l」、「d」這些字幕上,豎著的筆畫頂天立地一般。
而印度人和孟加拉人寫的英文則完全不同,就像繡花一樣,筆畫圓潤、上下起伏明顯。
研究者們統計了一下這個方法的準確率:
上面一個表格是該研究的準確率。結果顯示,準確率均在60%以上,平均正確率達到了75%。
下面一個表格是前人研究的結果,準確率都沒有超過50%。
雖然75%的準確率看上去也不是多麼好,但考慮到實驗的樣本僅限於5個國家,所以,該演算法的準確性依然有很大的提升空間。
有人會問,這個字跡識別到底有什麼用呢?
研究人員認為,這項技術會有助於犯罪調查。
目前,警方越來越多地藉助生物識別技術來處理犯罪問題。或許以後,從筆記中提取的信息可以結合人臉識別、生物識別等技術來幫助偵破犯罪,但是就目前看來,這項技術還有很長一段路要走。
素材來源:量子位
編審:小鹿君


※超好玩:谷歌大腦研究員用神經網路造了這些腦洞大開的「漢字」
※小米思維——「逆境求生」
TAG:微軟南京孵化器 |