當前位置:
首頁 > 最新 > 發現第二個太陽系沒什麼,人工智慧正在衝擊法律證據!

發現第二個太陽系沒什麼,人工智慧正在衝擊法律證據!

作者:尹相志 / 微信公眾號:qspyq2015

這是秦朔朋友圈的第1744篇原創首發文章

說人工智慧找到第二個太陽系

有點小牽強

日前谷歌CEO桑達爾·皮查伊(Sundar Pichai)在推特發布了谷歌AI團隊與NASA合作的成果,運用「機器學習」能夠從15000個訊號中正確地辨識出行星,正確率達到96%。而NASA發布的新聞稿,則是把重心放在行星狩獵計劃Transiting Exoplanet Survey Satellite(TESS)以及Kepler-90這個擁有8個行星的星系特性上。

國內某著名科技自媒體則是以《重大發現!NASA和谷歌共同宣布發現「第二個太陽系」,AI扮演至關重要之角色》為題進行報道的。

太陽系不是有九大行星嗎?實際上在2006年8月24日國際天文聯合會議中,將因過去測量有誤,誤以為它比地球大,後來才發現它比月球還小的冥王星,由於體重不足被除名降格為矮行星。

這次通過「機器學習」找到兩個星系,除了Kepler-90之外,另一個只有6顆行星在1000光年外的Kepler-80因為缺乏故事只能黯然做配角,我想這次NASA應該是要好好感謝國際天文聯合會議,因為若不是他們英明地開除了冥王星,這場記者會恐怕還要等久一點才能開。

「第二個太陽系」的概念本身就是一個故事,是湊到了8顆行星的星系所以剛好藉助這個概念來發布新聞,這和之前發布的第二個地球Kepler-452b其實是完全一樣的概念,其實大家都清楚宇宙中肯定會有剛好8顆行星的星系,只不過這次特別用「第二個太陽系」的概念再度包裝。

那人工智慧扮演甚麼樣的角色呢?我們是如何知道數千光年外星球的信息的?是如何發現這些不會發光的行星的?其實利用的是當行星經過星系的恆星時,不會發光的行星自然會小區域地遮擋恆星的光芒,這個就是我們太陽系常見到的「凌日」現象,透過光芒被遮擋的程度以及變化速率,就能夠推算出遮擋星體的體積以及運動速度,進而根據遮擋的類型來推斷這星系中有幾顆行星。但是會造成亮度變化的不只是行星,像雙恆星系統也有可能會產生亮度變化,如何從大量的亮度變化數據中找出真正的行星就是一個大難題。

這對人類來說非常困難,但是對機器而言卻不成問題。各位可以發現,有趣的是在國外的媒體幾乎都是用「機器學習」,或者是谷歌Tensorflow技術,或者是谷歌使用神經網路來描述這個狩獵行星的機器幫手,但是鮮少有人用「深度學習」或是「人工智慧」來描述這一過程。

其實貓膩就在於,對這些數據進行分析是個再簡單不過的分類問題,而仔細檢視谷歌發布的論文以及在GitHub上面發布的代碼(解釋附在文後),就可以知道裡面用的都是很傳統的舊型神經網路,裡面雖然有用現代機器視覺常用的卷積神經網路,但是只有使用最簡單的一維卷積,而且從實驗結果來看,用傳統神經網路和一維卷積的效果幾乎沒有差別。也就是說,這個發現要扯到人工智慧,真的是有點小牽強。

人工智慧演算法的可怕之處其實在這!

當然,「人工智慧」的威力不只是在找尋星繫上,自然語言理解(NLU, Nature Language Understanding)是深度學習的重要任務之一,但是近期有些研究逆天,試圖讓深度學習去學主宰這個世界運作規律的語言。例如有研究團隊將基因鹼基做為單詞,基因序列做為句子,來找出藏在基因中的文法,希望透過新技術能理解潛藏在句子中的語意,並用它識別潛在的遺傳疾病的特徵或是找尋治癒的契機。

不僅是基因工程,我們都知道藥物開發周期是相當漫長的,一個新葯可能得耗費十幾年的時間才能完成,也因此製藥工程開始使用了深度學習,以有機物結構做為單詞,有機分子做為語句,而語意正是指這些化學分子的藥理特性。聽起來是幻想?谷歌大腦在今年推出了「Neural Message Passing for Quantum Chemistry」(《量子化學中的神經信息傳遞》)這篇論文,可以說是探討化學分子語言理論的奠基之作,通過人工智慧助力,讓我們能夠讀懂化學分子的文法,並據此找出更快取得新葯候選清單的方法。

此外,最近我關注到了一篇社會新聞,就是主演神奇女俠的女星姬嘉鐸(Gal Gadot)被熱傳拍攝了成人片。當然這個事件並非是女星不愛惜羽毛,而背後其實是人工智慧搞的鬼。

在這兩年的人工智慧技術中,一個名為「生成式對抗網路」(GAN, Generative Adversarial Networks)的神經網路訓練技巧大為風行。它的概念很簡單也頗變態,就是讓一個生成模型不斷地製造假圖片,而另一個識別模型用來指出假圖片與真圖片混合樣本里那些是假圖片,兩個模型的損失函數都鏈接到對方的表現上,也就是當對方越強時,自己會變得更強(天啊,每次講到這段我就想起蠱毒),最後通常是生成模型獲勝,也就是得到一個可以做出幾乎可以以假亂真的假圖片的生成模型,最噁心的是,這個生成模型壓根沒看過真圖片,它為何能做到幾可亂真,其實純粹只是根據識別模型的反應來推測的。

在GAN裡面有一種結構的變體稱為Cycle GAN,簡單的來說它能做到像素層級的物體視覺翻譯。從技術的角度看,中文翻譯成英文其實與馬變成斑馬的概念是類似的,都是一種函數的轉換。而Cycle GAN的特別之處在於以前訓練模型需要成對的數據(一個句子同時有中文版與英文版),但是它可以不需要成對數據,只要有個別足夠的數據就能夠進行視覺翻譯。原本的論文中展示了馬變斑馬以及蘋果變橘子的神奇效果,但是由於它對於訓練樣本的彈性,這意味著我們只要手上有足夠的神奇女俠女星影像以及成人片的數據,就能夠做出神奇女俠拍成人片的效果。

2015年微軟藉由152層的神經網路首度在識別的任務中超越了人類視覺。當一個連深度學習都無法識別的假圖片,對人類來說就比真實還要真了。未來的世界可能會是一個真假難分的世界,所有我們現在做為法律證據的基礎都可能被衝擊,我認為這些演算法帶來的影響恐怕遠勝於找到幾千光年外的一個太陽系。

作者:Deepbelief人工智慧科學家。華院數據科學家。2002年在中國台灣創立亞洲資采,台灣第一個大數據公司。

(代碼:https://github.com/pearsonkyle/Exoplanet-Artificial-Intelligence

論文:https://arxiv.org/abs/1706.04319

Deal or No Deal? End-to-End Learning for Negotiation Dialogues下載地址https://arxiv.org/pdf/1706.05125.pdf)

作品鏈接:

AI不是來讓人們失業的,是讓人們更真誠相對的

阿法元100:0完爆阿法狗的啟示,人類應該向人工智慧學習三堂課

「 本文僅代表作者個人觀點 」


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 秦朔朋友圈 的精彩文章:

特朗普這一年:偉大領導者還是十足惡棍氣?
文博愛好者眼中的《國家寶藏》之二
比特幣將取代黃金,「中本聰」會獲得諾貝爾獎?
秦朔對話李暉:深化構造改革,製造更好的汽車
價值百萬年薪的谷歌面試題,你敢挑戰嗎?

TAG:秦朔朋友圈 |