當前位置:
首頁 > 新聞 > Google 中日韓文搜索演算法主要設計者吳軍:區塊鏈可能是大數據安全解決之道|CNCC 2018

Google 中日韓文搜索演算法主要設計者吳軍:區塊鏈可能是大數據安全解決之道|CNCC 2018

雷鋒網 AI 科技評論按:2018 中國計算機大會(CNCC2018)於 10 月 25-27 日在杭州國際博覽中心舉辦,會議由中國計算機學會(CCF)主辦,杭州市蕭山區人民政府、浙江大學承辦,浙江工業大學、浙江工商大學、杭州電子科技大學協辦。

今年的大會主題是「大數據推動數字經濟(Big Data Drives the Digital Economy)」,CNCC 邀請到近 400 位國內外計算機領域知名專家、企業家到會演講。大會次日,共有九位嘉賓帶來特邀報告,第二位特邀嘉賓是 Google 中日韓文搜索演算法的主要設計者吳軍,他的報告題目是《超級智能時代》。

吳軍博士認為人工智慧的發展趨勢是「超級人工智慧」,未來的世界應該是強連接的,而這種強連接帶來的好處包括:更好地保障食品和藥品安全以及交易安全,還能夠更好地追蹤健康,讓人能夠更加及時發現病症。同時,他也指出這種強連接會帶來隱私隱患、風險和危害,例如,IT 巨頭掌握並控制大量的數據信息,一旦泄露就會導致巨大的隱私風險;黑客犯罪成本接近零,巨大的收益將會鼓勵他們進行網路犯罪。這些問題可能是用法律無法解決的,所以我們需要嘗試從技術的角度來解決它們。

針對大數據帶來的隱私隱患,他表示,區塊鏈是可能的解決方案。這是由於其具備如下特點:


一是這項技術將所有權、使用權和驗證分開了,更好地保證了公正性;

二是較高的安全性,其理論上是無法破解的;

三是方便性,可隨意合併打包和拆解,能很好地進行追蹤,極大方便了溯源;

四是低成本;

五是透明化程度高。

至於區塊鏈在具體應用場景中的作用,他提到兩點:第一,去中心化,能夠存放病例等數據信息,使得使用者和擁有者都能從中獲益;第二,是智能合約方面的應用,能夠使用區塊鏈監控貸款還款以及撥款等問題,所有的執行完全由演算法監控,這使得相關人員都無法進行人為違約。

以下為他的演講內容,雷鋒網 AI 科技評論做了不改變原意的編輯整理。

Google 中日韓文搜索演算法主要設計者吳軍:區塊鏈可能是大數據安全解決之道|CNCC 2018

打開今日頭條,查看更多精彩圖片

Google 中日韓文搜索演算法主要設計者、博士吳軍

這是一個學術會議,我發現在中國,冠以「中國」開頭的會議都是最高的,冠以「世界」的會議我都不參加——因為可能沒有什麼收穫。在座的各位都是專家、學者,我站在這裡顯得有些班門弄斧,而且有時候我發現學術界存在一個鄙視鏈,做理論研究的看不起做應用研究的,而我是在鄙視鏈的最底層。

今天我講的題目跟人工智慧有關,因為我發現本次會議,大概有三分之二的報告內容跟人工智慧有點關係。如果在十年前我們開這個會議,一定不會出現這樣的情況,那為什麼今天會出現這種情況呢?很大的原因是,2016 年 AlphaGo 贏了李世石,這成為了人工智慧技術的一個節點。

人工智慧的發展趨勢:「超級人工智慧」

從 2016 年至今,我的感受是人工智慧的發展有這麼一個趨勢:它從類似於人的單一的智能單機或者說系統智能變成了網路智能,所以我把它叫做「超級人工智慧」

很多人問我怎樣判斷一個人研究的課題是真是假?我說很簡單,如果要造飛機,那些在研究鳥類飛行的就是騙子,因為他需要研究的,其實是空氣動力學。如果我們能夠找到他所做研究的一些科學基礎,那他就是在真正做人工智慧研究。

Google 中日韓文搜索演算法主要設計者吳軍:區塊鏈可能是大數據安全解決之道|CNCC 2018

今天,人工智慧有三個基礎:


第一個是摩爾定律,我們計算機從業者原本都對它有一個理解,我將換一種方式來講怎樣理解摩爾定律;

第二個是數據,今天的人工智慧之所以成功是因為有大數據的支撐;

第三個是數據模型。

兩年前,一位原來做深度學習的同事跟我說,他過去每次參加機器學習類會議,大概能夠坐 100 人的會場只坐了 10 個人,這 10 個人還都是去做報告的。深度學習本身是一個數據模型,我們可能還會找到更好的數據模型,不過這是機器的特長,而不是我們人的特長。

除了人工智慧,還有兩件事發展得非常快,一個是 IoT,這使得我們跟蹤東西變得不再那麼困難;另一個是區塊鏈。

最近有一個熱門的話題叫做 5G,今天你的手機上網,哪怕是看 4K 電視,網速都是夠的,那為什麼還要 5G?在場有一千多位參會者,如果把我們的桌子、椅子都連接到一起,不管帶寬多少,當我們同時上網時,網路都會變得非常阻塞,所以我們需要一個更好的上網方式。在 5G 時代,如果將所有的東西都連到網上,會怎麼樣?帶來的第一個好處是我們可以跟蹤很多事情。

講兩個很簡單的真實例子。第一個例子,在教室裝上攝像頭來了解每一個學生是否有好好聽課(這件事有沒有侵犯隱私我們另說);另外一個是更現實的應用,如果你有孩子的話,當課後送他去補習班後,他可能在那邊玩手機、橡皮,而在這樣智能化的教室里,你就可以很好地監控孩子的動態。

Google 中日韓文搜索演算法主要設計者吳軍:區塊鏈可能是大數據安全解決之道|CNCC 2018

在生活中我們還可以用這項技術來追蹤更大的問題,比如說食品安全。阿里巴巴的人跟我說,中國的食品安全問題還很嚴重,這個問題也很難解決。後來我還通過一些做藥品的人了解到,很多藥店賣的是假藥,一種情況是他不知道自己進的是假藥,另一種情況是製藥廠可能都不知道自己製造的是假藥。還有反欺詐的問題,剛才黃教授講了智能合約這個概念,如果我們將合約都變成這類智能合約,是可以解決違約、欺詐問題的。

此外,我們還可以進行健康跟蹤。現在任何一架商用客機上都裝有一千多個感測器,每天能產生超過 1 G 的數據,可以很好地監控裡面的溫度、濕度以及其他運行情況。但是人體內沒有感測器,以至於今天很多人在得知自己得了癌症的時候,已經是晚期了。我們對自己身體的監控,做得遠沒有像對很多設備的監控那麼好。今天特斯拉汽車裡面裝了幾百個感測器以及計算功能強大的晶元,你買個非電動的汽車都有 200 個感測器。我們為什麼不去做追蹤人體健康這件事?一是因為有難度,二是因為存在隱私隱患。

Google 中日韓文搜索演算法主要設計者吳軍:區塊鏈可能是大數據安全解決之道|CNCC 2018

今年 Facebook 出了一件大事,被曝賣掉了 5000 萬客戶的數據,而扎克伯格作證時則說他們賣了 8700 多萬客戶的數據。我們說雲計算好,很大程度上是因為它安全,有專業的團隊替你管理數據,不過有時候,專業團隊的管理並沒有我們想像中那麼好。更重要的是,我們的信息安全需要建立在大公司的善意的基礎上,一家大公司作為一個經濟實體可以有這個善意,然而公司裡面操作業務的人是否有這種善意,我們就不得而知了。所以,我們需要從技術的角度來解決這個問題,因為有時候我們不能完全靠法律——法律總是滯後很多。

區塊鏈可能是大數據隱私隱患的解決方案

對於網路連接帶來的隱私隱患、風險和危害,區塊鏈是一個可能的解決方案。不過因為這個概念實在被炒得太熱了,以至於現在大家都還在懷疑它是否是泡沫。

為什麼說區塊鏈可能是一個解決方案?因為它有一些很重要的特點:

  • 第一,它在數學上很漂亮。它使用非對稱的加密,公開密鑰;你可以確認真偽,但是不需要擁有;你可以訪問信息,但是無法修改。

  • 第二,從理論上來說,區塊鏈是無法被破解的,它很安全。

  • 第三,區塊鏈的使用很方便,你可以隨意合併打包和拆解。這也讓商品和藥品的溯源變得更簡單。

  • 此外,區塊鏈還有成本低、透明等特點。

Google 中日韓文搜索演算法主要設計者吳軍:區塊鏈可能是大數據安全解決之道|CNCC 2018

然而,現實的情況其實不是這樣的。

  • 一是區塊鏈使用起來很不方便,因為它的協議還很粗糙。

  • 二是成本非常高。大家可以猜想一下,如果我們用比特幣來買咖啡,成本有多高?大概是 12-15 美元。此外,還存在交易延遲問題,平均的延遲時間大概為兩三個小時。剛才黃教授提到以太坊十分之一秒就能完成一筆交易,不過吞吐量是一回事,真實的交易又是另一回事。

  • 三是透明性問題。今天真正實現了應用的區塊鏈,從邏輯上來看是透明的,但是在現實應用中企業會考慮很多中間環節,因此最終也變得沒那麼透明了。

不過我認為,任何一個問題都是一個機會,如果世界很完美,我們就都沒有工作了,而恰恰就是因為世界不完美,才需要我們在座的計算機科學家去做一些事情,比如說剛才講到的效率或者說延時問題。

第一代區塊鏈協議是比特幣,第二代是以太坊,以太坊是怎樣提高效率的呢?打個比方,滴滴司機有兩種方式接單:一是搶單,誰搶到就是誰的;二是由滴滴來進行訂單分配。比特幣的協議採用的就是搶單的方式,有很多交易需要驗證真偽,最終會由第一個搶到的人進行驗證,如果他驗證出來了,這筆功勞就是他的,當他驗證的足夠多的時候,就會得到一個比特幣的獎勵。在大家一擁而上搶單的時候,整個驗證過程的效率就變得很低,以至於每一次交易驗證都需要花很多時間。

Google 中日韓文搜索演算法主要設計者吳軍:區塊鏈可能是大數據安全解決之道|CNCC 2018

而以太坊的協議是,如果你想參與我們的驗證工作,就要先買以太幣,然後再根據你們手上所買的以太幣數量,按比例進行分配。這樣,區塊鏈就從技術上解決了延時問題,從而提高了效率。

以太坊今天的價值為幾百億美元,虛擬貨幣市場是兩千億到三千億美元。當到第三代區塊鏈的時候,有可能把延時從以太坊的幾分鐘減少至幾秒鐘。

區塊鏈的具體應用

區塊鏈到底有什麼用?

一是能夠保護跟蹤我們的隱私。斯坦福大學的一位教授發現,現在所謂的醫療病例數據共享在美國幾乎是不可能實現的,病例數據共享在中國談了這麼多年,到目前為止也還沒能實現,原因就是大家對隱私的擔憂。有些人是堅決的反對者,他們認為一旦病人的數據泄露出去,比信用卡的數據泄露還要嚴重得多。

此外,還有兩個嚴重的問題:一個是醫院不願意共享數據,另一個是病歷的歸屬問題。從現在的實際情況來說,無論中國還是美國,病歷都屬於醫院,醫院內部的信息系統是很難對外開放的。另外,即使法律上將病歷歸屬於病人,你也沒有辦法把它放到你家的計算機里。

如果有一個去中心化的地方存放病歷呢?如果將一個病歷開放給醫院,每次訪問收費十美元,醫生都願意支付查看。這就意味著如果你真有一個疑難雜症,一年收入可達十萬美元,另外當一些研究者對這個病歷感興趣時,他們也會買來查看。而今天大家對 BAT 不滿的是,他們賣你的數據,獲利的卻是他們。區塊鏈則提供了一個可能性:將數據還給大家,讓所有者從中獲益,同時也讓使用者從中獲得更大的應用。

二是智能合約的應用。中國過去在商業上有一個詞——三角債,這個問題很難用現有的技術從根本上解決。為什麼?比如在之前還欠別人的款的情況下,你再去向銀行貸款建工廠,因為所貸的這筆款是可以很快被挪用的,經銀行批准後,你就可能把錢挪做他用,最後就形成三角債,從而導致經濟運行效率的下降。只要是由人來進行撥款,三角債問題就很難被解決。

人工智慧發展到現在會進入一個新階段,而人工智慧和人的區別在於群體效應,比如無人駕駛汽車,將來會將整個城市的所有車都連成一張大網,從而帶來極大的網路效應。

如果把人工智慧想像為一個人,IoT 相當於是它的五官,計算機程序就是它的大腦,許多連接會帶來大量安全隱患,在這種情況下,區塊鏈有可能成為一個很好的解決辦法。

雖然區塊鏈現在還存在很多問題,跟它相關的項目可能 99% 都是騙人的,但是我們確確實實看到區塊鏈可以用來做跟蹤,來解決現有技術所解決不了的一些難題。

最後與大家分享我的觀點:任何時候當你碰到問題,倒過來看可能就是機會。這個世界上有各種各樣的問題,當應用上出現困難的時候,可能就是在座每一位計算機科學家的機會

(完)

敬請關注雷鋒網 AI 科技評論更多現場報告。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

TAG:雷鋒網 |