當前位置:
首頁 > 知識 > 她拒絕麥肯錫建立圖片訓練資料庫,現為斯坦福AI實驗室負責人 !

她拒絕麥肯錫建立圖片訓練資料庫,現為斯坦福AI實驗室負責人 !

「只有人文精神才擁有連接科技與人類社會的力量。 」——李飛飛[1]

她拒絕麥肯錫建立圖片訓練資料庫,現為斯坦福AI實驗室負責人 !

打開今日頭條,查看更多圖片

作者 | 數小妹

責編 | 伍杏玲

本文經授權轉載自DataGirls(ID:DataGirls)

2019年3月19日,在斯坦福大學「以人為本AI研究院」正式成立的峰會上,聚齊一眾大佬:

微軟創始人比爾·蓋茨、加州州長Gavin Newsom、谷歌Jeff Dean,DeepMind創始人Demis Hassabis,加州大學伯克利分校心理學家Alison Gopnik、知名投資人Reid Hoffman等人聚齊一堂。

而該研究院的負責人,正是華裔女科學家,李飛飛。

李飛飛是誰?

她36歲成為斯坦福大學終身教授,任斯坦福人工智慧實驗室和視覺實驗室主任;

她的高質量論文,在頂級期刊發表超過100篇,被引用高達4萬餘次;

她參與建立的兩個資料庫:Caltech 101 和 ImageNet 被 AI 研究者廣泛使用,其中的 ImageNet 更是成為全球最大的圖像識別資料庫;

她是學術界最頂尖的科學家之一......

作為一名華裔女性,李飛飛的影響力不只在學術界。

2015年,李飛飛入選2015年「全球百大思想者」,被評為美國「年度傑出移民」之一(愛因斯坦、基辛格也曾獲此殊榮);

2018年3月,獲影響世界華人大獎」[2]......

回首過往,她曾對英文一竅不通,為了生活去做過清潔工、中餐館收銀員,甚至幫人遛過狗,還到處借錢開乾洗店。

曾經的打工少女,是如何一步步走到今天的呢?

美國夢,無懼前行

20世紀70年代,李飛飛生於成都。

那時的成都,遠沒有今天繁華。但是,李飛飛的父母特別注重培養她的好奇心,一有展覽就帶她去,讓她接觸到更大的世界、更新奇的事物。

同時,家裡還有一條很有趣的家規:李飛飛放學回家後只能在40分鐘內做作業,40分鐘後就可以看課外書、可以玩,幹啥都可以,但就是不能再做作業[3]。

父母此舉,就是為了讓李飛飛養成專註高效的習慣,做事不拖延,不左顧右盼。這樣,就可以為自己留出充足時間,做自己感興趣的事。

李飛飛16歲時,全家移民到了美國。面對一個語言、文化完全迥異的環境,李飛飛和家人的最大障礙是:如何生存下去?

語言不通,迫於生計。受過高等教育的父母來到美國後,也失去了原本在中國的知識分子的工作,父親成了照相機修理工,母親成了超市收銀員,勉強維持溫飽。

全家人住在紐約附近一個叫帕西帕尼(Parsippany)的地方,全家人僅有的一些朋友都是和他們一樣的移民,「大家都很忙,忙著討生活」。

除了上學,李飛飛還要儘可能補貼家用,課餘時間去中餐館、洗衣店打零工。

打工和上學,就成了她適應美國新生活的全部內容,最辛苦時一天睡不到4小時。

她在16歲第一次踏上美國土地時,幾乎不會說英語,竟在高中畢業時,以 SAT(美國高考)1250 分,數學滿分的成績被世界名校普林斯頓大學物理系錄取,而且獲得了全額獎學金。

這樣優異的成績,連美國人都很難達到,當地報紙專門採訪報道了她,引起一時轟動。

她最大的欣喜是發現身邊朋友起了變化,「身邊全是這些學術、知性、充滿魅力的人」,[1]她說。

上大學後,李飛飛仍堅持勤工儉學,以貼家用。她四處向朋友、甚至中學數學老師借錢,買下了一家乾洗店。

如同「雙城記」,帕西帕尼和普林斯頓。

周一到周五,她在普林斯頓學物理,放學後通過電話參與乾洗店的經營,周末她就回到帕西帕尼給家裡的乾洗店幫忙,接待那些來取送衣物乾洗的人。「我非常愛普林斯頓,不過也非常愛我的洗衣店,缺少了它們中的任何一件,都沒有現在的我」[2],她說。

拒絕高薪,去西藏探秘

1999年,從普林斯頓大學畢業之後,李飛飛的就業前景一片大好。

大學畢業時,他們都可以選擇兩條路。從普林斯頓大學出來,就業機會非常樂觀。但李飛飛堅信,她的路不是常人走的路。

當時美國最大的兩大投資公司——高盛和麥肯錫都給過她工作Offer,但李飛飛均拒絕了。

「認為上清華、哈佛就是優秀,是一個非常表面的認識。實際上,上了名牌大學,只是對你過去的一份肯定。真正的路,你自己後面還有很長的路要走。 在我看來,僅為掙一份六位數美元的高薪,而沒有理想的人,也算是碌碌無為。」[4]

她拒絕麥肯錫建立圖片訓練資料庫,現為斯坦福AI實驗室負責人 !

在李飛飛的生命中,有一種很「野」的元素。她瘋狂地想去探索東西哲學和科學中的奧妙,去做東西文化的橋樑。

本科物理學的她,竟對西藏醫藥產生了濃厚的興趣。

恰逢機遇,普林斯頓有面對畢業生Martin A. Dale 』53 獎學金, 全校僅有一個名額,學校要求申請人,寫一個提案,用一年的時間,去探索世界。這個計劃必須由本人親自設計,親自完成。

那屆學生,有1200多個人申請Dale獎學金, 李飛飛的課題是「藏醫學和西醫學上的醫理比較」, 經過兩輪的面試和答辯,她如願拿到了這份獎學金。

就這樣,她的間隔年計劃開始了。不認識任何當地人,更沒有人知曉她是誰。帶著探索熱情和研究計劃,李飛飛背起行囊,去了西藏。

當時,研究需要在高原寒區風餐露宿,這對一直生活在城市中的女孩是個很大的挑戰。

但飛飛從未有過任何抱怨,而是愉快地融入到當地生活中,與藏地的醫生和牧民打成一片。

「房間里沒有床,我隨便找來一個墊子,放在地上。 沒有洗澡的地方,冷風呼呼地刮,不通水,不通電。我騎馬進山,跟牧民一樣,大口吃生肉。即使這樣,我還是很快樂,與藏族人一起,我在學習和體驗一種精神。 」[4]

這段經歷對她影響很大。

「雖然有些東西看起來沒用,比如我去研究藏葯,但只要是深思熟慮過的、認準的,之後肯定會起到作用的,別心急。」[4]

長久以來,西方的科學方法論和哲學思維佔據學術界的主導地位,而以藏醫藥為切入點,李飛飛體會到整個人類思想寶庫中完全不同的另一面。

直到現在,李飛飛的推特賬號背景,還是藏文化。

西藏歸來之後,李飛飛選擇繼續讀博,這意味著這段時間她還是只有微薄的獎學金,全家人仍然要承受經濟的不寬裕。

博士期間,李飛飛的母親接連患上了癌症與中風。那是一段艱苦的日子,經歷了很多困難,但最後都挺過來了。

人生最大的挑戰,其實是不辜負你最大的潛能,又不辜負你身上的責任,以及誠實面對你自己內心所希望追求的事業」[1],2017年,她在接受CNN採訪時這樣說。

讓計算機理解圖片

間隔年結束後,李飛飛同樣收到了大量的諮詢公司Offer。但李飛飛還是想堅守以學術研究造福世界的夢想,不為金錢,不為地位,也不為環境所迫。

在父母支持和自己的辛勤努力下,李飛飛拿到了加州理工學院電子工程專業的博士學位,具體研究方向是人工智慧和計算神經科學。

李飛飛一頭扎進當時的冷門研究中——如何讓計算機理解圖片。

計算機如果要越來越廣泛地被人們所使用,就必須習得認知畫面的能力。最簡單的例子是,當自動駕駛的汽車前方路面出現了一個障礙物時,計算機需要識別那是個可以輕鬆碾過去的紙袋子還是個應該避開的石頭。

那麼,計算機怎麼學會識別圖像呢?

比如,讓計算機識別貓,首先要告訴計算機,貓是圓臉、胖身子、兩隻尖耳朵和一條長尾巴構成的東西。

她拒絕麥肯錫建立圖片訓練資料庫,現為斯坦福AI實驗室負責人 !

然而現實生活中,貓的品種有成千上萬,就算同一隻貓,也可能擺出不同姿勢,這個時候,計算機可能就不知所措了。

面對圖像識別如此匱乏的「辭彙量」,李飛飛開始「訓練」計算機,讓它看更多圖片。

2007年起,她在網上下載了近10億幅圖片,然後給它們分類、打標籤,建立題庫為計算機看圖訓練而用。但由於工作量過大,幾個月後研究經費幾乎用光,而且,照此進度需十幾年才能完成建立題庫的目標。

在最困難時,李飛飛甚至想過重操舊業開乾洗店籌集經費。

一籌莫展時,美國最大電商亞馬遜的眾包平台幫了大忙。李飛飛在網上僱傭了167個國家共計5萬人,給10億張圖片篩選、排序、打標籤。

今天,這個數據集包含了使用日常英語標記的超過 1400 萬張圖像,跨越 21800 個類別。它就是大名鼎鼎的ImageNet資料庫。

更可貴的是,ImageNet 如此龐大的圖片數據是免費的。它向全球開放,所有致力於計算機視覺識別技術的團隊,都能從它裡面直接拿「試題」,訓練自家識別技術的準確率。

如今,計算機識別的錯誤率已經從28%降到3.6%,比人眼識別錯誤率5.1%還要低。這都要歸功於 ImageNet 資料庫以及李飛飛團隊的努力。

2009年,年僅36歲的李飛飛獲得了斯坦福的終身副教授職位。李飛飛更一直擔任斯坦福人工智慧實驗室和視覺實驗室的負責人,她不僅是斯坦福AI實驗室唯一的女性,還是計算機系最年輕的副教授。

AI+人文=更廣闊的未來

斯坦福以人為本AI研究院(Stanford Human-Centered AI Institute)的成立想法,始於2016年李飛飛和教務長John Etchemendy的一次鄰居對話,這場科學家和哲學家的隨意交談很快變得更有分量。

李飛飛說:「我們需要將人文和社會思想融入到科技中。」

她接著解釋最近的想法:建設科技未來的人,似乎有著相似的背景,他們都在數學、計算機科學和工程等領域。沒有足夠多的哲學家,歷史學家和行為學家能夠影響新技術的發展。

多樣性是一個重要議題。科技領域不僅需要穿帽衫的男生,也需要穿短裙的女生;不僅需要計算機、工程背景的團隊,還需要經濟學家、歷史學家、社會學家等有人文社會科學背景的人才加入,用人文精神給AI賦能。

2019年3 月 18 日,斯坦福以人為本 AI 研究院成立了。這所研究院由斯坦福大學七所學院的 200 名教師組成,同時計劃從人文、工程、醫學、藝術或者基礎科學等領域招募至少 20 名新教師,其中包括 10 名初級研究員,同時與 AI4All, AI100, AI Index 等組織展開合作。

斯坦福利用 HAI 評估智能機器對人類生活所造成的影響,包括機器自動化取代了部分人力工作,演算法引起的性別和種族偏見,醫療、教育和司法系統中存在的 AI 問題。

研究院雖然才剛剛成立,但是已經向斯坦福各學院,約 55 個跨學科研究小組提供了支持。其中包括幫助難民重新安置,改善重症監護室醫療服務系統,以及研究自動駕駛汽車對社會治理和基礎設施的影響。

她拒絕麥肯錫建立圖片訓練資料庫,現為斯坦福AI實驗室負責人 !

從以人為本的初衷出發,發布會上李飛飛也強調了 HAI 需要遵守的三個原則:

第一,Human-發展 AI 的過程中必須考慮 AI 對人類社會的影響;

第二,Augment-AI 的應用是為了賦能人類,而非取代人類;

第三,Intellect-人工智慧應該更多融入人類智慧的多樣性、差異性和深度。

雖然,近年來AI 發展出了一些非凡的能力,但它仍遠遠落後於神經元、人類智能的微妙和靈活性。當一種演算法在擁擠的街道上駕駛汽車或促成假釋聽證會的結果時,流暢的人類經驗是至關重要的。

這張簡單的照片可以說明 AI 和人類智能的區別。當今最先進的計算機視覺演算法可以很容易地識別它們眼前的對象,比如狗、沙發、人、咖啡杯等等。

但作為人類,我們看到了什麼?我們不僅能知道沙發壞了,還知道是狗乾的。我們還可以從一個簡單的姿勢看出,主人不是很開心。更神奇的,我們可能是從狗臉上的內疚表情中看出來的,而且馬上就能看出來。這些就是人腦所做的。我們毫不費力地就能識別環境並喚起記憶。我們能感覺到事件之間的因果關係,把一系列的瞬間變成一個故事。

「我們是見證AI從實驗室走入現實的第一代人,我們是見證它以前所未有的速度和規模向前發展的一代人,」李飛飛說,「從歷史上看,技術所產生的迴響遠遠超越了技術本身。」[2]

當後來有人問李飛飛,你是如何克服路上這些困難的時候。

她說:「我是一個拚命三郎,這是我的DNA使然」。[5]

因為在她眼裡,如果總是去感嘆為什麼會有那麼多的困難,這才是浪費時間和一件分散注意力的事情,還不如一心往前沖。

從成都到普林斯頓,從斯坦福再到谷歌,如今再度重重返校園的李飛飛,一直在路上。

讓人類世界變得更好,是李飛飛的追求。

而李飛飛的目標,也一直是整個世界。

參考資料:

[1]華西悅讀.《AI+人文=?李飛飛抱怨AI界太多「帽衫男」》

[2]插座學院.崔永旺.《谷歌最高華裔主管李飛飛離職:既要擔起生活的責任,又要對得起夢想》

[3]搜狐.《領軍AI的華裔女性——李飛飛 》

[4]陳屹視線.《採訪:矽谷精英李飛飛-20年前已是女神》

[5]環球人物.《做「佛系青年」,她從清潔工逆襲成首席科學家!》

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 CSDN 的精彩文章:

阿里雲的物聯網之路
5G 是時候商用了?| 程序員硬核評測

TAG:CSDN |