當前位置:
首頁 > 科技 > 《Nature》 封面:人工智慧引發材料科學變革

《Nature》 封面:人工智慧引發材料科學變革

這是對最極客視頻前所未有的挑戰:一部智能手機的特寫,一排排數字和符號正在手機屏幕上滾動著。但是,當拜訪者們駐足在 Nicola Marzari 可以俯瞰日內瓦湖的辦公室時,他迫不及待得向人們炫耀它了。「從2010年就開始了,」他說,「我的手機正在實時計算硅的電子結構!」


Marzari,瑞士洛桑聯邦理工學院 (Swiss Federal Institute of Technology in Lausanne,EPFL)的物理學家,解釋道,他現在的手機僅用 40 秒就可以執行一個超級計算機需花費數小時的量子力學運算 —— 這個傲人成果不僅展現了過去幾十年運算方式的進步,也證實了這些運算方式有望改變未來材料科學研究方式。


Marzari 和志同道合的研究人員正在使用計算機建模技術和機器學習技術,集成由數以萬計的候選材料組成的資料庫,而不再是用以前開發新材料的老式方法(靠運氣碰到一些新材料,然後在實驗室精心測試它們的性能)。即使實驗失敗,其產生的數據也可以做出貢獻。雖然許多候選材料是完全被假設出來的,但是,通過搜遍這些材料的性能,工程師們已經開始針對特定用途,篩選那些值得合成和測試的材料——例如,是否是良好的導體或絕緣體、是否有磁性以及熔點和耐壓強度如何。

「他們希望這種方法能讓材料發現的速度和效率產生巨大飛躍,」加州大學伯克利分校的材料科學家、也是這一領域的先驅者 Ceder 說。Ceder 認為,「我們對現存材料的了解大概只有 1% 」,他提到了鋰鐵電池(lithium iron phosphate) 的例子:在二十世紀三十年代就被合成出來的化合物,然而一直到 1996 年,人們才承認,它有望替代鋰離子電池。「之前,壓根沒有人想測量它的電壓」Ceder說。


目前,全世界已有至少三個主要的材料資料庫,每個資料庫包含了數萬或數十萬種的化合物。Marzari 位於洛桑的材料雲項目 (Materials Cloud project)將在今年內開始運行。而且也開始引發更廣泛的利益團體關注。Neil Alford,材料科學家,倫敦帝國理工學院(Imperial College London)科研副主任(不過他和資料庫項目沒有關係)認為,「我們正在見證一個真正匯聚,實驗者們想要的東西和理論學家可以傳遞內容的匯聚」。


然而,這些倡導者們很快發現,從電腦預測到現實世界技術,這條路可以不好走。現存的資料庫還遠不能包含所有已知的材料,更別說所有有可能性的材料了。對於某些材料而言,數據驅動下的發現很管用,但是,對其他材料而言,未必如此。而且,甚至在電腦挑選出一種有趣的材料後,在實驗室里合成它,仍然花費數年。「我們經常更了解應該做什麼,勝過如何製造它。」Ceder 說道。


這個領域的研究者們仍然很自信:有一批等去被發現的化合物,這些化合物能推動電子、能源、機器人、醫療保健和交通等領域的創新。「我們正在將許多拼圖的不同部分拼湊起來,」Giulia Galli,一名芝加哥大學的計算材料科學家,說「當不同部分組成一幅完整圖形時,對材料的預測就會成為現實。」

基因的靈感


21世紀初,Ceder 想到了這種高通量、數據驅動的材料發現研究方法,那時 ,Ceder 還在 MIT 學習並從幾近完成的人類基因組計劃( Human Genome Project)中受到啟發。「就這個計劃本身來說,人類基因組並不是新治療方案的秘方,」他說,「但是,它為醫學研究提供了客觀數量的基礎、定量信息,作為研究的出發點。」材料科學家可以從基因學家那裡學到什麼嗎?他不禁好奇。他們能不能辨認一種「材料基因組」(materials genome)——如 Ceder 所說的 ——編碼各種化合物的性質,就像生物信息被編碼進 DNA 鹼基對一樣?


如果可以,他推理道,編碼過程必須發生在組成給定材料的原子和電子中,發生在它們的晶狀結構中:亦即空間安排方式。2003 年, Ceder 和他的團隊首次展示了一個量子力學計算資料庫如何幫助預測了一種金屬合金最可能的晶體結構——對於任何從事新材料發明的人來說,這是關鍵一步。


過去,即使對超級計算機來說,這樣的計算也是既耗時又困難的。機器必須經歷一系列的試驗和錯誤來尋找到「基態(ground state)」:一種能量最低且受力均衡的電子排布以及晶體結構。但是,在 2003 年發表的論文中, Ceder 的團隊描述了一種捷徑。研究人員針對一個二元合金(由兩種不同合金元素組成的合金)的資料庫,計算出常見晶體結構的能量 ,然後設計了一種機器學習演算法,這種演算法可以從庫中提取模式,猜測一種新型合金最可能的基態 。該演算法效果很好,削減了計算所需的計算時間(參見下圖)。

《Nature》 封面:人工智慧引發材料科學變革


智能搜索


人工智慧幫助研究者們梳理巨量的材料信息,並找到他們手頭應用所需要的那幾款


從已知材料的實驗室數據與電腦模型開始


機器學習提取共有模式

結果引導對新材料的預測


研究者們尋找擁有特定的、預測特質的材料


化學家們嘗試著製造出可以接受真實世界檢驗的候選材料


「那篇論文介紹了有關材料性質的公共資料庫的想法,以及運用數據挖掘來填補缺失部分的想法,」Stefano Curtarolo 說。他在同一年離開了 Ceder 團隊並在杜克大學創建了自己的實驗室。這個想法孕育了另外兩個獨立的項目。 2006 年, Ceder 在 MIT 開始了材料基因組項目(Materials Genome Project),通過運用改良版本的演算法,預測電動汽車電池的鋰基材料。截止 2010 年,這個項目已經包含了大約兩萬種預測到的化合物。「我們從已知的材料入手,修改它們的晶體結構 ——也就是先改變其中一個元素,再計算會發生什麼,」 Kristin Persson,一位 Ceder 團隊的前成員,說道。她在 2008 年加入位於加州的勞倫斯伯克利國家實驗室( Lawrence Berkeley National Laboratory)後,繼續與這個項目進行合作。

與其同時,Curtarolo 在杜克大學創辦了材料基因組中心(Center for Materials Genomics),研究方向主要是金屬合金。他與來自猶他州普若佛市的楊百翰大學(Brigham Young University)和以色列的內蓋夫核研究中心(Negev Nuclear Research Center)的研究人員們組建團隊,逐漸將 2003 演算法資料庫擴展為 AFLOW,這個系統可以以已知的晶體結構為基礎,完成計算任務,自動預測新的晶體結構。


原團隊以外的研究者們也開始對這個高通量計算方式表示興趣。其中之一便是化學工程師 Jens N?rskov。在位於靈比的丹麥技術大學(Technical University of Denmark)時,他因為要研究將水分解成氫和氧的催化劑而開始接觸這個演算法,後來以加州斯坦佛大學 SUNCAT 催化劑計算研究中心(SUNCAT Center)總監的身份拓展了這個研究。另一位便是參與開發 Quantum Espresso 軟體的 Marzari。2009年,Quantum Espresso 軟體開始用於量子力學運算。這個演算法便是文章開始時在他的手機視頻上滾動的代碼。


材料基因組學


儘管如此,直到 2011 年六月,當白宮宣布百萬美金的材料基因組倡議(Materials Genome Initiative,MGI)時,計算材料科學才逐漸成為主流。「當白宮的人們開始熟悉 Ceder 的研究時,他們十分得激動,」James Warren,美國國家標準和技術研究所(National Institute of Standards and Technology)的材料科學家、同時也是材料基因組倡議的執行秘書,說道。「在這之前,人們就有了一個大概意識,計算機模擬已經到達了可以對創新和製造帶來真實影響的程度,」他說——更別提「基因組」大名,這讓人聯想到某種宏大敘事。


2011 年以來,這個倡議已經投入了2.5億美元,對象包括軟體工具、收集與報道實驗數據的標準化方法、主要大學的計算材料科學中心、以及大學與商業部門就特定用途展開的研究合作等。但是,尚不清楚的是,這筆投資到底在多大程度上推進了科學研究。「這個倡議帶來了很多好的東西,同時也有一些偏差,」Ceder說道。「有人開始說,他們的研究是關於這個基因組或者那個基因組,其實,這些研究跟基因組沒什麼關係。」


但是,可以確定的是,這個材料基因組倡議意在幫助 Ceder 和其他的人實現材料性質在線資料庫的宏大願望。2011 年末,在白宮要求他們放棄「基因組」這個標籤以避免混淆後,Ceder 和 Persson 以材料項目(the Materials Project )的形式重新開始了他們的材料基因組項目。在接下來的一年,Curtarolo 以他在杜克大學研發的一款軟體為基礎,發布了他自己的資料庫,名為 AFLOWlib。接著在 2013 年,Chris Wolverton, 一位西北大學(Northwestern University)的材料研究者開啟了開放量子材料資料庫(the Open Quantum Materials Database)。「我們從材料項目和 AFLOWlib 獲取到了許多的靈感,」Wolverton說,「然而,我們的軟體和數據是完全原創的。」


所有這三個資料庫,共享著約五萬種已知材料的核心,這些材料來自一個被廣泛使用的實驗資料庫,無機晶體結構資料庫(Inorganic Crystal Structure Database)。這些材料都是至少在實驗室中被創造出過一次並在論文中被描述過的固體,但是,它們的電磁性能還沒有完全被檢測到;它們將會是新型材料衍生的起點。


三個資料庫的區別在於它們所包括的假定的材料。The Materials Project 包括的相對較少,始於大約15,000個計算結構,這些結構源自 Ceder 和 Persson 對鋰電池的研究。「我們只是將它們涵蓋在資料庫中,如果我們確信計算是準確的,在一個合理條件下,它們是可以被製造的,」Persson 說。另外大約13萬,是由在明尼蘇達的明尼阿波利斯大學的納米多孔材料基因組中心預測出的結構。後者研究沸石和金屬 - 有機骨架:在其晶體結構內有著規律孔的海綿似的材料,可以吸收氣體分子,並且可以用來儲存甲烷或二氧化碳。


AFLOWlib 是最大的資料庫,擁有超過一百萬種不同的材料和大約1億的計算性能。這是因為它包含成千上萬的假設材料,這其中僅僅只有一小部分存在於現實世界裡。Curtarolo 說,「但是,當想要預測一種材料究竟是如何被製造出來時,卻要付出很多努力。」例如,他正在從 AFLOWlib 資料庫中調取數據,研究為什麼一些合金能夠形成金屬玻璃——一種特殊的金屬,有著無序的微觀結構,從而表現出特殊的電磁性能。事實證明,能夠形成金屬玻璃的材料與不能的材料之間的差異,取決於不穩定晶體結構的數量和能量,這些不穩定結構在合金冷卻時與基態原子相「競爭」,掙脫基態的束縛從而形成金屬玻璃。


沃爾弗頓的 OQMD 資料庫包含約40萬假定材料,通過從自然觀察中得出一個晶體結構的列表以及從元素周期表9中的每一個部分選擇元素「修飾」這些假定材料,從而計算得到的這些資料庫。它具有相當寬範圍的鈣鈦礦——其晶體結構通常展示出相當吸引人的特性,例如,超導性和作為微電子開發在太陽能電池中的應用。顧名思義,這個項目在這三個中是最開放的:用戶可以下載整個資料庫到自己的電腦,而不僅僅是單個搜索結果。


所有資料庫都在程序中運行,他們策劃人仍然花費相當一部分時間來增加更多的化合物以及完善的計算 。他們認為,這些還是遠遠不夠完善。這些代碼往往在預測晶體是否穩定方面性能相當不錯,但在預測如何吸收光線或導電性能方面不太好--有時,預測出的半導體看起來像金屬。Marzari 指出,即使是在計算材料學最有成功經驗的電池材料領域,標準計算仍然有平均半伏的誤差,導致性能方面存在許多差異。「事實是,理論本身存在一些錯誤:我們可能永遠無法改正,」Curtarolo 說。


每個團隊都正在開發自己的技術來調整計算以及彌補這些系統誤差。然而,在他們已經用數據做科研的同時,來自其他團隊的用戶也在這麼做。The Marerials Project 確定了幾個有前景的陰極材料,在鋰電池中使用效果比現有的要好一些,同時確定了在太陽能電池中可以提高陽光吸收效率和能量轉化效率的幾種金屬氧化物。今年早些時候,來自都柏林聖三一學院的研究人員使用 AFLOWlib 資料庫預測20哈斯勒合金,一類可被應用於感測器或電腦記憶體的磁鐵,他們成功地合成了兩種該類合金,確認了它們的磁特性非常接近預測結果。


歐洲擴張


材料基因組學已經傳播到歐洲——儘管通常用的是其它名字。例如,瑞士創建了 MARVEL,一個為計算材料科學而成立的機構網路,這個網路由 EPFL 領導,Marzari 做為主管。使用一個新的計算平台,Marzari 創建一個名為材料雲的資料庫,用來搜索「二維」的材料,如石墨,它僅僅由一層原子或分子構成。這樣的材料,應用範圍可以從納米電子擴展到生物醫學領域。為了找到更好的候選材料,Marzari 正在對超過 15 萬的已知材料進行他所謂的「計算剝皮」:計算從一個普通晶體的表面分離出單層結構會消耗多少能量。截止到今年下半年向公眾公布這些資料庫的時候,他預計初步可產生 1500 種二維結構,它們有潛在希望用於實驗測試。


在 Sion 幾公里以外的瑞士阿爾卑斯山之巔,計算化學家 Berend Smit 成立了另一個 EPFL 中心,旨在開發出能夠預測成千上萬的納米多孔沸石和金屬有機框架的演算法。也包括其他一些演算法:一個演算法使用面部識別軟體派生的技術掃描特定氣孔的形狀,從而挑選出從化石燃料發電廠的煙道吸收二氧化碳最佳的備選材料。


Smit 的工作還表明,材料基因組學也會帶來壞消息。許多研究人員曾希望利用納米多孔材料打造用更小的空間存儲更多甲烷的汽車罐。但篩查超過 65 萬種計算材料後,Smit 團隊得出結論,大部分的最好材料已經投入應用。新的選擇可能只帶來輕微的改善,而且目前美國機構設置的能源目標(押注重大技術改進甲烷存儲)可能是不切實際的。


正如這些耐人尋味的例子,在材料基因組學能夠實現其期望以前,仍然有許多障礙需要克服。其中最大的一個障礙就是,計算機模擬只是給出了一些在實驗室製造有趣材料的部分線索,更不要提大規模生產了。「我們一直對製造新化合物有一些有趣的想法」Ceder 說,「有時候,花兩個星期的時間就可以做出來。但有些時候,半年過去了,我們仍然無法做出來,不知道是我們沒有按照正確的方式做,還是它就是不能夠被製造出來。」


Ceder 和 Curtarolo 正在努力開發機器學習演算法,從而從已知的製造工藝中提取方法,指導化合物的合成。


另一個限制是,迄今為止,材料基因組學一直被專門用於工程師所謂的功能材料--即可以實現某種功能的化合物,例如太陽能電池吸收光或者讓晶體管導通電流。但該技術不被用於研究鋼這樣的結構材料,而這樣的材料是被需要的,例如,飛機機翼、橋樑或發動機都需要鋼材。不被用於這種材料是因為材料的彈性和硬度這樣的機械性能依賴於加工過程, 這是不能通過量子力學代碼描述的。


即使是在功能材料領域,目前的計算機代碼只能很好地對完整晶體結構進行分析。 這只是材料領域的一小部分 。「未來最有趣的材料可能會以創造性的方式在微觀層面進行組裝」Galli 說。它們可能是納米顆粒和晶體結構中特地布入缺陷的組合物,或者是纏結了不同化合物和相的異質材料。為了預測這種材料,Galli說,「你需要一次性計算許多性能,以及計算在特定溫度和時間下系統如何變化」。「有方法可以做到這一點,」她說,「但在高通量研究中使用計算的方法太過昂貴」。


在短期內,更多的實驗數據交換可以對計算進行現實檢查,並幫助完善它們。為此,Ceder 正在與麻省理工學院從事軟體研究的團隊進行合作,這種軟體可以讀取實驗類材料科學的論文,並自動以標準格式提取晶體結構的信息。「我們計劃開始在幾個月內將這些數據傳送到材料項目」他說。


從長遠來看,一些幫助將來自摩爾定律:隨著計算能力的不斷提高,一些超出目前計算的技術可能很快變得可用。


「我們已經擺脫了計算材料科學的手工時代,進入了產業化階段,」Marzari說,「我們現在可以創建模擬裝配鏈進行工作,還可以用全新的方法探究問題。」只是現在市場上還沒有計算預測的材料。「但是如果 10 年後再說,」Gall 表示,「我認為會出現很多。」


請您繼續閱讀更多來自 機器之心 的精彩文章:

世界上最聰明的七個人告訴你人工智慧的未來
構建人工智慧系統太難?Facebook 讓機器自行構建人工智慧系統
人工智慧即將顛覆這8大行業,你會因此而失業嗎?
IBM Watson新突破:詞錯率低至 6.9%
您可能感興趣

Nature封面刊文:人工智慧將要重塑材料科學
材料科學迎來爆發突破,IBM的超級計算機助力新材料發掘
《自然》《科學》一周材料科學前沿要聞
第七屆全國生物質材料科學與技術學術研討會
材料科學基礎—史上最全名詞解釋
學校巡視整改第一督導組赴化學與材料科學學院開展督導工作
材料科學專業申請難度大嗎?附相關學校分析
超級運算耗電量大,瑞士材料科學家呼籲基礎研究救地球
著名金屬材料科學家—崔崑院士
中環小課堂 硅材料科普
從材料科學角度解讀:越王勾踐的寶劍為什麼不生鏽!
十月產品熱銷——花境材料科普(六)
每日科學家:1940年3月11日,著名材料科學家周廉誕生
他是開熔爐澆鋁水的材料科學家:「為國家強大做事,這種自豪感錢買不來!」