機器學(xué)習(xí)借助材料科學(xué),能高效解決費力的人力工作
(文章來源:博科園)
通過使用機器學(xué)習(xí)作為一種圖像處理技術(shù),科學(xué)家可以在不犧牲準確性的情況下,極大地加快迄今費力的人工定量尋找和查看界面的過程。在從電池到半導(dǎo)體的系統(tǒng)中,邊緣和界面在決定材料性能方面起著至關(guān)重要的作用??茖W(xué)家們被迫研究樣本中兩種或兩種以上不同成分相遇的地方,以創(chuàng)造出更堅固、更節(jié)能或更持久的材料。
#科學(xué)了不起#現(xiàn)在在美國能源部阿貢國家實驗室的一項新研究中,研究人員采用了一項基于機器學(xué)習(xí)的新技術(shù)。機器學(xué)習(xí)可以揭開材料中埋藏的界面和邊緣的秘密,用來產(chǎn)生使用機器學(xué)習(xí)進行分析的數(shù)據(jù)實驗技術(shù)被稱為原子探針斷層攝影術(shù),研究人員在這種技術(shù)中挑選出針狀的三維小樣本。
然后從樣本中剝離單個原子,然后進行飛行時間測量和質(zhì)譜分析,以確定特定原子在材料中的來源。此過程生成樣本中原子位置非常大的數(shù)據(jù)集,為了分析這個數(shù)據(jù)集,研究人員將其分割成二維切片。然后將每個切片表示為一幅圖像,機器學(xué)習(xí)算法可以在該圖像上確定邊緣和界面。
在訓(xùn)練算法識別界面時,由阿貢材料科學(xué)家和研究作者奧勒·海諾寧(Olle Heinonen)領(lǐng)導(dǎo)的團隊使用了一種非傳統(tǒng)方法。海諾寧和同事們沒有使用邊界可能定義不清的材料庫圖像,而是從貓和狗的照片開始,以幫助機器學(xué)習(xí)算法了解圖像中的邊緣。在訓(xùn)練算法時,這些形狀對我們來說很簡單。
但對計算機來說卻很復(fù)雜,所這是提供了一個有用的試驗場。然后,研究人員通過匯編一組分子動力學(xué)模擬來證明機器學(xué)習(xí)算法的準確性,用它們來制作合成數(shù)據(jù)集,在這些數(shù)據(jù)集中,模擬樣本的組成是完全已知的。通過回到機器學(xué)習(xí)的方法,能夠提取成分信息,并將它們與實際情況進行比較。以前,嘗試從原子探針斷層掃描數(shù)據(jù)創(chuàng)建這些類型的濃度分布涉及勞動密集型的手動過程。
通過將機器學(xué)習(xí)算法與新開發(fā)的定量分析軟件搭配使用,科學(xué)家可以極大地加快對各種材料界面的分析速度。該方法是可擴展的,可以把它放在高性能計算上并完全自動化,而不是手動完成并查看不同的濃度,在這里發(fā)送代碼并按下一個按鈕就可以實現(xiàn)。雖然這項技術(shù)是為原子探針斷層掃描而開發(fā)的,但可以適用于任何類型的斷層掃描,甚至像X射線斷層掃描這樣不一定能揭示原子位置的技術(shù)。
無論在哪里擁有包含一些結(jié)構(gòu)信息和接口的三維數(shù)據(jù)集,這項技術(shù)都會很有用。催生這項研究合作值得注意的是,包括來自廣泛不同領(lǐng)域的專家,包括數(shù)學(xué)、人工智能、納米科學(xué)、材料科學(xué)和計算機科學(xué)。研究團隊匯集了各種各樣的專業(yè)知識,以解決材料表征方面的一個具有挑戰(zhàn)性的問題。研究作者阿貢計算機科學(xué)家普拉桑娜·巴拉普拉卡什說:從機器學(xué)習(xí)的角度來看,我們必須克服的一個關(guān)鍵挑戰(zhàn)是數(shù)據(jù)匱乏。
在典型的機器學(xué)習(xí)環(huán)境中,訓(xùn)練和學(xué)習(xí)所需的標記數(shù)據(jù)是豐富的,但在原子探針斷層掃描中,進行每個實驗并手動將等濃度表面識別為標記數(shù)據(jù)需要大量的時間和精力,這阻止了我們直接應(yīng)用深度學(xué)習(xí)方法。
? ? ?