尋找暗物質(zhì),機器比人的眼神好。近期《計算天體物理學(xué)和宇宙學(xué)》發(fā)表的一篇論文顯示,美國勞倫茲伯克利國家實(shí)驗室(以下簡(jiǎn)稱(chēng)“伯克利實(shí)驗室”)等機構共同研制的深度學(xué)習AI框架,能夠探尋宇宙里暗物質(zhì)的跡象。
近幾年,人工智能越來(lái)越多應用于天文學(xué)研究。深度學(xué)習需要海量數據,而天文學(xué)正是AI大顯身手的領(lǐng)域。機器可以替人類(lèi)從茫茫大海里撈針,捕捉到新的恒星、新的地外行星甚至暗物質(zhì)。
辨認“引力透鏡”,AI立功了
尋找“引力透鏡”是研究暗物質(zhì)分布的基本方法。巨大質(zhì)量的物體會(huì )像透鏡一樣扭曲路過(guò)的光線(xiàn),找出這種扭曲就能捕捉到不發(fā)光的質(zhì)量物。
論文顯示,伯克利實(shí)驗室建立的深度學(xué)習AI框架CosmoGAN,可以分析引力透鏡與暗物質(zhì)的關(guān)聯(lián)。它可以創(chuàng )建高保真、弱引力透鏡收斂圖。
曾幾何時(shí),尋找“引力透鏡”所需的模擬和數據處理很麻煩。20名科學(xué)家花費了好幾個(gè)月的時(shí)間只能查看一小塊空間圖像。物理模擬需要數十億個(gè)計算小時(shí),占用數兆字節的磁盤(pán)空間。
神經(jīng)網(wǎng)絡(luò )的進(jìn)步提供了機會(huì )。伯克利實(shí)驗室領(lǐng)導的團隊引入一種“生成性對抗網(wǎng)絡(luò )(GANs)”。研究者穆斯塔法說(shuō):“也有別的深度學(xué)習方法可以從許多圖像中得到收斂圖,但與競爭方法相比,GANs生成非常高分辨率的圖像,同時(shí)仍有神經(jīng)網(wǎng)絡(luò )的高效率!
現在,天文學(xué)家可以用CosmoGAN分析大得多的天區,速度也更快。
CosmoGAN不是唯一取得進(jìn)展的天文學(xué)深度學(xué)習神經(jīng)網(wǎng)絡(luò )。比如多倫多大學(xué)利用深度學(xué)習技術(shù)解析月球隕石坑的衛星圖像,P8超級計算機的神經(jīng)網(wǎng)絡(luò )在僅僅幾個(gè)小時(shí)內發(fā)現6000個(gè)新的隕石坑,是過(guò)去幾十年中人類(lèi)發(fā)現隕石坑數量的2倍。伊利諾伊大學(xué)厄巴納-香檳分校利用深度學(xué)習來(lái)探測和分析黑洞碰撞的引力波。AI在天文學(xué)遍地開(kāi)花。
數據太多,沒(méi)機器玩不轉
過(guò)去幾年里,天文領(lǐng)域的大多數方向都在嘗試使用人工智能?紤]到天文學(xué)要處理的數據之多,這是一個(gè)很自然的思路。讓機器練習去分析蛛絲馬跡,不如此,未來(lái)的天文學(xué)將無(wú)法運轉。
不久前舉辦的2019年GPU技術(shù)大會(huì )吸引了全世界的人工智能學(xué)者。大會(huì )請來(lái)加州大學(xué)圣克魯茲分校的天文學(xué)家布蘭特·羅伯特森演講,他指出:“天文學(xué)正在一場(chǎng)新的數據革命的風(fēng)口”。羅伯特森認為,新一代天文儀器必須配合由深度學(xué)習驅動(dòng)的新一代軟件。
比如預計在3年后運行的大口徑全天巡視望遠鏡(LSST)。它巡視南天那一半宇宙中的370億個(gè)星系,生成一部時(shí)長(cháng)十年的不間斷視頻。LSST配備的是32億像素的相機,每晚產(chǎn)生25TB的數據,相當于現在先進(jìn)天文望遠鏡一生貢獻的所有數據。
再比如平方公里陣列射電望遠鏡(SKA)。它遍布全球,一部分天線(xiàn)在非洲南部8國部署,還有100多萬(wàn)天線(xiàn)位于澳大利亞和新西蘭。它的原始數據每天達到5千個(gè)PB,處理后也有50個(gè)PB左右。
“暗能量巡天”編制幾億個(gè)星系的星圖;“蓋亞”衛星測繪銀河系數十億恒星;“茲威基”項目每小時(shí)能夠掃描3750平方度的天區。在中國,FAST每天的數據量將達150TB;郭守敬望遠鏡觀(guān)測了901萬(wàn)條光譜,是世界上最大的天體光譜庫……
捕捉人類(lèi)看不出的模式
數據越來(lái)越多,科學(xué)家試圖聚合它們。但在GPU大會(huì )上,羅伯特森說(shuō),未來(lái)幾個(gè)大型天文望遠鏡一起產(chǎn)生大量數據,聚合之后復雜到人類(lèi)無(wú)法直接利用。而加州大學(xué)圣克魯斯分校的科學(xué)家試圖解決這個(gè)問(wèn)題。計算機科學(xué)系一名博士生創(chuàng )建的Morpheus深度學(xué)習框架,可以基于望遠鏡的原始數據,逐像素地分類(lèi)天體。
加州大學(xué)圣克魯茲分校的科學(xué)家們還用AI更好地研究星系的形成。在他們2019年初發(fā)表的一項研究中,科學(xué)家用計算機模擬的星系訓練計算機,讓它學(xué)習星系演化的三個(gè)關(guān)鍵階段。后來(lái)計算機分析來(lái)自哈勃太空望遠鏡的星系圖像,表現出奇好。
人工智能應用于人臉識別,在海量數據訓練后,可以根據一張照片,認出這個(gè)人化妝和年老時(shí)候的樣子。而宇宙中很多圖像也可用同樣的方法來(lái)歸類(lèi)。
“深度學(xué)習可以尋找模式,機器能看到非常復雜的模式,而人類(lèi)看不到!眳⑴c研究的科學(xué)家大衛·庫說(shuō),“我們希望進(jìn)一步測試這種方法。在概念驗證研究中,機器似乎成功地在數據中找到了模擬中確定的星系演化的不同階段!
幫天文學(xué)家找到另一個(gè)太陽(yáng)系
2018年底的一篇報道顯示,谷歌人工智能發(fā)力,從開(kāi)普勒系外行星觀(guān)測數據庫里找到了新的行星。行星是很難尋找的。位于太空的開(kāi)普勒衛星觀(guān)察145000顆類(lèi)似太陽(yáng)的恒星,從恒星亮度微弱變化來(lái)發(fā)現行星。記錄4年的數據中,包括大約35000個(gè)疑似的行星記錄。天文學(xué)家用機器結合人眼來(lái)識別,但最暗最弱的信號常被忽略。
在谷歌AI的幫助下,我們發(fā)現了開(kāi)普勒90i和開(kāi)普勒80g兩顆新行星。也讓開(kāi)普勒90被確認為第一個(gè)至少擁有8顆行星的外星系。
神經(jīng)網(wǎng)絡(luò )和機器學(xué)習處理了140億個(gè)數據點(diǎn),之后成功篩選出了候選者。
NASA和谷歌說(shuō),未來(lái)新技術(shù)將找到更多系外行星。NASA還表示不用擔心天文學(xué)家失業(yè)。NASA的科學(xué)家杰西·道特森解釋表示,數據提供給神經(jīng)網(wǎng)絡(luò )之前,需要天文學(xué)家進(jìn)行分類(lèi),以便人工智能可以從中學(xué)習分析出新的信息。
道特森說(shuō):“AI以后絕對會(huì )和天文學(xué)家一起工作,成為必不可少的工具!
當然,機器學(xué)習也帶來(lái)“黑盒子”風(fēng)險:我們得到了答案,但我們不知道機器為何如此判斷,或許答案是錯的。機器也會(huì )犯錯。天文學(xué)家將繼續訓練和適應它。 |