18歲高中生自研 AI 狂掃 2000 億行數(shù)據(jù),挖出150萬顆未知天體,頂刊論文+25萬美金到手!
一個(gè)高中生,給宇宙來了個(gè)“大掃除”,直接揪出150萬個(gè)以前沒人知道的“太空新鄰居”!
主角Matteo Paz(馬特奧·帕茲),帕薩迪納高中的學(xué)生。他憑著一套全新的AI算法,不僅挖出了這150萬個(gè)太空“新星”,還順帶拓展了NASA一項(xiàng)任務(wù)的潛力,更以獨(dú)立作者身份,在頂刊《天文學(xué)雜志》上發(fā)了篇硬核論文。
就這操作,Paz直接在“再生元科學(xué)天才獎(jiǎng)”中拔得頭籌,斬獲25萬美元大獎(jiǎng)!
一、天才的火花與“點(diǎn)燈人”導(dǎo)師
這帕茲小哥,還在上小學(xué)的時(shí)候,他老媽就帶他去加州理工聽公共的“觀星講座”,那會(huì)兒,宇宙的種子就在他心里發(fā)了芽。
到了2022年夏天,他直接殺到加州理工校園,參加了由天文系教授安德魯·霍華德(Andrew Howard)領(lǐng)銜的“加州理工行星發(fā)現(xiàn)者學(xué)院”,猛補(bǔ)天文和相關(guān)的計(jì)算機(jī)科學(xué)。
2023年,他又報(bào)名了加州理工為期六周的“夏季研究連線”項(xiàng)目。該項(xiàng)目是另一個(gè)由教學(xué)、學(xué)習(xí)與推廣中心(Center for Teaching, Learning, and Outreach)運(yùn)營(yíng)的神仙項(xiàng)目,專門把本地高中生跟校園實(shí)驗(yàn)室的導(dǎo)師們“配對(duì)”。
這時(shí)候,帕茲的“貴人”出現(xiàn)了:天文學(xué)家、IPAC高級(jí)科學(xué)家戴維·柯克帕特里克(Davy Kirkpatrick,下文統(tǒng)稱柯老師)。這位柯老師,在過去的五個(gè)夏天里,除了帶本科生、公民科學(xué)家和訪問研究生學(xué)者,還堅(jiān)持指導(dǎo)高中生。
帕茲提起導(dǎo)師,那是贊不絕口:“能遇到柯老師,我真是太幸運(yùn)了。我記得第一次跟他聊,我就說我想整個(gè)大活兒,搞一篇論文出來。他非但沒勸退我,反而說:‘行啊,那咱聊聊這個(gè)。’ 他給了我一個(gè)毫無束縛的學(xué)習(xí)體驗(yàn)。”
而柯老師自己,也是在良師的指引下才走上天文學(xué)之路的。他成長(zhǎng)于田納西州的一個(gè)農(nóng)業(yè)社區(qū),是他的九年級(jí)化學(xué)和物理老師點(diǎn)燃了他的天文學(xué)夢(mèng)想。當(dāng)時(shí),柯老師的老師告訴他和他的母親,他有潛力,并指導(dǎo)他該如何選課為大學(xué)做準(zhǔn)備。
柯老師說:“我想把這種指導(dǎo)傳承下去,希望能幫到更多的人。如果我看到他們的潛力,我會(huì)確保他們能充分發(fā)揮出來,我會(huì)盡我所能去幫助他們。” 這 mentorship 的傳承,簡(jiǎn)直了!
二、NEOWISE的“數(shù)據(jù)金礦”與導(dǎo)師最初的“小目標(biāo)”
圖注:NEOWISE,近地小行星紅外廣域巡天探測(cè)器
柯老師心里一直惦記著一個(gè)叫NEOWISE(近地天體廣域紅外巡天探測(cè)器)的紅外望遠(yuǎn)鏡。這臺(tái)望遠(yuǎn)鏡雖然現(xiàn)在已經(jīng)“退休”了,但它在過去十多年里,可是兢兢業(yè)業(yè)地掃描了整個(gè)天空,搜尋小行星和其他近地天體。
在它忙著追蹤小行星的時(shí)候,其實(shí)也探測(cè)到了其他更遙遠(yuǎn)宇宙天體的熱量變化——那些劇烈閃耀、規(guī)律脈動(dòng)或者被遮擋時(shí)亮度變暗的天體。天文學(xué)家管這些叫“變?cè)础保╲ariable objects),比如類星體、爆發(fā)的恒星、互相掩食的雙星等等,都是些“神出鬼沒”的家伙。
但問題來了,這些關(guān)于變?cè)吹臄?shù)據(jù),之前一直沒被好好利用。如果NEOWISE團(tuán)隊(duì)能把這些變?cè)醋R(shí)別出來,整理成一個(gè)目錄共享給天文界,那將為了解這些宇宙實(shí)體如何隨時(shí)間演變提供寶貴的線索。
柯老師回憶道:“那時(shí)候,我們那個(gè)記錄了十多年來每一次探測(cè)的表格,數(shù)據(jù)量已經(jīng)快接近2000億行了!” 我的天,2000億行!手動(dòng)翻?那不得翻到地老天荒?
“所以我當(dāng)時(shí)給暑期項(xiàng)目的想法是,先挑一小塊天空區(qū)域,看看能不能手動(dòng)找到一些變星。然后我們可以把這些發(fā)現(xiàn)展示給天文界,說:‘瞧,這是我們手動(dòng)發(fā)現(xiàn)的新東西;你們想象一下這個(gè)數(shù)據(jù)集里還藏著多大的潛力!’”
三、高中生的“AI外掛”:從“大海撈針”到“宇宙級(jí)掃描”
圖注:Matteo Paz 在 2023 年的一次研討會(huì)上介紹了他項(xiàng)目的研究初期工作。照片:Kitt
于是,這個(gè)事兒就交給了帕茲。
帕茲在學(xué)校選修的一門整合了編程、理論計(jì)算機(jī)科學(xué)和形式數(shù)學(xué)的課程,早就深諳AI之道。
帕茲心里門兒清:AI訓(xùn)練,最喜歡的就是像柯老師給他的這種量大管飽、還井井有條的數(shù)據(jù)集。而且,他編程所需的大學(xué)高階數(shù)學(xué)知識(shí),在帕薩迪納聯(lián)合學(xué)區(qū)的數(shù)學(xué)學(xué)院(Math Academy)里啃完了。
帕茲開始開發(fā)一種機(jī)器學(xué)習(xí)技術(shù),目標(biāo)是分析整個(gè)NEOWISE數(shù)據(jù)集,并標(biāo)記出潛在的變?cè)础>驮谀嵌潭痰牧芾铮腁I模型初稿就搞出來了,而且效果初顯。期間,他不斷跟柯老師請(qǐng)教,學(xué)習(xí)相關(guān)的天文和天體物理知識(shí)。
“每次和柯老師開會(huì),都是10%的工作,剩下90%的時(shí)間我倆就是瞎聊,”帕茲笑著說。“能有個(gè)人這樣一起聊科學(xué),感覺超酷的。”
柯老師還把他引薦給了加州理工的天文學(xué)家舒巴內(nèi)·赫馬蒂(Shoubaneh Hemmati)、丹尼爾·馬斯特斯(Daniel Masters)、阿希什·馬哈巴爾(Ashish Mahabal)和馬修·格雷厄姆(Matthew Graham)。這些大牛們?cè)谔煳臋C(jī)器學(xué)習(xí)技術(shù)以及短時(shí)標(biāo)、長(zhǎng)時(shí)標(biāo)變?cè)囱芯糠矫妫冀o了帕茲不少專業(yè)指導(dǎo)。
現(xiàn)在,帕茲已經(jīng)把他的AI模型打磨得爐火純青,處理了NEOWISE觀測(cè)到的所有原始數(shù)據(jù),并對(duì)結(jié)果進(jìn)行了分析。這個(gè)被訓(xùn)練來探測(cè)望遠(yuǎn)鏡紅外測(cè)量中微小差異的算法,在數(shù)據(jù)中標(biāo)記并分類了150萬個(gè)潛在的新天體!師徒二人計(jì)劃在2025年,把NEOWISE數(shù)據(jù)中亮度變化顯著的天體的完整目錄發(fā)表出來。
四、“不務(wù)正業(yè)”的AI與導(dǎo)師的“人生高光”
你以為這AI只能看星星?那格局就小了。
帕茲說:“我實(shí)現(xiàn)的這個(gè)模型,不僅能用于天文學(xué)的其他時(shí)域研究,理論上還能用于任何以時(shí)間序列格式出現(xiàn)的數(shù)據(jù)。我能預(yù)見到它在(股市)圖表分析方面的應(yīng)用潛力,因?yàn)槟切┬畔⒁彩菚r(shí)間序列,周期性成分可能至關(guān)重要。你甚至可以用它來研究大氣效應(yīng),比如污染,其中季節(jié)性和晝夜循環(huán)就扮演著重要角色。”
帕茲在科學(xué)獎(jiǎng)上的成功,也讓柯老師對(duì)“為人師表”有了新的感悟:“當(dāng)他們宣布馬特奧是科學(xué)競(jìng)賽的冠軍時(shí),那是我人生中經(jīng)歷過的最激動(dòng)人心的時(shí)刻。我自己以前也獲過獎(jiǎng),那當(dāng)然很刺激,但是當(dāng)你幫助別人發(fā)揮了他們的潛力,并因此得到認(rèn)可時(shí),那種感覺太美妙了。”
圖片
2025 年再生元科學(xué)人才搜索一等獎(jiǎng)得主馬特奧·帕茲手持他的獎(jiǎng)杯。照片:科學(xué)協(xié)會(huì)
柯老師補(bǔ)充道:“我們能多大程度上發(fā)掘本地社區(qū)里那些真正聰明的年輕人,指導(dǎo)他們,確保他們的潛力不被埋沒和流失,我們整個(gè)社會(huì)就會(huì)變得更好。”
現(xiàn)在,帕茲一邊完成他的高中學(xué)業(yè),一邊已經(jīng)是加州理工的正式員工了。他在IPAC為柯克帕特里克工作,參與管理、處理、存檔和分析來自NEOWISE以及NASA和NSF支持的其他幾個(gè)空間任務(wù)的數(shù)據(jù)。這可是帕茲小哥人生第一份帶薪工作!