OpenAI再招華人研究員!高中入圍美國“少年諾貝爾獎”,還在哈佛教書
就在剛剛,哈佛華人研究員Jeffrey Wang正式官宣加入OpenAI——
將作為基礎團隊研究員,負責模型預訓練和推理。
消息公布后,OpenAI聯創&總裁Greg Brockman也在第一時間帶隊歡迎。
在這之前,Jeffrey Wang在哈佛一邊教課一邊研究機器學習。
從哈佛加入OpenAI,高中入圍美國“少年諾貝爾獎”
在從加利福尼亞一所高中畢業后,Jeffrey Wang于2021年本科入學哈佛,專業為數學和計算機科學,同時輔修了英語。
從今年9月開始,他就已經在為OpenAI工作,也許是這幾個月的經歷,讓他最終決定現在加入OpenAI。
實際上,在哈佛期間,還是學生的Jeffrey Wang已經開始一邊教課一邊研究機器學習了。
從去年1月開始,他為計算機科學和統計學系的61名學生講課。
而且同一時間,還兼顧著工程與應用科學學院研究員一職,主要方向為機器學習模型的魯棒性和隱私性。
期間擔任共同一作的兩篇論文還分別亮相了NeurIPS SoLar(2023)和ICML(2024)研討會。
第一篇《MoPe : Model Perturbation-based Privacy Attacks on Language Models》
MoPe:基于模型擾動的語言模型隱私攻擊
簡單理解,這篇論文提出了MoPe(Model Perturbations)這種新檢測工具,它能幫助人們判斷某個特定的文本是否被用來訓練過大語言模型。
這個工具通過在模型參數中加入一些擾動(噪聲),然后觀察這種擾動對模型預測的影響來工作。研究發現,MoPe比之前的方法更有效(從70M到12B參數范圍內),可以更準確地模擬出模型參數變化對預測的影響。
另外研究還發現,僅僅看一個訓練點的損失值是不夠的,因為有些損失值普通的點也能被MoPe成功恢復,這挑戰了之前一些依賴損失值來判斷信息是否被模型記住的研究。
第二篇《Bias Begets Bias: the Impact of Biased Embeddings on Diffusion Models》
偏見滋生偏見:偏見嵌入對擴散模型的影響
這篇論文研究了嵌入空間中的偏見如何影響擴散模型的公平性。
作者們提出,無偏見的文本嵌入對于生成平衡的圖像分布是必要的,并且發現偏見的多模態嵌入(如CLIP)會導致評估圖像與文本提示對齊度時的得分降低,從而無意中獎勵了不公平的行為。
當然,論文還提出了一個理論框架來研究評估中的偏見,并提出了減輕偏見的方法。
除此之外,高中階段的Jeffrey Wang就因“開發統計方法來探測3D基因組結構變化”而獲得國家級獎項。
2021年,他決賽入圍了(前40名)再生元科學天才獎(Regeneron Science Talent Search, STS),這是美國歷史最悠久、最負盛名的高中生研究競賽,有美國“少年諾貝爾獎”之稱。
而且進入前40的選手每人將獲得25000 美元(最低)獎金。
這項研究是他和Abhijit Chakraborty博士合作兩年的成果,前者在周末和休息時間跑到對方實驗室實習觀摩。
他們研究了染色體中DNA的結構。由于許多發育和疾病過程,包括癌癥,都是由DNA三維排列的變化引起的,因此Jeffrey創建了一個計算機應用程序,用于識別和排列不同細胞系基因組中這種排列的顯著差異。
該程序僅基于DNA的三維形狀,就能方便地定位重要的基因和路徑。
后來,他還將這一模型公開了(現已被50多個實驗室使用),以便更多人用于發現新的路徑、調節機制和癌癥靶點。
還是個writer
BTW,除了顯而易見地熱愛開發,Jeffrey Wang還是個小有成就的作家。
早在2019年,他就簽約了《The Adroit Journal》,這家位于紐約成立于2010年的雜志社,主要展示全球新興作家的詩歌、散文和藝術,其作品收錄率低于1%。
接受了文學藝術熏陶后,他又馬不停蹄地簽約了PBH Network長篇歷史作家,其多個聯合作品的點擊量超過25萬次。
一直到現在,他還在美國知名在線問答平臺Quora分享歷史、科學和統計方面的故事,其作品總計超過600萬次瀏覽。
好嘛,能文能武又開始具象化了(doge)。
不過也有網友借機調侃,“退學”加入OpenAI群體+1。
要知道類似消息在OpenAI也不算少見,前一陣還招了一個高中就輟學的瑞典小哥,入職Sora團隊專攻AGI。
甚至OpenAI CEO奧特曼,也是19歲從斯坦福大學計算機專業退學,創立了自己的第一家公司。
……
都快成一種企業文化了。(bushi
論文1:https://aclanthology.org/2023.emnlp-main.842.pdf
論文2:https://arxiv.org/pdf/2409.09569