算法聞到榴蓮臭!Science:AI嗅覺超人類,谷歌繪出50萬氣味圖譜
你想知道,下面這個分子是什么味道嗎?(文末揭曉)
圖片
8月31日,科學家在Science上發文稱,AI模型可以讓機器擁有比人類具有更好的「嗅覺」。
圖片
論文地址:https://www.science.org/doi/10.1126/science.ade4401
在這篇論文中,研究人員提出了一種由數據驅動的人類嗅覺高維圖譜(POM)。這個圖譜逼真地再現了由單一分子誘發的氣味感知類別的結構和關系。
圖片
50萬種氣味顏色都與AI預測的氣味標簽相匹配
研究證明,機器學習模型在理解和描述氣味上,已經達到了人類的水平。
并且,在氣味描述的前瞻性預測上,AI的準確度已經超過了人類個體!
這意味著,機器感知的邊界將進一步擴大——從視覺、聽覺,再到嗅覺.....
未來的機器將擁有更多的感知,真正感受和理解自身所處的世界,而不再只是從各種描述中,體驗一個懸空的符號世界。
圖片
而既然AI模型能將分子結構映射到氣味上,它就可以幫我們創造特定的食物口味,或者找到更好的驅蚊化合物。
空氣中的化學物質,如何與大腦的氣味感相連?
人類有大約400個功能性嗅覺受體。
這些是位于嗅覺神經末端的蛋白質,它們與空氣中的分子連接,將電信號傳輸到嗅球(olfactory bulb)。
嗅覺受體的數量遠遠超過我們用于視覺的4個,甚至是超過味覺的約40個。
圖片
在嗅覺研究中,究竟是什么物理特性讓空氣傳播的分子在大腦中產生氣味,一直是個迷。
神經科學的主要目標是了解感官是如何將光轉化為視覺、將聲音轉化為聽覺、將食物轉化為味覺以及將質地轉化為觸覺的。
對于視覺和聽覺,學界已有了完善的圖譜將物理屬性(如頻率和波長)和感知屬性(如音高和顏色)相關聯。
但嗅覺還沒有這樣的圖譜。
如果計算機能夠識別分子的形狀,以及我們最終如何感知氣味之間的關系,科學家就可以利用這一知識來加深對人類大腦和鼻子如何協同工作的理解。
為了解決這個問題,莫奈爾化學感官中心(Monell Chemical Senses Center)和初創公司Osmo(從谷歌分離出來)共同領導的一個研究小組,正在研究空氣中的化學物質是如何與大腦中的氣味感知相聯系。
算法根據分子結構預測氣味
分子結構如何才能映射到氣味感知中?
更具體地說,計算機是否可以根據分子結構預測氣味,以及是否優于人類嗅覺的能力。
為了解決這個問題,Alex Wiltschko博士和團隊創建了一個機器學習模型——即消息傳遞神經網絡(MPNN)。
這是一種特定的圖神經網絡,以學習如何將分子氣味的形象化描述與氣味的分子結構相匹配。
圖片
為了繪制分子結構如何與分子氣味相對應圖譜,研究人員使用了5000種已知化合物的數據集來訓練模型。
這些化合物與它們相應嗅覺標簽配對,比如,果味、花香、芝士味、薄荷味等等。
研究人員結合了Good Scents and Leffingwell & Associates (GS-LF) 香精香料數據庫(圖B),建立了一個包含約 5000 個分子的參考數據集,每個分子都有多個氣味標簽(如奶油味、青草味)。
在這個數據集中,數據輸入是分子的形狀,輸出是對哪些氣味詞最能描述其氣味的預測。
GS-LF香精香料數據庫數據庫
為了訓練模型,研究人員使用Adam優化了模型參數:將加權交叉熵損失超過150個epoch,學習率從5×10衰減 (?4) 到1×10 (?5) ,批大小為128。
此外,GS-LF數據集被拆分為80/20訓練/測試集,其中80%的訓練集進一步細分為五個交叉驗證集。
有了這些交叉驗證集,就可以使用Vizier(一種貝葉斯優化算法),通過調整1000次試驗,來優化超參數。
當正確調整超參數時,其性能在許多模型體系結構中都是穩健的。
經驗感知空間(圖D)直觀地表示了感知距離(例如,聞起來有茉莉花香味的兩個分子之間的距離應該比聞起來有牛肉味的分子之間的距離近)和層次(例如,茉莉花和薰衣草是花香氣味家族的子類型)。
氣味感知距離和層次
但研究表明,這種結構在基于摩根指紋的氣味空間圖(Morgan fingerprint-based maps)中丟失了(圖E),但POM保留了相對感知距離和層次結構(圖F)。
圖片
對此,Wiltschko表示,「計算機已經能夠將視覺和聽覺數字化,但無法將嗅覺數字化——我們感受世界最深層次的感官,這項研究提出并驗證了一種新的數據驅動的人類嗅覺圖譜,將化學結構與氣味感知相匹配?!?/span>
大蒜和臭氧,是什么味道?
為了確定這個模型的有效性(能否擴展到新的氣味上),莫內爾大學的研究人員進行了一個盲驗證過程。
在這個過程中,一組訓練有素的研究參與者會描述新分子,然后他們的答案會與模型的描述進行比較。
15名小組成員每人會被要求聞400種氣味,并且接受了訓練,用55個單詞(從薄荷到霉味)來描述每種分子。
共同一作Emily Mayhew博士表示:我們對這個模型非常有信心。
Mayhew在莫奈爾讀博期間,參與了這項研究。她現在是密歇根州立大學的助理教授。另一位共同一作是Brian K. Lee博士,來自谷歌團隊。
為了教會被試們識別氣味、選擇最合適的詞來描述自己的感覺,莫奈爾團隊專門設計了一個氣味參考工具包。
這是因為,在過去的研究中,很多被試會犯一些常見錯誤,比如將霉味和麝香混為一談。
被試會被要求從55個選項中,選擇最適用的描述術語,并且對400種氣味中的每一種,用1到5分來打分,來評定這個術語在多大程度上適合于這個氣味。
一位專家組成員,就將以前未定性的氣味劑2,3-二氫苯并呋喃-5-甲醛的氣味,評為粉末狀,有點腥臭。
在人類嗅覺和AI模型最終pk中,質量控制也非常重要。
這就輪到英國Reading大學的風味化學教授Jane Parker出場了。
她的團隊驗證了用于測試模型預測的樣品的純度。
首先,他們用氣相色譜法,分離出樣品中的每種化合物,包括任何雜質。
接下來,團隊成員會分別聞嗅每種分離出的化合物,以確定是否有雜質壓倒了目標分子的已知氣味。
Parker說:「在測試的50個樣品中,我們確實發現了一些含有明顯雜質的樣品?!?/span>
比如,在某個案例中,雜質來自合成目標分子時使用的試劑的痕跡,并賦予樣品一種獨特的黃油氣味,超過了感興趣的氣味?!冈谶@種情況下,我們能夠解釋為什么小組對氣味的描述與人工智能的預測不同?!?/span>
這種雜質來自于合成目標分子時使用的一種試劑,它使樣品散發出一種獨特的奶油味,這種奶油味就蓋過了相關氣味物質的氣味。
「在這種情況下,我們就明白為什么專家組成員對氣味的描述與AI的預測不同?!?/span>
AI嗅覺,趕超人類
研究人員將模型與個人小組成員的表現進行比較時,除了雜質,該模型對小組氣味評級平均值的預測比研究中的任何一個小組成員都要好。
具體來說,在53%的測試分子中,該模型的表現都優于小組成員的平均值。
圖片
GNN模型的總體表現達到了人類水平,但它在不同感知和化學類別中的表現如何呢?
研究人員按氣味標簽對其性能進行分類時,除麝香外,該模型在所有標簽上的表現都在人類評分者的分布范圍之內,并且在30/55個標簽上的表現超過了小組成員的中位數(55%)。
按標簽劃分的結果表明,GNN模型優于之前在相同數據上訓練的最先進模型。
模型性能在結構類和感知類中都很穩健
對特定標簽的預測性能,取決于該標簽的結構-氣味映射的復雜程度。
因此不難理解,模型在大蒜和腥味等具有明確結構決定因素(大蒜為含硫;腥味為胺)的標簽上表現最佳,而在麝香標簽上表現最差,因為麝香標簽至少包括五種不同的結構類別(大環、多環、硝基、甾體類型和直鏈)。
相比之下,小組成員對特定標簽的表現取決于他們對該標簽在氣味背景下的熟悉程度。
因此,小組成員中對堅果、大蒜和芝士等描述常見食物氣味的標簽的一致性很強,而對麝香和干草等標簽的一致性較弱。
模型的性能還取決于特定標簽的訓練示例數量。有了足夠的示例,模型甚至可以學習到復雜的結構與感知之間的關系。
一般來說,對于訓練示例較多的標簽(如果味、甜味、花香),模型性能較高(圖B),但對于訓練示例較少的標簽,模型性能要么較高(如腥味、樟腦味、涼意),要么較低(如臭氧、尖銳、發酵)。
同樣,模型性能也受到面板測試-重復相關性的限制。
圖片
按化學類別(如酯類、酚類、胺類)進行分類時,專家小組和模型的表現相對一致(圖C),其中含硫分子的專家小組和模型表現最強。
此外,模型在不同嗅覺任務中的表現依然出色。甚至能在沒有經過訓練的嗅覺任務上也取得成功。
圖片
并且,該模型能夠識別出幾十對結構不同但氣味卻非常相似的分子,還能描述潛在氣味分子的各種氣味特性,如氣味強度。
而通過模型可以直接計算出分子在POM中的坐標(圖A),研究人員根據這些坐標編制出了大約50萬種潛在的氣味!
圖片
這個數量遠遠超出了目前氣味目錄所涵蓋的空間(約5000種可購買的、有特征的氣味物質)。
這些分子需要訓練有素的人類小組成員花費約70人/年的連續嗅覺時間才能收集到。
最后,解答下開篇中提到分子味道,其實是榴蓮的臭味分子。
參考資料:https://www.science.org/doi/10.1126/science.ade4401