成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計 原創

發布于 2025-5-28 13:55
瀏覽
0收藏

清華大學劉洋老師組、人民大學高瓴人工智能學院黃文炳老師組、字節跳動 AI 制藥團隊共同提出了一種跨分子種類統一生成框架 UniMoMo 。該框架基于分子片段(block)對不同種類的分子進行統一表示,使用變分自編碼器對每個 block 的全原子構象進行壓縮,并在壓縮后的隱空間進行幾何擴散建模(diffusion),從而實現對同一靶點不同結合分子種類(小分子、多肽、抗體)的設計。 UniMoMo 在多類分子任務基準的評測中均實現領先表現,展示了跨模態知識遷移與數據共享的巨大潛力。

入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計-AI.x社區

相關成果以「UniMoMo: Unified Generative Modeling of 3D Molecules for De Novo Binder Design」為題,入選 ICML 2025 。

論文地址:

???https://go.hyper.ai/wZXZZ????

開源項目地址:

??https://github.com/kxz18/UniMoMo??????

為什么需要統一建模

不同的分子類型在藥物開發中各有優劣,因此在不同的疾病場景中往往需要選擇最合適的分子類型。例如:

* 小分子體積小、易于口服、穿透性強,適合進入細胞內部作用于靶點,廣泛應用于慢性病和代謝類疾病等;

* 多肽類分子擁有較高的靶向性,能夠與蛋白質表面的大而平的區域結合,適合靶向「難成藥」的蛋白互作位點,常用于癌癥、炎癥等治療中;

* 抗體具有極高的選擇性和親和力,能夠穩定識別特定的蛋白標志物,特別適合免疫治療等精確干預場景。

因此,面對不同的疾病機制、靶點特征和用藥需求,適合使用的分子類型是不同的。現有的生成方法通常只針對某一類分子(如小分子、肽或抗體)進行建模,

既無法滿足多樣化的治療需求,也無法利用不同分子之間的共性來提升模型性能。

從應用角度來看,統一建模可以讓我們針對同一個靶點同時探索多種類型的候選藥物,為不同的下游場景提供更多選擇。

從機器學習角度出發,不同分子類型之間共享相似的結合規律(氫鍵、π-π 堆疊、鹽橋等)和幾何約束(鍵長、鍵角等),是可以相互借鑒的,

因此統一建模通過利用更大的數據規模,應當能提升模型的泛化能力和交叉遷移能力。

入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計-AI.x社區

UniMoMo 為同一結合位點設計不同種類的結合分子

生成式統一建模的困難

盡管統一生成不同類型分子的想法令人期待,但要實現這樣一個框架仍面臨巨大挑戰,主要體現在分子表示的選擇,以及生成算法的設計上。

首先,不同分子類型在結構表示上存在較大差異:小分子由各種官能團組成,結構高度多樣且非線性;而肽和抗體則由氨基酸以線性序列連接構成,尤其抗體還具有功能明確的功能區域劃分。一種直觀但效果不佳的做法是將所有分子都視為原子圖來建模。

然而這種方式忽略了分子天然的層次結構,比如苯環或標準氨基酸等關鍵子結構,并且導致在處理如抗體這類結合面較大的體系時計算成本極高。

反之,如果僅使用常見的結構片段詞表構建立片段級別的圖(例如多數蛋白質設計的工作,只考慮 Cα 坐標),

而忽略原子級細節,則會犧牲分子生成的可遷移性與精度,因為結合分子設計的本質規律是與靶點的空間相互作用,以及分子內部的幾何約束,這些都是定義在原子級別上的物理規律,需要精確的全原子信息支持。

因此,要構建一個真正有效且高效的統一分子表示,就必須同時解決兩個難題:

既要保留原子層面的幾何細節,又要抽象出結構上的層級先驗。

其次,如果在生成中引入結構片段來保留層級先驗,則對生成算法帶來核心挑戰:

傳統的擴散模型通常依賴于定長、固定結構的數據表示,例如固定數量的點云或原子。對于 AF3 一類的結構預測模型而言,由于 2D 拓撲是提前給定的,擴散過程中并不會產生原子數或 2D 結構的變化。而對于分子生成的任務,2D 拓撲和 3D 結構是需要被同時生成的,而當去噪過程中結構片段的類型發生變化時,其所對應的原子數量、種類和排布都會隨之改變。這一點打破了常規擴散模型的假設,對建模提出了極高要求。

UniMoMo:統一的生成模型

為了解決不同分子類型結構差異大、建模難度高的問題,文章提出了一個全新的框架——UniMoMo,

它從兩個關鍵設計入手,有效兼顧了結構的層次性和原子級精度:

* 統一表示:以 block 形式建模所有分子類型。

無論是小分子、肽還是抗體,UniMoMo 都將其結構表示為由分子片段(block)組成的圖。其中每個 block 可以是一個標準氨基酸,也可以是一個常見的小分子片段(如苯環、吲哚等)。在文章的實現中,記錄的分子片段包括所有標準氨基酸和由主子圖(principle subgraph)挖掘算法自動識別而得的小分子片段。所有的非天然氨基酸可以當作小分子進行分詞。

這種表示方式既同時保留了分子的原子級別細節,以及不同種類分子自身的層級結構,使統一建模成為可能。

* 全原子幾何隱空間擴散模型:在壓縮表示上進行高效生成。

為了解決生成過程中 block 種類改變導致的原子種類和數量同步改變的問題,并且為了提升生成效率和結構精度,

文章設計了一個全原子的迭代變分自編碼器(IterVAE),將每個 block 中的所有原子壓縮為隱空間中的一個「點」,包括定長的隱空間表示向量和對應的隱空間坐標。

然后,模型在這個壓縮的幾何隱空間中進行生成式建模,生成新分子的潛在表示,最后再解碼回完整的原子結構。

由于隱空間的數據表示是定長(預先給定 block 的數量)且連續的,因此可以很容易地兼容已有的各種生成算法。在目前的嘗試中,擴散模型(diffusion)已經能產生比較不錯的結果。這種設計使得模型在生成過程中聚焦于 block 之間的全局布局,而細致的原子級構造則由解碼器來補全,從而同時實現了高效性與原子級準確性的統一。

入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計-AI.x社區

不同分子種類的分詞方案以及模型整體架構

統一建模超越單域建模

為了驗證 UniMoMo 在不同分子類型上的通用性與有效性,作者在多個基于結構設計任務中進行了系統評估,

涵蓋了小分子、多肽和抗體三類代表性的結合分子。通過與對應領域內最具代表性的單分子類型生成模型進行對比,實驗旨在探討統一建模是否具備更強的幾何建模能力與跨模態泛化能力,特別是在空間結構合理性與結合能力等關鍵指標上的表現。

結果顯示,

統一訓練的 UniMoMo 在所有分子類型上都實現了全面超越,不僅在結構還原精度上表現優異,更在關鍵的幾何合理性和與靶點的相互作用質量上取得顯著提升。

入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計-AI.x社區

與靶點結合的多肽設計結果

在多肽生成任務中,UniMoMo 在多個關鍵指標上顯著優于現有的專域模型,包括 RFDiffusion 、 PepFlow 和 PepGLAD 等。尤其在結構準確性方面,UniMoMo 達到了更低的復合物 RMSD 和單體的 RMSD,表明其生成的肽結構更加接近真實結合構象。

UniMoMo 還能生成具有更低 Rosetta 結合能的結構,

反映出其對蛋白結合位點幾何特征的更強建模能力。此外,在衡量多肽構象質量的二面角度分布一致性(JSD of backbone/sidechain torsions)以及原子級空間沖突(clash rate)等幾何合理性指標上,UniMoMo 同樣展現出領先表現。并且,使用所有數據訓練的 UniMoMo(all)在各種指標上一致性地超過了僅使用多肽數據訓練的模型,

證明了 UniMoMo 的跨分子種類學習和泛化的能力。

入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計-AI.x社區

抗體 CDR-H3 的設計結果


入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計-AI.x社區

抗體 CDR-H3 的設計的合理性結果

在抗體設計任務中,UniMoMo 同樣展現出強勁性能。相比現有方法如 MEAN 、 dyMEAN 和 DiffAb,

UniMoMo 在召回天然結合的序列和結構(AAR 和 RMSD)以及結合能提升(IMP)等關鍵指標上均實現全面超越。特別是在多次采樣生成的評估中,UniMoMo 能夠以更高概率生成接近天然構象的抗體片段,顯示出其在抗體結構空間中的良好探索能力。

同樣的,使用跨分子類型數據聯合訓練的 UniMoMo(all)在所有指標上均優于僅使用抗體數據訓練的版本,

說明統一建模確實有助于模型學習到更普適、更可遷移的分子結構空間規律。這一結果凸顯了不同分子類型之間在結構建模上的共性,也驗證了跨域數據融合對提升生成質量的顯著價值。

入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計-AI.x社區

小分子設計的整體比較


入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計-AI.x社區

小分子設計的子結構分析

在小分子生成任務中,UniMoMo 同樣展現了優越的性能。通過在 CrossDocked2020 數據集上的評估,

作者發現 UniMoMo 在基于 CBGBench 的綜合評價上超越了現有主流方法。

具體而言,UniMoMo 在子結構分布(原子種類、官能團等)、化學性質合理性(QED 、 LogP 、 SA 等)、幾何結構質量(鍵長/角度分布與原子沖突率等)以及相互作用得分(Vina docking)等方面均取得了更高的綜合評分(完整的實驗結果請查看原文)。尤為重要的是,與僅在小分子數據上訓練的單域版本相比,跨分子類型訓練的 UniMoMo(all)在所有評估維度上均有顯著提升。這表明,

即便是在分子結構構成最為靈活、類型最為多樣的小分子場景中,統一模型依然能夠從其他分子類型中遷移幾何規律與相互作用模式,進而提升小分子的單體構象和相對口袋空間布局的合理性。這一現象再次驗證了 UniMoMo 的核心理念:不同分子之間的幾何約束和結合機制具有可共享的模式,統一建模可以有效激發這一潛力。

綜合三類任務的實驗結果,UniMoMo 展現出高度一致的優勢:使用跨分子種類數據訓練的統一模型在各自任務中優于現有的單域生成模型,且相比只用單域數據訓練的 UniMoMo 有明顯的能力提升。這一現象表明,分子設計中看似截然不同的任務,其底層的物理化學約束與空間幾何規律實則具有高度共性,

而 UniMoMo 的統一建模策略正好捕捉并放大了這種共性,從而實現跨任務遷移、互補增強。這些結果不僅驗證了 UniMoMo 的有效性,也為未來構建更強大的統一的分子生成系統提供了強有力的實證支持。

GPCR 案例研究

入選ICML 2025,清華/人大/字節提出首個跨分子種類統一生成框架UniMoMo,實現多類型藥物分子設計-AI.x社區

UniMoMo 在 GPCR 相同結合位點設計的不同結合分子

作為案例,作者選取了人類最重要的藥物靶標之一——G 蛋白偶聯受體(GPCR),評估 UniMoMo 在同一結合位點上生成不同類型分子(多肽、抗體、小分子)的能力。 

UniMoMo 所生成的多肽、抗體和小分子常用結合能評價的力場(Rosetta ΔG,Vina score)下均展現出不錯的分布。而更令人驚喜的是,生成的小分子結構中還自發地模擬出類似天然氨基酸側鏈的官能團,用于構建氫鍵,與靶點形成關鍵互作。此外,小分子還借鑒了多肽與抗體中的局部幾何構型,如分子骨架上的酰胺連接,使其能夠有效填充原本更適合大分子的結合口袋。這一案例生動展示了 UniMoMo 在實際任務中跨模態借鑒、自動適應結合口袋的能力,體現了其在三維結構層面深度理解靶點與分子之間相互作用,以及分子內部幾何約束的潛力。

未來的探索

盡管 UniMoMo 已在多個分子類型與任務中展現出強大的統一生成能力,但作者也指出,該方向仍存在諸多值得探索的未來可能。

當前工作主要聚焦于天然氨基酸與常見分子片段的建模,后續可進一步擴展到非天然氨基酸、后修飾多肽/抗體、環狀分子等結構更加復雜的藥物形式,從而覆蓋更廣泛的候選分子空間。統一建模的理念也為模型的可控性和可解釋性研究提供了契機,有望進一步推進生成模型向更可信、更實用的分子設計平臺發展。總之,UniMoMo 的提出不僅為分子設計任務提供了一個通用而強大的生成框架,也為 AI 驅動的藥物發現打開了一個充滿潛力的新方向。

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 久久免费国产视频 | 国产一区二区三区在线看 | 黄色骚片 | 亚洲一区二区在线视频 | 精品亚洲一区二区三区 | 狠狠亚洲 | 福利av在线| 亚洲不卡在线观看 | 天天操天天射天天 | 亚洲欧洲一区 | 激情 亚洲| 在线欧美视频 | 久久久99精品免费观看 | 日日噜噜噜夜夜爽爽狠狠视频, | 日韩一区中文字幕 | 亚洲视频 欧美视频 | 国产高清精品一区二区三区 | 天天干天天色 | 亚洲午夜视频在线观看 | 免费在线一区二区 | 午夜av免费 | www..com18午夜观看 | 日韩精品免费 | 夜夜摸天天操 | 免费观看一级特黄欧美大片 | 久久久久国产一级毛片高清网站 | 天堂精品 | 超碰地址 | 国产美女特级嫩嫩嫩bbb片 | 日韩欧美三区 | 日本久草 | 亚洲黄色在线 | 久久网日本 | 97精品超碰一区二区三区 | 亚洲高清成人在线 | 欧美日韩在线视频观看 | 日日夜夜av | a级黄色毛片免费播放视频 国产精品视频在线观看 | 人人性人人性碰国产 | 亚洲一区二区三区免费在线观看 | 国产精品成人一区二区三区夜夜夜 |