AlphaFold 3引不滿!服務器被黑,全世界科學家競相破解
不久前,AlphaFold3橫空出世,直接登上了Nature頭版。
新的架構、前所未有的預測精度和準確率,再次震撼了整個學術界。
然而,與AlphaFold2不同,這個新一代的超強模型卻沒有開源。
取而代之的是,谷歌DeepMind推出了一個免費研究平臺「AlphaFold Server」,供全球科學家使用。
服務地址:https://gdm-alphafold.corp.google.com/welcome
網站操作簡單,只需點擊幾下,就可以利用AlphaFold3在10分鐘內得到預測結果。
但是服務有每日的次數限制,且只能用于非商業研究。同時,相比于開源的AlphaFold2來說,這種使用方式缺失了很多自由度,讓一些研究人員覺得差點意思。
——這么做其實無可厚非,畢竟DeepMind也是要盈利的,它的子公司Isomorphic Labs已經開始用AlphaFold3來開發藥物了。
谷歌DeepMind希望能在促進科學進步,以及保護自身商業利益上找到平衡。
科學家們感到失望
正所謂,由儉入奢易,由奢入儉難。
谷歌的AlphaFold3在5月9號登上Nature頭版,而僅僅兩天之后的5月11日,加州大學舊金山分校(University of California,San Francisco)的計算結構生物學家Stephanie Wankowicz,和其他九位科學家共同撰寫了一封致Nature的公開信:
公開信地址:https://zenodo.org/records/11206103
信中指出:谷歌DeepMind的這種做法不符合科學進步的原則,科學進步依賴于社區評估、使用和建立現有工作的能力。
此后,有600多名研究人員簽署了這封公開信。
公開信的合著者、計算結構生物學家Roland Dunbrack,曾對AlphaFold3的論文進行了同行評審,他對DeepMind沒有發布代碼感到失望。
「我想要可下載的代碼,如果我們可以自由使用AlphaFold3,新的研究成果就會誕生。」
其他科學家怎么說:
AlphaFold是一項千載難逢的突破,對生物科學產生了巨大影響。我認為它的作者最終會獲得諾貝爾獎,因為他們解決了一個70多年來一直無法破解的巨大問題。我基本上每天都在工作中使用它,指導藥物發現和實驗上有用的HBV聚合酶的工程設計。
最新版本的AlphaFold3比以前更強大。它已經在我的實驗室中揭示了HBV RNA最初如何與聚合酶結合的結構。不幸的是,他們更改了此版本的使用許可,限制了其用于藥物發現。
繞過DeepMind,自己破解
在遭到公開信打臉的兩天后,5月13日,DeepMind改頭換面,宣布將在六個月內,開放AlphaFold3的代碼和模型權重供學術使用。
并且,AlphaFold3服務的每日使用次數限制也上調為20次。
但科學家們似乎不太買賬,畢竟有了商業競爭的考量,誰知道你拿出來的是不是閹割版,而且還要等上半年之久。
對于這個未來的版本,科學家們尤其質疑其預測蛋白質結構與潛在藥物分子或配體的能力。
Dunbrack表示,「我不認為他們會給我們做任何配體的能力,而AlQuraishi團隊正在開發的OpenFold3模型就不會做這種閹割,也不會對商業用途有任何限制?!?/span>
Mohammed AlQuraishi是哥倫比亞大學的計算生物學家,他的「OpenFold」團隊已經開始編寫AlphaFold3的開源版本,他們希望今年完成。
AlQuraishi團隊此前開發了大名鼎鼎的OpenFold,作為AlphaFold2的開源重新實現,它的效率要高得多,并且得到的結果也差不多。
「如果這種對我們進行藥物發現和關系到人類健康的重要能力封閉在少數人手里,那將是糟糕的。」
科學家們追求AlphaFold3的開源版本還有其他原因,其一就是能夠重新訓練模型,以更好地模擬蛋白質和潛在藥物之間的相互作用。
AlQuraishi團隊的OpenFold就使用了與DeepMind相同的公開數據集進行訓練。
而對于許多制藥公司來說,他們可以利用自己的專有數據重新訓練,以提高模型的性能。
雖然但是,「Talk is cheap. Show me the code」。GitHub上的「開源AlphaFold3」早已經開搞了!
項目地址:https://github.com/lucidrains/alphafold3-pytorch
這是由舊金山的獨立軟件工程師Phil Wang發起的眾包工作。
大家有興趣還可以看看倉庫中的其他項目,這位大佬已經開發了幾十個AI模型的開源版本,包括著名的Dall-E 2。
此外,西雅圖華盛頓大學的計算生物物理學家David Baker,也帶領團隊開發了名為RoseTTAFold-All-Atom的開源蛋白質和化學預測模型,盡管暫時還打不過AlphaFold3。
AlphaFold3服務器被黑
盡管Wang表示自己的三人團隊能在一個月內完成描述AlphaFold3模型的代碼。
但最耗時也是最貴的步驟顯然是模型的訓練(AlQuraishi:「代碼是5%的努力」)。
MIT的進化生物學家Sergey Ovchinnikov估計,像DeepMind那樣訓練AlphaFold3可能需要花費超過100萬美元的云計算資源,盡管有可能在不影響性能的情況下偷工減料以降低成本。
AlphaFold3的完全開源版本,將使研究人員能夠更好地了解模型的工作原理并擴展其功能。
——在等待的日子里,已經有一些科學家在嘗試攻擊AlphaFold3服務器來獲取一些信息。
Ovchinnikov說,「網上已經有一些黑客攻擊,為了獲得嵌入細胞膜的蛋白質(與脂肪分子相互作用)的更準確的模型。另一次服務器黑客攻擊揭示了一種蛋白質采用的另一種形狀?!?/span>
AlQuraishi希望,開發AlphaFold3開源版本的推動力將成為一個「警示故事」,提醒學者們依賴DeepMind等科技公司開發和分發AlphaFold等工具的危險。
「他們這樣做很好,但我們不應該依賴它,我們需要建立一個公共部門和自己的基礎設施。」
網友怎么說?
有網友認為,安全問題是谷歌DeepMind選擇不開源的一個重要考量,也許AlphaFold3能幫助制造針對特定人群的生物武器。
我認為令人擔憂的是,有人可以用它制造超級朊病毒,或者設計一種非常有效的毒素(使用模型藥物發現部分的能力)
對此,有網友表示反對:「擔心我們可以制造出一種將接管一切的超級微生物,這是狂妄自大。」
我在科學中學到的一件事是,我們太傲慢了,認為我們可以設計一種超級疾病?,F實情況是,微生物世界已經充滿敵意,幾乎每一種致命的生物都已經進化了。你定制設計的任何東西都可能在離開實驗室的那一刻就死了?;蛘吒锌赡艿氖?,被干掉并被吃掉。
也有網友似乎玩起了「絕命毒師」:
我一直認為,如果人工智能最終能以某種方式,一步一步地指導你如何只用家居用品來制作這樣的東西,那將是瘋狂的。
想象一下,讓一個人工智能幫你制作氯胺酮,它告訴你去買一大袋鹽、果凍、3個鈦螺絲、一杯橙汁、一些石膏......然后給你一個非常非常長的步驟,把它們變成氯胺酮。過程可能非常乏味,并且需要做很多工作......但是,如果這在技術上是可行的呢?
——據說,有機化學是史上單人戰斗力的巔峰,有了知識的力量,沃爾瑪在你眼中就是武器庫。
不過,人類對知識和未知的渴望是擋不住的,我們拭目以待即可。