顛覆制藥行業,AI究竟是「噱頭」還是「盼頭」?
人工智能(AI)已經在過去十年左右的時間里從科幻變成了現實,并且正在顛覆(或可望顛覆)地球上幾乎每個流程。比如幫助導航我們的汽車、飛機和太空飛船,可以在Netflix上建議用戶看什么電影,也可以助力顛覆其他數十種事情,無論是大事情還是普通事情。
在這之中,制藥業可以說是個真正的生死攸關產業。而且,制藥業也在使用計算機和計算機工具(例如AI),但為什么AI在制藥業里幾乎就沒有顛覆的影子呢?有些專家認為,制藥行業仍然是效率最低的行業之一,亦是抵制技術顛覆的最后橋頭堡。此外,專家們還表示,自上世紀50年代以來,盡管其他行業的生產力和效率都在不斷提高,但制藥業的效率卻一直在下降。
舉個例子,現在要將一種藥物或新分子實體(NME)推向市場的成本超過26億美元。這種費用(甚至包括失敗藥物嘗試的費用)最終都會直接轉移給包括你我在內的患者、客戶和納稅人。
因此,筆者希望在本篇文章里相對客觀地討論一下傳統藥物發現的挑戰性,包括目前AI在藥物發現的方法以及該領域里新技術和新工藝革新的潛力。
賭一把:傳統藥物發現
要了解AI在小分子藥物發現中的潛力和局限性,就要先了解制藥公司傳統上如何完成藥物發現的流程,這一點很重要。
前面提到過,制藥業是地球上風險最高的企業之一。小分子藥物發現流程包括幾個步驟:科學家提出疾病假說、確定目標、設計分子然后進行臨床前研究,平均需要的時間為5年,可能的花費為數億美元。臨床開發過程可能還需要五年及外加數億美元。干預措施則是在此過程的第一階段(安全性)、第二階段(有效性)及第三階段(大規模安全性和有效性)里進行測試。
▲藥物發現和開發的各個階段:基于2010年Paul及其他人的“如何提高研發生產率:制藥行業的重大挑戰”文章整理(圖:Alex Zhavoronkov,Insilico Medicine)
所以說,藥物的發現類似于一個分子賭桌。在這個賭桌的輪盤上有超過2000種藥物治療目標及數千種疾病,而且每個患者在某種程度上都不盡相同。要在這么復雜的設置下為特定的患者小眾群體選擇正確靶標,幾率小得荒唐。大家都知道在輪盤上下注極少會有豐厚的回報以及玩家必須在失敗時淡定,其原因就在此。
盡管制藥業是賭桌上的輪盤,但世界上最聰明的人卻都在這個輪盤上下注,99%的概率,這些人都會輸。而且每賭一把的時間為八年或更長,頭四年里可以改賭注,從第二個四年臨床試驗開始,輪盤開始轉動,這時就只能減少損失或是在其他臨床計劃上下更多的賭注。通常,那些在頭四年里下注的人不會是在臨床階段決定減賭注或加倍下注的人。
AI幫襯、AI盼頭還是AI噱頭?
面對荒唐的幾率而且是身處數據密集型環境,可能有人會覺得人工智能非常適合制藥公司。而現實是,盡管現代技術進步在很多方面出現了重大顛覆,包括移動通訊和個人計算、互聯網以及基因組測序等等,但開發藥物的成本卻還在不斷增加。
實際上,利用AI提高幾率的想法其實對于制藥行業而言是利弊并存的。一方面,這可以為制藥領域帶來更多的投資和更多的人才。但另一方面炒作得厲害的同時藥品價格仍在飛漲,這也導致了一些人更加持懷疑態度。制藥業資深人士看到有希望的技術突破的出現,但卻并未顯著提高研發水平,因此,他們寧愿選擇在藥物發現過程的整個范圍內逐步開發內部能力,而不是將籌碼押在注特定的使能技術上。
現如今,“AI盼頭”和“AI噱頭”仍在角力。一方面,AI專家預測變革在即,而另一方面,持懷疑態度的藥物研發專家卻認為所有的最新進展只不過是增量式變化和噱頭而已。
也是出于同樣的原因,大多數行業專家對深度學習的前景也持懷疑態度。
利用深度學習打破噱頭
我們常常聽到AI是制藥行業潛在救星的說法,其中有很多原因,比如,基于深度學習的模型(例如生成對抗網絡,又名GAN)進行藥物研發,這對于制藥行業將會有極大影響。
在業界,第一篇有關“生成對抗網絡”的論文是Ian Goodfellow在2014年發表的,如今,他被稱為“GAN之父”。生成對抗網絡可以視為兩個深度神經網絡之間的競爭——一個網絡是生成器,根據所需的一組標準創建新穎的內容,另一個網絡名為鑒別器,用于測試生成器輸出的真假。這項技術一經提出幾乎立馬就推動了一些有趣結果的獲取。幾個小組在2016年里利用GAN用自然語言創建了逼真的圖像。例如,GAN可根據描述“這只小鳥的胸部和冠是粉紅色的,初級飛羽和次級飛羽為黑色”生成或“想象”出具有這種特征的大量鳥類圖像等等。
幾乎在同一時間里,我們的Insilico團隊開始研究GAN是否可以用于發現用得上的新型化學結構或分子。從生成鳥類圖片和DeepFakes走向創建超精密設計新的分子,聽起來似乎是沒什么邏輯的一步,但我們取得了相當大的成功,我們在2016年發表了一些早期同行評審論文,隨后還發布了許多生成方法并且還開始將這些方法與深度強化學習結合在一起。
但盡管我們發表了幾十篇論文,制藥行業許多計算化學家和藥物化學家卻仍持懷疑態度。他們的懷疑也并非一無是處。要明確證明這些生成方法可以對制藥業產生重大影響,唯一的方法就是選一種影響到數百萬人的疾病,而不僅僅是選罕見疾病,然后利用AI方法完全用“無人干預”的方式識別該疾病里新的生物靶標,再以這種方式利用AI及針對AI所選擇的目標生成新分子,然后在生物學分析、動物研究以及希望能在針對人類的研究中驗證所生成的分子。
▲ 完整的環:靶標識別、小分子生成和驗證用于證明AI在藥物發現中的價值(圖:Alex Zhavoronkov,Insilico Medicine)
但要這樣做在學術界幾乎是不可能的,因為費用非常昂貴,而且還需要具備分析開發和化學合成在內的多種專業知識,出于同樣的原因,在初創企業中要這樣做也是很困難的。因此,筆者預測:我們今年或明年將走到這一步——針對一種主要疾病的絕對新靶標、絕對新分子及對應該疾病的實驗驗證。并且在兩到三年后,看到這些分子出現在第二期臨床研究中。只有到了這個時候,懷疑論者才會滿意。但這仍需要幾年的時間。
AI在制藥業的未來
總的來說,筆者對AI方法的未來持樂觀態度,它可以生產為了改善健康和治療疾病所急需的藥物。諸如生成強化學習之類的方法組合和整合(以及量子計算的迷人前景),從而令我們對未來充滿期盼。但我們務必對面臨的挑戰保持清醒態度。生物學很復雜,化學也很復雜,臨床試驗同樣很復雜。要在三個很復雜的領域同時獲得成功是件艱巨的任務!
▲完全整合的“制藥 AI 大腦”:涵蓋了藥物發現和開發的所有領域(圖:Alex Zhavoronkov, Insilico Medicine)
因此,制藥AI成功的關鍵是要打造一個可用于識別生物靶標的龐大整合系統,這樣的系統將有助于設計新分子并可以進行個性化治療及預測臨床試驗結果。
同時,我們還需要一個龐大的制藥大腦,可以橫跨十年甚至更長的發現和開發周期,并可以將臨床數據重新整合到目標發現里。
要完成這些任務可能要花幾年的時間。科學家為了顯著加速開發小分子藥物發現的系統,就需要結合許多策略和方法,所以,他們必須是藥物發現的多領域專家。
拿眼下的新冠疫情來說,傳統及AI驅動方法的其實作用并不突出。筆者預計,在四個月內,所有FDA批準的藥物里,大約會有百分之十會被用做診治療法,畢竟新藥物的開發的還沒有取得可觀的臨床結果。要顯著加速藥物的開發,科學家們在AI和實驗室自動化方面還需要做大量的工作。