2020年1月,當醫生們在努力治療首批新冠病毒患者時,BenevolentAI的數據科學家和生化學家轉向了人工智慧,尋找一種可以幫助他們的藥物。
對於這種新病毒如何運作,研究人員只有很少的線索。他們將這些數據輸入自己的演算法,讓它在短短几小時內搜尋5000萬篇醫學期刊文章。科學家和演算法一起加深了他們對藥物應該針對哪些生物通路的理解,並尋找已批准的藥物來重新利用。
在短短四天內,他們把範圍縮小到巴利西替尼(baricitinib)。這種美國禮來公司(Eli Lilly)通常用於治療風溼性關節炎的藥物可以同時治療病毒和身體的炎症反應。這是人工智慧首次發現一種可以重新利用的藥物,然後被廣泛使用。
這家總部位於倫敦的新創公司的藥理學副總裁彼得·理查森(Peter Richardson)表示,人工智慧對這種藥物如何對抗新冠病毒的預測——從其生物機制到抗病毒效果——現在已經得到了驗證。世界衛生組織強烈建議使用巴利西替尼治療嚴重的新冠肺炎,而英國的康復試驗——一項針對該病毒治療方法的全國性研究——發現它能顯著降低死亡率。
理查森說:「這一切都在兩年內實現。這是令人驚訝的。」
一種藥物從最初的發現階段到獲得批准,平均需要10年時間,而且由於失敗率很高,製藥業估計,每一種藥物的上市成本爲27億美元。臨牀試驗佔據了大部分時間和成本,但發現和臨牀前試驗仍然需要三到四年的時間。
在大流行期間,人工智慧主要被用作節省科學家時間的工具,加速這一以緩慢著稱的發現過程,同時經常使用爲類似病毒(如Mers)設計的藥物和疫苗作爲起點。
但人工智慧的支持者認爲,危機期間人工智慧的廣泛應用,只是一場藥物發現革命的開始。這場革命將利用生物和化學數據、計算能力和更智慧演算法的成長,從而降低不斷飆升的醫療費用,併爲我們的疾病創造先前不存在的治療方法。
他們認爲,人工智慧在這場危機中證明了自己。AbCellera在三天時間裏篩選了600萬個細胞,找到了一種可以大規模生產的抗體——這是由禮來公司生產的——這種名爲bamlanivimab的藥物已經幫助了超過100萬名新冠患者。一臺超級電腦幫助輝瑞公司尋找一種可以口服的抗病毒藥物。
雖然人工智慧沒有設計Covid疫苗,但它對它們進行了優化。Moderna的平臺——該公司用於所有疫苗的技術——是從生產2萬個獨特的mRNA序列中學習到的,這幫助該公司在42天內設計和製造了第一批用於測試的Covid疫苗。
風險投資家認爲這僅僅是個開始。PitchBook的數據顯示,過去5年,用於人工智慧藥物研發的資金成長了3800倍,達到20億美元,風險資本支援的新創企業已與數十家大型製藥公司簽署了合作伙伴關係。
投資生命科學領域人工智慧公司的Air Street Capital普通合夥人內森•貝奈奇(Nathan Benaich)表示,大流行強化了製藥商需要加快發現過程的想法。他表示:「這一切帶來的明顯好處是,由於對快速創新的明顯需求,該領域的人工智慧公司現在正在向製藥行業推進一扇更加開放的大門。」
但是,就連貝奈奇也認爲,這並沒有達到大流行開始時人們膨脹的期望——而且他並不是唯一這樣認爲的人。
《深度醫學》(Deep Medicine)是一本關於醫療領域人工智慧的書,該書的作者埃裏克•託波爾(Eric Topol)表示:「我認爲(藥物的)再利用仍然值得追求。但我們沒有很多東西可以展示。在大流行中,我們肯定有一種藥…但人工智慧的整體理念是找到藥物,並以我們從未見過的高速度進行發現。」
在監管機構批准完全由人工智慧發現的藥物之前,肯定會有人持懷疑態度。目前有15種由人工智慧設計的候選藥物正在進行臨牀試驗,但正是因爲藥物開發可能需要10年以上的時間,所以要等待結果將是一個漫長的過程。
理查森說:「仍然有相當多的人不相信,認爲這都是炒作。」
安全閥
隨著疫情的發展,世界各地的臨牀醫生都在尋求英國康復試驗的建議,以指導他們的處方。牛津大學醫學和流行病學教授馬丁·蘭德雷(Martin Landray)幫助開展了Covid藥物的隨機對照試驗。但他說,在選擇在病人身上測試什麼時,他發現人工智慧「用處不大」。
他表示:「問題是(藥物發現演算法)都會按照不同的順序列出(治療方法)的優先順序。」他補充稱,「數學原理」往往沒有考慮到實用性。
康復試驗的調查人員選擇藥物的依據是有一些證據表明它們可能有效,比如應對之前的新冠病毒或在臨牀前測試中證明有效。但他們也考慮了該藥物是否供應充足,以及對其副作用的瞭解程度。
蘭德雷表示,安全幾乎具有人工智慧難以預測的「無限維度」,遠比人工智慧取得的一些最大成功要複雜得多,比如在古老的中國遊戲圍棋中學會擊敗人類。他表示:「(人工智慧在藥物研發中的應用)不是試圖玩圍棋,而是試圖玩所有被髮明出來的遊戲,其中有些甚至沒有規則。」
在生物世界中,人工智慧也可能是危險的。研究人員最近展示了他們的演算法是如何在不到6小時的時間裏發現4萬種有毒化合物的,其中許多可以被用作生物武器。
Covid-19表明需要快速開發藥物,但最初缺乏有關這種疾病的資訊,這意味著它不是人工智慧的完美證明點。一開始,可供演算法學習的數據很少,這意味著即使是Benevolent的科學家也不得不採取一種更親力親爲的方法——將人工智慧作爲一種互動工具——而不是像對待其他疾病那樣。
位於矽谷的人工智慧新創公司Insitro的首席執行長達芙妮•科勒(Daphne Koller)專注於藥物發現,她稱讚Benevolent公司證明了找到一種可以重新利用的藥物是可行的,但她警告說這與發現一種全新的化合物不同。
她說:「我不喜歡隨便許下什麼我們將在三年內改變一切的奢侈承諾。人類生物學很難:干預可能導致人死亡的事情是一個非常危險的命題。」
另一家名字相似的人工智慧新創公司Insilico設計了自己的Covid藥物。這家位於香港的公司在2020年4月發表了一篇關於其發現的論文,供任何人使用。當沒有人決定開發它時,該公司在同年9月自己合成了這種藥物。但由於沒有大型製藥公司的設施,它不得不等待9個月,在一個足以處理病毒的安全實驗室進行測試。而且它仍未進入人體試驗階段。
這場大流行凸顯了人工智慧在藥物發現領域未來的兩個最大障礙:使零散但日益豐富的數據變得有意義,以及改變對與人工智慧合作持謹慎態度的大型製藥公司的策略。
賽諾菲(Sanofi)首席科學官弗蘭克·內斯特爾(Frank Nestlé)正積極擁抱人工智慧。最近,他與總部位於牛津的Exscientia和醫療人工智慧公司Owkin簽署了兩項重大協議。他說,人工智慧依賴三大支柱——計算能力、演算法和數據。
他補充道:「數據是最需要改進的地方,也是未來需要改變的地方。」
由於收集基因和蛋白質的序列變得更加容易和便宜,數據已經出現了爆炸。製藥商擁有大量來自人類和動物試驗的數據,但這些數據往往是人工智慧難以消化的形式,從手寫的實驗筆記到Excel電子表格。
內斯特爾表示,標記這些數據需要艱苦的精確性:例如,隔夜運送的實驗室樣本應與其他樣本區分開來,因爲它們有不同的分子足跡,可能會促使演算法根據運送方式而不是病人組織中的內容得出錯誤結論。
這樣的工作需要時間。BioNTech首席執行長烏格•沙欣(Ugur Sahin)表示,這家德國生物技術公司在4年時間裏使用了一種「中間人」的方法來進行機器學習,由人類幫助培訓演算法。「人工智慧就像孩子。你必須教他們很多東西,直到他們開始得出結論,」他說。
對數據進行投資的公司已經看到了回報。2020年,輝瑞(Pfizer)無法自動篩選其擁有45億種商業可用化合物數據的資料庫之一。現在,它可以在48小時內掃描整個資料庫,大大加快了它識別潛在新藥的能力。
另一些人則強調僱用能夠在人工智慧和更傳統的科學方法之間架起橋樑的員工的重要性。嬌生(Johnson & Johnson)的製藥部門楊森(Janssen)的首席數據科學官兼研發戰略主管納賈特·汗(Najat Khan)說,它正在建立一個「雙語人才」庫。
她補充說:「我們的數據科學家精通機器學習、人工智慧、數字健康和真實世界證據,並且對藥物發現科學和醫學有深刻的瞭解。」
但一些製藥公司仍在摸索如何最好地納入人工智慧,不確定應該在新領域投資多少,以及應該在花多大力氣繼續推進他們目前的管道,並難以從技術公司招聘人才。
倫敦大學國王學院藥物化學教授米拉茲·拉赫曼(Miraz Rahman)說,該行業曾經因爲向組合化學傾注資金而被遭受重挫,這種建立化合物庫的方法在最近幾十年裏一直很有用,但並不像承諾的那樣具有變革性。
但他認爲,在未來5至10年內,所有大型製藥公司都將把人工智慧整合到藥物研發中。拉赫曼補充道:「所有數據都表明,人工智慧將繼續存在。如果你能成功採用人工智慧,它將使發現變得更流暢,並節省三到四年的時間。」
解鎖科學
Owkin首席執行長托馬斯•克洛澤爾(Thomas Clozel)表示,將藥物重新利用只是一種「修修補補」,人工智慧的長期希望在於,它可以改變我們對疾病的理解。
「今天的人工智慧還沒有準備好更好地治療病人。它已準備好加速藥物研發的投資回報,」他說。「但如何擴大它呢?你什麼時候才能發現製藥公司失敗的地方?」
他認爲,真正的創新將來自於從「患者數據」中挖掘出的實證證據。Owkin建立了來自醫院的數據集,並分析細胞層面的資訊,以發現新的患者亞羣。該公司利用電腦視覺(一種能夠理解和讀取影像的人工智慧)來研究活組織檢查,可以預測侵襲性腫瘤間皮瘤患者的存活率。間皮瘤主要影響肺部粘膜。這可能會爲製藥商打開開發複合藥物的大門,從而提高存活率。
我們理解得越深,藥物的個性化程度可能就越高。在因新冠病毒疫苗而出名之前,BioNTech專注於開發「癌症疫苗」,利用提取的腫瘤數據,定製個性化的「癌症疫苗」,引導個人的免疫系統攻擊他或她自己的疾病。目前,該公司正以人工智慧爲核心,努力推進這項工作。
「問題是:如果每個患者都有不同的突變,我們能否構建機器學習程式,讓我們能夠在每個患者身上選擇最佳目標?」沙欣問道。
他補充說,這是一項「極其複雜的任務」,涉及到權衡因素,包括腫瘤發生突變的可能性和免疫系統的T細胞識別突變的可能性。但他補充說,機器學習已經變得「越來越好」,現在人類干預只是爲了保證質量。
其他創新可能會加速進步。去年,谷歌的DeepMind發佈了一款名爲Alphafold2的人工智慧工具,它可以預測所有人類蛋白質的形狀。透過解決這個生物學上的巨大難題,它有助於科學家瞭解每種蛋白質的作用以及如何改變它。製藥商可以利用它來了解藥物可能需要在人體的哪個部位與目標結合。DeepMind正計劃這樣做,成立一家新公司同構實驗室(Isomorphic Labs),以「找到治療人類最具破壞性疾病的方法」。
大型製藥公司對使用這個工具很感興趣。嬌生公司的汗說,由於一種棘手的蛋白質,有很多蛋白質被認爲是「無藥可治」的。她說:「這將解開許多以前不可能的科學之謎,並使之成爲可能。」
量子計算的進步也可以大大增加可用的電腦能力,以幫助解決藥物發現方面的問題。但就目前而言,人工智慧可能對下一代抗疫藥物和疫苗更有幫助。
這種病毒現在是有史以來最受關注的病毒之一。BioNTech已與人工智慧新創公司InstaDeep合作,預測下一個高風險變異,因此其靈活的mRNA疫苗平臺可以領先於它。由此產生的演算法提前識別出了90%以上的擔憂變種,包括奧密克戎(Omicron)毒株。AbCellera利用人工智慧選擇了最強大的抗體,這種抗體能夠更好地抵禦變異,而Exscientia希望創造一種廣譜抗病毒藥物,可以用來對付下一種大流行病毒,無論它最終會是什麼。
Exscientia首席執行長安德魯•霍普金斯(Andrew Hopkins)表示,隨著大型製藥公司對投資人工智慧更感興趣,他開始看到一種「鉅變」。
他表示:「我們已經認識到了如何利用數據和演算法。該行業爲新冠病毒患者所做的,實際上我們應該適用於所有患者。我們迫切需要爲所有患者帶來所有藥物。」
Madhumita Murgia倫敦補充報導