Insilico Medicine–利用生成式AI重塑藥物發現的未來 (上)

Insilico Medicine(以下簡稱Insilico)是一家專注於生物醫藥領域應用人工智慧(AI)的公司,尤其在藥物發現與開發方面展現出深厚的技術實力。每次造訪他們內容豐富的官網,都讓我感到興奮,總是為琳瑯滿目的資訊所吸引。他們專門用於靶點識別的AI平台有個可愛親切的名字「PandaOmics」。Insilico為PandaOmics設計了專屬網頁,詳細指導使用者如何操作,從用戶需求出發,處處體現對使用者體驗的重視。此外,Insilico還提供免費的線上課程「Disease Modeling and Target Discovery」,系統性地從基礎知識講起,逐步引入AI技術在藥物開發中的應用,是一項相當珍貴且實用的學習資源。本文將帶領大家深入了解Insilico的技術服務與商業模式,並探索其如何顛覆傳統的藥物開發流程。

▍Insilico Medicine—AI藥物開發的先驅者

傳統的藥物開發流程,從最初的藥物探索到最終核准上市,平均需耗時1015年,投入資金可達數十億美元。然而,成功率卻極低,90%的藥物在臨床試驗階段便會失敗。研究顯示,導致這些失敗的四大原因包括:缺乏臨床療效(40%-50%)、無法控制的毒性(30%)、不良的藥物特性(10%-15%),以及缺乏商業需求的策略規劃(10%)。

隨著人工智慧的崛起,這一切正悄然改變。AI,尤其是機器學習和深度學習,正以前所未有的速度和深度,滲透到藥物開發的每一個環節。透過分析海量的生物醫學數據,AI能夠快速、準確地識別潛在的藥物靶點,設計出更有效的分子結構,並預測藥物在人體內的反應,藉此可以篩選出較能夠顯示臨床療效的候選藥物,進而提高後續臨床試驗的成功率,縮短總體研發時程。

在這場技術革新中,Insilico Medicine成為了其中的領導者之一。該公司於2014年成立,總部位於美國波士頓和香港。創辦人兼CEO Alex Zhavoronkov博士是多篇AI和藥物研發領域重要論文的作者,主要負責公司的戰略規劃,並領導AI工程團隊專注於AI平台的研究與開發。而公司另一位領導人Feng Ren博士擔任聯合CEO,負責推進公司pipeline項目,改善藥物發現流程並管理與CRO的合作關係。這兩位領導者在Insilico分別負責前端AI技術平台開發以及後端AI和藥物開發結合的關鍵任務。關於Insilico公司團隊組成與分工概況整理如下圖。

Insilico Medicine 公司內部組成與分工 (資料來源:Insilico Medicine 官網;整理繪製:黃霈穎)

作為一家以AI技術驅動的藥物研發公司,Insilico專注於運用深度學習和生成對抗網絡(GAN)技術,加速藥物發現和開發進程。公司核心平台Pharma.AI整合了多種AI工具,顯著提升了藥物開發的效率並縮短整體研發周期。接下來,我們將進一步探索Pharma.AI平台的技術奧秘,以及其在藥物開發流程中的應用。

▍Pharma.AI—端到端的藥物開發整合平台

Insilico的Pharma.AI平台,整合了多種先進的AI技術,提供端到端的藥物發現和開發服務,目的是為了加速藥物開發的整體流程。Pharma.AI平台包括三個主要模組,各自專注於不同的藥物開發階段:

  • PandaOmics: 專注於靶點識別(target identification)和生物標誌物(biomarker)的發現。
  • Chemistry42: 用於生成新分子結構與優化。
  • inClinico: 負責臨床試驗數據的分析和預測。
Insilico Medicine的AI藥物開發平台PHARMA.AI之三大構成模組(資料來源:Insilico Medicine官網)

平台模組一:PandaOmics—靶點識別與生物標誌物發現

Insilico Medicine的靶點識別平台PandaOmics主要特色 (資料來源:Insilico Medicine官網)

PandaOmics 是一款於 2020 年推出的生成式 AI 平台,使用者不需具備任何電腦運算的技巧便能操作。該平台專門用於靶點和生物標誌物的發現,它包含超過 20 種 AI 和生物資訊學模型,主要特徵是應用Transformer 的自然語言模型,處理過去 30 年發表的生物醫學相關文獻,使其產生「靶點-疾病關聯」的知識圖譜(knowledge graph for target-disease)。研究人員在得到知識圖譜後,可以進行多方面的工作,包括識別與特定疾病相關的新靶點、了解已知藥物與新疾病之間的潛在關聯、預測某些藥物在治療特定疾病中的有效性,以及深入理解疾病的分子機制等。

Insilico 在2023年推出了ChatPandaGPT,亦即把AI 聊天互動功能,整合到 PandaOmics 的知識圖譜中,這樣的好處是可以使PandaOmics的操作與解讀更人性化。例如使用者可以詢問平台「有哪些潛在的藥物靶點可以治療阿茲海默症?」或「基因A和疾病B之間有什麼關係?」等問題,ChatPandaGPT 會根據 PandaOmics 的知識庫,提供資料、支持性證據,以及相關研究。此技術的融合,可說是降低了使用PandaOmics的門檻,讓更多非生物學背景的人也能夠利用 PandaOmics 的功能(更多PandaOmics功能介紹請參考Insilico Medicine-PandaOmics)

PandaOmics整合AI聊天互動功能到知識圖譜中之示意圖 (資料來源:Insilico Medicine 官網)

平台模組二:Chemistry42—AI驅動的分子設計與生成

傳統的分子設計通常需要多次試驗,並且在合成和測試階段耗費大量資源。Chemistry42的亮點就在於其生成式AI設計的能力,使用超過40個生成模型,包括成自編碼器(Generative Autoencoders)和生成對抗網絡(Generative Adversarial Networks, GANs),使其能夠根據藥物靶點的需求,模擬不同分子的相互作用模式,並計算其生物活性和藥理學特徵,僅需幾天時間,便能自動產生符合特定藥理需求的化合物結構,並快速篩選出符合標準的候選分子。這強大的功能讓研究者可避免傳統的試錯法,直接進入分子優化的階段。

Chemistry42以(1)結構基礎(structure-based)以及(2)配體基礎(ligand-based)兩種方法來進行藥物設計。前者是利用已知的蛋白質三維結構,設計出能與蛋白質特定部位結合的小分子化合物,後者是根據已知的藥物分子結構,設計出結構相似、但具有更好藥理性質的新分子。此外,Chemistry42 可以利用 AlphaFold 等 AI 工具預測的蛋白質結構,來進行藥物設計,亦即縱然我們還沒有得到蛋白質的實際結構,也可以開始進行藥物設計的工作。此外,Chemistry42能與前述PandaOmics無縫集成,實現從靶點識別到de novo小分子生成和優化的開發流程。(更多Chemistry42的功能介紹可參考Insilico Medicine—Chemistry42)

Chemistry42功能示意圖 :Visualize generated molecules in the binding site (資料來源:Insilico Medicine官網)

平台模組三:inClinico—臨床試驗結果預測

inClinico平台於2022年11月推出,專為預測二期臨床試驗的結果而設計。這個平台利用了多種數據來源,包括小分子的化學特性、轉錄組學、文本資料和臨床數據與試驗計劃與等,來進行綜合預測。InClinico預測的準確度經過了回顧性、準前瞻性和前瞻性研究的測試,在準前瞻性的環境中,InClinico的預測引擎在預測第二期到第三期轉換時之ROC AUC值高達0.88。(ROC AUC是評估一個分類模型預測能力的指標,它的值範圍從0到1,越接近1表示模型的預測能力越強。一般來說,AUC值超過0.7被視為模型有效,而0.88則表示這是一個非常強大的模型。)

傳統上,臨床試驗是藥物開發中風險最高、成本最大的一環,並且超過90%的候選藥物無法順利通過臨床試驗。inClinico的設計初衷即是通過AI模型來預測候選藥物的臨床試驗成功率,提供詳細的風險評估,幫助製藥公司在臨床階段之前調整開發策略,提升研發投資的效益。(關於inClinico平台更深入的功能介紹可參考Insilico Medcine—inClinco;簡要功能介紹可參考影片InClinico – a platform for clinical leaders to assess trial risk and aid in portfolio triage)

inClinico平台參考的資料類型與數量 (資料來源:Insilico Medicine官網)

本篇我們著重在Insilico的核心平台Pharma.AI的三大模組功能介紹,接下來兩個章節我們將透過實際案例,深入探討Insilico如何透過此平台為公司創造收益。

▍本篇思路

《賦智圖》

Thinking Map & Takeaways

返回文章分類