AI 深度學(xué)習(xí)+藥物研發(fā),讓新藥不再遙不可及 | MedChemExpress
一般而言,一種藥物研發(fā)周期在 10 年以上,研發(fā)投入在數(shù)十億美金,并且呈現(xiàn)逐年上升的趨勢(shì)。近年來,深度學(xué)習(xí) (Deep Learning, DL) 技術(shù)在語音識(shí)別、圖像識(shí)別等領(lǐng)域取得重大突破,迅速成為學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn)。
深度學(xué)習(xí)是人工智能的一個(gè)分支,它是一種利用神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)的技術(shù)。深度學(xué)習(xí)技術(shù)在生物醫(yī)學(xué)領(lǐng)域已經(jīng)取得重要進(jìn)展,目前研究人員已經(jīng)開發(fā)了一系列基于深度學(xué)習(xí)的疾病診斷、蛋白質(zhì)設(shè)計(jì)、醫(yī)學(xué)圖像識(shí)別的應(yīng)用策略。制藥工業(yè)界目前也開始重視深度學(xué)習(xí)技術(shù),希望利用其加速藥物研發(fā)并降低成本。
此前的研究表明,深度學(xué)習(xí)技術(shù)在優(yōu)化化學(xué)合成路線、預(yù)測(cè)藥物的藥代動(dòng)力學(xué)性質(zhì)、預(yù)測(cè)藥物的作用靶點(diǎn)以及生成新型分子等方面具有優(yōu)勢(shì)。
圖 1. 虛擬篩選在藥物開發(fā)流程中的地位[1]。
? 虛擬篩選:化合物-靶蛋白的親和力
深度學(xué)習(xí)可以通過訓(xùn)練大量的已知化合物-靶蛋白相互作用數(shù)據(jù)來學(xué)習(xí)化合物和靶蛋白之間的內(nèi)在關(guān)系。這種訓(xùn)練過程使得深度學(xué)習(xí)模型能夠自動(dòng)提取和利用化合物和靶蛋白的特征,以及它們之間的相互作用模式。
Yelena Guttman 等人基于 DeepChem 框架,構(gòu)建了一個(gè) CYP3A4 抑制劑預(yù)測(cè)模型。先基于 lipinski 五原則對(duì)庫中化合物進(jìn)行排除,再基于此模型對(duì) FOODB 庫中 68,900 個(gè)化合物進(jìn)行 CYP3A4 抑制活性預(yù)測(cè),順利得到了兩種新的 CYP3A4 抑制劑。
圖 2. 基于 DeepChem 的 CYP3A4 抑制劑預(yù)測(cè)[2]。
在 KNIME 分析平臺(tái) 4.0.314 中創(chuàng)建了一個(gè)工作流來準(zhǔn)備和分析虛擬篩選。
? 預(yù)測(cè)化合物的 ADMET 性質(zhì)
自 Lipinski 類藥五原則提出以來,對(duì)先導(dǎo)化合物的 ADMET (吸收、分布、代謝、排泄和毒性) 性質(zhì)進(jìn)行早期預(yù)測(cè)也變得越來越重要。許多研究表明,通過對(duì)大量已知化合物的 ADMET 數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí),自動(dòng)識(shí)別和提取化合物特征與性質(zhì)之間的關(guān)系,訓(xùn)練好的深度學(xué)習(xí)模型可以用來預(yù)測(cè)新化合物的性質(zhì),從而加速藥物發(fā)現(xiàn)和開發(fā)的進(jìn)程。
Liu 等人利用定向消息傳遞網(wǎng)絡(luò) (directed message passing neural networks, D-MPNN,又稱 Chemprop) 對(duì) FOODB 庫中化合物進(jìn)行了 Nrf2 激動(dòng)活性預(yù)測(cè)及毒性分析,順利得到了Nicotiflorin這一兼具 Nrf2 激動(dòng)活性和安全性的藥物,并且在體內(nèi)外實(shí)驗(yàn)中得到了驗(yàn)證[3]。
? 優(yōu)化化學(xué)合成路線
近年來,人們已經(jīng)看到人工智能 (AI) 開始為化學(xué)合成帶來革命性的變化。然而,由于缺乏合適的化學(xué)反應(yīng)表示方式和反應(yīng)數(shù)據(jù)的稀缺性,限制了人工智能在反應(yīng)預(yù)測(cè)中的廣泛應(yīng)用。深度學(xué)習(xí)可以通過對(duì)大量的化學(xué)合成數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí),自動(dòng)識(shí)別和提取合成路線的特征和模式,用來預(yù)測(cè)新的合成路線的效率和選擇性,從而加速新藥的開發(fā)和生產(chǎn)。
圖 4. 深度學(xué)習(xí)在預(yù)測(cè)化學(xué)反應(yīng)合成路線上的應(yīng)用[4]。
Schwaller 等人結(jié)合了深度學(xué)習(xí)網(wǎng)絡(luò)和符號(hào)人工智能來規(guī)劃化學(xué)合成路線。他們開發(fā)了一個(gè)名為“MoleculeNet”的框架,該框架能夠預(yù)測(cè)反應(yīng)是否可能成功,并使用這些預(yù)測(cè)來規(guī)劃出從起始原料到目標(biāo)分子的合成路徑[5]。
深度學(xué)習(xí)在虛擬篩選領(lǐng)域中的應(yīng)用,主要是通過神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)化合物的活性或性質(zhì),從而在虛擬環(huán)境中篩選出有潛力的候選藥物或材料。
以下是一些常見的深度學(xué)習(xí)算法在虛擬篩選中的應(yīng)用:
卷積神經(jīng)網(wǎng)絡(luò) (CNN):CNN 特別適合處理圖像數(shù)據(jù),如分子結(jié)構(gòu)圖。通過識(shí)別和提取分子中的特征,如原子和化學(xué)鍵的類型和位置,CNN 可以預(yù)測(cè)分子的性質(zhì)和活性。
循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN):對(duì)于處理序列數(shù)據(jù) (如化學(xué)分子序列) 的虛擬篩選任務(wù),RNN 特別有用。RNN 可以捕捉分子序列中的長期依賴關(guān)系,從而更準(zhǔn)確地預(yù)測(cè)分子的性質(zhì)。
生成對(duì)抗網(wǎng)絡(luò) (GAN):GAN 可以生成新的分子結(jié)構(gòu),這在進(jìn)行虛擬篩選時(shí)非常有用。通過訓(xùn)練 GAN,可以生成具有所需性質(zhì)的分子,從而大大減少實(shí)驗(yàn)的必要性。
圖神經(jīng)網(wǎng)絡(luò) (GNN):GNN 特別適合處理圖結(jié)構(gòu)數(shù)據(jù),如分子圖。GNN 可以捕捉分子中原子和化學(xué)鍵之間的關(guān)系,從而更準(zhǔn)確地預(yù)測(cè)分子的性質(zhì)。
Transformer:對(duì)于處理長序列數(shù)據(jù)的虛擬篩選任務(wù),如多步化學(xué)反應(yīng)預(yù)測(cè),Transformer 是一個(gè)很好的選擇。Transformer 可以捕捉序列中的長期依賴關(guān)系,從而更準(zhǔn)確地預(yù)測(cè)分子的性質(zhì)。
今天,小 M 給大家介紹了深度學(xué)習(xí)在藥物研發(fā)領(lǐng)域的應(yīng)用方向及常見算法,作為一種新興的技術(shù),AI / 深度學(xué)習(xí)技術(shù)在新藥研發(fā)領(lǐng)域已初見成效,相信隨著科學(xué)的進(jìn)步,AI 助力藥物篩選一定會(huì)在生物醫(yī)藥領(lǐng)域有著更加深遠(yuǎn)的影響。
Virtual Screening 虛擬篩選 (Virtual Screening, VS) 是基于小分子數(shù)據(jù)庫開展的活性化合物篩選。利用小分子化合物與藥物靶標(biāo)間的分子對(duì)接運(yùn)算,虛擬篩選可快速從幾十至上百萬分子中,遴選出具有成藥性的活性化合物,大大降低實(shí)驗(yàn)篩選化合物數(shù)量,縮短研究周期,降低藥物研發(fā)的成本。 |
MCE 50K Diversity Library MCE 50K Diversity Library 由 50,000 種類藥化合物組成。依據(jù)谷本相似性 (Tanimoto Coefficient) 及聚類算法 (Bemis-Murcko) 對(duì)上百萬化合物進(jìn)行篩選以確保結(jié)構(gòu)多樣性。本多樣性庫具備新穎性、類藥性,化合物結(jié)構(gòu)類型多樣、化學(xué)空間豐富,庫中化合物可重復(fù)供應(yīng),是新藥研發(fā)的有力工具,可以廣泛地應(yīng)用于高通量篩選 (HTS) 和高內(nèi)涵篩選 (HCS)。 |
MegaUni 10M Virtual Diversity Library 運(yùn)用生成式人工智能技術(shù),依托強(qiáng)大的計(jì)算能力,基于高質(zhì)量的 40,662 個(gè)分子砌塊,匹配合適的反應(yīng)規(guī)則,選擇的化合物生成策略,去除合成難度高、類藥性低、PAINS 等不利化合物后,進(jìn)一步分析化合物骨架,優(yōu)選出類藥多樣性分子組成虛擬庫,適用于 AI 藥物篩選、大型虛擬篩選等。 |
MegaUni 50K Virtual Diversity Library Retatrutide 是胰高血糖素受體 (GCGR)、葡萄糖依賴性促胰島素多肽受體 (GIP 優(yōu)選 50,000 個(gè)分子組成 MegaUni 50K Virtual Diversity Library。50,000 個(gè)分子具有 46,744 種 BMS 分子骨架,每種分子骨架僅包含 1-3 個(gè)化合物,化學(xué)空間多樣,結(jié)構(gòu)新穎,適用于新型先導(dǎo)物發(fā)現(xiàn)等。 |
MCE 的所有產(chǎn)品僅用作科學(xué)研究或藥證申報(bào),我們不為任何個(gè)人用途提供產(chǎn)品和服務(wù)。
參考文獻(xiàn):
[1] Rifaioglu AS, et al. Recent applications of deep learning and machine intelligence on in silico drug discovery: methods, tools and databases. Brief Bioinform. 2019 Sep ;20(5):1878-1912.
[2] Guttman Y, Kerem Z. Dietary Inhibitors of CYP3A4 Are Revealed Using Virtual Screening by Using a New Deep-Learning Classifier. J Agric Food Chem. 2022 Mar ;70(8):2752-2761.
[3] Liu S, et al. Virtual Screening of Nrf2 Dietary-Derived Agonists and Safety by a New Deep-Learning Model and Verified In Vitro and In Vivo. J Agric Food Chem. 2023 May ;71(21):8038-8049.
[4] Li B, et al. A deep learning framework for accurate reaction prediction and its application on high-throughput experimentation data. J Cheminform. 2023 Aug;15(1):72.
[5] Segler MHS, et al. Planning chemical syntheses with deep neural networks and symbolic AI. Nature. 2018 Mar ;555(7698):604-610.
相關(guān)產(chǎn)品
免責(zé)聲明
- 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。