人工智能助力藥物研發(AI制藥綜述論文)

慈雲數據 8個月前 (03-13) 技術支持 60 0

人工智能到深度學習:藥物發現的機器智能方法

Artificial intelligence to deep learning: machine intelligence approach for drug discovery

Rohan Gupta1、Devesh Srivastava1、Mehar Sahu1、Swati Tiwari1、Rashmi K.Ambasta1、Pravir Kumar1

接收日期:2021年1月29日,接受日期:2021年3月22日,在線發布日期:2021年4月12日

©作者,根據Springer Nature Switzerland AG 2021的獨家許可

Rohan Gupta、Devesh Srivastava、Mehar Sahu和Swati Tiwari對這項工作做出了同等貢獻。

通訊作者:Pravir Kumar

pravirkumar@dtu.ac.in;kpravir@gmail.com

1印度,德裏110042,Bawana路,Shahbad Daulatpur,德裏科技大學生物技術系(原DCE),分子神經科學和功能基因組學實驗室

摘要

藥物設計與開發是制藥企業和化學科學家研究的重要領域。然而,低療效、靶向給藥、時間消耗和高成本給藥物設計和發現帶來了障礙和挑戰。此外,來自基因組學、蛋白質組學、微陣列數據和臨床試驗的複雜和大數據也給藥物發現管道帶來了障礙。人工智能和機器學習技術在藥物發現和開發中起着至關重要的作用。換句話說,人工神經網絡和深度學習算法已經使這個領域現代化。機器學習和深度學習算法已應用于多肽合成、基于結構的虛拟篩選、基于配體的虛拟篩選、毒性預測、藥物監測和釋放、藥效團建模、定量構效關系、藥物重定位、多重藥理學和理化活性等藥物發現過程。過去的證據加強了人工智能的實施和這一領域的深入學習。此外,新的數據挖掘、管理和管理技術爲最近開發的建模算法提供了關鍵支持。綜上所述,人工智能和深度學習的發展爲合理的藥物設計和發現過程提供了極好的機會,最終将影響人類。

圖形摘要

與藥物設計和開發相關的主要問題是時間消耗和生産成本。此外,效率低下、靶向給藥不準确和劑量不當也是阻礙藥物遞送和開發過程的其他障礙。随着技術的進步,集成人工智能算法的計算機輔助藥物設計可以消除傳統藥物設計和開發的挑戰和障礙。人工智能被稱爲包含機器學習的超集,而機器學習包括有監督學習、無監督學習和強化學習。此外,深度學習作爲機器學習的一個子集,在藥物設計和開發中得到了廣泛的應用。人工神經網絡、深度神經網絡、支持向量機、分類與回歸、生成對抗網絡、符号學習和元學習是應用于藥物設計和發現過程的算法示例。人工智能已應用于藥物設計和開發過程的各個領域,如從多肽合成到分子設計、虛拟篩選到分子對接、定量構效關系到藥物重新定位、蛋白質錯折疊到蛋白質相互作用、分子通路識别到多重藥理學等。人工智能原理已被應用于活性和非活性的分類、藥物釋放監測、臨床前和臨床開發、一級和二級藥物篩選、生物标志物開發、藥物制造、生物活性鑒定和理化性質、毒性預測和作用方式識别。

關鍵詞:人工智能、機器學習、深度學習、虛拟篩選、藥物設計與發現、人工神經網絡、計算機輔助藥物設計、定量結構-活性關系、藥物再利用

縮寫詞

1. 簡介

在過去的二十年中,高效、先進的治療藥物靶向給藥系統的發展給化學和生物科學家帶來了巨大的挑戰[1]。此外,開發新型治療藥物的開發成本和時間消耗是藥物設計和開發過程中的另一個挫折[2]。爲了最大限度地減少這些挑戰和障礙,世界各地的研究人員轉向計算方法,如虛拟篩選(VS)和分子對接,也被稱爲傳統方法。然而,這些技術也帶來了諸如不準确和效率低下等挑戰[3]。因此,新技術的實現出現了激增,這些新技術能夠自給自足地消除傳統計算方法中遇到的挑戰。人工智能(AI),包括深度學習(DL)和機器學習(ML)算法,已經成爲一種可能的解決方案,它可以克服藥物設計和發現過程中的問題和障礙[4]。此外,藥物發現和設計包括漫長而複雜的步驟,如靶點選擇和驗證、治療性篩選和先導化合物優化、臨床前和臨床試驗以及生産實踐。所有這些步驟都給确定有效的藥物治療疾病帶來了另一個巨大的挑戰。因此,擺在制藥公司面前的最大問題是管理成本和過程速度[5]。人工智能以一種簡單、科學的方式回答了所有這些問題,減少了過程的時間消耗和成本。此外,制藥公司和醫療保健部門數據數字化的增加推動了人工智能的實施,以克服審查複雜數據的問題[6]。

人工智能也稱爲機器智能,是指計算機系統從輸入或過去的數據中學習的能力。當機器在學習和解決問題的過程中模仿與人腦相關的認知行爲時,通常使用人工智能這個術語[7]。目前,生物和化學科學家廣泛地将人工智能算法應用于藥物設計和發現過程中[8]。基于AI和ML原理的計算建模爲化合物的識别和驗證、靶點識别、多肽合成、藥物毒性和理化性質評估、藥物監測、藥物療效和有效性以及藥物重新定位提供了重要途徑[9]。随着人工智能原理以及ML和DL算法的出現,對化學庫中的化合物進行VS變得簡單且時效,化學庫中包含超過萬億(10^6 million)種化合物。此外,AI模型消除了因靶外相互作用而産生的毒性問題[10]。在此,我們簡要讨論AI從ML到DL的演變以及大數據參與藥物發現過程的革命性變革。随後,綜述了人工智能與常規化學在藥物發現過程改進中的融合以及人工智能在傳統藥物發現過程改進中的應用。随後,我們讨論了人工智能在藥物設計和發現過程中的許多應用,如一級和二級篩選、藥物毒性、藥物釋放和監測、藥物劑量有效性和療效、藥物重新定位、多藥理學以及藥物-靶點相互作用

2. 人工智能的進化:機器學習到深度學習

2015年9月,Google搜索趨勢顯示,ML引入後,AI是搜索最多的詞。一些人将ML描述爲主要AI應用程序,而另一些人将其描述爲AI的子集[11,12]。AI是一個總括性術語,其中計算機程序能夠像人類一樣思考和行爲,而ML則超出了将數據輸入機器的範圍,以及像樸素貝葉斯(Naive Bayes)、決策樹(decision tree,DT)、隐馬爾可夫模型(hidden Markov models,HMM)等算法,這些算法有助于機器學習而無需顯式編程。後來,随着神經網絡的發展,機器可以像人腦一樣對輸入的數據進行分類和組織,這進一步顯示了人工智能的進步。20世紀前後,伊戈爾·艾森伯格(Igor Aizenberg)及其同事在談到人工神經網絡(ANN)時,首次提出了“深度學習”一詞。DL是ML的一個子集,而ML本身就是AI的一個子集,因此,演化過程是AI>ML>DL[13,14]。ML要麽使用監督學習,其中模型被訓練爲使用标記數據,這意味着輸入已被标記爲相應的首選輸出标簽;要麽使用無監督學習,其中模型被訓練爲使用未标記數據,但從輸入數據中查找循環模式[15]。另一些是半監督學習,使用監督和非監督學習的結合;自監督學習是一種特殊情況,它采用兩步過程,其中無監督學習爲未标記數據生成标簽,其最終目的是建立有監督學習模型;強化學習是一種ML,它借助于一個恒定的反饋回路,随着時間的推移對算法進行改進,最後是DL,其中有多層ML算法,被稱爲大腦啓發的算法家族,模仿人腦,但需要較高的計算能力來訓練和大數據才能成功[16,17]。ML的起源可以追溯到1943年,當時McCulloch和Pitts發表了一篇題爲“神經活動中内在思想的邏輯演算”的文章,他們給出了第一個神經網絡的數學模型[19]。Alan M. Turing在1950年發表的開創性論文[18]中提出了ML的概念。1952年,Arthur L. Samuel爲IBM編寫了一個棋盤格程序[20],從而推廣了“機器學習”這個術語。1957年,Frank Rosenblatt開發了用于圖像識别的感知機[21]。Henry J. Kelley在1960年開發了連續反向傳播模型,Stuart Dreyfus在1962年開發了一個僅基于鏈式規則的簡單版本[22,23]。1965年,Ivakhnenko和Lapa開發了第一個可用的DL網絡。1980年左右,福島國彥(Kunihiko Fukushima)開發了一種名爲神經認知機的人工神經網絡,這種網絡具有多層設計,可以幫助計算機學習如何識别視覺模式[24]。他還開發了第一個基于動物視覺皮層組織的卷積神經網絡(CNN)[25][圖1]。

圖1 (A)人工智能在醫療保健中的曆史:1950年,随着圖靈測試的發展,人工智能在醫療保健中的首次突破。後來,在1975年,第一個關于計算機在醫學上的研究資源被開發出來,随後NIH的第一個以AIM爲中心的研讨會标志着人工智能在醫療保健中的重要性。随着21世紀深度學習的發展和2007年DeepQA的引入,人工智能在醫療領域的應用範圍不斷擴大。此外,2010年,CAD首次應用于内鏡檢查,而2015年,第一台Pharmbot被開發出來。2017年,FDA批準的第一個基于雲的DL應用程序被引入,這也标志着人工智能在醫療領域的實施。從2018年到2020年,在胃腸病學領域進行了多個AI試驗。(B)人工智能分類:有七種人工智能分類,即推理和問題解決、知識表示、規劃和社會智能、感知、機器學習、機器人運動和操縱以及自然語言處理,正如Russel和Norvig在其《人工智能:現代方法》一書中所讨論的那樣。機器學習進一步分爲三個重要的子集:有監督學習、無監督學習和深度學習,而視覺又分爲兩個子集,如圖像識别和機器視覺。類似地,語音被劃分爲兩個子集:語音到文本和文本到語音,而自然語言處理被劃分爲五個主要子集,包括分類、機器翻譯、問答、文本生成和内容提取。人工智能在醫療和制藥行業有五個重要的應用,它們改變了整個場景。這些應用包括研究和發現、臨床開發、制造和供應鏈、患者監測和上市後監測

David Rumelhart、Geoffrey Hinton和Ronald J. Williams于1986年發表了一篇題爲“通過反向傳播錯誤學習表征”的論文,該論文證明反向傳播可以改善形狀識别和單詞預測[26]。在最初的成功之後,也有一些挫折,但辛頓在第二個人工智能冬季繼續努力,以達到新的高度。因此,他被認爲是DL的教父。很快,在1989年,Yann LeCun在貝爾實驗室首次進行了反向傳播的實際演示[27]。同年,Christopher Watkins發表了題爲“從延遲獎勵中學習”的論文,該論文引入了Q-Learning的概念,進一步改進了計算機程序中的強化學習[28]。1995年,Corinna Cortes和Vladimir Vapnik開發了支持向量機(SVM)來映射和識别相似的數據[29]。兩年後的1997年,Jürgen Schmidhuber和Sepp Hochreiter爲遞歸神經網絡開發了長-短期記憶(LSTM)[30]。

1999年,圖形處理單元(GPU)作爲微處理器電路推出,最初是爲了加速計算機遊戲的三維圖形處理而開發的。後來,GPU由于具有并行計算能力而成爲技術和研究領域的熱點。META Group在2001年發布的一份研究報告中指出,數據的數量、速度、來源和類型都在不斷增加,這是對大數據進軍的一種呼喚。2007年,Nvidia引入了計算統一設備架構(CUDA),這是一個允許程序員和研究人員使用GPU進行通用計算的框架[31]。從那時起,在CUDA的幫助下,研究人員開始使用GPU進行DL驅動的操作,因爲GPU的高内存帶寬允許輕松處理DL算法中涉及的大量數據,GPU中的數千個内核允許同時并行處理神經網絡。2009年,李飛飛推出了ImageNet,這是一個免費數據庫,包含數百萬張可用于研究目的的标記圖像 [32]。AlexNet是一種卷積神經網絡,由Alex Krizhevsky于2012年左右創建,它使用校正的線性單元來幫助增強速度和落差[33]。同年,Google Brain進行的“貓實驗”得出結論,該網絡能夠正确識别不到16%的呈現對象[34]。2014年,Nvidia引入了CUDA深度神經網絡(cuDNN),這是一個基于CUDA的DL庫,加速了基于DL的運行[35]。同樣,2014年開發并發布了“Deep Face”,用于識别人臉,準确率爲97.5%[36]。同年引入了産生式對抗網絡(generative adversative networks,GANs),使用兩個相互競争的神經網絡來檢驗數據是否真實或生成[37]。2016年,Cray Inc.在其XC50超級計算機上使用了微軟的神經網絡軟件,該計算機具有1000個Nvidia Tesla P100 GPU,可以執行任務并在幾秒鍾内輸出。2017年,英偉達推出了Tesla V100 GPU,其tensor内核加速了基于AI的運行。然而,DL仍處于成長階段,在這一領域的進一步發展需要創造性的想法。

3. 變革藥物發現過程:大數據和人工智能的作用

大數據可以定義爲過于龐大和複雜的數據集,無法用傳統的數據分析軟件、工具和技術進行分析。大數據的三個主要特征是體積、速度和多樣性,其中體積表示生成的大量數據,速度表示這些數據的複制速度,多樣性表示數據集中存在的異質性[38]。随着微陣列技術、RNA測序(RNA-seq)技術和高通量測序技術的出現,每天都會産生大量的生物醫學數據,當代藥物發現也因此向大數據時代過渡。在藥物發現中,第一步也是最重要的一步是确定與疾病病理生理學相關的适當靶點(例如,基因、蛋白質),然後找到能夠幹擾這些靶點的适當藥物或類藥物分子,現在我們可以訪問一組生物醫學數據存儲庫,在這方面可以幫助我們[39]。此外,人工智能的發展使得大數據分析變得更加容易,因爲現在有無數的ML技術可用,可以幫助提取這些大型生物醫學數據集中存在的有用特征、模式和結構[40]。對于靶點識别,像基因表達這樣的特征被廣泛應用于理解疾病機制和尋找與疾病相關的基因。微陣列技術和RNA-seq技術爲各種疾病提供了大量的基因表達數據。NCBI基因表達綜合數據庫(GEO)(https://www.ncbi.nlm.nih.gov/geo/)[41]、癌症基因組圖譜(TCGA)(https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga) [42]、Arrayexpress(https:// www.ebi.ac.uk/arrayexpress/)[43],是包含基因表達數據的大型存儲庫。通過分析基因表達特征,我們可以找到導緻不同疾病的靶基因。例如,van IJzendoorn等人2019利用ML方法和基因表達數據發現了罕見軟組織肉瘤的新生物标記物和潛在藥物靶點[44]。

此外,全基因組關聯研究(GWAS)可以确定基因組變異與特定複雜疾病之間的相互關系[45]。GWAS central(https://www. gwascentral.org/)[46]、NHGRI-EBI GWAS Catalog(https:// www.ebi.ac.uk/gwas/home)[47]是包含GWAS數據的一些存儲庫。此外,借助于GWAS,我們可以确定與疾病相關的基因位點,并且已經觀察到與這些位點相關的基因是潛在的治療靶點。例如,Li等人[48]使用GWAS catalog、基因表達、表觀基因組學和甲基化數據,通過ML分析确定與幼年特發性關節炎位點相關的靶點基因。此外,其突變可導緻不同威脅性疾病的特定基因也是很有希望的治療靶點。這些風險基因可以通過分析各種基因組和外顯子組測序數據來識别。對于測序數據,我們有公共存儲庫,如Sequence read archive(https://www.ncbi.nlm.nih.gov/sra)[49],其中包含從下一代測序技術獲得的測序數據。國家癌症研究所基因組數據共享空間(NCIGDC)(Home | NCI Genomic Data Commons) [50]和TCGA是包含與癌症相關的測序數據的數據庫。此外,利用大數據和人工智能,Han等人2019開發了DriverML(https://github.com/ HelloYiHan/DriverML),這是一種基于監督ML的工具,可以指出與癌症相關的驅動基因[51][圖2]。

圖2 大數據在藥物設計和發現中的應用:随着文獻、體外、體内、臨床研究、基因組學研究、蛋白質組學研究、代謝組學研究、基因本體研究、分子通路數據等生物和化學數據的增加,不同的數據庫也在發展。例如,ChemSpider、ChEMBL、ZINC、BindingDB和PubChem是藥物設計和發現過程中化合物合成和篩選的基本數據庫。對上述數據庫中存儲的數據進行整理并篩選出藥物發現過程所需化合物的藥理學和物理化學性質,而不是溶劑化能和質子親和力、波函數、原子力和過渡态等量子力學計算。高通量篩選數據根據藥物相似性、PAINS計算、ADMET分析和毒性進行過濾。對篩選出的化合物進行深度學習、随機森林、分類回歸、神經網絡等人工智能模型進一步分析。然後對這些化合物進行定量構效關系和藥效團模型,然後進行分子對接和分子動力學模拟研究。然後,将最終預測的化合物可視化,用于結合能計算和活性位點識别。因此,最終化合物被鑒定并進行體外和體内實驗研究以進行驗證。然而,量子力學性質在藥物的發現和設計過程中起着至關重要的作用,但這些性質并不能直接阻礙藥物的設計過程。QM方法包括從頭算密度泛函理論和半經驗計算,其中精确計算使用電子關聯方法。QM将成爲計算藥物化學家的重要工具。因此,現代QM方法将在熟悉和簡化藥物發現過程中發揮更直接的作用

此外,有時甚至已發表的文獻也可用于靶點識别,PubMed(https://pubmed.ncbi.nlm.nih.gov/)[52]是各種已發表生物醫學文獻的主要存儲庫,其數據挖掘可幫助識别不同疾病的靶點。在确定和驗證了合适的靶點之後,下一步是找到合适的藥物和/或類藥物分子,它們可以與靶點相互作用并引發期望的反應[53]。在大數據時代,我們可以使用大量的大型化學數據庫,這有助于找到針對特定靶點的完美藥物。同樣,PubChem(https:// pubchem.ncbi.nlm.nih.gov/)[54]是一個可自由訪問的化學數據庫,其中包含各種化學結構的數據,包括其生物、物理、化學和毒性特性[55]。此外,ChEMBL數據庫(ChEMBL Database)[56]是一個開放存取的大數據庫,包含許多具有藥物樣特性的生物活性化合物的數據[57]。ChEMBL數據庫還包含有關吸收、分布、代謝和排洩(ADME)、這些化合物的毒性特性,甚至其靶點相互作用的信息。此外,DrugBank(https://go.drugbank.com/)[58]是另一個開放存取的藥物數據存儲庫,其中包含各種藥物及其靶點和機制的數據[59]。此外,集成的基于網絡的細胞特征庫(LINCS)L1000(NIH LINCS Program)[60] 是另一個存儲庫,其中包含了人類細胞系在用不同化合物治療時基因表達特征變化的信息。LINCS L1000數據驅動搜索引擎,稱爲L1000CDS^2,是一個開放存取的搜索引擎,其中包含可以恢複差異表達基因表達的藥物數據;因此,它們也可用于藥物發現[61]。此外,蛋白質數據庫(PDB)(RCSB PDB: Homepage)[62]是另一個可自由訪問的在線存儲庫,其中包含蛋白質、DNA、RNA的三維結構數據[63]。PDB數據也被廣泛用于評估蛋白質與配體的相互作用,然後找到合适的靶蛋白抑制劑。Xu等[64]結合ML和分子對接尋找新冠病毒3CL蛋白酶抑制劑;本文從PDB中獲得了COVID 3CL蛋白酶的晶體結構。

4. 人工智能與常規化學的融合:促進藥物發現

在制藥工業中,人工智能已成爲解決經典化學或化學空間問題的一種可能的方法,這些問題阻礙了藥物的發現和開發。随着技術的進步和高性能計算機的發展,計算機輔助藥物設計(CADD)中的人工智能算法(如ML到DL)越來越多。人工智能并不是科學家發現和開發藥物的新技術;化學家期望準确預測化學活性結構關系也不是新鮮事。例如,Hammett将平衡常數與反應速率聯系起來,而Hansch用計算機輔助預測藥物化合物的物理化學性質和生物活性。Hansch的成功爲以下研究提供了一條途徑:(a)化學結構的詳細識别和預測,以及藥效團和三維結構等性質的表征;(b)假設與預測化合物的化學表征和生物活性相關的複雜數學方程。然而,當今時代科學家的主要目标是通過基于經典化學活動的ML算法來提高藥物發現和開發過程的準确性和置信度。這将鼓勵化學家識别人工智能技術的潛力,以回答醫學化學的兩個關鍵問題,如“下一個化合物應該是什麽?”和“合成化合物的過程是什麽?”。因此,在過去的二十年裏,發展了許多計算藥物發現的技術和工具,定量構效關系(QSAR)方法和自由能最小化技術。例如,文獻[65]使用機器智能方法(如DT、随機森林(RF)方法、CNN、SVM、LSTM網絡和梯度提升機)區分複合細胞活性。在上述模型中,有些模型通過簡化的分子輸入行輸入系統将化合物表示爲字符串,直接用作輸入數據,而不是任何化學描述符,起到自然語言處理的作用。他們對單個數據集(Z-score=3)和整個數據集(Z-score=5或6)使用了兩個不同的截止值。後來,他們合并了九個不同的指标,用于評估模型的精度、準确性、曲線下面積和Cohen的K值。結果表明,梯度提升機具有數據分布均衡的能力。實驗結果還表明,經典的ML方法和DL方法可以對複合細胞活性進行分類[65]。類似地,文獻[66]使用雙QSAR方法預測PAMPA有效滲透率,其中作者使用偏最小二乘(PLS)方案和分層SVM(HSVR)方案開發了經典QSAR模型和基于ML的QSAR模型。作者認爲HSVR方案在訓練集、測試集和統計分析方面均優于PLS方案。此外,對于新化合物的合成,化學科學家很容易依賴已發表的文獻。随着人工智能和分子生物學技術的發展,區分現有藥物和新的化學結構變得相對簡單。例如,文獻[67]應用計算方法篩選中藥中的肝毒性成分,而文獻[68]使用計算技術展示了系統發育關系、結構-毒性關系和草藥成分網絡。最近,Zhang等人對一種新的冠狀病毒進行了計算分析,作者在其中篩選了對嚴重急性呼吸綜合征(SARS)具有生物活性的不同化合物。随後,對化合物進行ADME和對接分析。結果表明,已有13種中藥對新型冠狀病毒有較好的抗藥性[69]。因此,傳統的以化學爲導向的藥物發現和開發理念與計算藥物設計相結合,提供了一個很好的未來研究平台。此外,全世界的系統生物學和化學科學家與計算科學家合作,開發現代ML算法和原理,以促進藥物的發現和開發。

5. 利用人工智能和機器學習技術改造傳統的計算藥物設計

多年來,計算方法在藥物設計和發現中發揮了重要作用,改變了藥物設計的全過程。然而,許多問題,如時間成本、計算成本和可靠性,仍然與傳統的計算方法有關[70,71]。人工智能有可能消除計算藥物設計領域的所有瓶頸,也可以增強計算方法在藥物開發中的作用。此外,随着基于ML的工具的出現,确定靶蛋白質的三維結構變得相對容易,這是藥物發現的關鍵步驟,因爲新藥物是基于蛋白質的三維配體結合環境設計的[72,73]。最近,Google的DeepMind (https://github.com/deepmind)設計了一個基于人工智能的工具,該工具根據PDB結構數據進行訓練,稱爲AlphaFold,它可以根據蛋白質的氨基酸序列來預測蛋白質的3D結構[74]。AlphaFold分兩步預測蛋白質的3D結構:

(i) 首先,使用CNN将蛋白質的氨基酸序列轉換爲距離矩陣和扭轉角矩陣;(ii)其次,使用梯度優化技術将這兩個矩陣轉換爲蛋白質的三維結構[75]。同樣,哈佛醫學院的Mohammed AlQuraishi也設計了一個基于數據倉庫的工具,以蛋白質的氨基酸序列爲輸入,生成其三維結構。該模型稱爲遞歸幾何網絡(https://github.com/aqlaboratory/rgn),使用單個神經網絡計算連接不同氨基酸的化學鍵的鍵角和旋轉角,以預測給定蛋白質的三維結構[76]。

此外,量子力學用于确定分子在亞原子水平上的性質,用于估計藥物開發過程中蛋白質與配體的相互作用。然而,有時使用傳統的計算技術,量子力學的計算可能非常昂貴且要求很高,這會影響其準确性[77]。然而,有了人工智能,量子力學可以變得更加友好和有效。Schtutt等人2019最近開發了一種DL驅動工具,稱爲SchNOrb(GitHub - atomistic-machine-learning/SchNOrb: Unifying machine learning and quantum chemistry with a deep neural network for molecular wavefunctions),該工具可以準确預測有機分子的分子軌道和波函數。利用這些數據,我們可以确定分子的電子性質、分子周圍化學鍵的排列以及反應位點的位置[78]。因此,SchNOrb可以幫助研究人員設計新藥。此外,分子動力學(MD)模拟分析了分子在原子水平上的行爲和相互作用[79]。在藥物發現中,MD模拟用于評估蛋白質-配體相互作用和結合穩定性。MD模拟的一個主要問題是,它可能非常困難和耗時。AI具有加速MD仿真過程的能力[80]。在這方面,Drew Bennett等人進行了MD模拟,以計算15000個小分子從水轉移到環己烷的自由能,從而利用這些自由能和其他一些原子特征來訓練3D卷積網絡和空間圖形CNN。研究人員發現,經過訓練的神經網絡預測轉移自由能的精度與MD模拟計算結果幾乎相似[81]。這項研究表明,ML技術可以改進和加快MD模拟。然而,要實現這一點,需要大量的訓練數據。

此外,近年來,從頭藥物設計也利用了人工智能。例如,Q. Bai等人在2020年設計了MolAIcal(MolAICal),這是一種可以在三維蛋白質袋中設計三維藥物的工具[82]。MolAICal通過兩個組分的作用設計3D藥物:(i)第一個組分使用DL和在美國食品和藥物管理局(FDA)批準的藥物上訓練的遺傳算法進行從頭藥物設計,(ii)第二個組分結合分子對接和在ZINC數據庫(ZINC)[83]上訓練的DL模型。同樣,Popova等人2018設計了一種基于深度強化學習的算法,稱爲ReLeaSE(https:// github.com/isayev/ReLeaSE),用于從頭藥物設計。ReLeaSE通過集成兩個深度神經網絡(DNN)(稱爲生成神經網絡和預測神經網絡)實現其預期結果,其中生成模型用于生成新化合物,預測模型用于預測化合物的性質[84]。此外,近年來,人工智能也被用于升級合成規劃過程,該過程用于确定感興趣分子的最佳合成路徑。最近,Grzybowski等人[85]開發了一個基于DT的程序,稱爲chematica,用于設計所需分子的新合成路徑。類似地,Genheden等人已經實現了AiZynthFinder(https://github.com/MolecularAI/aizynthfin der),這是一種基于Monte Carlo樹搜索的反轉錄合成規劃的開源工具,由神經網絡調節[86]。同樣,Segler等人[87]利用三個不同的神經網絡結合Monte Carlo樹搜索來發現新的逆合成路線。ICSYNTH(https://www.deepmatter.io/products/ icsynth/)是另一個工具,它可以通過使用通過ML模型生成的一系列化學規則來生成新的化學合成路徑[88]。

此外,各種基于文本挖掘的工具也被開發出來,可以幫助傳統的藥物發現過程。文本挖掘使用自然語言處理(NLP)等方法将各種文獻和數據庫中的非結構化文本轉換爲結構化數據,并對其進行适當的分析以獲得新的見解。NLP是人工智能的一個分支,它允許計算機通過基于人工智能的算法處理和分析人類語言,如語音和文本。利用這種人工智能驅動的技術,已經開發了各種基于文本挖掘的工具。例如,Jang等人2018利用NLP和主題建模開發了PISTON(http://datab io.gachon.ac.kr/tools/PISTON/),這是一種可以預測藥物副作用和藥物适應症的工具[89]。同樣,DisGeNET(DisGeNET - a database of gene-disease associations)是一個文本挖掘驅動的數據庫,包含了大量關于基因疾病和變異疾病關系的信息。DisGeNET中的數據可以分析各種生物過程,如藥物不良反應、參與疾病的分子通路、藥物對靶點的作用等。此外,STRING(STRING: functional protein association networks)是另一個文本挖掘驅動的數據庫,包含各種生物體的蛋白質相互作用的大量信息[91]。此外,STITCH(STITCH: chemical association networks)是另一個文本挖掘驅動的數據庫,其中包含蛋白質和化學品/小分子之間相互作用的信息[92]。STICH中的信息也可用于确定藥物的結合親和力和藥物-靶點的關聯。

6. 人工智能在一、二級藥物篩選中的應用

如今,人工智能已經成爲一種非常成功且要求很高的技術,因爲它節省了時間且具有成本效益[93]。一般來說,細胞分類、細胞分選、計算小分子的性質、借助計算機程序合成有機化合物、設計新化合物、開發分析方法以及預測目标分子的三維結構是一些費時費力的任務,借助人工智能可以減少并加快藥物發現的進程[94,95]。藥物初篩包括利用人工智能技術通過圖像分析對細胞進行分類和分選。許多使用不同算法的ML模型識别圖像的精度很高,但在分析大數據時卻顯得力不從心。要對目标細胞進行分類,首先需要對ML模型進行訓練,使其能夠識别細胞及其特征,這基本上是通過對比目标細胞的圖像來完成的,這将目标細胞與背景分離[96]。提取具有不同紋理特征的圖像,如小波紋理特征和Tamura紋理特征,并通過主成分分析(PCA)進一步降維。研究表明,最小二乘支持向量機(LS-SVM)的分類精度最高,爲95.34%[97,98]。關于細胞分類,機器需要快速從給定樣本中分離出目标細胞類型。有證據表明,圖像激活細胞分選(IACS)是最先進的設備,可以測量細胞的光學、電學和機械性能[99][圖3]。

圖3 人工智能在一、二級藥物篩選中的應用:在藥物發現和設計管道中,潛在先導化合物的篩選至關重要,人工智能在識别新的潛在先導化合物方面發揮着重要作用。從組學研究、臨床和臨床前研究、體内試驗和微陣列分析等不同的研究中,化學空間中出現了大約萬億個化學結構。利用強化模型、邏輯模型、回歸模型和生成模型等機器學習模型,根據活性位點、結構和靶結合能力篩選出這些化學結構。通過人工智能完成的藥物發現過程需要14-18年的時間,相對傳統的藥物發現過程要短。藥物發現過程的第一步是先導識别,通過反向對接、生物信息學分析和計算化學生物學來識别疾病修飾靶蛋白。第二步,對化合物進行初步篩選,篩選出對靶蛋白有抑制作用的潛在先導化合物。這可以通過虛拟篩選和從頭設計來實現。藥物發現過程的下一步包括通過聚焦庫設計、類藥物分析、藥物-靶點再現性和計算生物學進行先導優化和先導化合物識别。之後,對化合物進行二次篩選,然後進行臨床前試驗。藥物發現過程的最後一步是通過細胞培養分析、動物模型實驗和患者分析進行臨床開發

二級藥物篩選包括化合物的物理性質、生物活性和毒性分析。熔點和分配系數是控制化合物生物利用度的一些物理性質,也是設計新化合物的必要條件[100],在設計藥物時,可以使用不同的方法進行分子表征,如分子指紋、簡化分子輸入行輸入系統(SMILES)和庫侖矩陣[101]。這些數據可用于DNN,DNN包括兩個不同的階段,即生成階段和預測階段。雖然這兩個階段通過有監督學習分别進行訓練,但當它們聯合訓練時,偏差可以應用于輸出,在輸出中,偏差會因特定屬性而得到獎勵或懲罰。整個過程可用于強化學習[84]。匹配分子對(MMP)已被廣泛用于QSAR研究。MMP與候選藥物的單一變化相關,這進一步影響化合物的生物活性[102]。與MMP一樣,其他ML方法也被使用,如DNN、RF和梯度提升機(GBM)來進行修改。結果表明,DNN的預測能力優于RF和GBM[103]。随着ChEMBL、PubChem和ZINC等公開數據庫的增加,我們可以訪問數百萬種化合物,這些化合物注釋了它們的結構、已知靶點和可購買性等信息;MMP+ML可預測口服暴露、内在清除率、ADMET和作用方式等生物活動[98,104,105]。優化化合物的毒性是藥物發現中最耗時和最昂貴的任務,也是一個關鍵參數,因爲它爲藥物開發過程增加了重要價值。

7. 人工智能在藥物開發過程中的應用

在藥物的發現和開發過程中,最困難和最令人沮喪的步驟是确定存在于浩瀚的化學空間(大約10^60個分子)中的合适的生物活性藥物分子。此外,藥物發現和開發過程被認爲是一個耗時和成本高的過程。最令人惱火的一點是,十分之九的藥物分子通常無法通過II期臨床試驗和其他監管機構的批準[106-108]。上述藥物發現和開發的局限性可以通過實現基于AI的工具和技術來解決。AI參與藥物開發過程的每個階段,如小分子設計、藥物劑量和相關有效性的确定、生物活性劑的預測、蛋白質-蛋白質相互作用、蛋白質折疊和錯誤折疊的确定、基于結構和配體的VS、QSAR建模、藥物再利用、毒性和生物活性的預測,以及鑒定藥物化合物的作用模式,如下所述。

7.1 多肽合成與小分子設計

肽是一種具有生物活性的小分子鏈,由大約2–50個氨基酸組成,由于其能夠穿過細胞屏障并到達所需的靶點,因此越來越多地被用于治療目的[109]。近年來,研究者利用人工智能技術發現了新的多肽。例如,Yan等人2020開發了Deep-AmPEP30,一種基于DL的短抗微生物肽(AMP)鑒定平台[110]。DeepAmPEP30(AxPEP)是一個CNN驅動的工具,它可以從DNA序列數據預測短AMP。Yan等人利用Deep-AmPEP30從光滑念珠菌(一種存在于胃腸道的真菌病原體)的基因組序列中鑒定出新的AMP。同樣,Plisson等人2020将ML算法與異常檢測技術相結合,以發現具有非溶血特征的AMP[111]。此外,Kavousi等人開發了IAMPE(http://cbb1.ut. ac.ir/),一個用于鑒定抗菌肽的Web服務器,它集成了基于13CNMR的特征和肽的物理化學特征作爲ML算法的輸入,以識别新的AMP[112]。類似地,Yi等人2019設計了ACP-DL(https://github.com/haichengyi/ACP- DL),一種基于DL的工具,用于發現新的抗癌肽[113]。ACP-DL采用LSTM算法,這是遞歸神經網絡(RNN)的改進版本,用于區分抗癌肽和非抗癌肽。此外,Yu等人[114]提出了DeepACP,一種基于深度遞歸神經網絡的抗癌肽識别模型。同樣,Tyagi等人2013開發了一個基于SVM的平台,用于識别新的抗癌肽[115]。此外,Rao等人2020結合圖形卷積網絡和一種熱點編碼設計ACP-GCN,用于發現抗癌肽[116]。此外,Grisoni等人使用四個反向傳播神經網絡的集成來識别新的抗癌肽。同樣,Wu等人[117]提出了PTPD,一種基于CNN和word2vec的工具,用于發現用于治療的新肽。

此外,小分子是分子量非常低的分子,像肽一樣,小分子也被用于基于人工智能的工具的治療目的。例如,Zhavoronkov等人[118]設計了生成性張量強化學習(GENTRL),這是一種基于生成性強化學習的小分子從頭設計工具。在GENTRL(GitHub - insilicomedicine/GENTRL: Generative Tensorial Reinforcement Learning (GENTRL) model)的幫助下,Zhavoronkov等人發現了一種新的酶抑制劑,DDR1激酶[118]。同樣,McCloskey等人[119]将DNA編碼的小分子庫(DEL)數據與Graph CNN和RF等ML模型相結合,發現了新的類藥物小分子。類似地,Xing等人[120]整合了XGBoost、SVM和DNN,以尋找類風濕性關節炎靶點的小分子。

7.2 藥物劑量和給藥有效性的鑒定

給患者服用不适當劑量的任何藥物都可能導緻不良和緻命的副作用;因此,爲治療目的确定安全的藥物劑量至關重要。多年來,确定一種藥物的最佳劑量一直是一個挑戰,這種藥物可以在毒副作用最小的情況下達到預期的療效[121]。随着人工智能的出現,許多研究者正借助ML和DL算法來确定合适的藥物劑量。例如,Shen等人[122]開發了一個基于AI的平台,稱爲AI-PRS,以确定通過抗逆轉錄病毒治療用于艾滋病毒治療的最佳劑量和藥物組合。AI-PRS是一種神經網絡驅動的方法,通過抛物線反應曲線(PRS)将藥物組合和劑量與療效聯系起來。在他們的研究中,Shen等人對10名HIV患者聯合使用替諾福韋、伊法韋侖和拉米夫定,并在适當的時候使用PRS方法,他們發現替諾福韋的劑量可以減少起始劑量的33%,而不會導緻病毒複發。因此,使用AI-PRS也可以找到其他疾病的最佳用藥劑量。

此外,Pantuck等人[123]開發了CURATE.AI,以确定适當的藥物劑量,它使用患者的個人數據并将其轉換爲CURATE.AI配置文件,以确定最佳劑量。這項研究是在癌症藥物恩紮魯胺和研究藥物ZEN-3694聯合應用于轉移性去勢抵抗前列腺癌患者的情況下進行的。使用CURATE.AI,随着時間的推移,他們發現比ZEN-3694的起始劑量低50%,可以達到預期的效果并阻止癌症生長。

此外,Julkunen等人[124]設計了comboFM(https:// github.com/aalto-ics-kepaco/comboFM),這是一種新的ML驅動工具,可在臨床前研究(如癌細胞系)中确定合适的藥物組合和劑量。comboFM通過使用因子分解機(https://github.com/geffy/ tffm)确定合适的藥物組合和劑量,這是一個用于高維數據分析的ML框架。在他們的研究中,Julkunen等人利用comboFM鑒定了一種新的抗癌藥物克唑替尼和硼替佐米的組合,在淋巴瘤細胞系中顯示出良好的療效。類似地,Sharabiani等人使用ML方法确定抗凝藥物華法林的最佳初始劑量。他們使用相關向量機根據患者的劑量需求對不同患者進行分類,然後使用回歸模型預測患者的合适劑量[125]。同樣,Nemati等人[126]開發了一個深度強化學習模型,該模型在重症監護II數據庫(MIMIC II)中進行多參數智能監測,以找到另一種抗凝藥物肝素的理想劑量。同樣地,Tang等人[127]使用ML技術,如ANN、貝葉斯加性回歸樹、增強回歸樹、多元自适應回歸樣條來确定免疫抑制藥物他克莫司的最佳劑量。此外,Hu等人[128]采用分類回歸樹、多層感知器網絡、k近鄰等技術進行ML分析,以确定心髒藥物地高辛的安全初始劑量。此外,Imai等人[129]開發了一個DT模型,以找到抗生素萬古黴素的安全起始劑量。

7.3 生物活性物質的預測與藥物釋放的監測

類藥物的設計和監測是一個繁瑣和耗時的過程。最近,多個在線工具被開發來分析藥物釋放和檢查所選擇的生物活性化合物作爲載體的責任。随後使用基準數據集驗證計算分析。對于這樣的評價,基于化學特征的藥效團最适合。這些模型構建大型3D數據集,這些數據集是通過電子實驗或内部化合物收集開發的[130]。爲了研究基于配體的化學特性,已經使用CATALYST程序(www.accelerys.com)建立了各種成功的實驗,并且一組研究人員使用VS實驗[131]成功地預測了11種β-羟基類固醇脫氫酶1型抑制劑。

确定生物活性配體是篩選針對特定靶點的有效藥物的關鍵步驟。現在,研究人員正在利用人工智能确定可用于與疾病相關的特定靶點的生物活性化合物。例如,Wu等人綜合DL和RF方法設計WDL-RF(https://zhanglab. ccmb.med.umich.edu/WDL-RF/),以确定G蛋白偶聯受體(GPCR)靶向配體的生物活性。同樣,Cichonska等人[132]開發了pairwiseMKL(KEPACO · GitHub),一種基于多核學習的方法,用于确定化合物[133]的生物活性。爲了測試他們的模型的有效性,他們用以預測化合物的抗癌效力。此外,Mustapha等人[134]開發了一個Xgboost模型,以确定生物活性化學分子。此外,Merget等人[135]創建了DNN、RF等機器學習模型,以确定280多種不同激酶的生物活性。此外,Arshadi等人[136]設計了DeepMalaria,一種基于DL的模型,用于識别具有惡性瘧原蟲抑制活性的化合物。同樣,Sugaya等人[137]創建了配體效率驅動的支持向量回歸模型,以确定各種化合物的生物活性。此外,Afolabi等人[138]使用MLD藥物數據報告(MDDR)存儲庫中的數據,并将其應用于增強算法組合,以識别新的生物活性化合物。此外,Petinrin等人[139]使用多數投票技術和不同機器學習模型的集成來确定生物活性分子。

此外,藥物不良反應(ADR)是由給藥引起的意外、有害、緻命的副作用。ADR是藥物開發中的一個主要挑戰,在藥物開發的初期識别可能的ADR以使藥物開發過程更加穩健和有效已成爲必要。最近,研究人員使用人工智能來确定不同藥物在上市前可能出現的不良反應。例如,Dey等人[140]使用了基于DL的模型,該模型可以預測與藥物相關的不良反應,甚至可以識别導緻這些不良反應的化學亞結構。此外,Liu等人[141]綜合了藥物的化學、生物學和表型特性,通過機器學習分析預測與之相關的ADR。同樣,Jamal等人[142]結合生物、化學和表型特性,通過機器學習分析預測與藥物相關的神經系統不良反應。作者還利用他們的模型找出了與目前阿爾茨海默病藥物相關的不良反應。此外,Xue等人[143]将生物醫學網絡拓撲與DL算法相結合,以預測藥物ADR相關性。此外,Raja等人[144]使用機器學習分析預測ADR,ADR是藥物相互作用的結果。他們進一步使用他們的模型來預測與皮膚疾病藥物相關的ADR。除了篩選有效的生物活性劑外,另一個關鍵領域是藥物的相似性及其相互作用後釋放。最近,開發了一個可自由訪問、用戶友好的圖形界面SwissADME(http://www.swissadme.ch),以評估藥物的相容性及其藥代動力學作用[145]。Higuchi、Hixson–Crowell、Ritger–Peppas–Kormeyers、Brazel–Peppas、Baker–Lonsdale、Hopfenberg、Weibull和Peppas–Sahlin等數學模型也已應用于藥物發現,最常見的做法之一是計算選定或篩選的生物活性分子的載藥量。

7.4 蛋白質折疊和蛋白質相互作用的預測

分析蛋白質相互作用(PPI)對于有效的藥物開發和發現至關重要。大多數蛋白質注釋方法使用的序列同源性範圍有限。高通量的蛋白質相互作用數據,随着數據量的不斷增加,正成爲新的生物學發現的基礎。生物信息學面臨的一個巨大挑戰是對這些數據進行管理、分析和建模。因此,計算模型的發展,在一個地方同時預測多個輸入[146]。雖然計算方法被認爲比蛋白質-蛋白質非相互作用(PPNI)更具信息性,但也暗示了研究PPI和蛋白質-蛋白質非相互作用(PPNI)的計算方法。PPI預測可分爲直接PPI、間接功能關聯的直接PPI和信号轉導途徑的PPI[147]。利用機器學習和統計學習方法,如K近鄰、樸素貝葉斯、支持向量機、神經網絡、DT和RF等,對PPI中的障礙進行預測。貝葉斯網絡(BN)基本上是利用基因共表達、基因本體(GO)等生物過程相似性來預測PPI的。使用BN的數據集集成産生精确和準确的PPI網絡,說明全面的酵母相互作用組[148]。另一組還使用BN結合酵母的數據集來研究PPI[149]。一種新的層次模型PCA集成極限學習機(PCA-EELM)僅利用蛋白質序列信息預測蛋白質-蛋白質相互作用,是一種有效的工具,具有輸出準确、持續時間短等優點。此外,通過一種稱爲DNN蛋白質相互作用預測(DeepPPI)的新方法(http://ailab.ahu.edu.cn:8087/DeepPPI/index.html)[151]提高了DNS PPI預測效率。在哺乳動物細胞中,信号轉導主要由非結構基序和球狀蛋白結合域(PBD)之間的PPI控制。爲了跨多個蛋白質家族預測這些PBD,開發了定制的ML工具,稱爲分層統計力學建模(HSMM)[152]。基于ML、結構域親和力和頻率表的蛋白質-蛋白質相互作用預測,一種稱爲PPI_SVM的新工具于2011年開發,可在(http://code.google.com/p/cmater-bioinfo/)[153]免費訪問。由于已解決的複雜結構的數量不斷增加,已經開發了一種多體線程方法MULTIPROPERTOR。在該方法中,将已知模闆結構的蛋白質重新思考,并建立其與其他蛋白質的相互作用、界面能和Z評分[154]。基于結構的線程邏輯回歸工具Struct2Net(http://struct2net.csail.mit.edu)用于評估交互概率,是除同源建模之外的第一個基于結構的PPI預測工具[155]。基于基因簇的方法計算同一基因簇編碼的查詢蛋白同源序列的共現概率。這種方法也稱爲結構域/基因共現。如果兩個蛋白質的基因在基因組中并不接近,那麽這種方法就不能可靠地預測這兩個基因之間的相互作用[156,157]。

7.5 基于結構和配體的虛拟篩選

在藥物設計和藥物發現中,VS是CADD的關鍵方法之一。VS是指識别與藥物靶點結合的小化合物。VS是從化合物庫中篩選出有前景的治療性化合物的有效方法[158]。因此,它成爲高通量篩選的重要工具,同時也帶來了成本高、準确率低的問題。一般來說,有兩種重要的VS類型,即基于結構的VS(SBV)和基于配體的VS(LBV)[159,160]。LBV依賴于活性配體和非活性配體的化學結構和經驗數據,它利用活性配體的化學和物理化學相似性,從具有高生物活性的化合物庫中預測其他活性配體。然而,LBV不依賴于靶蛋白的三維結構,因此,該方法在缺少靶結構或信息且獲得的結構精度較低的情況下實現[161]。另一方面,SBVS已經在這樣的情況下實現,其中蛋白質或靶的三維結構信息已經通過體外或體内實驗或通過計算建模闡明[162,163]。通常,該方法用于預測活性配體或其相關靶點之間的相互作用,以及預測參與藥物-靶點結合的氨基酸殘基。與LBVS相比,SBVS具有較高的準确性和精密度。然而,SBVS與越來越多的緻病蛋白及其複雜構象有關[164]。要将ML用于VS,應該有一個由已知活性和非活性化合物組成的過濾訓練集。這些訓練數據用于使用監督學習技術訓練模型。然後對訓練後的模型進行驗證,如果模型足夠精确,則将該模型用于新的數據集,以篩選針對靶具有所需活性的化合物[165]。之後,入圍的化合物可以進行ADMET分析,然後進行各種生物測定,然後進入臨床試驗。因此,ML具有加速VS的能力,使其更加健壯,甚至可以減少VS中的誤報。對接是SBVS中應用的主要原則,其中開發了幾種基于AI和ML的評分算法,如NNScore、CScore、SVR Score和ID-Score[166]。類似地,已經構建了諸如RFs、SVM、CNN和淺層神經網絡等ML和DL方法來預測SBV中的蛋白質-配體親和力。此外,基于人工智能的算法已被開發用于SBV[167]中的分子動力學模拟分析。另一方面,LBVS由幾個步驟組成,每個步驟都提出了新的基于AIA和ML的算法,以加快過程并提高可靠性。例如,已經構建了一些基于ML和DL的算法來準備有用的誘餌集,例如高斯混合模型(GMM)、隔離林和人工神經網絡(ANN)。

此外,已爲LBV[168,172]構建了PARASHIFT、HEX、USR和ShaPE算法等ML模型。目前,随着人工智能算法在醫療和制藥行業的興起,針對LBV和SBV開發了不同的工具和模型。例如,已經爲SBV開發了MTiOpenScreen(http://bioserv.rpbs. univ-paris-diderot.fr/services/MTiOpenScreen/)[170]、FlexX‐Scan[171]、CompScore(http://bioquimio.udla.edu.ec/compscore/)[172]、PlayMolecule BindScope(PlayMolecule.org)[173]、GeauxDock(http://www.brylinski.org/ geauxdock)[174]、EasyVS(http://biosig.unimelb.edu.au/ easyvs)[175]、DEKOIS 2.0[176]、PL-PatchSurfer2(http://www.kiharalab.org/plps2/)[177]、SPOT-ligand 2(http:// sparks-lab.org/)[178]、Gypsum -DL(https://durrantlab.pitt. edu/gypsum-dl/)[179]和ENRI[180]等工具。此外,越來越多的證據驗證了AI在SBV中起關鍵作用的假設,如識别非肽半胱氨酸-半胱氨酸趨化因子受體5受體激動劑[181],篩選β2腎上腺素能受體的部分激動劑[182],識别含溴代多巴胺的蛋白4抑制劑[183],天然産物樣信号轉導子和轉錄激活因子3二聚化抑制劑[184]的發現,VHL和缺氧誘導因子1-α抑制劑[185]的預測,以及Kelch樣ECH相關蛋白核因子紅系2相關因子2(Keap-Nrf2)小分子抑制劑[186]的預測。同樣,Liu等人2017年發現了低毒的O-GlcNAc轉移酶抑制劑,而Dou等人[187]通過SBV[188]發現了新的糖原合成酶激酶3β(GSK-3β)抑制劑。通過SBVS對腫瘤和白血病進行了不同的研究,如發現了治療急性髓系白血病的新型GSK-3β[189],在非小細胞肺癌中鑒定了新型蛋白精氨酸甲基轉移酶5抑制劑[190],鑒定了治療腎癌的血管内皮生長因子受體2強效化合物[191],乳腺癌多靶點抑制劑[192]的鑒定及Mdm2-p53抑制劑的發現[193]。近年來,新型冠狀病毒在世界範圍内成爲一個巨大的問題,因此,SBVS也爲化學和生物科學家提供了一個很好的機會來識别針對緻病靶點的新型藥物化合物。例如,Gahlawat等人2020确定沙奎那韋、紫草次酸和11m_32045235是抗SARS-Cov-2主要蛋白酶的有希望的治療性化合物,而Selvaraj等人2020證明TCM 57025、TCM 3495、TCM 5376、TCM 20111和TCM 31007是與N7-MTase底物結合位點相互作用的治療性化合物[194,195]。同樣的趨勢,Cruz等人2018得出結論,ZINC91881108是針對RIPK2的有效化合物,而Simoben等人2018證明了八種新型N-(2,5-二氧吡咯烷-3-基)-羟肟酸二烷基酯衍生物作爲smHDAC8抑制劑,針對smHDAC8,IC50值範圍爲4.4至20.3 µM [196,197][圖4]。

圖4 (A)基于配體的虛拟篩選:在藥物設計和發現過程中,基于配體的虛拟篩選是最關鍵的步驟,包括如圖所示的不同步驟。初始步驟包括數據庫篩選和三維結構模型通過特定靶标的活性位點和複合物的X射線結構進行預測。随後,對具有選定特征的選定化合物進行藥效團建模,然後對化合物進行基于藥效團和對接的虛拟篩選。篩選出的化合物具有不同的毒性和理化性質,以供進一步分析。最後,對先導化合物進行體外和體内生物測定以進行驗證。(B)基于結構的虛拟篩選:它是應用于藥物發現過程中的另一種虛拟篩選,其中靶結構準備和化合物庫準備是初始步驟。然後,進行結構分析和結合位點預測,然後将化合物與選定的靶點進行分子對接。随後,進行了分子動力學模拟研究,以在生物信息學中驗證篩選出的化合物,然後通過生物測定進行實驗驗證

此外,針對LBV開發了不同的算法和工具,如SwissSimilarity(http://www.swiss similarity.ch/)[189]、METADOCK[199]、開源平台[200]、HybridSim VS(http://www.rcidm.org/Hybri dSim-VS/)[201]、PKRank[202]、PyGOLD(http://www. agkoch.de/)[203]、BRUSELAS(http://bio-hpc.eu/softw are/Bruselas)[204]、RADER(http://rcidm.org/rader/)[205]、QEX[206]、IVS2vec(https://github.com/haiping1010/ IVS2Vec)[207]、AutoDock Bias(http://autodockbias.wordp ress.com/)[208]、Ligity[209]、D3Similarity(https://www. d3pharma.com/D3Targets-2019-nCoV/D3Similarity/index. php)[210]和GCAC (http://ccbb.jnu.ac.in/gcac)[211]。新證據表明,人工智能算法在LBV中的潛在應用,如識别極光激酶A抑制劑[212]、G-四鏈體靶向化學型[213]、PI3Kα抑制劑[214]、靶向登革熱病毒非結構蛋白3螺旋酶[215]、潛在的選擇性組蛋白去乙酰化酶8抑制劑[216],以及新型對羟基苯丙酮酸雙加氧酶抑制劑[217]。除上述研究外,許多文獻證實了AI在LBV中的可能實施,例如識别HIV侵入抑制劑和有效的DNA甲基轉移酶抑制劑[218,219]。與SBV一樣,LBV在識别針對新型人類冠狀病毒的潛在治療化合物方面也起着關鍵作用。例如,Amin等人2020展示了一些内部分子作爲木瓜蛋白酶樣蛋白酶抑制劑的分子對接研究,而Hofmarcher等人2020至DNN從庫中鑒定了30000種化合物作爲CoV-2抑制劑[220,221]。同樣,Choudhary等人2020确定SARS-CoV-2細胞進入抑制劑,而Ferraz等人2020确定貝達喹啉、格列本脲和咪康唑爲抗冠狀病毒的潛在治療化合物[222,223]。Xiao等人2018針對六個抗癌靶點,針對化合物庫的VS開發了基于配體的大數據DNN模型。該研究整合了0.5 M的化合物,并通過十倍交叉驗證對所開發的模型進行了評估[224]。随着化合物庫規模的不斷擴大,尋找潛在的苗頭化合物變得越來越困難,這就像大海撈針一樣。因此,SBV和LBV在最小化潛在治療性化合物識别的複雜性方面發揮着巨大的作用。此外,SBV和LBV中基于AI的模型使其更簡單,具有高準确度和高精确度。表1讨論了在LBV和SBV中實現的基于AI和DL的不同web工具和算法。

表1 包括機器學習(ML)和深度學習原理在内的人工智能(AI)算法在基于結構和配體的虛拟篩選中的應用

7.6 QSAR模型與藥物再利用

在藥物的設計和發現中,研究藥物的化學結構、理化性質與生物活性之間的關系至關重要。因此,QSAR建模是一種計算方法,通過它可以建立化學結構和生物活性之間的定量數學模型。建立一個數學模型的主要優點是從分子數據庫中識别出各種各樣的化學結構,這些結構可以作爲針對疾病靶點的治療性化合物。一旦選定最有希望的化合物,就要進行實驗室合成和體外或體内試驗。QSAR模型大緻分爲回歸模型和分類模型兩類。高斯過程(Gaussian Process,GP)是一種建立QSAR回歸模型的方法,是一種穩健而有效的QSAR建模方法。GP方法可以處理大量的描述符,并識别出關鍵的描述符。近年來,已有兩種分類模型被證明是使用GP這一固有的GP分類方法,另一種是GP回歸技術與probit分析相結合的方法[235,236]。此外,該方法适用于非線性關系的建模,并且不需要主觀地确定模型參數[237]。近年來,神經網絡、DL、SVM等ML算法的發展和應用日益廣泛,爲QSAR建模提供了一條新的途徑。已經開發了幾種基于web的QSAR建模工具和算法,如VEGA平台(https://www.vega-qsar.eu/)[238]、QSAR-Co(https://github.com/meta-QSAR/simple-tree)[239]、FL-QSAR(https://github.com/bm2-lab/FL-QSAR)[240]、Meta-QSAR(https://github.com/meta-QSAR/simple-tree)(https://github.com/meta- QSAR/drug-target-descriptors)[241]、DPubChem(www.cbrc.kaust.edu.sa/ dpubchem) [242], Transformer-CNN(GitHub - bigchem/transformer-cnn: Transformer CNN for QSAR/QSPR modelling)[243]、Cloud 3D-QSAR (http://chemyang. ccnu.edu.cn/ccb/server/cloud3dQSAR/)[244]、Transformer-CNN(GitHub - bigchem/transformer-cnn: Transformer CNN for QSAR/QSPR modelling)[243]、Cloud 3D-QSAR(http://chemyang.ccnu.edu.cn/ccb/server/cloud3dQSAR/)[244]、MoDeSuS和ChemException(https:// github.com/Abdulk084/Chemception)[245]。Karpov等人2020開發了一種新的基于ANN的QSAR建模算法,稱爲transformer-CNN。該方法利用SMILES增強進行訓練和幹擾。類似地,Wang等人2020通過集成分子結構生成、排列和分子相互作用場的特征,開發了基于web的QSAR建模工具。Jin等通過Cloud 3D-QSAR發現了一種高效、選擇性的單胺氧化酶B(MAO-B)抑制劑。在本研究中,作者認爲(S)-1-(4-((3-氟苄基)氧基)苄基)氮雜環丁烷-2-甲酰胺(C3)比番紅花酰胺(safinamide)更有效和選擇性地抑制MOB。此外,體内分析顯示,化合物C3可抑制腦MAO-B活性并挽救1-甲基-4-苯基-1,2,3,6-四氫吡啶(MPTP)誘導的多巴胺能神經元丢失[246]。基于同樣的趨勢,Bennett等人2020通過化學感受,結合MD模拟和DL[81]預測了小分子轉移自由能。此外,QSAR協同工具還應用于不同的研究中,如I類磷脂酰肌醇3-激酶酶亞型抑制的多靶點化學計量學模型的開發,ERK抑制劑作爲抗癌藥物的篩選,K562細胞功能抑制劑的預測,以及酚類化合物抗真菌特性的預測[247-250]。同樣,Kim和Cho 2018開發了一種稱爲PyQSAR(https://github.com/crong-k/pyqsar_tutorial)的新算法,用于使用ML和Jupyter筆記本的快速QSAR建模平台。PyQSAR是一個獨立的python包,它将所有QSAR建模過程組合在一個工作台中[251]。A. S. Geoffrey等人2020使用PyQSAR進行了兩項不同的研究,例如識别新型冠狀病毒的有效候選藥物和開發槲皮素及其腫瘤壞死因子α抑制活性的QSAR[252,253]。此外,Zuvela等人開發了基于人工神經網絡的QSAR模型,用于預測黃酮類化合物的抗氧化活性。在這項研究中,作者整合了六種方法,如PaD、PaD2、權重、逐步、擾動和輪廓,用于解釋和闡明基于ANN的模型,該模型計算植物當量的抗氧化性能。結果表明,基于神經網絡的算法可以消除由于描述分子結構的量子力學參數解釋不當而産生的困難[254]。同時,Ding等人2020生成了一個基于web的工具,稱爲VISAR(GitHub - Svvord/visar),用于通過DNN QSAR方法剖析化學特征[255]。越來越多的證據表明,QSAR模型在藥物設計和發現過程中的應用,如與肝脂肪變性中AOP分子起始事件相關的ToxCast分析建模[256],針對二肽基肽酶8和二肽基肽酶9酶的二肽基肽酶4抑制劑的開發[257],QSAR模型在HIV-1蛋白酶抑制劑[258]結構域分析及靶向HIV/HCV合并感染[259]研究中的應用。ML模型的一個公認問題是SAR模型生成中生物測定數據缺失值的數據插補。基本上有三種主要類型的缺失值:(i)完全随機缺失(MCAR),當變量中缺失值的概率對于所有樣本都相同時,就會出現這種情況;(ii)随機缺失(MAR),這意味着變量中随機缺失值的概率僅取決于其他預測值中的可用信息;(iii)非随機缺失(MNAR),這意味着缺失值的概率不是随機的,并且取決于未記錄的信息和現有信息預測缺失值[260]。有幾種方法可以處理缺失值,如使用零、均值、中值或模式公共值進行插補,使用随機選擇的值進行插補,使用模型進行插補或使用深度學習庫(Datawig)進行插補。每個數據集都缺少需要明智地處理的值,以便構建健壯的模型[261]。此外,還應消除數據的複雜性,并對數據進行整理,以提高生成的模型的準确性和精确度。此外,最初的QSAR模型用于預測小分子(如分子量(mw)小于1500 m.w的分子)的毒性和代謝。然而,2000年代初應用的QSAR技術存在一些限制,如準确性和可靠性[262]。随着QSAR在藥物發現和設計過程(如VS、先導優化和靶點識别)中的日益廣泛應用,醫學科學家和生物學家不斷努力開發更可靠和可信賴的方法[263]。基于AI/ML算法的QSAR模型具有消除早期方法約束的潛力。基于AI/ML的QSAR模型,即基于全息圖的QSAR(HQSAR)、基于基團的QSAR(G-QSAR)和基于集成的QSAR模型,使藥物發現過程加速了數倍[264,265]。此外,除了經典的Hansch和Free-Wilson方法外,QSAR在過去幾年中随着新的細化方法、描述符計算的新方法、系統驗證測試的實施以及受體結構信息的參與而逐漸發展。類似地,除了經典的先導優化外,QSAR已應用于藥物發現和設計的不同新興領域,如肽QSAR、混合物毒性QSAR、納米粒子QSAR、離子液體QSAR、化妝品QSAR、植物化學QSAR和材料信息學[266][圖5]。

圖5 (A)定量結構-活性關系工作流:初始步驟包括數據集編譯,其中來自公共數據庫和文獻數據庫的數據被累積和編譯,進一步劃分爲不同的子集進行調查。然後,進行數據集處理,其中數據預處理和整理,然後計算分子描述符。在描述計算之後,執行數據集處理、數據歸一化以及将數據拆分爲不同的數據集。第三步進行模型構建,積累内部數據和外部數據等數據集,應用學習算法進行QSAR建模。最後,通過統計計算來衡量模型的魯棒性。定量結構-活性關系的最後一步是模型評估,通過與以前的基準模型進行比較、識别特征、性能評估和解釋基本特征來評估模型。(B)藥物再利用或重新定位工作流程:第一步是數據收集和數據預處理,然後是計算模型生成。生成的模型包括支持向量機、邏輯回歸、随機森林、深度學習和矩陣分解。然後,從文獻來源生成概念證明。随後,通過交叉驗證、案例分析和評估度量來評估重新定位模型。最後,通過臨床試驗、體外研究和體内研究對再利用藥物進行驗證

除了QSAR建模外,人工智能算法還應用于藥物再利用或藥物再定位方法中。在藥物設計和發現中,藥物重新定位是指對已開發的藥物進行研究,并将其重新定位到其他疾病狀态。由于多個靶點參與多種疾病的可能性,重新定位藥物可能是成功的[267-269]。另一方面,基因組學、蛋白質組學和體内外藥理學研究的大數據集的出現爲藥物的重新定位提供了一個很好的途徑。近年來,基于人工智能的藥物發現工具和算法的出現爲今後的研究提供了平台。ML算法以新的系統生物學方法取代了基于化學相似性和分子對接的傳統方法,可以評價藥物作用[270-273]。因此,最近開發了不同的基于AI的算法和基于web的工具,如DrugNet(http://genome2.ugr.es/ drugnet/)[274]、DRIMC(https://github.com/linwang1982/ DRIMC)[275]、DPDR-CPI(http://cpi.bio-x.cn/dpdr/)[276]、PHARMGKB(PharmGKB)[277]、Promiscular 2.0(http://bioinformatics.charite.de/promiscuous2)[278]和DRRS(http://bioinformatics.csu.edu. cn/resources/softs/DrugRepositioning/DRRS/index.html)[279]。此外,Yella和Jegga等人2020年利用稱爲MGATRx的多視圖圖注意方法構建了藥物重新定位模型[280],而Yan等人2019年基于稱爲BiRWDDA的多相似性融合方法構建了藥物重新定位的新算法[281]。此外,Fahimian等人于2020年構建了一種稱爲RepCOOL的新算法,用于識别有希望用于II期乳腺癌的再利用藥物。結果表明,阿黴素、紫杉醇、曲妥珠單抗和他莫昔芬是治療II期乳腺癌的潛在藥物[282]。同樣,Li等人2020構建了一個基于宿主的藥物再利用的計算框架,用于針對RNA病毒的廣譜抗病毒藥物。在這項研究中,作者調查了2352種已批準的藥物和1062種天然化合物對不同的病毒病原體,并得出結論,重新利用的藥物對寨卡病毒和冠狀病毒有效[283]。此外,Wu等人2020應用ML模型,即結構譜預測模型和生物譜預測模型,預測抗纖維化候選藥物。結果表明,訓練集的受試者工作特性曲線下面積分别爲0.879和0.972,而測試集的受試者工作特性曲線下面積分别爲0.814和0.874。結果表明,天然産物具有抗纖維化特性,可作爲潛在的抗纖維化藥物靶點。最近,COVID-19作爲一種全球流行病出現,全球各地的研究人員開始尋找有希望的治療藥物。在這方面,基于人工智能的藥物重新定位起着至關重要的作用。例如,基于網絡的藥物再利用确定了16種潛在的抗HCoV再利用藥物,而Hooshmand等人2020基于多模式DL方法确定了12種有希望的COVID-19藥物靶點[285,286]。近年來,神經網絡、DL模型和藥物定位管道的發展在很大程度上得到了提高。例如,基于藥物相似性網絡融合的SNF-CVAE識别出治療阿爾茨海默病(AD)和幼年類風濕性關節炎的有希望的治療藥物,而基于神經網絡算法和整合長-短期記憶的DTI-RCNN預測藥物-靶點相互作用[287,288]。PhenoPredict和SDTNBI是另外兩種基于ML的算法,分别用于識别精神分裂症疾病全表型藥物重新定位和預測藥物-靶相互作用[289,290]。Zang等人2019開發了一個基于DL的模型,稱爲deepDR(GitHub - ChengF-Lab/deepDR),用于預測生物信息學藥物的重新定位。在本研究中,作者整合了藥物-疾病、藥物-副作用、藥物-靶點等10種不同類型的生物網絡和7種藥物-藥物網絡。結果表明,deepDR預測利培酮和阿立哌唑等藥物可用于治療阿爾茨海默病(AD),而哌甲酯和培高利特可用于治療帕金森病(PD)[291]。同樣,Chen等人2020構建了一種基于人工智能的新算法iDrug(https://github.com/Case-esaC/iDrug),用于通過跨網絡嵌入整合藥物重新定位和藥物靶點預測。iDrug的效率和有效性允許用戶了解藥物-靶點-疾病機制的新臨床見解[292]。研究表明,通過基于人工智能的算法進行藥物再利用可以在癌症中實現。例如,Li等人2020使用DL整合轉錄組學數據和化學結構信息,并确定吡莫唑是治療非小細胞肺癌的有希望的候選藥物[293]。類似地,Kuenzi等人2020使用人類癌細胞的DL模型預測藥物反應和協同作用。結果表明,預測組合可提高無進展生存率,反應預測可将ER陽性乳腺癌患者的臨床結果分層[294]。另一個AI在藥物再利用中的應用來自Wang等人2020年進行的研究,該研究使用二部圖卷積網絡進行計算機藥物再利用。作者通過DL和異構信息融合構建了一個稱爲BiFusion(https://github.com/zcwang0702/BiFusion)的模型。結果表明,BiFusion在藥物再利用方面的性能優于多個基線[295]。上述例子總結了基于人工智能的算法在藥物再利用中的潛在作用。此外,随着技術的進步,化學科學家、生物科學家和計算科學家都在尋找提高人工智能模型準确性和精确度的方法。此外,QSAR和藥物重定位的藥物發現方法都是不完整的,沒有分子對接的參與,分子對接用于分析靶分子和配體分子之間的相互作用。最初,在21世紀初,分子對接作爲一種獨立的工具被開發出來,用于确定作爲靶分子和配體分子的兩個分子之間的相互作用。然而,随着人工智能技術的出現,分子對接的适用性發生了變化。現在,分子對接正被用于與MD模拟和基于AI的工具結合,用于藥物發現的不同領域,如VS、靶點識别、多重藥理學和藥物再利用[296]。MD模拟和人工智能算法的實現可以提高分子對接的效率和精度。此外,多年來,分子對接的局限性也得到了解決。例如,在藥物設計中,分子對接隻适用于晶體結構可用的生物靶點,因爲許多靶點的結構是不可用的。因此,一種類似同源建模的技術被開發出來以克服這一障礙[297]。此外,PDB中的晶體結構數據呈指數增長,增強了分子對接在藥物發現中的适用性。表2讨論了已在計算機QSAR和藥物重新定位中實現的工具和算法。

表2 包括機器學習(ML)和深度學習原理在内的人工智能(AI)算法在藥物設計和發現過程中的應用

7.7 理化性質及生物活性預測

每個化合物都與溶解度、分配系數、電離度、滲透系數等理化性質有關,這可能會影響化合物的藥動學性質和藥物-靶點結合效率。因此,在設計新的藥物分子時,必須考慮化合物的物理化學性質[100,298]。爲此,開發了不同的人工智能工具來預測化合物的物理化學性質。用于預測化合物的生物物理和生化性質的基于AI的工具包括分子指紋、SMILES格式、庫侖矩陣和勢能測量,它們用于DNN訓練階段[299,300]。最近,Zhang等人開發了一個QSAR模型來預測從美國環境保護署(EPA)提取的六種不同理化性質的環境因子。類似地,Lusci等人2013構建了基于神經網絡的模型來預測分子性質。在該研究中,分子是用無向循環圖來描述的,而以前的預測物理化學性質的方法是用有向無環圖來描述的[301]。随後,構建了6種基于人工智能的化合物人體腸道吸收預測算法。構造的方法有支持向量機、k近鄰、概率神經網絡、人工神經網絡、偏最小二乘法和線性判别模型。在上述模型中,SVM具有較高的準确率91.54%[302]。2016年,Zang等人開發了一個基于ML的模型,用于預測環境化學品的物理化學性質,如辛醇-水分配系數、水溶性、沸點、熔點、蒸汽壓和生物濃縮因子[303]。此外,還開發了不同的基于AI的工具,如ALOGPS 2.1(On-line Lipophilicity/Aqueous Solubility Calculation Software)[304]、ASNN(Associative Neural Network)[305]、E-BABEL(http://www.vcclab.org/lab/babel/)[304]、PCLIENT(http://www.vcclab.org/lab/pclient/)[304]、E-DRAGON(http://www.vcclab.org/lab/edragon/)[304]、ChemSpider(http://www.chemspider.com/)[306]、SPARC(http://sparc.chem.uga.edu/sparc/)[307]和OSIRIS property explorer(https:// www.organic-chemistry.org/prog/peo/)[308]。2020年開展了雙苯并咪唑類抗癌藥物的設計、合成及ADMET預測研究。在同一研究中,作者通過Lipinski的五定律計算了化合物的分子性質,并預測了合成化合物的預ADMET性質[309]。此外,Puratchikody等人2016年在其研究中使用ORISIS property explorer來預測用于安全、有效炎症治療的酪氨酸衍生物的定量結構毒性。結果表明,在55個有效分子中,隻有19個被認爲是有效的環氧化酶-2抑制劑。在相似的實驗條件下,建立了基于RF和DNN的人體腸道吸收模型。因此,從實例可以看出,基于人工智能的方法通過預測藥物的理化性質在藥物發現和開發中具有重要作用。

此外,藥物分子的治療活性取決于其與受體或靶點的結合效率,因此不能表現出與藥物靶點結合親和力的化學分子将不被視爲治療劑。因此,預測化學分子與治療靶點的結合親和力對于藥物的發現和開發至關重要[311]。人工智能算法的最新進展增強了結合親和力預測的過程,它利用藥物及其相關靶點的相似性特征。已經開發了一些基于web的工具,如ChemMapper和相似集成方法(SEA)。此外,已經構建了基于ML和DL的藥物-靶點親和力識别模型,例如KronRLS、SimBoost、DeepDTA和PADME[312]。KronRLS通過預測藥物與其靶點之間的相似度來計算基于ML算法的藥物-靶點結合親和力。KronRLS在預測藥物-靶點結合親和力時同時考慮了基于特征和基于相似性的相互作用[313]。DeepDTA(https://github.com/hkmztrk/DeepDTA)[314]和PADME[315]等DL方法預測藥物-靶點結合親和力,這取決于蛋白質的三維結構。Beck等人2020年進行了一項研究,通過DeepDTA[316]預測商業上可獲得的抗病毒藥物作爲一種潛在的治療劑,用于對抗新型冠狀病毒(SARS-CoV-2)。類似地,Lee和Kim 2019基于使用PADME的大規模藥物誘導轉錄組數據,預測了DNN的藥物-靶相互作用[317]。構建了一個同時使用RNN和CNN預測藥物-靶點結合親和力的DL模型,稱爲DeepAffinity  (GitHub - Shen-Lab/DeepAffinity: Protein-compound affinity prediction through unified RNN-CNN)[318]。Jiang等人2019年利用DeepAffinity提出了一種新的蛋白質描述符,用于識别藥物-靶點相互作用,而Born等人2020年利用Deep Affinity确定了SARS-CoV-2的候選抗病毒藥物[319,320]。以上數據驗證了ML和DL算法在藥物設計中對藥物分子的理化性質和生物活性的重要性。然而,從研究的角度來看,這些算法的有效性和準确性仍然是一個顯著的缺點。因此,需要進行廣泛的研究,通過精确和廣泛的數據輸入來最大限度地提高基于人工智能的算法的準确性和精度。在表2中,我們總結了基于人工智能算法的理化和生物活性預測工具和數據庫,包括DL、神經網絡、SVM等。

7.8 化合物的作用方式和毒性預測

藥物毒性是指由于化合物的作用或代謝方式,化學分子對生物體或生物體任何部分的不利影響。人工智能的擴展範圍有可能預測藥物分子的非靶向和靶向效應,以及化合物合成前的體内安全性分析,已吸引了與藥物開發過程相關的科學家。人工智能的參與減少了藥物開發時間、成本、損耗率和人力資源。爲此,開發了不同的基于web的工具,如LimTox(http://limtox.bioinfo.cnio.es/)[321]、pkCSM(pkCSM)[322]、admetSAR(http://lmmd.ecust.edu.cn/admetsar2/)[323]和Toxtree(Toxtree – Toxtree - Toxic Hazard Estimation by decision tree approach)[324]。Srivastava等人2020使用admetSAR評估Withania somnifera作爲抗COVID-19治療化合物的毒性,而Uygun等人2021結合pkCSM來鑒定吡唑并[1,5-a]吡嗪-4(5H)-酮衍生物對肺腺癌細胞系的治療作用和毒理學特性[325,326]。基于AI的方法的進步導緻了不同毒性預測軟件和基于web的工具的開發,如Tox21(Tox21)[327]、SEA(SEA Search Server)[328]、eToxPred(https://www.brylinski.org/etoxpred-0)[329]和TargeTox(https://github.com/ artem-lysenko/TargeTox)[330]。Tox21評估了12707種環境化合物和藥物的毒性,而SEA預測了656種上市藥物對73個非預期目标的毒性。TargeTox基于靶點-藥物生物網絡預測毒性風險。2016年,Huang等人通過建模Tox21預測了1萬多種化合物的體内毒性曲線和機制表征,而同年,Zhou等人利用改進的分子SEA預測了癌症相關蛋白質[331,332]。此外,Gupta和Rana 2019年采用eToExpred預測雄激素受體小分子的毒性。作者在10273種藥物中納入了1444種小分子特征,其中461種爲活性藥物,9812種爲非活性藥物[333]。

DeepTox(http://bioinf.jku.at/research/DeepTox/tox21.html)[334]和PrOCTOR(https://github.com/kgayvert/PrOCTOR)[335]分别用于預測新化合物的毒性和預測臨床試驗中的毒性概率。例如,Robledo Cadena等人2020使用PrOCTOR預測了非甾體抗炎藥對順鉑、紫杉醇和阿黴素對宮頸癌細胞的療效的影響,而Gilvarie等人2020确定了2576個小分子的新适應症,這些小分子與PD和2型糖尿病的16種不同藥物特征相結合[336,337]。同樣,Simm等人2018使用DeepTox分析并重新利用高通量成像分析數據,以預測針對替代生物途徑和過程的不同化合物的生物活性[338]。此外,DeepTox還用于開發多個ML和DL算法,用于預測藥物化合物的毒性特性和化學特性,如SMILES2Vec(預測化學特性)[339]、Chemiception(基于DNN的化學特性預測)[245]、DeepSynergy(使用DL預測抗癌藥物協同作用)[340],和deepAOT(複方急性經口毒性預測)[341]。然而,可以通過使用大型和精細化的數據集來提高DeepTox和PrOCTOR的準确性和精确度,這可以通過制藥行業的參與來實現。最近,其他基于ML的工具,如SPIDER[341]和閱讀-跨結構-活性關系(read-Cross structure–activity relationships,RASAR)[342]也被開發出來,它們能夠分别分析β-拉帕酮靶點和連接未知化合物的分子結構和毒性特性。

Zhang等人[344]基于五種ML算法結合MACCS或FP4指紋圖譜建立了不同的藥物肝毒性預測模型。結果表明,最佳模型對外部驗證數據集[344]的準确率爲75%。基于相關向量機(RVM)、正則化RF、C5.0樹、極值梯度提升(XGBoost)、AdaBoost、SVM 提升(SVMBoost)、RVM 提升(RVMBoost)等ML方法構建了毒性評價算法。構建的模型用于評估大鼠口服急性毒性、呼吸毒性和尿路毒性[345-348]。近年來,深度學習算法的應用爲化合物的分子表征帶來了新的方法,使得DL方法适合于預測化合物的毒性。此外,DL算法用于毒性預測的潛力取決于數據集的質量和數量。總之,要使基于人工智能的毒性預測算法更可靠,還需要進一步的研究。然而,目前基于ML的預測因子仍然不适合替代生物系統,但它們足以将藥物化學原理擴展到正确的方向,從而減少合成周期。此外,表2中讨論了基于AI的毒性預測算法和工具的詳細描述。

7.9 分子通路識别與多重藥理學

AI和ML算法在藥物發現和開發中的重要成果之一是預測和估計疾病網絡或藥物-藥物相互作用或藥物-靶點關系的整體拓撲和動力學[349]。這種方法爲識别特定疾病的新分子治療靶點提供了廣闊的途徑。文本挖掘驅動的數據庫DisGeNET、STITCH、STRING分别被廣泛用于确定基因-疾病關聯、藥物-靶點關聯和分子通路。例如,Gu等人2020使用相似性集成方法識别197種最常用中藥的靶點。後來,DisGeNET數據庫被用來将這些藥物靶點與不同的疾病聯系起來,從而将草藥與可用于治療的疾病聯系起來[350]。此外,Chen等人2019年使用STITCH數據庫尋找食管癌候選藥物的靶點[351]。同樣,Taha等人2020年使用STITCH數據庫尋找家養南天竹(Nandina domestica)活性成分的靶點,家養南天竹是一種用于治療各種腫瘤的植物。後來使用STRING數據庫,借助cytoscape工具[352]構建複合靶通路。

在藥物化學中,多重藥理學是指在與疾病相關的藥物-靶點生物網絡中設計一個能夠與多個靶點相互作用的單一藥物分子。它最适合設計一種有前途的治療劑,用于治療更複雜的疾病,如癌症、神經退行性疾病(NDD)、糖尿病、心力衰竭和其他許多疾病[353-355]。基于ML的方法具有強大的挖掘能力和數據分析能力,有可能通過關聯分子網絡分析犯罪。此外,ML模型通過生成具有所需多重藥理學特征的化合物來協助多靶配體的合理設計,因爲ML模型生成具有不同化學和拓撲特征的大量化學結構。因此,發現多靶配體的概率增加。此外,ML模型有助于識别存在不同結合口袋的多靶配體。人工智能在藥物發現和開發方面的最新進展導緻了用于多重藥理學預測的基于web的工具和獨立軟件包的産生,如多重藥理學浏覽器(PPB)(Reymond Research Group)[356]、TarPred(http://www.dddc.ac.cn/ tarpred/)[140]、基于自組織映射的藥物等效關系預測(SPiDER)(http://modlabcadd.ethz.ch/software/spider )[357]、Targethunter(https://www.cbligand.org/TargetHunter3D/)[358]、PharmMapper(http://lilab-ecust.cn/pharmmapper/)[359]、ChemMapper(http://lilab.ecust.edu.cn/chemmapper/)[360],和Swiss Target Prediction(SwissTargetPrediction)(http://www.swisstargetprediction.ch/ )[361]。Poirier等人2018使用PPB進行了一項實驗,以确定溶血磷脂酸酰基轉移酶β作爲納摩爾血管生成的治療靶點,而Ozhathil等人2018使用PPB[362,363]确定了陽離子通道瞬時受體電位陽離子通道亞家族M成員4的強效和選擇性小分子抑制劑。此外,Vleet Van等人2018實施了TarPred工具,用于篩選改進的非目标責任預測策略和方法,而同年,Ratnawati等人使用反向傳播算法預測SMILES代碼中的活性化合物[364,365]。在上述基于web的工具中,PharmMapper和ChemMapper經常用于當前的研究。如黃芪、黃連對糖尿病[366]的協同作用機制研究、當歸補血湯[367]的補血機制研究、白花蛇舌草多機制預測等。對于結直腸癌[368],使用PharmMapper。類似地,在癌症中鑒定人銅轉運阻斷劑[369],通過化學蛋白質相互作用在AD中鑒定多靶點配體[370],預測苦參注射液抗肝癌的抗癌機制[371],以及發現基于蝶呤-7(8H)酮的抗表皮生長因子受體激酶T790M/L858R突變體的治療化合物[372],使用ChemMapper進行。人工智能算法用于多藥預測的一個主要限制是數據不足或數據集的可靠性。因此,應進行量子化學計算,提供微調的數據集,從而提高預測模型的準确性。

此外,藥物開發中的人工智能爲通過基因組學信息、生化特征和靶點說明确定治療人類疾病的分子通路或分子靶點打開了大門[373]。“OpenTargets”( Home - Open Targets)[374],一個基于ML的免費工具,用于優先考慮潛在的治療藥物靶點,準确率超過71%。最近,Nabirotchkin等人鑒定了常用抗COVID-19藥物的未折疊蛋白反應和自噬相關途徑,而Lopez-Cortes等人鑒定了結直腸癌中的等位基因頻率[375,376]。此外,Isac-Lopez等人[377]進行的GWAS研究預測了多個風險位點,并強調了纖維化和血管病變途徑。結果表明,27個獨立的全基因組相關信号和13個新的危險位點與系統性硬化相關。Martin等人研究染色質相互作用以預測風濕性疾病中的新基因靶點。在同一研究中,作者得出結論,454個高置信度基因與風濕性疾病相關,其中48個是藥物靶點,11個是現有靶點。最後,他們證明367種藥物适合重新定位[378]。

8. 人工智能在新藥設計中的應用

設計受體三維結構以産生新分子的叠代過程稱爲從頭藥物設計,旨在産生新的動力學。然而,從頭藥物設計并沒有在藥物披露中看到無限的應用。此外,由于人工智能領域的進步,該領域最近出現了一些複蘇[421,422]。VS已成爲藥物改進措施中的一個巨大工具,因爲它在大量混合物中進行了有利可圖的計算機檢查,進一步擴大了潛在藥物線索的産量。作爲AI的一個子集,ML是一種協調藥物先導物的VS的技術,通常包括收集一組過濾過的化合物,其中包含已知的活性和非活性化合物,以訓練模型[423,424]。在建立模型之後,将對其進行測試,如果足夠準确,将其用于之前未知的數據庫,以識别新藥物。在本節中,我們将讨論人工智能如何被證明是使用從頭技術進行藥物設計的福音。

在一項研究中,研究人員利用惰性空間描述來準備一個依賴于藥物相似性定量估計(QED)藥物相似性評分和制造可用性評分合成可及性評分(SAS)的模型[425]。在另一個分布中,這種變分自動編碼器的呈現與對抗自動編碼器的呈現形成對比[426]。該不良布置的自動編碼器包括傳遞新穎複合結構的生成模型。第二個判别拮抗模型用于區分真實粒子和生成粒子,而生成模型則試圖欺騙判别模型[427]。從本質上講,對抗式自動編碼器比變分式自動編碼器在生成模式下産生了更多的實體結構。在與電子模型的混合中,可以得到預期針對多巴胺受體類型2動态的新結構。研究利用生成不良處置組織(GAN)提出具有假定抗癌特性的混合物[428]。

RNN同樣被有效地用于從頭藥物設計。由于SMILES字符串在一組字母中編碼物質結構,RNN被用來生成複合結構。據觀察,RNNs有潛力利用SMILES串進行藥物設計[429]。類似的方法同樣有效地用于開發新的肽結構[430]。神經網絡學習被有效地應用于将所創建的混合料傾向于所需的特性[431]。同樣,轉移學習也被用作另一個系統,以創造具有理想自然行爲的新型合成結構。在接下來的步驟中,組織準備使用大量的準備集[432,433]熟悉SMILES語法。在随後的步驟中,用具有理想運動的混合物進行制備。此外,額外的訓練時間足以達到新的組合階段,進入由動态原子組成的複合空間。根據這樣一種方法,五個原子被結合起來,四個粒子對抗原子、化學受體的計劃行動可以得到确認[434]。一些獨特的設計已經被提出,創造了合法的,重要的新結構。新的合成已經研究了這些策略,與性質傳播所創建的分子或原子類似的廣泛使用的訓練集。該策略的主要應用是充分的,5個原子中有4個表示理想作用[435]。人工智能和多目标優化是連接化學和生物兩個階段的有效途徑。開發了用于基于SMILES的自動化從頭設計的基于RNN的新型多目标對,以找到物理化學性質與其受約束的生物目标之間的最佳匹配。結果表明,人工智能和多目标優化可以捕捉化學和生物方面的潛在聯系,從而爲可定制的設計策略提供易于使用的選項,這對潛在客戶開發和潛在客戶優化都特别有效[436]。

ML模型如SVM、RF、DNN等已被用于藥物發現,用于分析從對接到VS[437]的藥物應用。最近,藥物再利用已成爲一種創新的方法,以盡量縮短藥物開發時間,通常涉及數據挖掘和人工智能[438]。一個小組提出了一個問答人工系統(QAAI),該系統能夠利用Google語義AI通用編碼器來計算嵌入紅腦JSON數據庫中的句子。這項研究驗證了脂氧合酶抑制劑藥物齊留通作爲NRF2通路調節劑在體外的預測,在減少巨噬細胞M1表型和活性氧産生方面具有潛在的應用前景。這種新方法已被證明對NDD的重新定位有效[439]。随着系統藥理學和多靶點藥理學的快速發展,開發合理設計多靶點藥物的方法迫在眉睫。第一個全新的多靶點藥物配置程序LigBuilder V3(http://www.pkumdl.cn/ligbuilder3/)被設計用于設計不同受體的配體、一個受體的多個偶聯位點或一個受體的不同配置。LigBuilder V3再次用于多靶點藥物計劃和增強,特别是用于具有不同配體結合位點的蛋白質的緊湊配體[440]。從頭藥物設計積極尋求使用一套化學規則,快速有效地識别具有所需生物學特性的結構新的化學型。此外,基于片段的從頭設計工具已成功應用于非共價抑制劑的發現。在此,設計了一種稱爲Cov_FB3D的新方案,該方案涉及通過識别靶蛋白[441]的共價結合位點中的活性片段來進行潛在新型共價抑制劑的電子組裝。

9. 人工智能在藥物生産和臨床試驗設計中的作用

在制藥工業中,計算方法的使用是相當成熟的。然而,人工智能的引入爲開發能夠改進和優化藥物發現的新方法提供了更大的範圍[442]。這不僅鼓勵了科學界,也導緻了制藥行業和人工智能公司之間日益增長的夥伴關系[443]。一項研究表明,2013年21143種藥物的總體成功率接近5.2%,而2005年則低于11.2%。因此,人工智能的使用主要與減少損耗和成本的需要有關[444]。一種新藥上市通常需要12年時間,成本高達30億美元[445]。此外,在現有1060個類藥物分子的情況下,尋找新藥是一項艱巨的任務[446]。目前藥物研發面臨的挑戰涉及藥物的毒性、副作用、選擇合适的靶點、合适的劑量甚至知識産權等[447]。制藥行業在藥物獲得批準之前,通常不共享藥物的藥代動力學和藥效學測量。除此之外,用于訓練AI模型的藥物發現數據非常少[448]。需要一個能夠規範和管理臨床前和臨床藥理學數據的團體來加速人工智能在這一領域的進展。人工智能的最新進展在許多方面影響了臨床藥理學,如文獻檢索和處理、與在線預測ML模型的交互作用、在許多國家制定政策鼓勵醫療保健的ML方法以及獲得藥物相關信息的預測分析[449,450]。

當候選藥物成功通過所有臨床前試驗後,将其應用于臨床試驗患者,包括三個階段:第1階段,少數人進行藥物安全性試驗;第2階段,對少數受特定疾病影響的受試者進行藥物療效試驗;第3階段,對大量患者進行療效研究,并在通過臨床試驗後,FDA對其進行審查,以供批準和商業化[451,452]。此外,臨床試驗的失敗率增加了藥物開發過程的低效性,每次失敗的試驗都會破壞投資并影響臨床前試驗的成本。高失敗率背後的兩個主要原因是患者選擇不當和試驗期間監測效率低下。此外,人工智能技術的引入,大大提高了臨床試驗的成功率[453]。IBM Watson開發了一個臨床試驗匹配系統,該系統使用患者的病曆和大量過去的臨床試驗數據來創建詳細的臨床發現概要。它還可用于檢查登記的患者[454]。AI模型還可以通過分析毒性、副作用和其他相關參數來提高成功率,從而降低臨床試驗的成本[455]。其中一個這樣的例子預測了I期和II期臨床試驗的結果,它基于DL并計算了可能的副作用概率和通路激活評分,進一步用于訓練模型[456]。同樣,另一個名爲“視覺生理人”的項目也被用于支持電子(in silico)試驗[457]。此外,人工智能技術的發展将有助于更好地管理臨床試驗數據,最終開發個性化藥物。

10. 人工智能在藥物開發中的應用——以神經退行性疾病爲例

NDD是緻命的、多方面的、使人衰弱的中樞神經系統疾病,是全世界範圍死亡的主要原因。AD、PD、肌萎縮側索硬化症(ALS)和亨廷頓病(HD)是最常見的NDD,最終可導緻中樞神經系統不同區域的神經元死亡[458]。毒性、錯誤折疊的細胞質蛋白在不同腦區的聚集是這些疾病發生的主要原因之一[459]。此外,這些障礙可表現出不同的症狀,如認知能力下降、動作遲緩、震顫、記憶力喪失、抑郁、說話問題、肌肉僵硬等[460,461]。NDD帶來的主要挑戰是在藥物發現領域,迄今爲止,尚未發現能夠阻止和逆轉這種疾病進展的藥物。因此,迫切需要新的藥物靶點和藥物化合物,它們可以緩解中樞神經系統的症狀和疾病狀況[462]。目前,ML被廣泛用于尋找與NDD相關的新靶點和生物标志物。例如,Martínez-Ballesteros等人2016将DT、定量關聯規則和層次聚類結合起來,通過患者和對照樣本的基因表達譜确定AD的潛在風險基因。此外,文獻[463]結合蛋白質-蛋白質相互作用網絡、自動編碼器和支持向量機預測與PD相關的新靶基因,同樣地,文獻[464]使用諸如RF、DT、廣義線性模型和規則歸納等ML模型通過基因表達譜來發現HD的風險基因。此外,文獻[465]使用CNN對廣泛的GWAS數據集進行訓練,以發現新的風險單核苷酸多态性和與ALS相關的基因。

此外,ML技術也被用于尋找NDD相關靶蛋白的合适抑制劑。例如,文獻[466]應用VS、ML和分子對接的組合來發現1類和IIb類組蛋白去乙酰化酶抑制劑,因爲HDAC酶已被報道促進AD神經毒性。在這裏,ML用于抑制劑和非抑制劑後-VS的分類。此外,文獻[467]使用來自caspase-8蛋白-配體複合物的MD模拟軌迹的描述符來訓練ANN和RF模型,以找到caspase 8蛋白酶的抑制劑,這是一種與AD發病機制有關的蛋白酶。在另一項研究中,文獻[468]使用來自中醫藥數據庫的數據,然後使用VS、分子對接和ML技術(包括DL)來尋找GSK3β的抑制劑,GSK3β是一種與AD相關的酶。此外,使用MD模拟來評估GSK3β-配體相互作用的穩定性。此外,Ponzoni等人2019建立了一個QSAR模型,用于尋找BACE1酶的抑制劑,BACE1酶負責AD中β-澱粉樣蛋白(aβ)聚集。在這裏,QSAR模型是使用一組最佳的分子描述符構建的,這些分子描述符使用ML算法、雜交技術、反向消除策略和視覺分析的融合進行分類[469]。類似地,文獻[470]使用一系列樸素貝葉斯網絡尋找有效且安全的阿貝爾森(abelson)酪氨酸蛋白激酶1(c-Abl)抑制劑,促進PD的神經保護。同樣,Shao等人2018使用SVM算法和基于Tanimoto相似性的聚類集成,然後進行體外實驗,以找到A2A腺苷受體和多巴胺D2受體的新拮抗劑,正如已經觀察到的,阻斷這兩個受體會導緻PD的神經保護作用[471]。此外,文獻[472]實施了分子對接、AI-QSAR和MD模拟,以發現NLR家族pyrin結構域包含3(NLRP3)的抑制劑,這是一種參與PD發病機制的炎性體。在這裏,VS和對接用于從中藥數據庫中篩選化合物,而AI和QSAR模型用于确定化合物的生物活性,然後通過MD模拟評估其結合穩定性[472]。類似地,文獻[473]使用分子對接、AI和MD模拟來發現半乳糖凝集素-3抑制劑,半乳糖凝集素-3是HD中與神經炎症相關的蛋白質。在這裏,分子對接用于初步篩選,然後通過ML評估化合物的生物活性,并通過MD模拟評估其結合穩定性。此外,不同的研究使用ML算法在NDD中重新調整藥物用途。類似地,X. Zeng等人2019開發了一種基于DL的藥物再利用工具,稱爲deepDR(GitHub - ChengF-Lab/deepDR),用于尋找新的AD和PD再利用藥物[291]。此外,文獻[474]通過使用遺傳網絡驅動的分類模型,提出替米沙坦作爲潛在的AD再利用藥物。此外,文獻[475]通過整合知識表示學習和ML算法掃描科學文獻,提出了PD的藥物再利用策略。

11. 未來的挑戰和可能的解決辦法

目前,制藥行業在開發新藥時面臨的主要挑戰是成本增加和效率降低。然而,ML方法和DL的最新發展帶來了在藥物發現和開發過程中降低成本、提高效率和節省時間的巨大機會。人工智能算法的發展,特别是DL方法的發展,以及體系結構硬件的改進和大數據的易訪問性,都預示着人工智能的第三次浪潮。藥物開發中的人工智能方法引起了研究者的極大興趣,許多制藥公司與人工智能公司進行了合作。此外,該領域的初創企業數量也在不斷增加,到2020年6月達到230家[476]。此外,DL方法通過非線性模型在多個層次上集成數據,這是AI和ML方法的缺點。然而,在多個層次上集成數據使得DL算法具有優勢,因爲它提供了非常高的準确性和精确度。此外,與AI和ML算法相比,DL提供了更靈活的體系結構,可以爲特定問題創建神經網絡[477-480]。像自然語言處理、圖像和語音識别這樣的人工智能應用現在很容易實現,在性能方面已經超過了人類[481]。因此,人工智能可以很好地應用于藥物發現過程也就不足爲奇了。如今,人工智能被用于藥物發現,用于靶點識别、苗頭發現、先導優化、ADMET預測和構建臨床試驗。盡管取得了巨大成功,但仍然存在許多挑戰,如高質量數據采集,其中有兩個重要問題。首先,由于藥物在生物系統中的作用是複雜的,标記不能是二元的;第二,藥物發現中可用的數據量與可用的大量信息相比是微乎其微的。因此,需要一個不僅提供數量而且提供高質量數據的團體。在制藥行業,開放式數據共享并不常見,Pistoia聯盟已主動發起一項運動,鼓勵許多公司與其他公司共享數據。他們還打算建立一種統一的數據格式,這在技術上具有挑戰性[161]。解決這個問題的一個可能的方法是開發一種能夠處理稀疏數據的算法;斯坦福大學已經開發了一種叫做“一次性學習”的方法,該方法基于異構數據預測藥物的性質[482]。此外,實驗數據的準确性和不确定性可用于建模,即不必建立新的ML技術,可以通過調整大量的超參數來訓練現有的超參數,并對其進行優化以獲得良好的結果,盡管一些研究表明,可以使用一些合理的參數來啓動優化[435]。分子表征也是一個挑戰,因爲它是模型建立的控制因素之一。最近開發的模型很少從原始數據中學習與任務相關的特征,并将分子表示細化到一個标準。早些時候,藥物的重新用途過去隻依賴于臨床觀察。然而,目前包含科學文獻、專利和臨床試驗結果的大量數據可共同用于改進篩選過程。此外,基于DL的VS可以充分利用數據,并減少由于正負數據不平衡而獲得的假陽性率。爲了開發具有良好ADMET性質和靶向活性的高效藥物,先導的優化也是一個挑戰;但是,這些參數是獨立的,有時相互不兼容。通過分别優化各參數,進一步改進模型,可以解決這一問題。制藥公司在招募足夠數量的患者進行臨床試驗方面面臨困難。人工智能方法将有助于确定和招募目标患者,并有助于管理收集的數據。對于神經退行性疾病的藥物發現,主要的問題是其未知的病理生理,這使得藥物鑒定更具挑戰性。ML模型的“黑箱”性質是一個額外的挑戰,即使專家也無法解釋模型是如何得出結果的,也無法理解其背後的生物學機制。此外,不斷增加的ML模型數量以及它們聲稱是最新的,這使得非專業人員束手無策,因爲他們無法決定選擇哪個模型來解決他們的問題。因此,如果用戶和開發人員對标準的客觀評估達成一緻,然後檢查模型的性能,這将是更好的。此外,值得注意的是,大多數國家都沒有爲那些完全由人工智能技術創造的發明授予專利。此外,使用人工智能技術進行藥物發現的公司必須通過強有力的程序爲其作品版權,以确保專利權。安全性也是一個主要問題,因爲人工智能驅動的個性化醫療需要個人的遺傳代碼,而個人信息是必需的。最後,處理大數據需要更快的計算速度,據說未來,量子計算機或其他技術将取代目前的超級計算機,這些技術隻需幾分鍾,而不是幾小時。雖然人工智能爲不同的疾病提供了許多新的靶點和新的化合物,但是通過人工智能産生的化合物進入市場供公衆使用的成功案例還沒有出現。近年來,基于人工智能的工具首次提出了一種新的靶點及其抑制劑。Insilico medicine,一家生物技術公司,提出了一種新的靶點參與特發性肺纖維化,并通過他們基于AI的工具從頭開始制備其新型抑制劑。所鑒定的小分子抑制劑在人細胞和動物模型中顯示出良好的效果。2020年12月,Insilico公司提名其小分子抑制劑用于研究新藥(IND),并計劃在2022年初進行臨床試驗。如果試驗成功,那麽将是有史以來第一次通過基于AI的工具提出新的靶點及其抑制劑并獲得批準。盡管在藥物發現周期中引入人工智能工具存在着一些不可避免的障礙,需要做大量的工作,但毫無疑問,在不久的将來,人工智能将給藥物發現和開發過程帶來革命性的變化。

緻謝

我們要感謝德裏科技大學的高層管理人員一直以來的支持和指導。

作者的貢獻

所有作者已閱讀論文并同意提交。PK構思了這個想法。RG、DS、MS、ST準備數據。RG、DS、MS和ST對這項工作的貢獻相同。RKA和PK給出了他們的批評性意見并構建了本文。圖片藝術作品由RG、RAK和PK完成。論文由PK撰寫。

聲明

利益沖突:作者聲明不存在利益沖突。

參考文獻

  1. Lipinski CF, Maltarollo VG, Oliveira PR et al (2019) Advances and perspectives in applying deep learning for drug design and discovery. Front Robot AI. https://doi.org/10.3389/frobt.2019. 00108
  2. Hamet P, Tremblay J (2017) Artificial intelligence in medicine.Metabolism. https://doi.org/10.1016/j.metabol.2017.01.011
  3. Hassanzadeh P, Atyabi F, Dinarvand R (2019) The significance of artificial intelligence in drug delivery system design. Adv Drug Deliv Rev. https://doi.org/10.1016/j.addr.2019.05.001
  4. Duch W, Swaminathan K, Meller J (2007) Artificial intelligence approaches for rational drug design and discovery. Curr Pharm Des. https://doi.org/10.2174/138161207780765954
  5. Zhang L, Tan J, Han D, Zhu H (2017) From machine learning to deep learning: progress in machine intelligence for rational drug discovery. Drug Discov Today. https://doi.org/10.1016/j. drudis.2017.08.010
  6. Jordan AM (2018) Artificial intelligence in drug design–the storm before the calm? ACS Med Chem Lett. https://doi.org/10.1021/acsmedchemlett.8b00500
  7. Goel AK, Davies J (2019) Artificial intelligence. In: The Cambridge Handbook of Intelligence. Cambridge
  8. Harrer S, Shah P, Antony B, Hu J (2019) Artificial Intelligence for Clinical Trial Design. Sci, Trends Pharmacol. https://doi.org/10.1016/j.tips.2019.05.005
  9. Zhong F, Xing J, Li X et al (2018) Artificial intelligence in drug design. Sci China Life Sci. https://doi.org/10.1007/s11427-018-9342-2
  10. Brown N, Ertl P, Lewis R et al (2020) Artificial intelligence in chemistry and drug design. J Comput Aided Mol Des. https://doi.org/10.1007/s10822-020-00317-x
  11. Badillo S, Banfai B, Birzele F et al (2020) An introduction to machine learning. Clin Pharmacol Ther. https://doi.org/10.1002/cpt.1796
  12. Dutta Majumdar D (1985) Trends in pattern recognition and machine learning. Def Sci J. https://doi.org/10.14429/dsj.35.6027
  13. Kubat M (2017) An Introduction to Machine Learning
  14. Aggarwal M, Murty MN (2021) Deep Learning. In: SpringerBriefs in Applied Sciences and Technology. https://doi.org/10.1007/978-981-33-4022-0_3
  15. Schmidhuber J (2015) Deep learning in neural networks: an overview. Neural Netw. https://doi.org/10.1016/j.neunet.2014.09.003
  16. Hu YH, Hwang JN (2001) Introduction to neural networks for signal processing. In: Handbook of Neural Network Signal Processing. CRC Press, pp 12–41
  17. Angermueller C, Pärnamaa T, Parts L, Stegle O (2016) Deep learning for computational biology. Mol Syst Biol. https://doi.org/10.15252/msb.20156651
  18. McCulloch WS, Pitts W (1943) A logical calculus of the ideas immanent in nervous activity. Bull Math Biophys 5:115–133. https://doi.org/10.1007/BF02478259
  19. Turing AM (2009) Computing machinery and intelligence. Parsing the Turing Test: Philosophical and Methodological Issues in the Quest for the Thinking Computer. Springer, Netherlands, pp 23–65
  20. Samuel AL (1959) Some studies in machine learning using the game of checkers. IBM J Res Dev 3:210–229. https://doi.org/10.1147/rd.33.0210
  21. Rosenblatt F (1957) The Perceptron: A Perceiving and Recognizing Automaton, Report 85–60–1
  22. KELLEY HJ, (1960) Gradient theory of optimal flight paths. ARS J 30:947–954. https://doi.org/10.2514/8.5282
  23. Dreyfus S (1962) The numerical solution of variational problems. J Math Anal Appl 5:30–45. https://doi.org/10.1016/0022-247X(62)90004-5
  24. Fukushima K (1980) Neocognitron: a self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position. Biol Cybern 36:193–202. https://doi.org/10.1007/BF00344251
  25. Fukushima K (1988) Neocognitron: a hierarchical neural network capable of visual pattern recognition. Neural Netw 1(2):119–130. https://doi.org/10.1016/0893-6080(88)90014-7
  26. Rumelhart DE, Hinton GE, Williams RJ (1986) Learning representations by back-propagating errors. Nature 323:533–536. https://doi.org/10.1038/323533a0
  27. LeCun Y, Boser B, Denker JS et al (1989) Backpropagation applied to handwritten zip code recognition. Neural Comput 1:541–551. https://doi.org/10.1162/neco.1989.1.4.541
  28. Watkins CJCH, Dayan P (1992) Q-learning. Mach Learn 8:279–292. https://doi.org/10.1007/bf00992698
  29. Cortes C, Vapnik V (1995) Support-vector networks. Mach Learn 20:273–297. https://doi.org/10.1023/A:1022627411411
  30. Hochreiter S, Schmidhuber J (1997) Long short-term memory. Neural Comput 9:1735–1780. https://doi.org/10.1162/neco. 1997.9.8.1735
  31. Ilievski A, Zdraveski V, Gusev M (2018) How CUDA Powers the machine learning revolution. 2018 26th Telecommun Forum, TELFOR 2018 - Proc 420–425. https://doi.org/https://doi.org/10.1109/TELFOR.2018.8611982
  32. Deng J, Dong W, Socher R et al (2010) ImageNet: a large-scale hierarchical image database. Inst Electric Electron Eng IEEE. https://doi.org/10.1109/CVPR.2009.5206848
  33. Krizhevsky A, Sutskever I, Hinton GE (2012) ImageNet Classification with Deep Convolutional Neural Networks. In Proceedings of the 25th International Conference on Neural Information Processing Systems - Volume 1
  34. Le Q V, Ranzato M’ A, Monga R, et al (2012) Building Highlevel Features Using Large Scale Unsupervised Learning. https://arxiv.org/abs/1112.6209v5
  35. Jorda M, Valero-Lara P, Pena AJ (2019) Performance evaluation of cuDNN convolution algorithms on NVIDIA volta GPUs. IEEE Access 7:70461–70473. https://doi.org/10.1109/ACCESS.2019.2918851
  36. Taigman Y, Yang M, Ranzato M, Wolf L (2014) DeepFace: Closing the gap to human-level performance in face verification. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, pp 1701–1708
  37. Goodfellow I, Pouget-Abadie J, Mirza M et al (2020) Generative Adversarial Networks. Commun ACM. https://doi.org/10.1145/3422622
  38. Gandomi A, Haider M (2015) Beyond the hype: Big data concepts, methods, and analytics. Int J Inf Manage 35:137–144. https://doi.org/10.1016/j.ijinfomgt.2014.10.007
  39. Brazma A, Kapushesky M, Parkinson H et al (2006) [20] Data Storage and Analysis in ArrayExpress. Methods Enzymol 411:370–86. https://doi.org/10.1016/S0076-6879(06)11020-4
  40. Lo Y-C, Ren G, Honda H, L. Davis K (2020) Artificial Intelligence-Based Drug Design and Discovery. In: Cheminformatics and its Applications: https://doi.org/10.5772/intechopen.89012
  41. Edgar R, Domrachev M, Lash AE (2002) Gene expression omnibus: NCBI gene expression and hybridization array data repository. Nucleic Acids Res. https://doi.org/10.1093/nar/30.1.207
  42. Wang Z, Jensen MA, Zenklusen JC (2016) A practical guide to The Cancer Genome Atlas (TCGA). In: Methods in Molecular Biology 1418:111–41: https://doi.org/10.1007/978-1-4939-3578-9_6
  43. Parkinson H, Kapushesky M, Shojatalab M et al (2007) ArrayExpress-a public database of microarray experiments and gene expression profiles. Nucleic Acids Res. https://doi.org/10.1093/nar/gkl995
  44. van IJzendoorn DGP, Szuhai K, Briaire-De Bruijn IH, et al (2019) Machine learning analysis of gene expression data reveals novel diagnostic and prognostic biomarkers and identifies therapeutic targets for soft tissue sarcomas. PLoS Comput Biol 15:1–19. https://doi.org/10.1371/journal.pcbi.1006826
  45. Lau A, So HC (2020) Turning genome-wide association study findings into opportunities for drug repositioning. Comput Struct Biotechnol J 18:1639–1650. https://doi.org/10.1016/j.csbj.2020.06.015
  46. Beck T, Hastings RK, Gollapudi S et al (2014) GWAS Central: a comprehensive resource for the comparison and interrogation of genome-wide association studies. Eur J Hum Genet. https://doi.org/10.1038/ejhg.2013.274
  47. Buniello A, Macarthur JAL, Cerezo M et al (2019) The NHGRIEBI GWAS Catalog of published genome-wide association studies, targeted arrays and summary statistics 2019. Nucleic Acids Res. https://doi.org/10.1093/nar/gky1120
  48. Li J, Yuan X, March ME et al (2019) Identification of target genes at juvenile idiopathic arthritis GWAS loci in human neutrophils. Front Genet. https://doi.org/10.3389/fgene.2019.00181
  49. Leinonen R, Sugawara H, Shumway M (2011) The sequence read archive. Nucleic Acids Res. https://doi.org/10.1093/nar/gkq1019
  50. Jensen MA, Ferretti V, Grossman RL, Staudt LM (2017) The NCI genomic data commons as an engine for precision medicine. Blood 130(4):453–459. https://doi.org/10.1182/blood-2017-03-735654
  51. Han Y, Yang J, Qian X et al (2019) DriverML: a machine learning algorithm for identifying driver genes in cancer sequencing studies. Nucleic Acids Res. https://doi.org/10.1093/nar/gkz096
  52. Guillaume JC (1998) PubMed. Ann Dermatol Venereol. https://doi.org/10.1002/9783527678679.dg10319
  53. Canese K, Weis S (2013) PubMed: The bibliographic database. NCBI Handb
  54. Kim S, Chen J, Cheng T et al (2021) PubChem in 2021: new data content and improved web interfaces. Nucleic Acids Res. https://doi.org/10.1093/nar/gkaa971
  55. Kim S, Chen J, Cheng T et al (2019) PubChem 2019 update: improved access to chemical data. Nucleic Acids Res. https://doi.org/10.1093/nar/gky1033
  56. Mendez D, Gaulton A, Bento AP et al (2019) ChEMBL: towards direct deposition of bioassay data. Nucleic Acids Res. https://doi.org/10.1093/nar/gky1075
  57. Bento AP, Gaulton A, Hersey A et al (2014) The ChEMBL bioactivity database: an update. Nucleic Acids Res. https://doi.org/10.1093/nar/gkt1031
  58. Wishart DS, Knox C, Guo AC et al (2008) DrugBank: a knowledgebase for drugs, drug actions and drug targets. Nucleic Acids Res. https://doi.org/10.1093/nar/gkm958
  59. Wishart DS, Feunang YD, Guo AC et al (2018) DrugBank 5.0: a major update to the DrugBank database for 2018. Nucleic Acids Res. https://doi.org/10.1093/nar/gkx1037
  60. Keenan AB, Jenkins SL, Jagodnik KM et al (2018) The library of integrated network-based cellular signatures NIH program: system-level cataloging of human cells response to perturbations. Cell Syst 6(1):13–24. https://doi.org/10.1016/j.cels.2017.11.001
  61. Duan Q, Reid SP, Clark NR et al (2016) L1000CDS2: LINCS L1000 characteristic direction signatures search engine. npj Syst Biol Appl 2:1–12. https://doi.org/10.1038/npjsba.2016.15
  62. Rose PW, Prlić A, Altunkaya A et al (2017) The RCSB protein data bank: integrative view of protein, gene and 3D structural information. Nucleic Acids Res. https://doi.org/10.1093/nar/gkw1000
  63. Burley SK, Berman HM, Bhikadiya C et al (2019) RCSB Protein data bank: biological macromolecular structures enabling research and education in fundamental biology, biomedicine, biotechnology and energy. Nucleic Acids Res. https://doi.org/10.1093/nar/gky1004
  64. Xu Z, Yang L, Zhang X et al (2020) Discovery of potential flavonoid inhibitors against COVID-19 3CL proteinase based on virtual screening strategy. Front Mol Biosci 7:1–8. https://doi.org/10.3389/fmolb.2020.556481
  65. Fan Y, Zhang Y, Hua Y et al (2019) Investigation of machine intelligence in compound cell activity classification. Mol Pharm. https://doi.org/10.1021/acs.molpharmaceut.9b00558
  66. Chi CT, Lee MH, Weng CF, Leong MK (2019) In silico prediction of PAMPA effective permeability using a two-QSAR approach. Int J Mol Sci. https://doi.org/10.3390/ijms20133170
  67. He S, Zhang X, Lu S et al (2019) A computational toxicology approach to screen the hepatotoxic ingredients in traditional chinese medicines: polygonum multiflorum thunb as a case study. Biomolecules. https://doi.org/10.3390/biom9100577
  68. He S, Zhang C, Zhou P et al (2019) Herb-induced liver injury: Phylogenetic relationship, structure-toxicity relationship, and herb-ingredient network analysis. Int. J Mol Sci. 20(15):3633. https://doi.org/10.3390/ijms20153633
  69. Zhang D, hai, Wu K lun, Zhang X, et al (2020) In silico screening of Chinese herbal medicines with the potential to directly inhibit 2019 novel coronavirus. J Integr Med. https://doi.org/10.1016/j.joim.2020.02.005
  70. Baldi A (2010) Computational approaches for drug design and discovery: an overview. Syst Rev Pharm 1(1):99. https://doi.org/10.4103/0975-8453.59519
  71. Lavecchia A, Cerchia C (2016) In silico methods to address polypharmacology: current status, applications and future perspectives. Drug Discov Today 21(2):288–298. https://doi.org/10.1016/j.drudis.2015.12.007
  72. Smith JS, Roitberg AE, Isayev O (2018) Transforming computational drug discovery with machine learning and AI. ACS Med Chem Lett 9(11):1065–1069. https://doi.org/10.1021/acsmedchemlett.8b00437
  73. Jing Y, Bian Y, Hu Z et al (2018) Deep learning for drug design: an artificial intelligence paradigm for drug discovery in the big data era. AAPS J 20(3):58. https://doi.org/10.1208/s12248-018-0210-0
  74. Powles J, Hodson H (2017) Google deepmind and healthcare in an age of algorithms. Health Technol (Berl). https://doi.org/10.1007/s12553-017-0179-1
  75. Senior AW, Evans R, Jumper J et al (2020) Improved protein structure prediction using potentials from deep learning. Nature 577:706–710. https://doi.org/10.1038/s41586-019-1923-7
  76. AlQuraishi M (2019) End-to-End differentiable learning of protein structure. Cell Syst 8:292-301.e3. https://doi.org/10.1016/j.cels.2019.03.006
  77. Kalaiarasi C, Manjula S, Kumaradhas P (2019) Combined quantum mechanics/molecular mechanics (QM/MM) methods to understand the charge density distribution of estrogens in the active site of estrogen receptors. RSC Adv. https://doi.org/10.1039/c9ra08607b
  78. Schütt KT, Gastegger M, Tkatchenko A et al (2019) Unifying machine learning and quantum chemistry with a deep neural network for molecular wavefunctions. Nat Commun. https://doi.org/10.1038/s41467-019-12875-2
  79. Gastegger M, McSloy A, Luya M et al (2020) A deep neural network for molecular wave functions in quasi-atomic minimal basis representation. J Chem Phys DOI. https://doi.org/10.1063/5.0012911
  80. De Vivo M, Masetti M, Bottegoni G, Cavalli A (2016) Role of molecular dynamics and related methods in drug discovery. J Med Chem 59(9):4035–4061. https://doi.org/10.1021/acs.jmedchem.5b01684
  81. Bennett WFD, He S, Bilodeau CL et al (2020) Predicting small molecule transfer free energies by combining molecular dynamics simulations and deep learning. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.0c00318
  82. Bai Q, Tan S, Xu T et al (2020) MolAICal: a soft tool for 3D drug design of protein targets by artificial intelligence and classical algorithm. Brief Bioinform 00:1–12. https://doi.org/10.1093/bib/bbaa161
  83. Sterling T, Irwin JJ (2015) ZINC 15-ligand discovery for everyone. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.5b00559
  84. Popova M, Isayev O, Tropsha A (2018) Deep reinforcement learning for de novo drug design. Sci Adv 4:1–15. https://doi.org/10.1126/sciadv.aap7885
  85. Grzybowski BA, Szymkuć S, Gajewska EP et al (2018) Chematica: a story of computer code that started to think like a chemist. Chem 4:390–398. https://doi.org/10.1016/j.chempr.2018.02.024
  86. Genheden S, Thakkar A, Chadimová V et al (2020) AiZynthFinder: a fast, robust and flexible open-source software for retrosynthetic planning. J Cheminform 12:1–9. https://doi.org/10.1186/s13321-020-00472-1
  87. Segler MHS, Preuss M, Waller MP (2018) Planning chemical syntheses with deep neural networks and symbolic AI. Nature 555:604–610. https://doi.org/10.1038/nature25978
  88. Bøgevig A, Federsel HJ, Huerta F et al (2015) Route design in the 21st century: the IC SYNTH software tool as an idea generator for synthesis prediction. Org Process Res Dev 19:357–368. https://doi.org/10.1021/op500373e
  89. Jang G, Lee T, Hwang S et al (2018) PISTON: predicting drug indications and side effects using topic modeling and natural language processing. J Biomed Inform 87:96–107. https://doi.org/10.1016/j.jbi.2018.09.015
  90. Piñero J, Bravo Á, Queralt-Rosinach N et al (2017) DisGeNET: a comprehensive platform integrating information on human disease-associated genes and variants. Nucleic Acids Res. https://doi.org/10.1093/nar/gkw943
  91. Szklarczyk D, Gable AL, Lyon D et al (2019) STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Res. https://doi.org/10.1093/nar/gky1131
  92. Szklarczyk D, Santos A, Von Mering C et al (2016) STITCH 5: augmenting protein-chemical interaction networks with tissue and affinity data. Nucleic Acids Res 44:D380–D384. https://doi.org/10.1093/nar/gkv1277
  93. Davenport TH, Ronanki R (2018) Artificial intelligence for the real world. Harv Bus Rev
  94. Zhavoronkov A, Vanhaelen Q, Oprea TI (2020) Will Artificial Intelligence for Drug Discovery Impact Clinical Pharmacology? Clin Pharmacol Ther. https://doi.org/10.1002/cpt.1795
  95. Watson O, Cortes-Ciriano I, Taylor A, Watson JA (2018) A decision theoretic approach to model evaluation in computational drug discovery. arXiv. https://arxiv.org/abs/1807.08926
  96. Tripathy RK, Mahanta S, Paul S (2014) Artificial intelligencebased classification of breast cancer using cellular images. RSC Adv 4:9349–9355. https://doi.org/10.1039/c3ra47489e
  97. Samui P, Kothari DP (2011) Utilization of a least square support vector machine (LSSVM) for slope stability analysis. Sci Iran 18:53–58. https://doi.org/10.1016/j.scient.2011.03.007
  98. Chan HCS, Shan H, Dahoun T et al (2019) Advancing Drug Discovery via Artificial Intelligence. Trends Pharmacol Sci 40:592–604. https://doi.org/10.1016/j.tips.2019.06.004
  99. Ho CWL, Soon D, Caals K, Kapur J (2019) Governance of automated image analysis and artificial intelligence analytics in healthcare. Clin Radiol 74:329–337. https://doi.org/10.1016/j.crad.2019.02.005
  100. Andrysek T (2003) Impact of physical properties of formulations on bioavailability of active substance: Current and novel drugs with cyclosporine. In: Molecular Immunology; 39(17–18):1061–5. https://doi.org/10.1016/s0161-5890(03)00077-4.
  101. Elton DC, Boukouvalas Z, Butrico MS et al (2018) Applying machine learning techniques to predict the properties of energetic materials. Sci Rep 8:9059. https://doi.org/10.1038/s41598-018-27344-x
  102. Tyrchan C, Evertsson E (2017) Matched molecular pair analysis in short: algorithms, applications and limitations. Comput Struct Biotechnol J 15:86–90. https://doi.org/10.1016/j.csbj.2016.12.003
  103. Turk S, Merget B, Rippmann F, Fulle S (2017) Coupling matched molecular pairs with machine learning for virtual compound optimization. J Chem Inf Model 57:3079–3085. https://doi.org/10.1021/acs.jcim.7b00298
  104. Carpenter KA, Huang X (2018) Machine learning-based virtual screening and its applications to Alzheimer’s drug discovery: a review. Curr Pharm Des 24:3347–3358. https://doi.org/10.2174/1381612824666180607124038
  105. Schyman P, Liu R, Desai V, Wallqvist A (2017) vNN web server for ADMET predictions. Front Pharmacol 8:889. https://doi.org/10.3389/fphar.2017.00889
  106. Álvarez-Machancoses Ó, Fernández-Martínez JL (2019) Using artificial intelligence methods to speed up drug discovery. Expert Opin Drug Discov 14(8):769–777. https://doi.org/10.1080/17460441.2019.1621284
  107. Fleming N (2018) How artificial intelligence is changing drug discovery. Nature. How artificial intelligence is changing drug discovery
  108. Segler MHS, Kogej T, Tyrchan C, Waller MP (2018) Generating focused molecule libraries for drug discovery with recurrent neural networks. ACS Cent Sci. https://doi.org/10.1021/acscentsci.7b00512
  109. Bruno BJ, Miller GD, Lim CS (2013) Basics and recent advances in peptide and protein drug delivery. Ther. Deliv 4(11):1443–67. https://doi.org/10.4155/tde.13.104
  110. Yan J, Bhadra P, Li A et al (2020) Deep-AmPEP30: improve short antimicrobial peptides prediction with deep learning. Mol Ther-Nucleic Acids 20:882–894. https://doi.org/10.1016/j.omtn. 2020.05.006
  111. Plisson F, Ramírez-Sánchez O, Martínez-Hernández C (2020) Machine learning-guided discovery and design of non-hemolytic peptides. Sci Rep 10:1–19. https://doi.org/10.1038/s41598-020-73644-6
  112. Kavousi K, Bagheri M, Behrouzi S et al (2020) IAMPE: NMRassisted computational prediction of antimicrobial peptides. J Chem Inf Model 60:4691–4701. https://doi.org/10.1021/acs.jcim.0c00841
  113. Yi HC, You ZH, Zhou X et al (2019) ACP-DL: a deep learning long short-term memory model to predict anticancer peptides using high-efficiency feature representation. Mol Ther-Nucleic Acids 17:1–9. https://doi.org/10.1016/j.omtn.2019.04.025
  114. Yu L, Jing R, Liu F et al (2020) DeepACP: a novel computational approach for accurate identification of anticancer peptides by deep learning algorithm. Mol Ther-Nucleic Acids 22:862–870. https://doi.org/10.1016/j.omtn.2020.10.005
  115. Tyagi A, Kapoor P, Kumar R et al (2013) In silico models for designing and discovering novel anticancer peptides. Sci Rep 3:1–8. https://doi.org/10.1038/srep02984
  116. Rao B, Zhang L, Zhang G (2020) ACP-GCN: the identification of anticancer peptides based on graph convolution networks. IEEE Access 8:176005–176011. https://doi.org/10.1109/access.2020.3023800
  117. Wu C, Gao R, Zhang Y, De Marinis Y (2019) PTPD: predicting therapeutic peptides by deep learning and word2vec. BMC Bioinformatics 20:1–8. https://doi.org/10.1186/s12859-019-3006-z
  118. Zhavoronkov A, Ivanenkov YA, Aliper A et al (2019) Deep learning enables rapid identification of potent DDR1 kinase inhibitors. Nat Biotechnol 37:1038–1040. https://doi.org/10.1038/s41587-019-0224-x
  119. McCloskey K, Sigel EA, Kearnes S et al (2020) Machine learning on DNA-encoded libraries: a new paradigm for hit finding. J Med Chem 63:8857–8866. https://doi.org/10.1021/acs.jmedchem.0c00452
  120. Xing G, Liang L, Deng C et al (2020) Activity prediction of small molecule inhibitors for antirheumatoid arthritis targets based on artificial intelligence. ACS Comb Sci. https://doi.org/10.1021/acscombsci.0c00169
  121. Dimmitt S, Stampfer H, Martin JH (2017) When less is more–efficacy with less toxicity at the ED50. Br J Clin Pharmacol 83(7):1365–1368. https://doi.org/10.1111/bcp.13281
  122. Shen Y, Liu T, Chen J et al (2020) Harnessing artificial intelligence to optimize long-term maintenance dosing for antiretroviral-naive adults with HIV-1 Infection. Adv Ther 3:1900114. https://doi.org/10.1002/adtp.201900114
  123. Pantuck AJ, Lee D-K, Kee T et al (2018) Modulating BET bromodomain inhibitor ZEN-3694 and Enzalutamide combination dosing in a metastatic prostate cancer patient using CURATE. AI an artificial intelligence platform. Adv Ther. https://doi.org/ 10.1002/adtp.201800104
  124. Julkunen H, Cichonska A, Gautam P et al (2020) Leveraging multi-way interactions for systematic prediction of pre-clinical drug combination effects. Nat Commun. https://doi.org/10.1038/s41467-020-19950-z
  125. Sharabiani A, Bress A, Douzali E, Darabi H (2015) Revisiting warfarin dosing using machine learning techniques. Comput Math Methods Med. https://doi.org/10.1155/2015/560108
  126. Nemati S, Ghassemi MM, Clifford GD (2016) Optimal medication dosing from suboptimal clinical examples: a deep reinforcement learning approach. Proc Annu Int Conf IEEE Eng Med Biol Soc EMBS. https://doi.org/10.1109/EMBC.2016.7591355
  127. Tang J, Liu R, Zhang YL et al (2017) Application of machinelearning models to predict tacrolimus stable dose in renal transplant recipients. Sci Rep. https://doi.org/10.1038/srep42192
  128. Hu YH, Tai CT, Tsai CF, Huang MW (2018) Improvement of adequate digoxin dosage: an application of machine learning approach. J Healthc Eng. https://doi.org/10.1155/2018/3948245
  129. Imai S, Takekuma Y, Miyai T, Sugawara M (2020) A new algorithm optimized for initial dose settings of vancomycin using machine learning. Biol Pharm Bull 43:188–193. https://doi.org/10.1248/bpb.b19-00729
  130. Rollinger JM, Stuppner H, Langer T (2008) Virtual screening for the discovery of bioactive natural products. Prog Drug Res 65:212–249. https://doi.org/10.1007/978-3-7643-8117-2_6
  131. Schuster D, Maurer EM, Laggner C et al (2006) The discovery of new 11β-hydroxysteroid dehydrogenase type 1 inhibitors by common feature pharmacophore modeling and virtual screening. J Med Chem 49:3454–3466. https://doi.org/10.1021/jm0600794
  132. Wu J, Zhang Q, Wu W et al (2018) WDL-RF: predicting bioactivities of ligand molecules acting with G protein-coupled receptors by combining weighted deep learning and random forest. Bioinformatics 34:2271–2282. https://doi.org/10.1093/bioinformatics/bty070
  133. Cichonska A, Pahikkala T, Szedmak S et al (2018) Learning with multiple pairwise kernels for drug bioactivity prediction. Bioinformatics 34:i509–i518. https://doi.org/10.1093/bioinformatics/bty277
  134. Babajide Mustapha I, Saeed F (2016) Bioactive molecule prediction using extreme gradient boosting. Molecules 21:1–11. https://doi.org/10.3390/molecules21080983
  135. Merget B, Turk S, Eid S et al (2017) Profiling prediction of kinase inhibitors: toward the virtual assay. J Med Chem 60:474–485. https://doi.org/10.1021/acs.jmedchem.6b01611
  136. Arshadi AK, Salem M, Collins J et al (2020) Deepmalaria: artificial intelligence driven discovery of potent antiplasmodials. Front Pharmacol. https://doi.org/10.3389/fphar.2019.0152
  137. Sugaya N (2014) Ligand efficiency-based support vector regression models for predicting bioactivities of ligands to drug target proteins. J Chem Inf Model 54:2751–2763. https://doi.org/10.1021/ci5003262
  138. Afolabi LT, Saeed F, Hashim H, Petinrin OO (2018) Ensemble learning method for the prediction of new bioactive molecules. PLoS ONE 13:1–14. https://doi.org/10.1371/journal.pone.0189538
  139. Petinrin OO, Saeed F (2018) Bioactive molecule prediction using majority voting-based ensemble method. J Intell Fuzzy Syst 35:383–392. https://doi.org/10.3233/JIFS-169596
  140. Liu X, Gao Y, Peng J et al (2015) TarPred: a web application for predicting therapeutic and side effect targets of chemical compounds. Bioinformatics. https://doi.org/10.1093/bioinformatics/btv099
  141. Liu M, Wu Y, Chen Y et al (2012) Large-scale prediction of adverse drug reactions using chemical, biological, and phenotypic properties of drugs. J Am Med Informatics Assoc 19:28–35. https://doi.org/10.1136/amiajnl-2011-000699
  142. Jamal S, Goyal S, Shanker A, Grover A (2017) Predicting neurological adverse drug reactions based on biological, chemical and phenotypic properties of drugs using machine learning models. Sci Rep 7:1–12. https://doi.org/10.1038/s41598-017-00908-z
  143. Xue R, Liao J, Shao X et al (2020) Prediction of adverse drug reactions by combining biomedical tripartite network and graph representation model. Chem Res Toxicol 33:202–210. https://doi.org/10.1021/acs.chemrestox.9b00238
  144. Raja K, Patrick M, Elder JT, Tsoi LC (2017) Machine learning workflow to enhance predictions of adverse drug reactions (ADRs) through drug-gene interactions: application to drugs for cutaneous diseases. Sci Rep 7:1–11. https://doi.org/10.1038/s41598-017-03914-3
  145. Daina A, Michielin O, Zoete V (2017) SwissADME: a free web tool to evaluate pharmacokinetics, drug-likeness and medicinal chemistry friendliness of small molecules. Sci Rep. https://doi.org/10.1038/srep42717
  146. Rost B, Liu J, Nair R et al (2003) Automatic prediction of protein function. Cell Mol Life Sci 60:2637–2650. https://doi.org/10.1007/s00018-003-3114-8
  147. Browne F, Zheng H, Wang H, Azuaje F (2010) From experimental approaches to computational techniques: a review on the prediction of protein-protein interactions. Adv Artif Intell. https://doi.org/10.1155/2010/924529
  148. Hale WH (1913) American association for the advancement of science. Sci Am 75:34–34. https://doi.org/10.1038/scientificamerican01181913-34supp
  149. Troyanskaya OG, Dolinski K, Owen AB et al (2003) A Bayesian framework for combining heterogeneous data sources for gene function prediction (in Saccharomyces cerevisiae). Proc Natl Acad Sci U S A 100:8348–8353. https://doi.org/10.1073/pnas.0832373100
  150. You ZH, Lei YK, Zhu L et al (2013) Prediction of proteinprotein interactions from amino acid sequences with ensemble extreme learning machines and principal component analysis. BMC Bioinformatics 14:1–11. https://doi.org/10.1186/1471-2105-14-S8-S10
  151. Du X, Sun S, Hu C et al (2017) DeepPPI: boosting prediction of protein-protein interactions with deep neural networks. J Chem Inf Model 57:1499–1510. https://doi.org/10.1021/acs.jcim.7b00028
  152. Cunningham JM, Koytiger G, Sorger PK, AlQuraishi M (2020) Biophysical prediction of protein–peptide interactions and signaling networks using machine learning. Nat Methods 17:175–183. https://doi.org/10.1038/s41592-019-0687-1
  153. Chatterjee P, Basu S, Kundu M et al (2011) PPI_SVM: prediction of protein-protein interactions using machine learning, domain-domain affinities and frequency tables. Cell Mol Biol Lett 16:264–278. https://doi.org/10.2478/s11658-011-0008-x
  154. Lu L, Lu H, Skolnick J (2002) Multiprospector: an algorithm for the prediction of protein-protein interactions by multimeric threading. Proteins Struct Funct Genet 49:350–364. https://doi.org/10.1002/prot.10222
  155. Singh R, Park D, Xu J et al (2010) Struct2Net: a web service to predict protein-protein interactions using a structure-based approach. Nucleic Acids Res 38:508–515. https://doi.org/10.1093/nar/gkq481
  156. Dandekar T, Snel B, Huynen M, Bork P (1998) Conservation of gene order: a fingerprint of proteins that physically interact. Trends Biochem Sci 23:324–328. https://doi.org/10.1016/S0968-0004(98)01274-2
  157. Keskin O, Tuncbag N, Gursoy A (2016) Predicting protein-protein interactions from the molecular to the proteome level. Chem Rev 116:4884–4909. https://doi.org/10.1021/acs.chemrev.5b00683
  158. Lavecchia A, Giovanni C (2013) Virtual screening strategies in drug discovery: a critical review. Curr Med Chem. https://doi.org/10.2174/09298673113209990001
  159. Gonczarek A, Tomczak JM, Zaręba S et al (2018) Interaction prediction in structure-based virtual screening using deep learning. Comput Biol Med. https://doi.org/10.1016/j.compbiomed. 2017.09.007
  160. Goh GB, Hodas NO, Vishnu A (2017) Deep learning for computational chemistry. J Comput Chem 38(16):1291–1307. https://doi.org/10.1002/jcc.24764
  161. Yang X, Wang Y, Byrne R et al (2019) Concepts of artificial intelligence for computer-assisted drug discovery. Chem. Rev 119(18):10520–10594. https://doi.org/10.1021/acs.chemrev.8b00728
  162. Arciniega M, Lange OF (2014) Improvement of virtual screening results by docking data feature analysis. J Chem Inf Model. https://doi.org/10.1021/ci500028u
  163. Feinstein WP, Brylinski M (2015) Calculating an optimal box size for ligand docking and virtual screening against experimental and predicted binding pockets. J Cheminform. https://doi.org/10.1186/s13321-015-0067-5
  164. Gazgalis D, Zaka M, Zaka M et al (2020) Protein binding pocket optimization for virtual high-throughput screening (vHTS) drug discovery. ACS Omega. https://doi.org/10.1021/acsomega.0c00522
  165. Carpenter KA, Huang X (2018) Machine learning-based virtual screening and its applications to Alzheimer’s drug discovery: a review. Curr Pharm Des. https://doi.org/10.2174/1381612824666180607124038
  166. Serafim MSM, Kronenberger T, Oliveira PR et al (2020) The application of machine learning techniques to innovative antibacterial discovery and development. Expert Opin Drug Discov. https://doi.org/10.1080/17460441.2020.1776696
  167. Melville J, Burke E, Hirst J (2009) Machine learning in virtual screening. Comb Chem High Throughput Screen. https://doi.org/10.2174/138620709788167980
  168. Wójcikowski M, Ballester PJ, Siedlecki P (2017) Performance of machine-learning scoring functions in structure-based virtual screening. Sci Rep. https://doi.org/10.1038/srep46710
  169. Carpenter KA, Cohen DS, Jarrell JT, Huang X (2018) Deep learning and virtual drug screening. Future Med Chem. 10(21):2557–2567. https://doi.org/10.4155/fmc-2018-0314
  170. Labbé CM, Rey J, Lagorce D et al (2015) MTiOpenScreen: a web server for structure-based virtual screening. Nucleic Acids Res. https://doi.org/10.1093/nar/gkv306
  171. Schellhammer I, Rarey M (2004) FlexX-Scan: Fast, structurebased virtual screening. Proteins Struct Funct Bioinforma 57:504–517. https://doi.org/10.1002/prot.20217
  172. Perez-Castillo Y, Sotomayor-Burneo S, Jimenes-Vargas K et al (2019) CompScore: boosting structure-based virtual screening performance by incorporating docking scoring function components into consensus scoring. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.9b00343
  173. Skalic M, Martínez-Rosell G, Jiménez J, De Fabritiis G (2019) PlayMolecule bindscope: large scale CNN-based virtual screening on the web. Bioinformatics. https://doi.org/10.1093/bioinformatics/bty758
  174. Fang Y, Ding Y, Feinstein WP et al (2016) GeauxDock: accelerating structure-based virtual screening with heterogeneous computing. PLoS ONE. https://doi.org/10.1371/journal.pone.0158898
  175. Pires DEV, Veloso WNP, Myung YC et al (2020) EasyVS: a user-friendly web-based tool for molecule library selection and structure-based virtual screening. Bioinformatics. https://doi.org/10.1093/bioinformatics/btaa480
  176. Ibrahim TM, Bauer MR, Boeckler FM (2015) Applying DEKOIS 2.0 in structure-based virtual screening to probe the impact of preparation procedures and score normalization. J Cheminform. https://doi.org/10.1186/s13321-015-0074-6
  177. Shin WH, Christoffer CW, Wang J, Kihara D (2016) PL-PatchSurfer2: improved local surface matching-based virtual screening method that is tolerant to target and ligand structure variation. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.6b00163
  178. Litfin T, Zhou Y, Yang Y (2017) SPOT-ligand 2: improving structure-based virtual screening by binding-homology search on an expanded structural template library. Bioinformatics. https://doi.org/10.1093/bioinformatics/btw829
  179. Ropp PJ, Spiegel JO, Walker JL et al (2019) GypSUm-DL: An open-source program for preparing small-molecule libraries for structure-based virtual screening. J Cheminform. https://doi.org/10.1186/s13321-019-0358-3
  180. Akbar R, Jusoh SA, Amaro RE, Helms V (2017) ENRI: a tool for selecting structure-based virtual screening target conformations. Chem Biol Drug Des. https://doi.org/10.1111/cbdd.12900
  181. Kellenberger E, Springael JY, Parmentier M et al (2007) Identification of nonpeptide CCR5 receptor agonists by structure-based virtual screening. J Med Chem. https://doi.org/10.1021/jm061389p
  182. De Graaf C, Rognan D (2008) Selective structure-based virtual screening for full and partial agonists of the β2 adrenergic receptor. J Med Chem. https://doi.org/10.1021/jm800710x
  183. Vidler LR, Filippakopoulos P, Fedorov O et al (2013) Discovery of novel small-molecule inhibitors of BRD4 using structurebased virtual screening. J Med Chem. https://doi.org/10.1021/jm4011302
  184. Liu LJ, Leung KH, Chan DSH et al (2014) Identification of a natural product-like STAT3 dimerization inhibitor by structurebased virtual screening. Cell Death Dis. https://doi.org/10.1038/cddis.2014.250
  185. Yang C, Wang W, Chen L et al (2016) Discovery of a VHL and HIF1α interaction inhibitor with: in vivo angiogenic activity via structure-based virtual screening. Chem Commun. https://doi.org/10.1039/c6cc04938a
  186. Zhuang C, Narayanapillai S, Zhang W et al (2014) Rapid identification of Keap1-Nrf2 small-molecule inhibitors through structure-based virtual screening and hit-based substructure search. J Med Chem. https://doi.org/10.1021/jm4017174
  187. Dou X, Jiang L, Wang Y et al (2018) Discovery of new GSK-3β inhibitors through structure-based virtual screening. Bioorganic Med Chem Lett. https://doi.org/10.1016/j.bmcl.2017.11.036
  188. Liu Y, Ren Y, Cao Y et al (2017) Discovery of a low toxicity O-GlcNAc Transferase (OGT) inhibitor by structure-based virtual screening of natural products. Sci Rep. https://doi.org/10.1038/s41598-017-12522-0
  189. Wang Y, Dou X, Jiang L et al (2019) Discovery of novel glycogen synthase kinase-3α inhibitors: Structure-based virtual screening, preliminary SAR and biological evaluation for treatment of acute myeloid leukemia. Eur J Med Chem. https://doi.org/10.1016/j.ejmech.2019.03.039
  190. Wang Q, Xu J, Li Y et al (2018) Identification of a novel protein arginine methyltransferase 5 inhibitor in non-small cell lung cancer by structure-based virtual screening. Front Pharmacol. https://doi.org/10.3389/fphar.2018.00173
  191. Sharma K, Patidar K, Ali MA et al (2018) Structure-based virtual screening for the identification of high affinity compounds as potent vegfr2 inhibitors for the treatment of renal cell carcinoma. Curr Top Med Chem. https://doi.org/10.2174/1568026619666181130142237
  192. Yousuf Z, Iman K, Iftikhar N, Mirza MU (2017) Structure-based virtual screening and molecular docking for the identification of potential multi-targeted inhibitors against breast cancer. Breast Cancer Targets Ther. https://doi.org/10.2147/BCTT.S132074
  193. Leão M, Pereira C, Bisio A et al (2013) Discovery of a new small-molecule inhibitor of p53-MDM2 interaction using a yeast-based approach. Biochem Pharmacol. https://doi.org/10.1016/j.bcp.2013.01.032
  194. Gahlawat A, Kumar N, Kumar R et al (2020) Structure-based virtual screening to discover potential lead molecules for the SARS-CoV-2 main protease. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.0c00546
  195. Selvaraj C, Dinesh DC, Panwar U et al (2020) Structure-based virtual screening and molecular dynamics simulation of SARSCoV-2 guanine-N7 methyltransferase (nsp14) for identifying antiviral inhibitors against COVID-19. J Biomol Struct Dyn. https://doi.org/10.1080/07391102.2020.1778535
  196. Cruz JV, Neto MFA, Silva LB et al (2018) Identification of novel protein kinase receptor type 2 inhibitors using pharmacophore and structure-based virtual screening. Molecules. https://doi.org/10.3390/molecules23020453
  197. Kannan S, Melesina J, Hauser AT et al (2014) Discovery of inhibitors of schistosoma mansoni hdac8 by combining homology modeling, virtual screening, and in vitro validation. J Chem Inf Model. https://doi.org/10.1021/ci5004653
  198. Zoete V, Daina A, Bovigny C, Michielin O (2016) SwissSimilarity: a web tool for low to ultra high throughput ligand-based virtual screening. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.6b00174
  199. Imbernón B, Cecilia JM, Pérez-Sánchez H, Giménez D (2018) METADOCK: a parallel metaheuristic schema for virtual screening methods. Int J High Perform Comput Appl. https://doi.org/10.1177/1094342017697471
  200. Riniker S, Landrum GA (2013) Open-source platform to benchmark fingerprints for ligand-based virtual screening. J Cheminform. https://doi.org/10.1186/1758-2946-5-26
  201. Li H, Leung KS, Wong MH, Ballester PJ (2016) USR-VS: a web server for large-scale prospective virtual screening using ultrafast shape recognition techniques. Nucleic Acids Res. https://doi.org/10.1093/nar/gkw320
  202. Suzuki SD, Ohue M, Akiyama Y (2018) PKRank: a novel learning-to-rank method for ligand-based virtual screening using pairwise kernel and RankSVM. Artif Life Robot. https://doi.org/10.1007/s10015-017-0416-8
  203. Patel H, Brinkjost T, Koch O (2017) PyGOLD: a python based API for docking based virtual screening workflow generation. Bioinformatics. https://doi.org/10.1093/bioinformatics/btx197
  204. Banegas-Luna AJ, Cerón-Carrasco JP, Puertas-Martín S, PérezSánchez H (2019) BRUSELAS: HPC generic and customizable software architecture for 3D ligand-based virtual screening of large molecular databases. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.9b00279
  205. Wang L, Pang X, Li Y et al (2017) RADER: a rapid decoy retriever to facilitate decoy based assessment of virtual screening. Bioinformatics. https://doi.org/10.1093/bioinformatics/btw783
  206. Mochizuki M, Suzuki SD, Yanagisawa K et al (2019) QEX: target-specific druglikeness filter enhances ligand-based virtual screening. Mol Divers. https://doi.org/10.1007/s11030-018-9842-3
  207. Zhang H, Liao L, Cai Y et al (2019) IVS2vec: a tool of inverse virtual screening based on word2vec and deep learning techniques. Methods. https://doi.org/10.1016/j.ymeth.2019.03.012
  208. Arcon JP, Modenutti CP, Avendaño D et al (2019) AutoDock Bias: improving binding mode prediction and virtual screening using known protein-ligand interactions. Bioinformatics. https://doi.org/10.1093/bioinformatics/btz152
  209. Ebejer JP, Finn PW, Wong WK et al (2019) Ligity: a non-superpositional, knowledge-based approach to virtual screening. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.8b00779
  210. Zhu Z, Wang X, Yang Y et al (2020) D3Similarity: a ligandbased approach for predicting drug targets and for virtual screening of active compounds against COVID-19. ChemRxiv. https://doi.org/10.26434/chemrxiv.11959323.v1
  211. Bharti DR, Hemrom AJ, Lynn AM (2019) GCAC: Galaxy workflow system for predictive model building for virtual screening. BMC Bioinformatics. https://doi.org/10.1186/s12859-018-2492-8
  212. Kong Y, Bender A, Yan A (2018) Identification of Novel Aurora Kinase A (AURKA) Inhibitors via Hierarchical Ligand-Based Virtual Screening. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.7b00300
  213. Musumeci D, Amato J, Zizza P et al (2017) Tandem application of ligand-based virtual screening and G4-OAS assay to identify novel G-quadruplex-targeting chemotypes. Biochim Biophys Acta - Gen Subj. https://doi.org/10.1016/j.bbagen.2017.01.024
  214. Yu M, Gu Q, Xu J (2018) Discovering new PI3Kα inhibitors with a strategy of combining ligand-based and structure-based virtual screening. J Comput Aided Mol Des. https://doi.org/10.1007/s10822-017-0092-8
  215. Halim SA, Khan S, Khan A et al (2017) Targeting dengue virus NS-3 Helicase by Ligand based Pharmacophore Modeling and structure based virtual screening. Front Chem. https://doi.org/10.3389/fchem.2017.00088
  216. Debnath S, Debnath T, Bhaumik S et al (2019) Discovery of novel potential selective HDAC8 inhibitors by combine ligandbased, structure-based virtual screening and in-vitro biological evaluation. Sci Rep. https://doi.org/10.1038/s41598-019-53376-y
  217. Fu Y, Sun YN, Yi KH et al (2017) 3D pharmacophore-based virtual screening and docking approaches toward the discovery of novel HPPD inhibitors. Molecules. https://doi.org/10.3390/molecules22060959
  218. Krishna S, Shukla S, Lakra AD et al (2017) Identification of potent inhibitors of DNA methyltransferase 1 (DNMT1) through a pharmacophore-based virtual screening approach. J Mol Graph Model. https://doi.org/10.1016/j.jmgm.2017.05.014
  219. Pérez-Nueno VI, Pettersson S, Ritchie DW et al (2009) Discovery of novel HIV entry inhibitors for the CXCR4 receptor by prospective virtual screening. J Chem Inf Model. https://doi.org/10.1021/ci800468q
  220. Hofmarcher M, Mayr A, Rumetshofer E et al (2020) Large-scale ligand-based virtual screening for SARS-CoV-2 inhibitors using deep neural networks. SSRN Electron J. https://doi.org/10.2139/ssrn.3561442
  221. Amin SA, Ghosh K, Gayen S, Jha T (2020) Chemical-informatics approach to COVID-19 drug discovery: monte carlo based QSAR, virtual screening and molecular docking study of some in-house molecules as papain-like protease (PLpro) inhibitors. J Biomol Struct Dyn. https://doi.org/10.1080/07391102.2020.1780946
  222. Ferraz WR, Gomes RA, Novaes ALS, Goulart Trossini GH (2020) Ligand and structure-based virtual screening applied to the SARS-CoV-2 main protease: an in silico repurposing study. Future Med Chem. https://doi.org/10.4155/fmc-2020-0165
  223. Choudhary S, Malik YS, Tomar S (2020) Identification of SARSCoV-2 Cell entry inhibitors by drug repurposing using in silico structure-based virtual screening approach. Front Immunol. https://doi.org/10.3389/fimmu.2020.01664
  224. Xiao T, Qi X, Chen Y, Jiang Y (2018) Development of Ligandbased big data deep neural network models for virtual screening of large compound libraries. Mol Inform. https://doi.org/10.1002/minf.201800031
  225. Hu J, Liu Z, Yu DJ, Zhang Y (2018) LS-align: An atom-level, flexible ligand structural alignment algorithm for high-throughput virtual screening. In: Bioinformatics 34(13): 2209–2218; https://doi.org/https://doi.org/10.1093/bioinformatics/bty081
  226. Ha EJ, Lwin CT, Durrant JD (2020) LigGrep: a tool for filtering docked poses to improve virtual-screening hit rates. J Cheminform. https://doi.org/10.1186/s13321-020-00471-2
  227. Spiegel JO, Durrant JD (2020) AutoGrow4: an open-source genetic algorithm for de novo drug design and lead optimization. J Cheminform. https://doi.org/10.1186/s13321-020-00429-4
  228. Chen P, Ke Y, Lu Y et al (2019) Dligand2: an improved knowledge-based energy function for protein–ligand interactions using the distance-scaled, finite, ideal-gas reference state. J Cheminform. https://doi.org/10.1186/s13321-019-0373-4
  229. Gattani S, Mishra A, Hoque MT (2019) StackCBPred: a stacking based prediction of protein-carbohydrate binding sites from sequence. Carbohydr Res. https://doi.org/10.1016/j.carres.2019.107857
  230. Li X, Yan X, Yang Y et al (2019) LSA: a local-weighted structural alignment tool for pharmaceutical virtual screening. RSC Adv. https://doi.org/10.1039/c8ra08915a
  231. Seifert MHJ (2005) ProPose: steered virtual screening by simultaneous protein-ligand docking and ligand-ligand alignment. J Chem Inf Model. https://doi.org/10.1021/ci0496393
  232. Schellhammer I, Rarey M (2007) TrixX: Structure-based molecule indexing for large-scale virtual screening in sublinear time. J Comput Aided Mol Des. https://doi.org/10.1007/s10822-007-9103-5
  233. Lagarde N, Goldwaser E, Pencheva T et al (2019) A free webbased protocol to assist structure-based virtual screening experiments. Int J Mol Sci. https://doi.org/10.3390/ijms20184648
  234. Rifaioglu AS, Nalbat E, Atalay V et al (2020) DEEPScreen: high performance drug-target interaction prediction with convolutional neural networks using 2-D structural compound representations. Chem Sci. https://doi.org/10.1039/c9sc03414e
  235. Obrezanova O, Segall MD (2010) Gaussian processes for classification: QSAR modeling of ADMET and target activity. J Chem Inf Model. https://doi.org/10.1021/ci900406x
  236. Wu Z, Zhu M, Kang Y et al (2020) Do we need different machine learning algorithms for QSAR modeling? A comprehensive assessment of 16 machine learning algorithms on 14 QSAR data sets. Brief Bioinform. https://doi.org/10.1093/bib/bbaa321
  237. Obrezanova O, Csányi G, Gola JMR, Segall MD (2007) Gaussian processes: a method for automatic QSAR modeling of ADME properties. J Chem Inf Model. https://doi.org/10.1021/ci7000633
  238. Benfenati E, Manganaro A, Gini G (2013) VEGA-QSAR: AI inside a platform for predictive toxicology. In: CEUR Workshop Proceedings
  239. Ambure P, Halder AK, González Díaz H, Cordeiro MNDS (2019) QSAR-Co: an open source software for developing robust multitasking or multitarget classification-based QSAR models. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.9b00295
  240. Chen S, Xue D, Chuai G et al (2020) FL-QSAR: a federated learning based QSAR prototype for collaborative drug discovery. Bioinformatics. https://doi.org/10.1093/bioinformatics/btaa1006
  241. Olier I, Sadawi N, Bickerton GR et al (2018) Meta-QSAR: a large-scale application of meta-learning to drug design and discovery. Mach Learn. https://doi.org/10.1007/s10994-017-5685-x
  242. Soufan O, Ba-Alawi W, Magana-Mora A et al (2018) DPubChem: a web tool for QSAR modeling and high-throughput virtual screening. Sci Rep. https://doi.org/10.1038/s41598-018-27495-x
  243. Karpov P, Godin G, Tetko IV (2020) Transformer-CNN: swiss knife for QSAR modeling and interpretation. J Cheminform. https://doi.org/10.1186/s13321-020-00423-w
  244. Wang Y-L, Wang F, Shi X-X et al (2020) Cloud 3D-QSAR: a web tool for the development of quantitative structure–activity relationship models in drug discovery. Brief Bioinform. https://doi.org/10.1093/bib/bbaa276
  245. Goh GB, Siegel C, Vishnu A, et al (2017) Chemception: A deep neural network with minimal chemistry knowledge matches the performance of expert-developed QSAR/QSPR models. arXiv
  246. Reis J, Cagide F, Chavarria D et al (2016) Discovery of new chemical entities for old targets: insights on the lead optimization of chromone-based monoamine oxidase B (MAO-B) inhibitors. J Med Chem. https://doi.org/10.1021/acs.jmedchem.6b00527
  247. Hoelz L, Horta B, Araújo J et al (2010) Quantitative structureactivity relationships of antioxidant phenolic compounds. J Chem Pharm Res 2(5):291–306
  248. Zhang Y, Han Z, Gao Q et al (2019) Prediction of K562 Cells Functional Inhibitors Based on Machine Learning Approaches. Curr Pharm Des. https://doi.org/10.2174/1381612825666191107092214
  249. Halder AK, Giri AK, Dias Soeiro Cordeiro MN (2019) Multitarget chemometric modelling, fragment analysis and virtual screening with ERK inhibitors as potential anticancer agents. Molecules. https://doi.org/10.3390/molecules24213909
  250. Halder AK, Cordeiro MNDS (2019) Development of multitarget chemometric models for the inhibition of class I PI3K enzyme isoforms: a case study using QSAR-Co tool. Int J Mol Sci. https://doi.org/10.3390/ijms20174191
  251. Kim S, Cho KH (2019) PyQSAR: a fast QSAR modeling platform using machine learning and jupyter notebook. Bull Korean Chem Soc. https://doi.org/10.1002/bkcs.11638
  252. Ben Geoffrey AS, Christian Prasana J, Muthu S (2020) Structureactivity relationship of Quercetin and its tumor necrosis factor alpha inhibition activity by computational and machine learning methods. Mater Today Proc. https://doi.org/10.1016/j.matpr. 2020.07.464
  253. Ben Geoffrey A S, Rafal Madaj, Akhil Sanker, Mario Sergio Valdés Tresanco, Host Antony Davidd, Gitanjali Roy, Rinnu Sarah Saji, Abdulbasit Haliru Yakubu BM Automated In Silico Identification of Drug Candidates for Coronavirus Through a Novel Programmatic Tool and Extensive Computational (MD, DFT) Studies of Select Drug Candidatesl; https://doi.org/https://doi.org/10.26434/chemrxiv.12423638.v3
  254. Žuvela P, David J, Wong MW (2018) Interpretation of ANNbased QSAR models for prediction of antioxidant activity of flavonoids. J Comput Chem. https://doi.org/10.1002/jcc.25168
  255. Ding Q, Hou S, Zu S et al (2020) VISAR: an interactive tool for dissecting chemical features learned by deep neural network QSAR models. Bioinformatics. https://doi.org/10.1093/bioinformatics/btaa187
  256. Gadaleta D, Manganelli S, Roncaglioni A et al (2018) QSAR modeling of ToxCast assays relevant to the molecular initiating events of AOPs leading to hepatic steatosis. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.8b00297
  257. Hermansyah O, Bustamam A, Yanuar A (2020) Virtual Screening of DPP-4 Inhibitors Using QSAR-Based Artificial Intelligence and Molecular Docking of Hit Compounds to DPP-8 and DPP-9 Enzymes. https://doi.org/10.21203/rs.2.22282/v1
  258. Tian Y, Zhang S, Yin H, Yan A (2020) Quantitative structureactivity relationship (QSAR) models and their applicability domain analysis on HIV-1 protease inhibitors by machine learning methods. Chemom Intell Lab Syst. https://doi.org/10.1016/j.chemolab.2019.103888
  259. Wei Y, Li W, Du T et al (2019) Targeting HIV/HCV coinfection using a machine learning-based multiple quantitative structureActivity Relationships (Multiple QSAR) Method. Int J Mol Sci. https://doi.org/10.3390/ijms20143572
  260. Michel Kana (2020) Handling Missing Data For Advanced Machine Learning
  261. Kumar S (2020) 7 Ways to Handle Missing Values in Machine Learning | by Satyam Kumar | Towards Data Science
  262. Gad SC (2014) QSAR. In: Third E (ed) Wexler PBT- Encyclopedia of Toxicology. Academic Press, Oxford, pp 1–9
  263. Neves BJ, Braga RC, Melo-Filho CC et al (2018) QSAR-Based Virtual Screening: Advances and Applications in Drug Discovery. Front Pharmacol 9:1275. https://doi.org/10.3389/fphar.2018.01275
  264. Roy K, Kar S, Das RN (2015) Chapter 9 - Newer QSAR Techniques. In: Roy K, Kar S, Das RN, Book Title- Understanding the Basics of QSAR for Applications in Pharmaceutical Sciences and Risk Assessment (eds). Academic Press, Boston,
  265. Kwon S, Bae H, Jo J, Yoon S (2019) Comprehensive ensemble in QSAR prediction for drug discovery. BMC Bioinformatics 20:521. https://doi.org/10.1186/s12859-019-3135-4
  266. Roy K, Kar S, Das RN (2015) Chapter 12 - Future Avenues. In: Roy K, Kar S, Das RN, Book Title- Understanding the Basics of QSAR for Applications in Pharmaceutical Sciences and Risk Assessment (eds). Academic Press, Boston, pp 455–462. https://doi.org/https://doi.org/10.1016/B978-0-12-801505-6.00012-0
  267. Paolini GV, Shapland RHB, Van Hoorn WP et al (2006) Global mapping of pharmacological space. Nat Biotechnol. https://doi.org/10.1038/nbt1228
  268. Koch U, Hamacher M, Nussbaumer P (2014) Cheminformatics at the interface of medicinal chemistry and proteomics. Biochim Biophys Acta-Proteins Proteomics 1844(1):156–61; https://doi.org/10.1016/j.bbapap.2013.05.010
  269. Makhouri FR, Ghasemi JB (2019) Combating diseases with computational strategies used for drug design and discovery. Curr Top Med Chem. https://doi.org/10.2174/1568026619666190121125106
  270. Würth R, Thellung S, Bajetto A et al (2016) Drug-repositioning opportunities for cancer therapy: novel molecular targets for known compounds. Drug Discov Today 21(1):190–199. https://doi.org/10.1016/j.drudis.2015.09.017
  271. Joachim Haupt V, Schroeder M (2011) Old friends in new guise: repositioning of known drugs with structural bioinformatics. Brief Bioinform. https://doi.org/10.1093/bib/bbr011
  272. Butcher EC (2005) Can cell systems biology rescue drug discovery? Nat Rev Drug Discov. https://doi.org/10.1038/nrd1754
  273. Iyengar R, Zhao S, Chung SW et al (2012) Merging systems biology with pharmacodynamics. Sci Transl Med 4(126):126ps7. https://doi.org/10.1126/scitranslmed.3003563
  274. Martínez V, Navarro C, Cano C et al (2015) DrugNet: networkbased drug-disease prioritization by integrating heterogeneous data. Artif Intell Med. https://doi.org/10.1016/j.artmed.2014.11.003
  275. Zhang W, Xu H, Li X et al (2020) DRIMC: an improved drug repositioning approach using Bayesian inductive matrix completion. Bioinformatics. https://doi.org/10.1093/bioinformatics/btaa062
  276. Luo H, Zhang P, Cao XH et al (2016) DPDR-CPI, a server that predicts drug positioning and drug repositioning via chemical-protein interactome. Sci Rep. https://doi.org/10.1038/srep35996
  277. Zhu Q, Tao C, Shen F, Chute CG (2014) Exploring the pharmacogenomics knowledge base (pharmgkb) for repositioning breast cancer drugs by leveraging Web ontology language (owl) and cheminformatics approaches. In: Pacific Symposium on Biocomputing
  278. Gallo K, Goede A, Eckert A et al (2020) PROMISCUOUS 2.0: a resource for drug-repositioning. Nucleic Acids Res. https://doi.org/10.1093/nar/gkaa1061
  279. Luo H, Li M, Wang S et al (2018) Computational drug repositioning using low-rank matrix approximation and randomized algorithms. Bioinformatics. https://doi.org/10.1093/bioinformatics/bty013
  280. Yella JK, Jegga AG (2020) MGATRx: discovering drug repositioning candidates using multi-view graph attention. biorxiv. https://doi.org/10.1101/2020.06.29.171876
  281. Yan CK, Wang WX, Zhang G et al (2019) BiRWDDA: a novel drug repositioning method based on multisimilarity fusion. J Comput Biol. https://doi.org/10.1089/cmb.2019.0063
  282. Fahimian G, Zahiri J, Arab SS, Sajedi RH (2019) RepCOOL: computational drug repositioning via integrating heterogeneous biological networks. biorxiv. https://doi.org/10.1101/817882
  283. Li Z, Yao Y, Cheng X, et al (2020) A Computational Framework of Host-Based Drug Repositioning for Broad-Spectrum Antivirals against RNA Viruses. https://doi.org/10.26434/chemrxiv.12927260.v1
  284. Wu D, Gao W, Li X et al (2020) Dr AFC: drug repositioning through anti-fibrosis characteristic. Brief Bioinform. https://doi. org/10.1093/bib/bbaa115
  285. Hooshmand SA, Zarei Ghobadi M, Hooshmand SE et al (2020) A multimodal deep learning-based drug repurposing approach for treatment of COVID-19. Mol Divers. https://doi.org/10.1007/s11030-020-10144-9
  286. Zhou Y, Hou Y, Shen J et al (2020) Network-based drug repurposing for novel coronavirus 2019-nCoV/SARS-CoV-2. Cell Discov. https://doi.org/10.1038/s41421-020-0153-3
  287. Zheng X, He S, Song X, et al (2018) DTI-RCNN: New efficient hybrid neural network model to predict drug–target interactions. In: Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
  288. Jarada TN, Rokne JG, Alhajj R (2020) SNF–CVAE: computational method to predict drug–disease interactions using similarity network fusion and collective variational autoencoder. Knowledge-Based Syst. https://doi.org/10.1016/j.knosys.2020.106585
  289. Xu R, Wang QQ (2015) PhenoPredict: a disease phenome-wide drug repositioning approach towards schizophrenia drug discovery. J Biomed Inform. https://doi.org/10.1016/j.jbi.2015.06.027
  290. Wu Z, Cheng F, Li J et al (2017) SDTNBI: an integrated network and chemoinformatics tool for systematic prediction of drug-target interactions and drug repositioning. Brief Bioinform. https://doi.org/10.1093/bib/bbw012
  291. Zeng X, Zhu S, Liu X et al (2019) DeepDR: a network-based deep learning approach to in silico drug repositioning. Bioinformatics. https://doi.org/10.1093/bioinformatics/btz418
  292. Chen H, Cheng F, Li J (2020) IDrug: Integration of drug repositioning and drug-target prediction via cross-network embedding. PLoS Comput Biol. https://doi.org/10.1371/journal.pcbi.1008040
  293. Li B, Dai C, Wang L et al (2020) A novel drug repurposing approach for non-small cell lung cancer using deep learning. PLoS ONE. https://doi.org/10.1371/journal.pone.0233112
  294. Kuenzi BM, Park J, Fong SH et al (2020) Predicting drug response and synergy using a deep learning model of human cancer cells. Cancer Cell. https://doi.org/10.1016/j.ccell.2020.09.014
  295. Wang Z, Zhou M, Arnold C (2020) Toward heterogeneous information fusion: bipartite graph convolutional networks for in silico drug repurposing. Bioinformatics. https://doi.org/10.1093/bioinformatics/btaa437
  296. Pinzi L, Rastelli G (2019) Molecular docking: Shifting paradigms in drug discovery. Int J Mol Sci. https://doi.org/10.3390/ijms20184331
  297. Muhammed MT, Aki-Yalcin E (2019) Homology modeling in drug discovery: overview, current applications, and future perspectives. Chem Biol Drug Des 93:12–20. https://doi.org/10.1111/cbdd.13388
  298. Lynch SR, Bothwell T, Campbell L et al (2007) A comparison of physical properties, screening procedures and a human efficacy trial for predicting the bioavailability of commercial elemental iron powders used for food fortification. Int J Vitam Nutr Res. https://doi.org/10.1024/0300-9831.77.2.107
  299. Schneider P, Walters WP, Plowright AT et al (2020) Rethinking drug design in the artificial intelligence era. Nat Rev Drug Discov 19:353–364. https://doi.org/10.1038/s41573-019-0050-3
  300. Chen H, Engkvist O, Wang Y et al (2018) The rise of deep learning in drug discovery. Drug Discov Today 23(6):1241–1250. https://doi.org/10.1016/j.drudis.2018.01.039
  301. Lusci A, Pollastri G, Baldi P (2013) Deep architectures and deep learning in chemoinformatics: the prediction of aqueous solubility for drug-like molecules. J Chem Inf Model. https://doi.org/10.1021/ci400187y
  302. Kumar R, Sharma A, Siddiqui MH, Tiwari RK (2017) Prediction of human intestinal absorption of compounds using artificial intelligence techniques. Curr Drug Discov Technol. https://doi.org/10.2174/1570163814666170404160911
  303. Zang Q, Mansouri K, Williams AJ et al (2017) In silico prediction of physicochemical properties of environmental chemicals using molecular fingerprints and machine learning. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.6b00625
  304. Tetko IV, Gasteiger J, Todeschini R et al (2005) Virtual computational chemistry laboratory-design and description. J Comput Aided Mol Des. https://doi.org/10.1007/s10822-005-8694-y
  305. Radchenko E V, Palyulin VA, Zefirov NS (2002) Virtual computational chemistry laboratory. System
  306. Royal Society of Chemistry (2015) ChemSpider. Search and Share Chemistry. R. Soc, Chem
  307. Kucukdereli H, Allen NJ, Lee AT et al (2011) Control of excitatory CNS synaptogenesis by astrocyte-secreted proteins hevin and SPARC. Proc Natl Acad Sci U S A. https://doi.org/10.1073/pnas.1104977108
  308. Ayati A, Falahati M, Irannejad H, Emami S (2012) Synthesis, in vitro antifungal evaluation and in silico study of 3-azolyl-4-chromanone phenylhydrazones. DARU, J Pharm Sci. https://doi.org/10.1186/2008-2231-20-46
  309. Rashid M (2020) Design, synthesis and ADMET prediction of bis-benzimidazole as anticancer agent. Bioorg Chem. https://doi.org/10.1016/j.bioorg.2020.103576
  310. Puratchikody A, Sriram D, Umamaheswari A, Irfan N (2016) 3-D structural interactions and quantitative structural toxicity studies of tyrosine derivatives intended for safe potent inflammation treatment. Chem Cent J. https://doi.org/10.1186/s13065-016-0169-9
  311. Nascimento ACA, Prudêncio RBC, Costa IG (2016) A multiple kernel learning algorithm for drug-target interaction prediction. BMC Bioinformatics. https://doi.org/10.1186/s12859-016-0890-3
  312. Öztürk H, Özgür A, Ozkirimli E (2018) A chemical language based approach for protein-Ligand interaction prediction. arXiv https://doi.org/10.1002/minf.202000212
  313. Nascimento ACA, Prudêncio RBC, Costa IG (2019) A drugtarget network-based supervised machine learning repurposing method allowing the use of multiple heterogeneous information sources. Methods Mol Biol 1903:281–289. https://doi.org/10.1007/978-1-4939-8955-3_17
  314. Öztürk H, Özgür A, Ozkirimli E (2018) DeepDTA: Deep drugtarget binding affinity prediction. Bioinformatics 34(17):i821–i829. https://doi.org/10.1093/bioinformatics/bty593
  315. Feng Q, Dueva E, Cherkasov A, Ester M (2018) PADME: A deep learning-based framework for drug-target interaction prediction. arXiv https://arxiv.org/abs/1807.09741v4
  316. Beck BR, Shin B, Choi Y et al (2020) Predicting commercially available antiviral drugs that may act on the novel coronavirus (SARS-CoV-2) through a drug-target interaction deep learning model. Comput Struct Biotechnol J. https://doi.org/10.1016/j.csbj.2020.03.025
  317. Lee H, Kim W (2019) Comparison of target features for predicting drug-target interactions by deep neural network based on large-scale drug-induced transcriptome data. Pharmaceutics. https://doi.org/10.3390/pharmaceutics11080377
  318. Karimi M, Wu D, Wang Z, Shen Y (2019) DeepAffinity: interpretable deep learning of compound-protein affinity through unified recurrent and convolutional neural networks. Bioinformatics. https://doi.org/10.1093/bioinformatics/btz111
  319. Born J, Manica M, Cadow J, et al (2020) PaccMannRL on SARS-CoV-2: Designing antiviral candidates with conditional generative models. arXiv https://arxiv.org/abs/2005.13285v3
  320. Jiang M, Li Z, Bian Y, Wei Z (2019) A novel protein descriptor for the prediction of drug binding sites. BMC Bioinformatics. https://doi.org/10.1186/s12859-019-3058-0
  321. Cañada A, Capella-Gutierrez S, Rabal O et al (2017) LimTox: a web tool for applied text mining of adverse event and toxicity associations of compounds, drugs and genes. Nucleic Acids Res. https://doi.org/10.1093/nar/gkx462
  322. Pires DEV, Blundell TL, Ascher DB (2015) pkCSM: Predicting small-molecule pharmacokinetic and toxicity properties using graph-based signatures. J Med Chem. https://doi.org/10.1021/acs.jmedchem.5b00104
  323. Cheng F, Li W, Zhou Y et al (2012) AdmetSAR: A comprehensive source and free tool for assessment of chemical ADMET properties. J Chem Inf Model. https://doi.org/10.1021/ci300367a
  324. Patlewicz G, Jeliazkova N, Safford RJ et al (2008) An evaluation of the implementation of the Cramer classification scheme in the Toxtree software. SAR QSAR Environ Res. https://doi.org/10.1080/10629360802083871
  325. Uygun MT, Amudi K, Turaçlı İD, Menges N (2021) A new synthetic approach for pyrazolo[1,5-a]pyrazine-4(5H)-one derivatives and their antiproliferative effects on lung adenocarcinoma cell line. Mol Divers. https://doi.org/10.1007/s11030-020-10161-8
  326. Srivastava A, Siddiqui S, Ahmad R et al (2020) Exploring nature’s bounty: identification of Withania somnifera as a promising source of therapeutic agents against COVID-19 by virtual screening and in silico evaluation. J Biomol Struct Dyn. https://doi.org/10.1080/07391102.2020.1835725
  327. Attene-Ramos MS, Miller N, Huang R et al (2013) The Tox21 robotic platform for the assessment of environmental chemicalsFrom vision to reality. Drug Discov. Today 18(15–16):716–23. https://doi.org/10.1016/j.drudis.2013.05.015
  328. Wang Z, Liang L, Yin Z, Lin J (2016) Improving chemical similarity ensemble approach in target prediction. J Cheminform. https://doi.org/10.1186/s13321-016-0130-x
  329. Pu L, Naderi M, Liu T et al (2019) eToxPred: a machine learningbased approach to estimate the toxicity of drug candidates. BMC Pharmacol Toxicol. https://doi.org/10.1186/s40360-018-0282-6
  330. Lysenko A, Sharma A, Boroevich KA, Tsunoda T (2018) An integrative machine learning approach for prediction of toxicityrelated drug safety. Life Sci Alliance. https://doi.org/10.26508/lsa.201800098
  331. Zhou B, Sun Q, Kong DX (2016) Predicting cancer-relevant proteins using an improved molecular similarity ensemble approach. Oncotarget. https://doi.org/10.18632/oncotarget.8716
  332. Huang R, Xia M, Sakamuru S et al (2016) Modelling the Tox21 10 K chemical profiles for in vivo toxicity prediction and mechanism characterization. Nat Commun. https://doi.org/10.1038/ncomms10425
  333. Gupta VK, Rana PS (2019) Toxicity prediction of small drug molecules of androgen receptor using multilevel ensemble model. J Bioinform Comput Biol. https://doi.org/10.1142/S0219720019500331
  334. Mayr A, Klambauer G, Unterthiner T, Hochreiter S (2016) DeepTox: toxicity prediction using deep learning. Front Environ Sci. https://doi.org/10.3389/fenvs.2015.00080
  335. Gayvert KM, Madhukar NS, Elemento O (2016) A data-driven approach to predicting successes and failures of clinical trials. Cell Chem Biol. https://doi.org/10.1016/j.chembiol.2016.07.023
  336. Gilvary C, Elkhader J, Madhukar N et al (2020) A machine learning and network framework to discover new indications for small molecules. PLoS Comput Biol. https://doi.org/10.1371/JOURNAL.PCBI.1008098
  337. Robledo-Cadena DX, Gallardo-Pérez JC, Dávila-Borja V et al (2020) Non-steroidal anti-inflammatory drugs increase cisplatin, paclitaxel, and doxorubicin efficacy against human cervix cancer cells. Pharmaceuticals (Basel). https://doi.org/10.3390/ph13120463
  338. Simm J, Klambauer G, Arany A et al (2018) Repurposing highthroughput image assays enables biological activity prediction for drug discovery. Cell Chem Biol. https://doi.org/10.1016/j.chembiol.2018.01.015
  339. Goh GB, Siegel C, Hodas N, Vishnu A (2017) SMILES2vec: An interpretable general-purpose deep neural network for predicting chemical properties. arXiv https://arxiv.org/abs/1712.02034v2
  340. Preuer K, Lewis RPI, Hochreiter S et al (2018) Deepsynergy: predicting anti-cancer drug synergy with deep learning. Bioinformatics. https://doi.org/10.1093/bioinformatics/btx806
  341. Xu Y, Pei J, Lai L (2017) Deep learning based regression and multiclass models for acute oral toxicity prediction with automatic chemical feature extraction. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.7b00244
  342. Rodrigues T, Werner M, Roth J et al (2018) Machine intelligence decrypts β-lapachone as an allosteric 5-lipoxygenase inhibitor. Chem Sci. https://doi.org/10.1039/c8sc02634c
  343. Luechtefeld T, Marsh D, Rowlands C, Hartung T (2018) Machine learning of toxicological big data enables read-across structure activity relationships (RASAR) outperforming animal test reproducibility. Toxicol Sci. https://doi.org/10.1093/toxsci/kfy152
  344. Zhang C, Cheng F, Li W et al (2016) In silico prediction of drug induced liver toxicity using substructure pattern recognition method. Mol Inform. https://doi.org/10.1002/minf.201500055
  345. Lei T, Li Y, Song Y et al (2016) ADMET evaluation in drug discovery: 15. Accurate prediction of rat oral acute toxicity using relevance vector machine and consensus modeling. J Cheminform. https://doi.org/10.1186/s13321-016-0117-7
  346. Lei T, Chen F, Liu H et al (2017) ADMET evaluation in drug discovery. Part 17: development of quantitative and qualitative prediction models for chemical-induced respiratory toxicity. Mol Pharm. https://doi.org/10.1021/acs.molpharmaceut.7b00317
  347. Lei T, Sun H, Kang Y et al (2017) ADMET evaluation in drug discovery. 18 reliable prediction of chemical-induced urinary tract toxicity by boosting machine learning approaches. Mol Pharm. https://doi.org/10.1021/acs.molpharmaceut.7b00631
  348. Pandya R, Pandya J (2015) C5.0 algorithm to improved decision tree with feature selection and reduced error pruning. Int J Comput Appl. https://doi.org/10.5120/20639-3318
  349. Jenwitheesuk E, Horst JA, Rivas KL et al (2008) Novel paradigms for drug discovery: computational multitarget screening. Trends Pharmacol Sci. https://doi.org/10.1016/j.tips.2007.11.007
  350. Gu S, Lai L, hua, (2020) Associating 197 Chinese herbal medicine with drug targets and diseases using the similarity ensemble approach. Acta Pharmacol Sin 41:432–438. https://doi.org/10.1038/s41401-019-0306-9
  351. Chen YT, Xie JY, Sun Q, Mo WJ (2019) Novel drug candidates for treating esophageal carcinoma: a study on differentially expressed genes, using connectivity mapping and molecular docking. Int J Oncol 54:152–166. https://doi.org/10.3892/ijo.2018.4618
  352. Taha KF, Khalil M, Abubakr MS, Shawky E (2020) Identifying cancerrelated molecular targets of Nandina domestica Thunb. by network pharmacologybased analysis in combination with chemical profiling and molecular docking studies. J Ethnopharmacol 249:112413. https://doi.org/10.1016/j.jep.2019.112413
  353. Anighoro A, Bajorath J, Rastelli G (2014) Polypharmacology: Challenges and opportunities in drug discovery. J Med Chem 57(19):7874–87. https://doi.org/10.1021/jm5006463
  354. Zhang W, Pei J, Lai L (2017) Computational multitarget drug design. J Chem Inf Model 57(3):403–412. https://doi.org/10.1021/acs.jcim.6b00491
  355. Proschak E, Stark H, Merk D (2019) Polypharmacology by design: a medicinal chemist’s perspective on multitargeting compounds. J Med Chem 62(2):420–444. https://doi.org/10.1021/acs.jmedchem.8b00760
  356. Awale M, Reymond JL (2017) The polypharmacology browser: a web-based multi-fingerprint target prediction tool using ChEMBL bioactivity data. J Cheminform. https://doi.org/10.1186/s13321-017-0199-x
  357. Reker D, Rodrigues T, Schneider P, Schneider G (2014) Identifying the macromolecular targets of de novo-designed chemical entities through self-organizing map consensus. Proc Natl Acad Sci U S A. https://doi.org/10.1073/pnas.1320001111
  358. Wang L, Ma C, Wipf P et al (2013) Targethunter: an in silico target identification tool for predicting therapeutic potential of small organic molecules based on chemogenomic database. AAPS J. https://doi.org/10.1208/s12248-012-9449-z
  359. Xia W, Chenxu P, Honglin L (2016) PharmMapper. In: Enhancing Enrich. Pharmacophore-Based Target Predict. Polypharmacological Profiles Drugs 56(6):1175–83. https://doi.org/10.1021/acs.jcim.5b00690
  360. Gong J, Cai C, Liu X et al (2013) ChemMapper: a versatile web server for exploring pharmacology and chemical structure association based on molecular 3D similarity method. Bioinformatics. https://doi.org/10.1093/bioinformatics/btt270
  361. Gfeller D, Grosdidier A, Wirth M et al (2014) SwissTargetPrediction: a web server for target prediction of bioactive small molecules. Nucleic Acids Res. https://doi.org/10.1093/nar/gku293
  362. Poirier M, Awale M, Roelli MA et al (2019) Identifying lysophosphatidic acid acyltransferase β (LPAAT-β) as the target of a nanomolar angiogenesis inhibitor from a phenotypic screen using the polypharmacology browser PPB2. ChemMedChem. https://doi.org/10.1002/cmdc.201800554
  363. Ozhathil LC, Delalande C, Bianchi B et al (2018) Identification of potent and selective small molecule inhibitors of the cation channel TRPM4. Br J Pharmacol. https://doi.org/10.1111/bph.14220
  364. Ratnawati DE, Marjono M, Anam S (2018) Prediction of active compounds from SMILES codes using backpropagation algorithm. In: AIP Conference Proceedings
  365. Van Vleet TR, Liguori MJ, Lynch JJ et al (2019) Screening strategies and methods for better offtarget liability prediction and identification of small-molecule pharmaceuticals. SLAS Discov 24(1):1–24. https://doi.org/10.1177/2472555218799713
  366. Yue SJ, Liu J, Feng WW et al (2017) System pharmacologybased dissection of the synergistic mechanism of huangqi and huanglian for diabetes mellitus. Front Pharmacol. https://doi.org/10.3389/fphar.2017.00694
  367. Shi XQ, Yue SJ, Tang YP et al (2019) A network pharmacology approach to investigate the blood enriching mechanism of Danggui buxue Decoction. J Ethnopharmacol. https://doi.org/10.1016/j.jep.2019.01.027
  368. Liu X, Wu J, Zhang D et al (2018) A network pharmacology approach to uncover the multiple mechanisms of hedyotis diffusa willd on colorectal cancer. EvidenceBased Complem Altern Med. https://doi.org/10.1155/2018/6517034
  369. Wang J, Luo C, Shan C et al (2015) Inhibition of human copper trafficking by a small molecule significantly attenuates cancer cell proliferation. Nat Chem. https://doi.org/10.1038/nchem.2381
  370. Fang J, Li Y, Liu R et al (2015) Discovery of multitarget-directed ligands against Alzheimer’s disease through systematic prediction of chemical-protein interactions. J Chem Inf Model. https://doi.org/10.1021/ci500574n
  371. Gao L, Wang KX, Zhou YZ et al (2018) Uncovering the anticancer mechanism of compound Kushen Injection against HCC by integrating quantitative analysis, network analysis and experimental validation. Sci Rep. https://doi.org/10.1038/s41598-017-18325-7
  372. Zhou W, Liu X, Tu Z et al (2013) Discovery of pteridin-7(8H)-one-based irreversible inhibitors targeting the epidermal growth factor receptor (EGFR) kinase T790M/L858R Mutant. J Med Chem 56:7821–7837. https://doi.org/10.1021/jm401045n
  373. Wang Q, Feng YH, Huang JC et al (2017) A novel framework for the identification of drug target proteins: combining stacked auto-encoders with a biased support vector machine. PLoS ONE. https://doi.org/10.1371/journal.pone.0176486
  374. Carvalho-Silva D, Pierleoni A, Pignatelli M et al (2019) Open targets platform: new developments and updates two years on. Nucleic Acids Res. https://doi.org/10.1093/nar/gky1133
  375. López-Cortés A, Paz-y-Miño C, Guerrero S et al (2020) Pharmacogenomics, biomarker network, and allele frequencies in colorectal cancer. Pharmacogenomics J 20(1):136–158. https://doi.org/10.1038/s41397-019-0102-4
  376. Nabirotchkin S, Peluffo AE, Bouaziz J, Cohen D (2020) Focusing on the unfolded protein response and autophagy related pathways to reposition common approved drugs against COVID-19. Preprints
  377. López-Isac E, Acosta-Herrera M, Kerick M et al (2019) GWAS for systemic sclerosis identifies multiple risk loci and highlights fibrotic and vasculopathy pathways. Nat Commun. https://doi.org/10.1038/s41467-019-12760-y
  378. Martin P, Ding J, Duffus K et al (2019) Chromatin interactions reveal novel gene targets for drug repositioning in rheumatic diseases. Ann Rheum Dis. https://doi.org/10.1136/annrheumdis-2018-214649
  379. Dong J, Cao DS, Miao HY et al (2015) ChemDes: an integrated web-based platform for molecular descriptor and fingerprint computation. J Cheminform. https://doi.org/10.1186/s13321-015-0109-z
  380. Angelo RM, Io AK, Almeida MP, et al (2020) OntoQSAR: An ontology for interpreting chemical and biological data in quantitative structure-activity relationship studies. In: Proceedings-14th IEEE International Conference on Semantic Computing, ICSC 2020
  381. Oldenhof M, Arany A, Moreau Y, Simm J (2020) Chemgrapher: optical graph recognition of chemical compounds by deep learning. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.0c00459
  382. Dong J, Yao ZJ, Zhu MF et al (2017) ChemSAR: An online pipelining platform for molecular SAR modeling. J Cheminform. https://doi.org/10.1186/s13321-017-0215-1
  383. Buyukbingol E, Sisman A, Akyildiz M et al (2007) Adaptive neuro-fuzzy inference system (ANFIS): a new approach to predictive modeling in QSAR applications: a study of neuro-fuzzy modeling of PCP-based NMDA receptor antagonists. Bioorg Med Chem 15:4265–4282. https://doi.org/10.1016/j.bmc.2007.03.065
  384. Jiang HJ, Huang YA, You ZH (2019) Predicting drug-disease associations via using Gaussian interaction profile and kernelbased autoencoder. Biomed Res Int. https://doi.org/10.1155/2019/2426958
  385. Wang YY, Cui C, Qi L et al (2019) DrPOCS: drug repositioning based on projection onto convex sets. IEEE/ACM Trans Comput Biol Bioinforma. https://doi.org/10.1109/TCBB.2018.2830384
  386. Xuan P, Cui H, Shen T et al (2019) HeteroDualNet: a dual convolutional neural network with heterogeneous layers for drugdisease association prediction via chou’s five-step rule. Front Pharmacol. https://doi.org/10.3389/fphar.2019.01301
  387. Sadeghi SS, Keyvanpour M (2019) RCDR: A Recommender Based Method for Computational Drug Repurposing. In: 2019 IEEE 5th Conference on Knowledge Based Engineering and Innovation, KBEI 2019
  388. Zhu Q, Luo J, Ding P, Xiao Q (2018) GRTR: Drug-disease association prediction based on graph regularized transductive regression on heterogeneous network. In: Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
  389. Jiang HJ, Huang YA, You ZH (2020) SAEROF: an ensemble approach for large-scale drug-disease association prediction by incorporating rotation forest and sparse autoencoder deep neural network. Sci Rep. https://doi.org/10.1038/s41598-020-61616-9
  390. Wang MN, You ZH, Li LP, et al (2020) WGMFDDA: A Novel Weighted-Based Graph Regularized Matrix Factorization for Predicting Drug-Disease Associations. In: Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics),
  391. Liu H, Zhang W, Song Y et al (2020) HNet-DNN: inferring new drug-disease associations with deep neural network based on heterogeneous network features. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.9b01008
  392. Lee I, Keum J, Nam H (2019) DeepConv-DTI: prediction of drug-target interactions via deep learning with convolution on protein sequences. PLoS Comput Biol. https://doi.org/10.1371/journal.pcbi.1007129
  393. Abdel-Basset M, Hawash H, Elhoseny M et al (2020) DeepHDTA: deep learning for predicting drug-target interactions: a case study of COVID-19 drug repurposing. IEEE Access. https://doi.org/10.1109/access.2020.3024238
  394. Yang J, He S, Zhang Z, Bo X (2020) NegStacking: drug-target interaction prediction based on ensemble learning and logistic regression. IEEE/ACM Trans Comput Biol Bioinforma. https://doi.org/10.1109/TCBB.2020.2968025
  395. King MD, Long T, Pfalmer DL et al (2018) SPIDR: small-molecule peptide-influenced drug repurposing. BMC Bioinformatics. https://doi.org/10.1186/s12859-018-2153-y
  396. Huang K, Fu T, Glass LM et al (2020) DeepPurpose: a deep learning library for drug–target interaction prediction. Bioinformatics. https://doi.org/10.1093/bioinformatics/btaa1005
  397. Chu Y, Kaushik AC, Wang X et al (2019) DTI-CDF: a cascade deep forest model towards the prediction of drug-target interactions based on hybrid features. Brief Bioinform. https://doi.org/10.1093/bib/bbz152
  398. Shar PA, Tao W, Gao S et al (2016) Pred-binding: large-scale protein–ligand binding affinity prediction. J Enzyme Inhib Med Chem 31:1443–1450. https://doi.org/10.3109/14756366.2016.1144594
  399. Capuzzi SJ, Kim ISJ, Lam WI et al (2017) Chembench: a publicly accessible, integrated cheminformatics portal. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.6b00462
  400. Pires DEV, Blundell TL, Ascher DB (2016) MCSM-lig: quantifying the effects of mutations on protein-small molecule affinity in genetic disease and emergence of drug resistance. Sci Rep. https://doi.org/10.1038/srep29575
  401. Pires DEV, Ascher DB (2016) CSM-lig: a web server for assessing and comparing protein-small molecule affinities. Nucleic Acids Res. https://doi.org/10.1093/nar/gkw390
  402. Pires DEV, Ascher DB (2016) mCSM-AB: a web server for predicting antibody-antigen affinity changes upon mutation with graph-based signatures. Nucleic Acids Res. https://doi.org/10.1093/nar/gkw458
  403. Kaminskas LM, Pires DEV, Ascher DB (2019) dendPoint: a web resource for dendrimer pharmacokinetics investigation and prediction. Sci Rep. https://doi.org/10.1038/s41598-019-51789-3
  404. Patel RD, Prasanth Kumar S, Pandya HA, Solanki HA (2018) MDCKpred: a web-tool to calculate MDCK permeability coefficient of small molecule using membrane-interaction chemical features. Toxicol Mech Methods. https://doi.org/10.1080/15376516.2018.1499840
  405. Montanari F, Knasmüller B, Kohlbacher S et al (2020) Vienna LiverTox workspace—a set of machine learning models for prediction of interactions profiles of small molecules with transporters relevant for regulatory agencies. Front Chem. https://doi.org/10.3389/fchem.2019.00899
  406. Kochev N, Avramova S, Jeliazkova N (2018) Ambit-SMIRKS: a software module for reaction representation, reaction search and structure transformation. J Cheminform. https://doi.org/10.1186/s13321-018-0295-6
  407. Hornig M, Klamt A (2005) COSMOfrag: a novel tool for highthroughput ADME property prediction and similarity screening based on quantum chemistry. J Chem Inf Model. https://doi.org/10.1021/ci0501948
  408. Hassan-Harrirou H, Zhang C, Lemmin T (2020) RosENet: improving binding affinity prediction by leveraging molecular mechanics energies with an ensemble of 3D convolutional neural networks. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.0c00075
  409. Rifaioglu AS, Cetin Atalay R, Cansen Kahraman D et al (2020) MDeePred: novel multi-channel protein featurization for deep learning-based binding affinity prediction in drug discovery. Bioinformatics. https://doi.org/10.1093/bioinformatics/btaa858
  410. Banerjee P, Eckert AO, Schrey AK, Preissner R (2018) ProTox-II: a webserver for the prediction of toxicity of chemicals. Nucleic Acids Res. https://doi.org/10.1093/nar/gky318
  411. Dong J, Wang NN, Yao ZJ et al (2018) Admetlab: a platform for systematic ADMET evaluation based on a comprehensively collected ADMET database. J Cheminform. https://doi.org/10.1186/s13321-018-0283-x
  412. Maunz A, Gütlein M, Rautenberg M et al (2013) Lazar: a modular predictive toxicology framework. Front Pharmacol. https://doi.org/10.3389/fphar.2013.00038
  413. Yao ZJ, Dong J, Che YJ et al (2016) TargetNet: a web service for predicting potential drug–target interaction profiling via multitarget SAR models. J Comput Aided Mol Des. https://doi.org/10.1007/s10822-016-9915-2
  414. Meng C, Hu Y, Zhang Y, Guo F (2020) PSBP-SVM: a machine learning-based computational identifier for predicting polystyrene binding peptides. Front Bioeng Biotechnol. https://doi.org/10.3389/fbioe.2020.00245
  415. Shen C, Luo J, Ouyang W et al (2020) IDDkin: network-based influence deep diffusion model for enhancing prediction of kinase inhibitors. Bioinformatics. https://doi.org/10.1093/bioinformatics/btaa1058
  416. Jewison T, Su Y, Disfany FM et al (2014) SMPDB 2.0: big improvements to the small molecule pathway database. Nucleic Acids Res. https://doi.org/10.1093/nar/gkt1067
  417. Dalabira E, Viennas E, Daki E et al (2014) DruGeVar: an online resource triangulating drugs with genes and genomic biomarkers for clinical pharmacogenomics. Public Health Genom. https://doi.org/10.1159/000365895
  418. Verma J, Luo H, Hu J, Zhang P (2017) DrugPathSeeker: Interactive UI for exploring drug-ADR relation via pathways. In: IEEE Pacific Visualization Symposium
  419. Jarada T, Rokne J, Alhajj R (2021) SNF-NN: Computational Method To Predict Drug-Disease Interactions Using Similarity Network Fusion and Neural Networks. Res Sq. https://doi.org/10.21203/rs.3.rs-56433/v1
  420. Cao X, Fan R, Zeng W (2020) DeepDrug: a general graphbased deep learning framework for drug relation prediction. biorxiv. https://doi.org/10.1101/2020.11.09.375626
  421. Hartenfeller M, Schneider G (2011) Enabling future drug discovery by de novo design. Wiley Interdiscip Rev Comput Mol Sci 1:742–759. https://doi.org/10.1002/wcms.49
  422. Schneider P, Schneider G (2016) De Novo design at the edge of chaos. J Med Chem 59:4077–4086. https://doi.org/10.1021/acs.jmedchem.5b01849
  423. Lavecchia A (2015) Machine-learning approaches in drug discovery: methods and applications. Drug Discov Today 20(3):318–331. https://doi.org/10.1016/j.drudis.2014.10.012
  424. Vyas V, Jain A, Jain A, Gupta A (2008) Virtual screening: a fast tool for drug design. Sci Pharm 76(3):333–360. https://doi.org/10.3797/scipharm.0803-03
  425. Ertl P, Schuffenhauer A (2009) Estimation of synthetic accessibility score of drug-like molecules based on molecular complexity and fragment contributions. J Cheminform 1:1–11. https://doi.org/10.1186/1758-2946-1-8
  426. Blaschke T, Olivecrona M, Engkvist O et al (2018) Application of generative autoencoder in De novo molecular design. Mol Inform 37:1–11. https://doi.org/10.1002/minf.201700123
  427. Jaakkola TS, Haussler D (1999) Exploiting generative models in discriminative classifiers. In: Advances in Neural Information Processing Systems
  428. Kadurin A, Aliper A, Kazennov A et al (2017) The cornucopia of meaningful leads: applying deep adversarial autoencoders for new molecule development in oncology. Oncotarget 8:10883–10890. https://doi.org/10.18632/oncotarget.14073
  429. Müller AT, Hiss JA, Schneider G (2018) Recurrent neural network model for constructive peptide design. J Chem Inf Model 58:472–479. https://doi.org/10.1021/acs.jcim.7b00414
  430. Olivecrona M, Blaschke T, Engkvist O, Chen H (2017) Molecular de-novo design through deep reinforcement learning. J Cheminform 9:1–14. https://doi.org/10.1186/s13321-017-0235-x
  431. Merk D, Friedrich L, Grisoni F, Schneider G (2018) De novo design of bioactive small molecules by artificial intelligence. Mol Inform 37:3–6. https://doi.org/10.1002/minf.201700153
  432. Sarkar D (2018) A comprehensive hands-on guide to transfer learning with real-world applications in deep learning. Medium
  433. Li X, Fourches D (2020) Inductive transfer learning for molecular activity prediction: next-gen QSAR models with MolPMoFiT. J Cheminform. https://doi.org/10.1186/s13321-020-00430-x
  434. Engkvist O, Norrby PO, Selmi N et al (2018) Computational prediction of chemical reactions: current status and outlook. Drug Discov Today 23:1203–1218. https://doi.org/10.1016/j.drudis.2018.02.014
  435. Hessler G, Baringhaus KH (2018) Artificial intelligence in drug design. Molecules. https://doi.org/10.3390/molecules23102520
  436. Domenico A, Nicola G, Daniela T et al (2020) De novo drug design of targeted chemical libraries based on artificial intelligence and pair-based multiobjective optimization. J Chem Inf Model 60:4582–4593. https://doi.org/10.1021/acs.jcim.0c00517
  437. Ekins S, Puhl AC, Zorn KM et al (2019) Exploiting machine learning for end-to-end drug discovery and development. Nat Mater 18:435–441. https://doi.org/10.1038/s41563-019-0338-z
  438. Pushpakom S, Iorio F, Eyers PA et al (2018) Drug repurposing: progress, challenges and recommendations. Nat Rev Drug Discov 18(1):41–58. https://doi.org/10.1038/nrd.2018.168
  439. Kubick N, Pajares M, Enache I et al (2020) Repurposing Zileuton as a depression drug using an AI and in vitro approach. Molecules. https://doi.org/10.3390/molecules25092155
  440. Yuan Y, Pei J, Lai L (2020) LigBuilder V3: a multi-target de novo drug design approach. Front Chem 8:1–18. https://doi.org/10.3389/fchem.2020.00142
  441. Wei L, Wen W, Rao L et al (2020) Cov_FB3D: a de novo covalent drug design protocol integrating the Ba-SAMP strategy and machine-learning-based synthetic tractability evaluation. J Chem Inf Model 60:4388–4402. https://doi.org/10.1021/acs.jcim.9b01197
  442. Jiménez-Luna J, Grisoni F, Schneider G (2020) Drug discovery with explainable artificial intelligence. Nat Mach Intell 2:573–584. https://doi.org/10.1038/s42256-020-00236-4
  443. Cavasotto CN, Di Filippo JI (2021) Artificial intelligence in the early stages of drug discovery. Arch Biochem Biophys 698:108730. https://doi.org/10.1016/j.abb.2020.108730
  444. Wong CH, Siah KW, Lo AW (2019) Estimation of clinical trial success rates and related parameters. Biostatistics 20:273–286. https://doi.org/10.1093/biostatistics/kxx069
  445. DiMasi JA, Grabowski HG, Hansen RW (2016) Innovation in the pharmaceutical industry: new estimates of R&D costs. J Health Econ 47:20–33. https://doi.org/10.1016/j.jhealeco.2016.01.012
  446. Ruddigkeit L, Van Deursen R, Blum LC, Reymond JL (2012) Enumeration of 166 billion organic small molecules in the chemical universe database GDB-17. J Chem Inf Model 52:2864–2875. https://doi.org/10.1021/ci300415d
  447. Mohs RC, Greig NH (2017) Drug discovery and development: role of basic biological research. Alzheimer’s Dement Transl Res Clin Interv 3(4):651–657. https://doi.org/10.1016/2Fj.trci.2017.10.005
  448. Vamathevan J, Clark D, Czodrowski P et al (2019) Applications of machine learning in drug discovery and development. Nat Rev Drug Discov 18(6):463–477. https://doi.org/10.1038/s41573-019-0024-5
  449. Niel O, Bastard P (2019) Artificial intelligence in nephrology: core concepts, clinical applications, and perspectives. Am J Kidney Dis. https://doi.org/10.1053/j.ajkd.2019.05.020
  450. Ahuja AS (2019) The impact of artificial intelligence in medicine on the future role of the physician. PeerJ. https://doi.org/10.7717/peerj.7702
  451. Rubin EH, Gilliland DG (2012) Drug development and clinical trials-the path to an approved cancer drug. Nat Rev Clin Oncol 9:215–222. https://doi.org/10.1038/nrclinonc.2012.22
  452. Rautio J, Kumpulainen H, Heimbach T et al (2008) Prodrugs: design and clinical applications. Nat Rev Drug Discov 7(3):255–270. https://doi.org/10.1038/nrd2468
  453. Harrer S, Shah P, Antony B, Hu J (2019) Artificial intelligence for clinical trial design. Trends Pharmacol Sci 40:577–591. https://doi.org/10.1016/j.tips.2019.05.005
  454. Fogel DB (2018) Factors associated with clinical trials that fail and opportunities for improving the likelihood of success: a review. Contemp Clin Trials Commun 11:156–164. https://doi.org/10.1016/2Fj.conctc.2018.08.001
  455. Toh TS, Dondelinger F, Wang D (2019) Looking beyond the hype: applied AI and machine learning in translational medicine. EBioMedicine 47:607–615. https://doi.org/10.1016/j.ebiom.2019.08.027
  456. Qi Y (2019) Predicting phase 3 clinical trial results by modeling phase 2 clinical trial subject level data using deep learning. Proc Mach Learn Res 106:1–14
  457. Viceconti M, Henney A, Morley-Fletcher E (2016) In silico clinical trials: how computer simulation will transform the biomedical industry. Int J Clin Trials. https://doi.org/10.18203/2349-3259.ijct20161408
  458. Magalingam KB, Radhakrishnan A, Ping NS, Haleagrahara N (2018) Current concepts of neurodegenerative mechanisms in Alzheimer’s disease. Biomed Res Int. https://doi.org/10.1155/2018/3740461
  459. Hussain R, Zubair H, Pursell S, Shahab M (2018) Neurodegenerative diseases: regenerative mechanisms and novel therapeutic approaches. Brain Sci. https://doi.org/10.3390/brainsci8090177
  460. Levenson RW, Sturm VE, Haase CM (2014) Emotional and behavioral symptoms in neurodegenerative disease: a model for studying the neural bases of psychopathology. Annu Rev Clin Psychol 10:581–606. https://doi.org/10.1146/annurev-clinpsy-032813-153653
  461. Gitler AD, Dhillon P, Shorter J (2017) Neurodegenerative disease: Models, mechanisms, and a new hope. DMM Dis Model Mech 10:499–502. https://doi.org/10.1242/dmm.030205
  462. Mak KK, Pichika MR (2019) Artificial intelligence in drug development: present status and future prospects. Drug Discov Today 24(3):773–780. https://doi.org/10.1016/j.drudis.2018.11.014
  463. Peng J, Guan J, Shang X (2019) Predicting Parkinson’s disease genes based on node2vec and autoencoder. Front Genet 10:1–6. https://doi.org/10.3389/fgene.2019.00226
  464. Thomas SN, Funk KE, Wan Y et al (2012) Dual modification of Alzheimer’s disease PHF-tau protein by lysine methylation and ubiquitylation: a mass spectrometry approach. Acta Neuropathol. https://doi.org/10.1007/s00401-011-0893-0
  465. Yousefian-Jazi A, Sung MK, Lee T et al (2020) Functional finemapping of noncoding risk variants in amyotrophic lateral sclerosis utilizing convolutional neural network. Sci Rep 10:1–12. https://doi.org/10.1038/s41598-020-69790-6
  466. Gupta R, Ambasta RK, Kumar P (2020) Identification of novel class I and class IIb histone deacetylase inhibitor for Alzheimer’s disease therapeutics. Life Sci. https://doi.org/10.1016/j.lfs.2020.117912
  467. Jamal S, Grover A, Grover S (2019) Machine learning from molecular dynamics trajectories to predict caspase-8 Inhibitors against Alzheimer’s disease. Front Pharmacol 10:1–13. https://doi.org/10.3389/fphar.2019.00780
  468. Chen HY, Chen JQ, Li JY et al (2019) Deep learning and random forest approach for finding the optimal traditional Chinese medicine formula for treatment of Alzheimer’s Disease. J Chem Inf Model 59:1605–1623. https://doi.org/10.1021/acs.jcim.9b00041
  469. Ponzoni I, Sebastián-Pérez V, Martínez MJ et al (2019) QSAR Classification models for predicting the activity of inhibitors of beta-secretase (BACE1) associated with Alzheimer’s disease. Sci Rep 9:1–13. https://doi.org/10.1038/s41598-019-45522-3
  470. Kaiser TM, Dentmon ZW, Dalloul CE et al (2020) Accelerated discovery of novel Ponatinib Analogs with improved properties for the treatment of Parkinson’s disease. ACS Med Chem Lett 11:491–496. https://doi.org/10.1021/acsmedchemlett.9b00612
  471. Shao YM, Ma X, Paira P et al (2018) Discovery of indolylpiperazinylpyrimidines with dual-target profiles at adenosine A2A and dopamine D2 receptors for Parkinson’s disease treatment. PLoS ONE 13:1–27. https://doi.org/10.1371/journal.pone.0188212
  472. Chen ZD, Zhao L, Chen HY et al (2020) A novel artificial intelligence protocol to investigate potential leads for Parkinson’s disease. RSC Adv 10:22939–22958. https://doi.org/10.1039/d0ra04028b
  473. Deng L, Zhong W, Zhao L et al (2020) Artificial intelligencebased application to explore inhibitors of neurodegenerative diseases. Front Neurorobot. https://doi.org/10.3389/fnbot.2020.617327
  474. Oh M, Ahn J, Yoon Y (2014) A network-based classification model for deriving novel drug-disease associations and assessing their molecular actions. PLoS ONE 9:1–12. https://doi.org/10.1371/journal.pone.0111668
  475. Zhu Y, Jung W, Wang F, Che C (2020) Drug repurposing against Parkinson’s disease by text mining the scientific literature. Libr Hi Tech 38:741–750. https://doi.org/10.1108/LHT-08-2019-0170
  476. Vatansever S, Schlessinger A, Wacker D, et al (2020) Artificial intelligence and machine learning-aided drug discovery in central nervous system diseases: state-of-the-arts and future directions. Med Res Rev Online ahead of print
  477. Stokes JM, Yang K, Swanson K et al (2020) A deep learning approach to antibiotic discovery. Cell. https://doi.org/10.1016/j.cell.2020.01.021
  478. Mamoshina P, Vieira A, Putin E, Zhavoronkov A (2016) Applications of deep learning in biomedicine. Mol Pharm 13(5):1445–1454. https://doi.org/10.1021/acs.molpharmaceut.5b00982
  479. Preuer K, Klambauer G, Rippmann F, et al (2019) Interpretable deep learning in drug discovery. In: Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
  480. Ramsundar B, Liu B, Wu Z et al (2017) Is multitask deep learning practical for pharma? J Chem Inf Model. https://doi.org/10.1021/acs.jcim.7b00146
  481. Grace K, Salvatier J, Dafoe A, et al (2017) When Will AI Exceed Human Performance? evidence from AI experts. J Artif Intell Res 62:1–48 https://arxiv.org/abs/1705.08807
  482. Altae-Tran H, Ramsundar B, Pappu AS, Pande V (2017) Low data drug discovery with one-shot learning. ACS Cent Sci 3:283–293. https://doi.org/10.1021/acscentsci.6b00367
微信掃一掃加客服

微信掃一掃加客服

點擊啓動AI問答
Draggable Icon