近日,來自瑞士洛桑聯邦理工學院(EPFL)的科學家們建立了一個名為ShiftML的機器學習程序,用來預測分子中的原子在磁場中的移動狀況。這項研究發(fā)表在了《Nature Communications》上,表明AI可以幫助化學家們用比傳統(tǒng)建模方法更快的方式,來破解晶體的分子結構。
如今的許多藥物都是以粉末狀固體的形式生產出來的。但是,要想充分了解藥物中的活性成分進入體內之后會如何表現,科學家們需要知道它們的確切原子結構,通常會采用核磁共振和密度泛函理論相結合的技術。
核磁共振技術通常用于探測原子之間的磁場,并確定相鄰原子之間是如何相互作用的。然而,通過核磁共振測定完整的晶體結構,需要極其復雜且非常耗時的量子化學計算,這對于結構非常復雜的分子而言難度非常大,同時需要配合密度泛函理論(DFT)技術來進行計算工作。DFT技術使用復雜的量子化學計算來映射特定區(qū)域內的電子密度,這個過程中需要進行非常大量的計算。
為了優(yōu)化這個過程,研究人員開發(fā)出了一個名為ShiftML的機器學習工具,可以用更快的速度來完成計算工作,并且在某些情況下可以像DFT程序一樣準確地執(zhí)行。研究人員利用來自Cambridge Structural Database的數據對ShiftML進行了訓練,其中2000個化合物結構用于對ShiftML的訓練和驗證,另外500個用于對其進行測試。該數據庫包含數千種化合物計算得出的DFT化學位移,其中每一個化合物都由不到200個原子組成。研究人員表示,即使對于相對簡單的分子,ShiftML的計算速度也比現有的方法快了將近1萬倍。
對于更加復雜的化合物,這一優(yōu)勢將會更加明顯。舉例來說,ShiftML對一個分子的化學位移進行計算,這個分子由86個原子構成,其化學元素和可 卡 因相同,但排列成了不同的晶體結構。整個計算過程花費的CPU時間不到一分鐘。相比之下,使用DFT技術計算同樣一個分子的化學位移,需要的CPU時間大約為62至150小時。
研究小組希望未來的ShiftML可以用來輔助藥物設計工作。“這項研究是非常令人興奮的,因為大幅度加速計算時間可以讓我們能夠覆蓋更大的構象空間,并準確界定那些以前無法確定的結構,”研究論文的共同作者之一、EPFL的化學教授Lyndon Emsley博士表示:“ShiftML可以讓現代的大多數復雜藥物分子觸手可及。”
如今,ShiftML已經可以開源使用,任何人都可以在平臺上上傳分子,并獲得其核磁共振特征。
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com