圖一|二維勢能面上的反應(yīng)物(R),過渡態(tài)(TS),產(chǎn)物(P),以及最小能量路徑(minimal energy pathway)
近日,深度原理 Deep Principle聯(lián)合佐治亞理工大學(xué),康奈爾大學(xué)等機構(gòu)聯(lián)合提出了一種革新性的過渡態(tài)檢索方法--React-OT,采用最優(yōu)傳輸(Optimal Transport, OT)的方法,從反應(yīng)物和產(chǎn)物的結(jié)構(gòu)插值開始,推導(dǎo)出高度精確的過渡態(tài)結(jié)構(gòu),相關(guān)成果已作為封面文章發(fā)表在 Nature Machine Intelligence 上,同時MIT News也對文章的第一兼通訊作者,深度原理 Deep Principle的創(chuàng)始人兼CTO段辰儒博士進行了專訪報道。
本文將帶你深入了解 React-OT 的核心原理、與傳統(tǒng)方法的對比,以及它如何突破計算化學(xué)的瓶頸,大幅提升 TS 搜索的效率與精度,為反應(yīng)機理研究和催化劑設(shè)計提供全新工具。
一、方法創(chuàng)新
OA-ReactDiff是深度原理 Deep Principle于2023年推出的首個生成3D化學(xué)反應(yīng)的擴散生成模型,這項成果已在Nature大子刊Nature Computational Science上發(fā)表,并被選為封面論文。OA-ReactDiff僅依賴反應(yīng)物和產(chǎn)物的3D幾何形狀即可生成過渡態(tài)結(jié)構(gòu),比傳統(tǒng)量化方法預(yù)測過渡態(tài)速度提升1000倍。但是由于擴散模型采樣過程中的隨機性,OA-ReactDiff生成的過渡態(tài)也是隨機的,往往需要多次采樣才能獲得理想的過渡態(tài)結(jié)構(gòu)。
作為OA-ReactDiff的迭代升級版本,React-OT在OA-ReactDiff的基礎(chǔ)上,針對給定的反應(yīng)物和生成物(雙端搜索)進行了改進,基于最優(yōu)傳輸理論,通過流匹配方法,從反應(yīng)物和產(chǎn)物直接推導(dǎo)TS結(jié)構(gòu),單次采樣即可生成確定性的TS結(jié)構(gòu)。
最優(yōu)傳輸是一種數(shù)學(xué)理論和計算方法,用于描述兩個概率分布之間的距離或者對應(yīng)關(guān)系。它的核心概念是如何以最佳方式將一組資源(如質(zhì)量、能量等)從一個位置傳輸?shù)搅硪粋€位置。類比初中學(xué)習(xí)的線性規(guī)劃問題:三個城市(A, B, C)分別有1、0.5、1.5噸煤,另外有兩個城市(D, E)分別需要2、1噸煤,由于不同城市之間的運輸成本不同,城市需求也不同,需要制定策略給出最優(yōu)運輸路線,這些“最優(yōu)路線”在化學(xué)反應(yīng)中就代表了最合理化學(xué)反應(yīng)路徑以其對應(yīng)的過渡態(tài)結(jié)構(gòu)。
1. 初始過渡態(tài)結(jié)構(gòu):OA-ReactDiff從高斯噪音中隨機采樣,所以生成的過渡態(tài)也存在隨機性。React-OT則是從反應(yīng)物和產(chǎn)物的線性插值出發(fā),并且通過平移旋轉(zhuǎn)等操作確保初始結(jié)構(gòu)的等變性和唯一性,獲得相對合理的初始猜測,將采樣路徑推向更接近最優(yōu)傳輸?shù)姆较颉?/span>
2. 采樣過程:OA-ReactDiff采用擴散模型,過渡態(tài)生成是一個隨機采樣過程。而React-OT將采樣過程模擬為常微分方程,而不是擴散模型中的隨機微分方程,將反應(yīng)物、產(chǎn)物和過渡態(tài)的聯(lián)合分布視為動態(tài)傳輸問題,通過流匹配(flow matching)方法,直接從反應(yīng)物和產(chǎn)物推導(dǎo)TS結(jié)構(gòu),不再需要多次隨機采樣。
3. 更大數(shù)據(jù)集的預(yù)訓(xùn)練:使用RGD1-xTB 數(shù)據(jù)集對React-OT進行預(yù)訓(xùn)練,然后再在Transition 1x數(shù)據(jù)集上進行模型的微調(diào),RGD1-xTB包含95萬個基于 GFN2-xTB 計算的化學(xué)反應(yīng),對比訓(xùn)練OA-ReactDiff使用的Transition1x 數(shù)據(jù)集(1 萬個反應(yīng)),RGD1-xTB的數(shù)據(jù)量大幅增加,可為 React-OT 提供更廣泛的化學(xué)環(huán)境和結(jié)構(gòu)信息。
圖二 | 擴散模型和最佳傳輸模型生成TS結(jié)構(gòu)的工作概述(左)OA-ReactDiff的隨機推理過程。(右)React-OT的確定性推理過程
二、結(jié)果一覽
在使用Transition 1x訓(xùn)練React-OT之前,先在RGD1-xTB 數(shù)據(jù)集上對 React-OT進行了預(yù)訓(xùn)練,預(yù)訓(xùn)練后,React-OT在TS預(yù)測精度上實現(xiàn)了顯著提升:生成結(jié)構(gòu)的 RMSD 中位數(shù)和勢壘高度誤差降低 25%以上,相比未預(yù)訓(xùn)練模型精度提升顯著。除了精度的提升之外,搜索過渡態(tài)所需運行時間也顯著減少。OA-ReactDiff在單張GPU上需6秒完成過渡態(tài)搜索,而React-OT的采樣過程消除了隨機性,只要0.4秒就可以得到正確的TS結(jié)構(gòu)。對比OA-ReactDiff,React-OT能適應(yīng)更復(fù)雜的化學(xué)反應(yīng)類型,對未見過反應(yīng)的預(yù)測能力也要更好。
圖三 | React-OT和OA-ReactDiff模型在生成過渡態(tài)的精度和速度方面的性能對比 a. React-OT得到滿足特定RMSD要求的TS結(jié)構(gòu)的可能性高于兩種擴散模型。b. OA-ReactDiff和React-OT生成過渡態(tài)的質(zhì)量。c. 兩種模型預(yù)測效果的對比。d. 運行速度的比較。
在經(jīng)過 RGD1-xTB 預(yù)訓(xùn)練后,React-OT顯著提升了對未見反應(yīng)類型的適應(yīng)性和預(yù)測能力,即使在12 個非氫原子的復(fù)雜反應(yīng)體系中,仍能準確生成TS結(jié)構(gòu),具備應(yīng)對多步有機反應(yīng)的能力。為了探索React-OT在反應(yīng)網(wǎng)絡(luò)探索中的實際應(yīng)用,這篇文章選擇γ-酮過氧化氫(KHP)作為研究對象。KHP 是一個備受關(guān)注的反應(yīng)體系,近年來被廣泛用于基準測試。
圖四| KHP的反應(yīng)網(wǎng)絡(luò) 其中紅色/黑色的數(shù)字分別為DFT計算/React-OT生成的過渡態(tài)上計算得到的活化能
可以看到,React-OT生成的反應(yīng)網(wǎng)絡(luò)與文獻記載的KHP反應(yīng)節(jié)點完全一致,表明其能夠準確捕捉所有關(guān)鍵反應(yīng),且兩者的平均絕對能量差僅為 3.84 kcal/mol。這一案例研究展示了 React-OT 在加速反應(yīng)網(wǎng)絡(luò)探索中的應(yīng)用潛力。
三、應(yīng)用展望
段辰儒表示,“人類眨眼的平均時間是0.4秒。在這個時間內(nèi)React-OT就可以精準的找到一個化學(xué)反應(yīng)的過渡態(tài),這在之前是不可想象的。極致的加速會產(chǎn)生行為模式的質(zhì)變,React-OT將改變我們對化學(xué)反應(yīng)的理解和探索新材料的方式?!?/span>
?催化劑設(shè)計:快速篩選高活性反應(yīng)路徑,加速清潔能源催化劑開發(fā)。
?藥物合成:精準預(yù)測有機反應(yīng)能壘,優(yōu)化合成路線,降低實驗成本。
?材料探索:構(gòu)建超大型反應(yīng)網(wǎng)絡(luò),發(fā)現(xiàn)新型功能材料(如MOFs、鈣鈦礦)。
未來已來
React-OT標(biāo)志著化學(xué)反應(yīng)TS搜索進入高效、精準的新紀元,有望成為計算化學(xué)領(lǐng)域的重要工具。歡迎關(guān)注深度原理 Deep Principle團隊,探索更多前沿研究!
拓展閱讀:Bohrium Notebook
如果對生成式模型感興趣,想進一步了解React-OT,復(fù)制下方鏈接,打開 Notebook:
https://bohrium.dp.tech/notebooks/47742251216
也可以通過Bohrium App或者深度原理 Deep Principle(DeepPrinciple)官方使用鏈接直接試用模型生成你想要的過渡態(tài):
https://bohrium.dp.tech/apps/bohriumweb/job?type=app
深度原理 Deep Principle(DeepPrinciple)官方使用鏈接:http://reactot-dev.deepprinciple.com
聲明:化學(xué)加刊發(fā)或者轉(zhuǎn)載此文只是出于傳遞、分享更多信息之目的,并不意味認同其觀點或證實其描述。若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益,請作者持權(quán)屬證明與本網(wǎng)聯(lián)系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@m.yqxsz.com