九九久久精品免费观看,蜜臀av午夜福利在线,后入内射无码人妻一区,六月婷婷精品视频在线观看,一区二区三区婷婷中文字幕,51精品免费视频国产专区,JIZZJIZZ国产,国产极品女主播国产区,亚洲一区二区三区国产精品 ,免费一看一级毛片

歡迎來到-化學加-六摩爾!客服熱線:186-7688-2001

“幾何構象增強AI算法”,百度生物計算最新研究成果登上《Nature》子刊

來源:飛槳PaddlePaddle      2022-02-24
導讀:近日,百度在國際頂級期刊《Nature》旗下子刊《Nature Machine Intelligence》(Impact score 16.65)上發(fā)表了AI+生物計算的最新研究成果《Geometry Enhanced Molecular Representation Learning for Property Prediction》,提出“基于空間結構的化合物表征學習方法”,即“幾何構象增強AI算法”(Geometry Enhanced Molecular Representation Learning,GEM模型),揭示了一種基于三維空間結構信息的化合物建模方法,以及在藥物研發(fā)中的應用。

image.png

近日,百度在國際頂級期刊《Nature》旗下子刊《Nature Machine Intelligence》(Impact score 16.65)上發(fā)表了AI+生物計算的最新研究成果《Geometry Enhanced Molecular Representation Learning for Property Prediction》,提出“基于空間結構的化合物表征學習方法”,即“幾何構象增強AI算法”(Geometry Enhanced Molecular Representation Learning,GEM模型),揭示了一種基于三維空間結構信息的化合物建模方法,以及在藥物研發(fā)中的應用。


論文鏈接:
https://www.nature.com/articles/s42256-021-00438-4 

公開資料顯示,《Machine Intelligence》是《Nature》旗下專注于機器學習領域的頂級期刊,過去兩年該期刊的影響因子已超過16。在該項研究中,百度螺旋槳PaddleHelix團隊首次將化合物的幾何結構信息引入自監(jiān)督學習和分子表示模型,并在下游十多項的屬性預測任務中取得SOTA,成為百度在AI賦能藥物研發(fā)領域?qū)ν夤_的又一項重磅成果。


藥研領域求變,AI+生物計算成最佳選擇

眾所周知,藥物研發(fā)的成本高、周期長、風險高。據(jù)美國塔夫茨大學2014年的研究,新藥進入市場的平均成本約為26億美元,從首次合成到進入臨床試驗的平均耗時為31.2個月,從一期臨床到上市長達96.8個月。另一方面,隨著全球邁入老齡化社會,對新藥的需求也在逐年增加,到2024年全球醫(yī)藥市場總規(guī)模將超過11萬億。與之相反,制藥公司每10億美元投資所獲得的上市新藥數(shù)量卻在逐年下降。如何通過新的技術手段,快速找到有潛力的候選藥物,降低進入臨床試驗失敗的風險,就成為藥物研發(fā)領域最亟需解決的問題。

在計算方法出現(xiàn)之前,藥物研發(fā)基本通過生物實驗的方法來尋找藥物,成本高昂且耗時長,隨著計算化學和計算生物學的發(fā)展,也有通過傳統(tǒng)機器學習方法輔助進行藥物設計的,但這些方法或多或少在效果和效率層面有不足,以小分子為例,要找到一個候選藥物,篩選(搜索)的數(shù)量級達到10的60次方,傳統(tǒng)計算方法很難高效完成。另一方面,隨著AI技術的發(fā)展和普及,藥物研發(fā)也逐漸進入到AI時代,天生擅長處理大數(shù)據(jù)的AI深度學習技術,就成為近年來大家關注的焦點,希望通過AI新技術提升藥物研發(fā)效率,減少后期失敗概率,降低藥物研發(fā)成本。

化合物的性質(zhì)預測的主要目的在于及時發(fā)現(xiàn)理化性質(zhì)不達標的化合物,以降低候選化合物進入臨床實驗失敗的風險,提升藥物研發(fā)的成功率。傳統(tǒng)的化合物性質(zhì)預測分析一般采取實驗方式,成本高昂且耗時長。業(yè)內(nèi)也有一些基于AI算法的工作,但大多是使用化合物的二維信息,沒有納入化合物的三維空間結構信息。而百度首次提出,將化合物的空間結構信息引入到化合物預訓練中,通過幾何增強的自監(jiān)督學習,對化合物分子進行表征,通過化合物的表征自主推斷出空間結構信息,進而預測化合物分子的性質(zhì)屬性,以輔助進行藥物研發(fā),提升效率,降低成本。

值得一提的是,該研究由百度螺旋槳PaddleHelix生物計算團隊獨立完成,并已經(jīng)在藥物研發(fā)領域,攜手合作伙伴在早期藥物研發(fā)管線中落地。

百度GEM模型加速藥物研發(fā)進程
很多的研究工作都證明了機器學習技術,特別是深度學習在化合物性質(zhì)預測方面的巨大潛力,這些工作使用序列(SMILES表達式)或是圖(原子為節(jié)點,化學鍵為邊)來表示化合物,用序列建?;蛘邎D神經(jīng)網(wǎng)絡(GNN)去預測化合物的屬性。有些研究直接把每個化合物看作一個圖,利用基于圖拓撲結構的自監(jiān)督學習方法進行分子表征,比如,遮蓋并還原化合物圖中的原子,化學鍵或子結構。但是,這些方法都只把化合物視為拓撲圖,沒有充分利用化合物的幾何結構信息。而化合物的幾何結構,即三維空間結構,對化合物的物理,化學,生物等性質(zhì)都起著關鍵性的作用,具有相同拓撲結構的兩個化合物的空間結構可能完全不同。另一方面,由于生物實驗復雜的操作和高昂的成本,化合物的標注數(shù)據(jù)十分稀少且珍貴。稀疏的數(shù)據(jù)讓深度神經(jīng)網(wǎng)絡極易過擬合,難以發(fā)揮強大的建模能力,如何從海量的無標注化合物中學習高質(zhì)量的化合物表征成為化合物建模和屬性預測的關鍵。

image.png

鑒于此,百度提出一種全新的基于空間結構的化合物建模方法——幾何構象增強AI算法GEM,并設計了多個幾何級別的自我監(jiān)督學習策略,用于學習化合物的空間結構知識,使得化合物的表征能自主推斷出空間結構信息。這項技術在十多個基準的化合物屬性預測數(shù)據(jù)集上均取得出色成績,并成功應用到候選化合物的ADMET成藥性預測任務上,取得良好收益。

解讀幾何構象增強AI算法GEM模型
幾何構象增強AI算法GEM模型包含兩個主要部分:基于空間結構的圖神經(jīng)網(wǎng)絡(a)和多個幾何級別的自監(jiān)督學習任務(b)。

image.png

圖1: GEM的整體框架

1. 基于空間結構的圖神經(jīng)網(wǎng)絡
由于化合物的集合結構可以完全被原子-化學鍵鍵長-鍵角確定。GEM提出了一種基于空間結構的圖網(wǎng)絡,同時對原子-化學鍵-鍵角的關系建模空間結構信息。每個化合物由兩個圖組成:原子-化學鍵的圖G和化學鍵-鍵角的圖H。類似于過往的工作,原子-化學鍵的圖G以原子作為圖的節(jié)點,化學鍵作為連接原子的邊。而化學鍵-鍵角的圖H則為首次引入,以化學鍵作為圖的節(jié)點,兩個化學鍵所形成的鍵角為圖的邊。圖神經(jīng)網(wǎng)絡包含多輪迭代,而化學鍵作為每一輪迭代中圖G和圖H的橋梁進行信息互通。最后一輪迭代的表征被用于化合物屬性預測。

2. 基于空間結構的自監(jiān)督學習
為了使模型更好學習到化學空間知識,GEM不單單只是將幾何信息作為輸入,更進一步地設計了基于幾何信息的學習任務(目標):預測化學鍵的長度;預測化學鍵組成的鍵角;預測兩兩原子之間的距離。其中,鍵長和鍵角描述化合物的局部結構,而兩兩原子之間的距離更關注化合物的全局結構。描述局部結構的自監(jiān)督學習任務隨機挑選化合物中以某個原子為中心的子圖并進行遮蓋,預測被遮蓋的子圖中的化學鍵的鍵長和化學鍵間形成的鍵角。描述全局結構的自監(jiān)督學習任務則預估原子距離矩陣中的元素。通過這些基于空間結構的自監(jiān)督學習任務,圖神經(jīng)網(wǎng)絡能夠有效推斷出化合物的空間信息,從而對化合物的表征帶來正向影響。

3. 實驗結果
GEM在14個化合物屬性的基準數(shù)據(jù)集中取得了最佳表現(xiàn),這些數(shù)據(jù)集都是目前學術界公認的化合物屬性預測數(shù)據(jù)集。例如,在毒性相關的數(shù)據(jù)集(tox21、toxcast)和HIV(艾滋病)病毒數(shù)據(jù)集上,GEM預測結果遠優(yōu)于其他baseline模型。總體而言,百度的GEM模型,在ESOL、FreeSolv等回歸任務上相對現(xiàn)在方法提升8.8%,在BACE、BBBP、SIDER等分類任務上相對提升4.7%。此外,在自監(jiān)督學習方法上的消融實驗也證明了基于空間結構的自監(jiān)督學習方法的有效性。

image.png

落地ADMET成藥性預測和藥物篩選等場景
幾何構象增強AI算法GEM,能很好的學習化合物的空間結構知識,自主推斷出空間結構信息,從而準確地預測候選化合物的ADMET性質(zhì)——吸收(Absorption)、分布(Distribution)、代謝(Metabolism)、排泄(Excretion)和毒性(Toxicity),幫助在藥物研發(fā)早期快速篩選潛在成功率更高的化合物。據(jù)了解,百度的該項研究已經(jīng)應用于藥物研發(fā)領域,在合作伙伴的早期藥物篩選管線中實現(xiàn)了商業(yè)化落地。

此外,幾何構象增強AI算法GEM還在藥物虛擬篩選和藥物聯(lián)用方面,也起到關鍵作用。藥物虛擬篩選是藥物研發(fā)的重要一環(huán),旨在通過從大規(guī)模的虛擬化合物庫中找到與目標靶點有強親和力的候選化合物。藥物聯(lián)用是通過預測兩個藥物在不同細胞系中的協(xié)同效用,以幫助找出給定藥物在某一細胞系內(nèi)中具有最佳協(xié)同作用。使得兩種有協(xié)同效用的藥物能夠在保證治療效果的同時,減少抗藥性的產(chǎn)生。并通過降低使用劑量提升藥物的安全性。

關于百度螺旋槳PaddleHelix
螺旋槳PaddleHelix是基于百度飛槳深度學習框架打造,面向新藥研發(fā)、疫苗設計、精準醫(yī)療等場景的生物計算平臺,為生物醫(yī)藥領域的研究者提供全面的AI+生物計算的模型工具和技術方案。目前,螺旋槳PaddleHelix平臺已開放多個模型,涵蓋分子生成、虛擬篩選、ADMET預測、蛋白/RNA結構預測、mRNA序列設計、雙藥聯(lián)用等方面。

image.png

除此之外,在PPI蛋白-蛋白相互作用,組學的表征和精準用藥等方面,螺旋槳PaddleHelix團隊也開展了相關的工作,并在多個國際競賽中取得佳績,相關研究成果也將陸續(xù)開放給大家體驗試用。未來,螺旋槳PaddleHelix生物計算平臺,還將繼續(xù)秉持開源開放的態(tài)度,繼續(xù)攜手合作伙伴賦能生物計算行業(yè),共建AI+生物計算的生態(tài)和服務。

基于空間結構的化合物表征學習方法GEM已通過螺旋槳PaddleHelix平臺對外開放,歡迎大家使用。
GitHub地址:
https://github.com/PaddlePaddle/PaddleHelix
平臺地址:
https://paddlehelix.baidu.com/
合作洽談:
baidubio_cooperate@baidu.com


聲明:化學加刊發(fā)或者轉載此文只是出于傳遞、分享更多信息之目的,并不意味認同其觀點或證實其描述。若有來源標注錯誤或侵犯了您的合法權益,請作者持權屬證明與本網(wǎng)聯(lián)系,我們將及時更正、刪除,謝謝。 電話:18676881059,郵箱:gongjian@m.yqxsz.com

亚州精品无码人妻久久| 中文字幕人妻丝袜成熟乱| 日韩av高清无码一区二区三区| 两个奶头被吃高潮视频| 4hc44四虎在线永久地址| 果冻传媒MV国产推荐视频| 激情综合色综合久久综合| 精品综合久久久久久97| 中文字幕在线视频不卡一区二区| 国产免费视频一区二区| 成人av午夜在线观看| 九九热视频在线免费观看| 啦啦啦视频在线观看免费播放高清 | 一本色道无码道dvd在线观看 | 国产一区精品综亚洲av| 精品亚洲女同一区二区| 久久这里只有精品好国产| 精品国产午夜理论片不卡精品 | 国外黄色大片久久久免费| 高清性欧美暴力猛交| 一级做a爰片在线播放| 欧美综合影院在线影院| 国产成人8x视频一区二区| 亚洲福利网址| 国产99精品久久| 日本在线视频网站www色下载| 久久精品久久精品亚洲国产av| 精品乱码一区二区三区四区| 极度性变态另类扩张| 亚洲爆乳WWW无码专区| 亚洲色欲色欲综合网站| 国产呦系列久久精品| 99国产精品永久免费视频| 国产午夜亚洲精品久久| 久久天天躁夜夜躁一区| 97日日碰曰曰摸日日澡| 好男人社区www在线官网| 九九久久精品免费观看| 蜜臀98精品国产免费观看| 花式道具play高h文调教| 国产精品三级中文字幕|