ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺

ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖1

ISV(  Independent Software Vendors,以下簡稱ISV)計劃是由北鯤云發(fā)起,秉承完全開放的生態(tài)策略,致力于與合作伙伴一起,為有高算力計算需求的用戶提供更多樣且更具價值的極致應(yīng)用,給北鯤云用戶帶來更多選擇及便利,也為合作伙伴提供平臺推廣服務(wù)及專業(yè)技術(shù)支持。我們希望與國內(nèi)外計算機(jī)軟件開發(fā)者成為合作伙伴,將更多的應(yīng)用和服務(wù)集成到北鯤云超算平臺。

港中文深圳理工學(xué)院-未來智聯(lián)網(wǎng)絡(luò)研究院-上海智峪生科聯(lián)合團(tuán)隊(包括但不限于)帶著  PointSite(蛋白質(zhì)上基于深度點云模型的小分子結(jié)合區(qū)域預(yù)測軟件 )入駐北鯤云超算平臺,服務(wù)于生命信息行業(yè)用戶,有助于 提高基于結(jié)構(gòu)的藥物發(fā)現(xiàn)精度和未來潛在的靶點尋找的效率。


ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖2
PointSite是一種無需模板的配體結(jié)合位點預(yù)測方法,用于精確識別蛋白質(zhì)配體結(jié)合原子,它以蛋白質(zhì)為中心的方式在原子水平上進(jìn)行蛋白質(zhì)LBS識別。具體來說,PointSite主要由三個模塊組成,原子點云轉(zhuǎn)換(APCT)模塊、配體結(jié)合原子預(yù)測(LAP)模塊以及LBS識別(LBSI)模塊。
 
在APCT模塊中,首先將原始的蛋白質(zhì)結(jié)構(gòu)從PDB格式轉(zhuǎn)換到原子級的點云。LAP模塊將原子的點云坐標(biāo)轉(zhuǎn)換為稀疏體積表示,而原子的特征保持不變,利用基于子流形稀疏卷積(SSC)的U-net對配體原子進(jìn)行預(yù)測。由于稀疏卷積的操作,我們可以用更高的分辨率表示點云,并保持計算效率。接著,LBSI模塊將點云分割的結(jié)果和以口袋為中心的方法進(jìn)行結(jié)合:濾除較低概率的原子,并對剩余原子進(jìn)行重新排序,從而得到更加精確的結(jié)合位點原子預(yù)測。



ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖3   (PointSite工作示意圖)
 
作為藥物設(shè)計的第一環(huán)節(jié),PointSite目前正在被運用于學(xué)術(shù)研究和藥物開發(fā)中。研究結(jié)果表明,PointSite中分割出的結(jié)合位點原子 可以作為一個后處理工具,通過過濾和重新排序策略來指導(dǎo)任何以口袋為中心的方法,以優(yōu)先確定識別出的偽表面點(PSPs 。由于 以口袋為中心的方法可能會輸出許多假陽性結(jié)果,因此后續(xù)的優(yōu)先級劃分步驟可以大大提高此類工具的性能(識別成功率)。同時,在常用的DCA準(zhǔn)則和所有口袋中心方法的原子級IoU方面可以大大提高識別準(zhǔn)確性。因此, PointSite是基于結(jié)構(gòu)的藥物發(fā)現(xiàn)的高效工具。


ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖4

1、PointSite 識別結(jié)合位點原子的準(zhǔn)確性

本部分的實驗使用atom-IoU指標(biāo),即預(yù)測原子集合和真實原子集合的交并比來衡量各方法預(yù)測的結(jié)合位點原子的準(zhǔn)確性。


表1列出了PointSite與其他方法在B277、DT198、ASTEX85、CHEN251、COACH420 和 HOLO4k數(shù)據(jù)集上的atom-IoU結(jié)果。從表1中可以看出,在幾乎所有數(shù)據(jù)集上,PointSite方法明顯優(yōu)于其他方法,僅次于PointSite的方法是P2Rank。PointSite在 DT198、B277、ASTEX85、COACH420 和 HOLO4k 上的atom-IoU分?jǐn)?shù)分別比 P2Rank 高 7%、11%、14%、14% 和 15%。在CHEN251數(shù)據(jù)集,也就是P2Rank的訓(xùn)練集上,PointSite與P2Rank也有相當(dāng)?shù)男Ч?/span>


表1: 各方法在B277、DT198、ASTEX85、CHEN251、COACH420 和 HOLO4K 數(shù)據(jù)集上的識別性能比較。(以 atom-IoU (%) 表示)

 ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖5


2、PointSite 預(yù)測結(jié)合位點中心位置的性能


DCA指標(biāo)用于描述預(yù)測結(jié)合位點(口袋)的中心與配體的任何原子之間的最小距離,本部分的實驗用DCA指標(biāo)來測量各方法預(yù)測結(jié)合位點中心位置的性能。


PointSite不僅可以單獨使用來預(yù)測結(jié)合位點相關(guān)的原子,也可以作為一個靈活的過濾工具和其他以口袋為中心的方法結(jié)合,從而提高其他方法的預(yù)測性能。如表2所示,結(jié)合PointSite可以在幾乎所有數(shù)據(jù)集上顯著提高以口袋為中心的方法的DCA 分?jǐn)?shù)(除了 CHEN251,是 P2Rank 的訓(xùn)練集)。值得注意的是,對于SiteHound方法,它的原始結(jié)果比 P2Rank 低約10-20% ,但是,在SiteHound 與PointSite結(jié)合后,它結(jié)果分別比 P2Rank 在 B277、DT198、ASTEX85、COACH420 和 HOLO4k 上的原始結(jié)果高 4%、2%、11%、8% 和 11%。在一些數(shù)據(jù)集中,如B277、ASTEX85、COACH420、HOLO4k,SiteHound的結(jié)合后結(jié)果甚至比P2Rank結(jié)合后結(jié)果還要高1%、6%、5%、6%。


表2:以口袋為中心的方法以及這些方法與PointSite結(jié)合的結(jié)果的DCA指標(biāo)(閾值為4 ?)在B277、DT198、ASTEX85、CHEN251、COACH420 和 HOLO4K 數(shù)據(jù)集上的識別性能比較。

 ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖6


3、CAMEO數(shù)據(jù)集上的atom-IoU和DCA性能結(jié)果


為了測試我們的點云分割方法是成功地學(xué)習(xí)到了三維蛋白質(zhì)結(jié)構(gòu)和結(jié)合原子之間的復(fù)雜關(guān)系,還是只是簡單地“記住”了訓(xùn)練數(shù)據(jù)。我們從CAMEO數(shù)據(jù)集中選擇了難度較高的蛋白質(zhì)結(jié)構(gòu),并且這些蛋白質(zhì)不僅序列相似度很低 (< 25%),而且與我們的訓(xùn)練數(shù)據(jù)集的結(jié)構(gòu)相似性度也較低(TMscore < 0.648),從而來模擬真實的藥物發(fā)現(xiàn)場景。


如表3所示,在CAMEO數(shù)據(jù)集中,單獨使用PointSite達(dá)到了 0.43 atom-IoU,分別比單獨使用FPocket、Site-Hound、MetaPocket2、DeepSite 和 P2Rank提高了 18%、23%、19%、21% 和 6%,這表明PointSite具有較好的泛化性。


當(dāng)以口袋為中心的方法與PointSite結(jié)合時,它們的識別精度在 atom-IoU 和 DCA 方面都有顯著提高。比較典型的是FPocket 和 SiteHound,它們分別是基于幾何和能量方法,而不是基于機(jī)器學(xué)習(xí)的方法(例如 DeepStie 和 P2Rank)。這些結(jié)果進(jìn)一步證明了我們的以蛋白質(zhì)為中心的方法與以口袋為中心的方法提取到的蛋白質(zhì)的信息是相互補(bǔ)充的。


表3:各方法在CAMEO數(shù)據(jù)集上的atom-IoU和DCA(閾值為4 ?)指標(biāo)的比較

 ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖7


4、案例分析


案例1:未結(jié)合-結(jié)合蛋白對(unbound-bound protein pairs)的案例


在藥物設(shè)計中,預(yù)測未結(jié)合狀態(tài)下的蛋白質(zhì)潛在結(jié)合位點是一個重要的任務(wù)。如圖3所示,左邊三列是未結(jié)合-結(jié)合蛋白對1q1c-4lay(人體FKBP52的前1-260個殘基的蛋白質(zhì)結(jié)構(gòu))。與配體結(jié)合后,蛋白質(zhì)和配體結(jié)合的區(qū)域相比于未結(jié)合時有明顯的形變(見中間真實值列中的紅色點云標(biāo)簽)。即使對于未結(jié)合的蛋白質(zhì) 1q1c,我們的 PointSite 也可以預(yù)測出近似的結(jié)合位點。圖3右邊三列是未結(jié)合-結(jié)合蛋白對1p9r-1p9w(霍亂弧菌推定的 NTPase EpsE 的蛋白質(zhì)結(jié)構(gòu)),即使在對未結(jié)合蛋白結(jié)構(gòu)的預(yù)測中存在更多的假陽性原子,PointSite 始終可以為蛋白結(jié)構(gòu)獲得近似的配體結(jié)合位點。


圖2:兩組未結(jié)合-結(jié)合蛋白對的預(yù)測結(jié)果的可視化效果圖

 ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖8





案例2:SARS-CoV-2 (COVID-2019) (PDB ID: 7BTF) 的 RNA 依賴性 RNA 聚合酶 (RdRp) 和 SARS-Cov2 (PDB ID: 7BQY) 的主要蛋白酶 (Mpro)的預(yù)測效果


如圖3所示,中間的一列圖片顯示了真實的結(jié)合位點位置,最右邊的一列顯示了PointSite的預(yù)測結(jié)果。PointSite不但能夠預(yù)測出準(zhǔn)確的結(jié)合位點的位置,而且其預(yù)測出的結(jié)合位點的位置也包括了核心的殘基所在的位置。這些結(jié)果表明,PointSite 可以成為未來基于結(jié)構(gòu)的藥物設(shè)計的一個非常有潛力的工具。


圖3 PointSite對SARS-CoV-2 (COVID-2019) (PDB ID: 7BTF) 的 RNA 依賴性 RNA 聚合酶 (RdRp) 和 SARS-Cov2 (PDB ID: 7BQY) 的主要蛋白酶 (Mpro)的預(yù)測結(jié)果


ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖9


ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖10

PointSite在北鯤云平臺上的使用極其簡單。


登錄北鯤云平臺,找到PointSite,按照視頻中提示操作即可完成計算。





ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖11
P oint S ite的入駐 是北鯤云ISV計劃 重要的第一步, 也是一個 良好的開端 。

PointSite的入駐,為北鯤云的用戶提供了更多樣的選擇 ,能夠幫助用戶得到更精準(zhǔn)的計算結(jié)果,提高計算效率。


同時,PointSite結(jié)合北鯤云平臺 產(chǎn)品與服務(wù)卓越的安全性及靈活性 ,能夠為用戶提供更優(yōu)質(zhì)的服務(wù),幫助其進(jìn)一步提升整體運營能力與盈利水平。

在5月31日,智峪生科ceo王晟博士在北鯤云講堂為大家分享了PointSite的算法與使用,感興趣的朋友可以點擊下方鏈接查看回放。


ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖12

加入ISV計劃,北鯤云為您提供

ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖13

們期待未來有更多的合作伙伴加入北鯤云ISV計劃。

ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖14
END


ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖15 ISV計劃 | 結(jié)合位點原子識別準(zhǔn)確性顯著提高,智峪生科PointSite口袋預(yù)測上線北鯤云超算平臺的圖16


登錄后免費查看全文
立即登錄
App下載
技術(shù)鄰APP
工程師必備
  • 項目客服
  • 培訓(xùn)客服
  • 平臺客服

TOP