[分析示例] 通過機器學習估計 χ 參數(shù)
從兩個分子的描述符中創(chuàng)建特征,學習與相互作用參數(shù) χ 的關系
目標和方法
使用 J-OCTA 機器學習功能(MI-Suite)來估計 χ 參數(shù)。使用的數(shù)據來自 Flory-Huggins Chi 數(shù)據庫。獲取的數(shù)據包括兩個化合物 A 和 B 的名稱以及它們之間的 χ 參數(shù)值。數(shù)據量為 263。學習/預測 χ 參數(shù)的過程如下:
χ 參數(shù)學習/預測過程
1. 從公共化合物數(shù)據庫 PubChem 獲取每種化合物的 SMILES 表示法。 使用 MI-Suite 的數(shù)據獲取功能 DB-Explorer 獲取。使用 MI-Suite 的數(shù)據采集功能 DB-Explorer 獲取數(shù)據。只有同時獲得 A 和 B 的 SMILES 表達式的化合物對(169 個)才會被使用。
2. 使用描述符計算功能 ChemDC 計算每個化合物的描述符值和 AutoCorr2D。
3. 根據原始數(shù)據中對化合物的描述,將計算出的描述符值進行混合,以創(chuàng)建單一特征。
4. 使用的混合方案是定量地理學中使用的混合方案,因為描述符(AutoCorr2D)可視為空間自相關量。
5. 訓練以混合計算的特征為輸入值,以每對化合物的 χ 參數(shù)為目標值。
學習的設置如下:
l 在 MI-Suite 的學習功能所支持的學習方法中,我們使用了 XGBoost,這是一種基于提升的學習方法。XGBoost 的超參數(shù)設置基于 GP(高斯過程),以獲得最佳參數(shù)設置。
l 離群點的去除是在第 90 個百分點(兩側)進行的。
l 在訓練過程中,訓練集和測試集的數(shù)據比例為 8:2。
結果
以下是訓練結果。
對于通過訓練獲得的預測模型(即學得的模型),使用訓練集時的預測準確率為 R^2=0.937,而使用測試集時的預測準確率為 R^2=0.778。
![[分析示例] 通過機器學習估計 χ 參數(shù)的圖1](https://img.jishulink.com/202401/imgs/7d063373cb4b4336aafc95a78b6548e3.png)
(文章來源:轉載自J-Octa官網)
相關產品鏈接:http://www.anscos.com/jocta.html
如需更多技術咨詢,請隨時與我們聯(lián)系:
全國熱線:400 633 6258
官方郵箱:info@anscos.com
工程師必備
- 項目客服
- 培訓客服
- 平臺客服
TOP




















