若將隱藏層擴(kuò)展至 [8,256,256,128,128,64,6],權(quán)重參數(shù)激增,訓(xùn)練時(shí)需要將批量數(shù)據(jù)駐留顯存,24GB顯存是起步,48GB+才能從容混合精度訓(xùn)練:COMSOL 6.x版本支持FP16/FP32混合精度,NVIDIA RTX Pro系列(Ada/Blackwell架構(gòu))的Tensor Core可在此場(chǎng)景下提供2~4倍額外加速訓(xùn)練時(shí)間敏感性:對(duì)于1000樣本×8參數(shù)的數(shù)據(jù)集