
發(fā)布
注冊(cè)
/
登錄模型量化
關(guān)注創(chuàng)建者:匿名 創(chuàng)建時(shí)間:2026-01-04

模型量化的實(shí)例教程
不確定性量化模塊增強(qiáng)了敏感和可靠性分析能力
模型管理器擴(kuò)展了COMSOL在工程設(shè)計(jì)和開(kāi)發(fā)領(lǐng)域的應(yīng)用范圍,而不確定性量化模塊使其能夠生成更加完整、準(zhǔn)確且實(shí)用的多物理場(chǎng)模型。
基于概率設(shè)計(jì)法,用戶可以通過(guò)可靠性分析估算制造公差如何影響最終產(chǎn)品的預(yù)期性能,以避免對(duì)設(shè)備或工藝過(guò)程的過(guò)度設(shè)計(jì)或設(shè)計(jì)不足。
參數(shù)篩選和敏感性分析揭示了哪些參數(shù)比其他參數(shù)更為重要,可以用于測(cè)試模型的基本假設(shè)是否有效,而誤差傳遞可以用來(lái)預(yù)估輸出量的概率分布。
圖|不確定性量化模塊揭示了輸入?yún)?shù)的變化對(duì)仿真結(jié)果的影響
“不確定性量化模塊的一個(gè)優(yōu)勢(shì)是,它可以與COMSOL Multiphysics中的所有物理場(chǎng)仿真結(jié)合使用。” COMSOL數(shù)值分析技術(shù)總監(jiān)Jacob Ystr?m介紹道,“該模塊不僅適用于結(jié)構(gòu)分析,還可以對(duì)聲學(xué)、流體、電磁以及多物理場(chǎng)耦合問(wèn)題進(jìn)行類(lèi)似分析,其應(yīng)用范圍非常廣泛?!?6.0版本帶來(lái)求解器性能和建模能力的廣泛提升
COMSOL Multiphysics 6.0版本對(duì)軟件平臺(tái)和附加產(chǎn)品進(jìn)行了全面更新,對(duì)特定工程領(lǐng)域的問(wèn)題,以內(nèi)存消耗和計(jì)算速度為指標(biāo)的求解性能提升了10倍以上;除此之外,新版本還增強(qiáng)了針對(duì) PCB 電路板設(shè)計(jì)的電磁仿真能力,并為聲學(xué)領(lǐng)域的用戶帶來(lái)了一個(gè)全新的仿真方向:流致噪聲。
了解 COMSOL 軟件新版本的更多信息,請(qǐng)點(diǎn)擊【閱讀原文】訪問(wèn) 6.0 版本發(fā)布亮點(diǎn)。
展開(kāi) 圖1 通過(guò)熱力學(xué)理論模型計(jì)算不同溫度下iHEA的層錯(cuò)能和Gibbs自由能變化
隨后,發(fā)展了考慮多重強(qiáng)化機(jī)制(林位錯(cuò)、晶界、碳化物顆粒、晶格摩擦力)和塑性變形機(jī)制(位錯(cuò)滑移、變形孿生、馬氏體相變)的晶體塑性本構(gòu)模型,并在不同機(jī)制中針對(duì)性地引入溫度效應(yīng)。本構(gòu)模型通過(guò)德國(guó)馬普鋼鐵所開(kāi)發(fā)的DAMASK平臺(tái)移植有限元方法,以用戶子程序的形式與商業(yè)軟件Abaqus進(jìn)行關(guān)聯(lián)。在驗(yàn)證多晶Voronoi幾何模型合理性的基礎(chǔ)上,通過(guò)模擬實(shí)驗(yàn)加載工況,對(duì)本構(gòu)參數(shù)進(jìn)行識(shí)別和校核,驗(yàn)證本構(gòu)模型的有效性。對(duì)比發(fā)現(xiàn)發(fā)展的本構(gòu)模型和所采用的參數(shù)能夠較好地描述iHEA溫度相關(guān)的單拉變形行為(如圖2)和微結(jié)構(gòu)演化(如圖3)。
圖2 不同溫度和晶粒尺寸下iHEA單拉變形行為的模擬和實(shí)驗(yàn)值對(duì)比
圖3 不同溫度和晶粒尺寸下iHEA微結(jié)構(gòu)演化的模擬和實(shí)驗(yàn)值對(duì)比
最后,利用本構(gòu)模型量化了各種強(qiáng)化機(jī)制在iHEA屈服應(yīng)力中的占比(如圖4(a)),分析了不同溫度下孿晶和馬氏體形核應(yīng)力的變化,對(duì)低溫下iHEA屈服應(yīng)力變化和馬氏體相變?cè)鰪?qiáng)等問(wèn)題進(jìn)行了討論。通過(guò)對(duì)比模擬量化了馬氏體相變對(duì)iHEA應(yīng)變硬化的貢獻(xiàn)。在此基礎(chǔ)上,通過(guò)發(fā)展的本構(gòu)模型和模擬手段,預(yù)測(cè)了不同溫度和不同晶粒尺寸下iHEA的強(qiáng)韌性分布(如圖4(b)),相關(guān)規(guī)律可為iHEA的工程服役和性能設(shè)計(jì)提供參考。
展開(kāi) Neuron Studio可針對(duì)模型到應(yīng)用,提供一站式、全鏈路、自動(dòng)化的開(kāi)發(fā)協(xié)助,不僅讓AI應(yīng)用開(kāi)發(fā)的全流程可視化,更帶來(lái)整個(gè)多種工具的一站式開(kāi)發(fā)能力,還支持神經(jīng)網(wǎng)絡(luò)自動(dòng)化調(diào)優(yōu)和跨模型全鏈路分析功能,針對(duì)AI應(yīng)用開(kāi)發(fā)的三大痛點(diǎn)逐個(gè)擊破。
當(dāng)前AI應(yīng)用開(kāi)發(fā)者在使用開(kāi)發(fā)工具時(shí)會(huì)面臨一個(gè)很頭疼的問(wèn)題,種類(lèi)多、功能不聚合、過(guò)于碎片化,導(dǎo)致開(kāi)發(fā)過(guò)程非常復(fù)雜。Neuron Studio整合了多個(gè)MLKits工具,包含模型轉(zhuǎn)換、模型量化和模型調(diào)優(yōu),將關(guān)鍵模塊融合成一站式、可視化的完整開(kāi)發(fā)鏈路,開(kāi)發(fā)者不再需要“拼積木式”組合多個(gè)工具,只用一套工具就可以已全部搞定,極大提升開(kāi)發(fā)效率。
Neuron Studio 還支持自動(dòng)化調(diào)優(yōu)神經(jīng)網(wǎng)絡(luò)使用的帶寬及性能,在開(kāi)發(fā)過(guò)程中,將性能和內(nèi)存占用自動(dòng)優(yōu)化至最佳配置。而且,開(kāi)發(fā)者可以全程監(jiān)控大模型演化過(guò)程。以前萬(wàn)組參數(shù)手動(dòng)調(diào)優(yōu)動(dòng)輒需要一周,而現(xiàn)在只要幾個(gè)小時(shí)即可完成。
此外,Neuron Studio打造了跨模型全鏈路分析功能,提供全局視角和執(zhí)行流程。開(kāi)發(fā)者不在需要針對(duì)大模型中不同模塊各自獨(dú)立分析,實(shí)現(xiàn)“全局視角、一站掌控”,大幅節(jié)省模型分析時(shí)間。
這不僅僅是工具的升級(jí),更是邁向智能體化用戶體驗(yàn)的關(guān)鍵基礎(chǔ)設(shè)施。
天璣AI開(kāi)發(fā)套件 2.0,全面釋放天璣端側(cè)AI能力
去年,天璣AI開(kāi)發(fā)套件一經(jīng)發(fā)布就廣受開(kāi)發(fā)者好評(píng)和推薦。在MDDC 2025上,聯(lián)發(fā)科帶來(lái)了全面升級(jí)的天璣AI開(kāi)發(fā)套件2.0,在模型庫(kù)規(guī)模、架構(gòu)開(kāi)放程度、前沿端側(cè)AI技術(shù)支持和端側(cè)LoRA訓(xùn)練落地等方面均迎來(lái)全面躍遷,為開(kāi)發(fā)者提供了更全面、更開(kāi)放、更強(qiáng)大的端側(cè)AI開(kāi)發(fā)解決方案。
端側(cè)AI應(yīng)用開(kāi)發(fā)往往需要調(diào)用各種各樣的大模型能力,需要更豐富、類(lèi)型更多的模型適配。
展開(kāi) 這使設(shè)計(jì)者能夠在L31內(nèi)核的標(biāo)準(zhǔn)變體之間進(jìn)行選擇,并評(píng)估使用TFLite-Micro 進(jìn)行量化的好處。
圖4 包含了PPA 圖表,顯示了識(shí)別測(cè)試集的單一圖像所需的相對(duì)時(shí)鐘周期數(shù)、消耗的能量和利用的芯片面積。沒(méi)有浮點(diǎn)硬件的基本L31 配置是有效的,但性能相對(duì)較慢,因?yàn)镕P 操作必須在軟件中模擬。而通過(guò)在L31 中添加硬件浮點(diǎn)單元可以解決這個(gè)問(wèn)題,并使總時(shí)間減少近85%,功耗減少42%,但代價(jià)是芯片面積擴(kuò)大(+207%)。
圖4 Codasip的L31 32位整數(shù)內(nèi)核、32位浮點(diǎn)內(nèi)核以及運(yùn)行手寫(xiě)數(shù)字識(shí)別的量化TFLite模型的32位整數(shù)內(nèi)核之間的PPA比較
此外還有一個(gè)解決方案:TFLite-Micro 支持神經(jīng)網(wǎng)絡(luò)參數(shù)和輸入數(shù)據(jù)的量化。這個(gè)功能是從最初的TensorFlow Lite 框架中提取的, 并提供了將任何TensorFlow 模型轉(zhuǎn)換為整數(shù)(有符號(hào)/ 無(wú)符號(hào)8/16 位)表示的能力,因此它可以直接在整數(shù)內(nèi)核上運(yùn)行。圖4顯示,在標(biāo)準(zhǔn)整數(shù)L31 內(nèi)核上運(yùn)行的int8 量化模型幾乎達(dá)到了浮點(diǎn)內(nèi)核的性能,運(yùn)行時(shí)間減少了80% 以上,功耗比初始水平進(jìn)一步提高了78%,而不需要增加內(nèi)核的復(fù)雜性和硅面積。
神經(jīng)網(wǎng)絡(luò)模型的量化總是在預(yù)測(cè)精度和算法復(fù)雜性之間進(jìn)行權(quán)衡。從浮點(diǎn)版本切換到int16 和int8 不可避免地會(huì)降低精度,而用戶有責(zé)任確保它不會(huì)降太多。量化(int8)和初始浮點(diǎn)模型都在包含10,000 張圖片的測(cè)試集上得到了驗(yàn)證,結(jié)果準(zhǔn)確率為98.91%(fp32)和98.89%(int8),這似乎是對(duì)資源、功率和性能增益的合理權(quán)衡。
展開(kāi) 矩陣乘法加速不僅需要定點(diǎn)設(shè)計(jì),還需要精確的量化設(shè)計(jì)。作者試圖通過(guò)針對(duì)特定數(shù)據(jù)和模型定制量化設(shè)計(jì)來(lái)解決這個(gè)問(wèn)題,因?yàn)樗鼈儗?duì)應(yīng)的量化值范圍和范圍不同。這種方法有助于防止溢出,這種溢出很容易發(fā)生,因?yàn)槌朔ɡ奂舆\(yùn)算的維數(shù)很大。
5、Section Summary
采用了各種優(yōu)化技術(shù)來(lái)改進(jìn)基于Transformer的模型。數(shù)據(jù)重組運(yùn)算符,如reshape、permute、split、concat和transpose,用于處理不規(guī)則數(shù)據(jù),依賴(lài)片上存儲(chǔ)器進(jìn)行中間結(jié)果存儲(chǔ)。軟件編譯器優(yōu)化,包括operator合并和運(yùn)算符映射,被用來(lái)優(yōu)化這些operator。
模型量化是加速模型推理的關(guān)鍵技術(shù),它用整數(shù)多項(xiàng)式近似方法或函數(shù)近似方法取代了Transformer網(wǎng)絡(luò)中的非線性算子。對(duì)于矩陣乘法加速,也考慮了替代量化方法,如指數(shù)量化。模型結(jié)構(gòu)的改進(jìn),如使用有效的注意力機(jī)制或輕量級(jí)結(jié)構(gòu),有助于進(jìn)一步優(yōu)化。
還研究了模型壓縮方法,如剪枝和知識(shí)蒸餾。剪枝涉及從訓(xùn)練的模型中刪除不重要的參數(shù)或連接,各種方法側(cè)重于多頭自注意力(MHSA)、通道、token或整個(gè)Transformer結(jié)構(gòu)。
知識(shí)蒸餾將知識(shí)從大的教師模型轉(zhuǎn)移到小的學(xué)生模型。將模型量化與知識(shí)提取相結(jié)合,減少了內(nèi)存開(kāi)銷(xiāo),提高了性能。視覺(jué)Transformer蒸餾技術(shù)檢查了特征圖和注意力,特征圖蒸餾將地圖劃分為patch,注意力蒸餾使用額外的蒸餾token進(jìn)行知識(shí)轉(zhuǎn)移。
對(duì)Transformer硬件加速的研究主要集中在NLP模型(如BERT)和視覺(jué)Transformer模型(如ViT)上。2022年,Transformer在自動(dòng)駕駛領(lǐng)域的應(yīng)用迅速發(fā)展,這導(dǎo)致人們對(duì)其實(shí)施的興趣增加。然而,自動(dòng)駕駛Transformer模型的硬件加速仍處于初級(jí)階段。
展開(kāi) 
模型量化的相關(guān)專(zhuān)題、標(biāo)簽、搜索
模型量化的最新內(nèi)容
1、AI驅(qū)動(dòng)的根因分析
這是 DTEmpower 的核心優(yōu)勢(shì),它集成了回歸、時(shí)序、分類(lèi)、聚類(lèi)等 150 余種機(jī)器學(xué)習(xí)算法,且低代碼易上手,不需要深厚的算法背景,通過(guò)拖拽式建模和 AI Agent 輔助,質(zhì)量工程師可以快速建立回歸模型或分類(lèi)模型,量化各工藝因子對(duì)良率的貢獻(xiàn)率,實(shí)現(xiàn)“智能故障搜索”。
02/三維矢量成像模型在零波像差非雙遠(yuǎn)心物鏡中的應(yīng)用
遠(yuǎn)心度與模型差異的量化關(guān)系
各級(jí)衍射光主光線轉(zhuǎn)動(dòng)關(guān)系示意圖
物鏡像方遠(yuǎn)心度衡量:投影物鏡像方主光線方向單位矢量[kx,ky,kz],用kx/kz,ky/kz表示。
本地部署 DeepSeek 私有助手:從零到上線的完整方案7個(gè)月前
此方案兼顧了部署簡(jiǎn)單性與功能擴(kuò)展性,適用于個(gè)人開(kāi)發(fā)者與企業(yè)落地應(yīng)用,并可在未來(lái)結(jié)合量化模型與推理加速進(jìn)一步提升性能。
結(jié)論:方案特色與價(jià)值
本方案將 Ollama 的輕量化本地推理能力與 Dify 的可視化應(yīng)用構(gòu)建平臺(tái)深度結(jié)合,實(shí)現(xiàn)了從模型部署到業(yè)務(wù)落地的全鏈條私有化 AI 解決方案。
本文通過(guò)模型量化呈現(xiàn)了電解液吸熱相變后的傳熱傳質(zhì)過(guò)程,通過(guò)實(shí)驗(yàn)獲得了模型所需輸入,例如電池?zé)崾Э禺a(chǎn)熱量、產(chǎn)氣量、內(nèi)部壓力、電解液相變吸熱參數(shù)、熱失控噴發(fā)質(zhì)量流量及等。在模型與實(shí)驗(yàn)結(jié)果對(duì)比中,電池正表面溫度的決定系數(shù)R2為0.9258,背表面溫度決定系數(shù)R2為0.9046。安全閥開(kāi)啟后電解液吸熱氣化的實(shí)驗(yàn)結(jié)果與模擬結(jié)果相差7℃,精確的溫度計(jì)算將提升電池模組熱失控隔熱設(shè)計(jì)的可靠性。
可重復(fù)性檢驗(yàn)
相同輸入是否產(chǎn)生一致輸出,反映穩(wěn)定性
方法二:結(jié)果分析法
方法名稱(chēng) 作用描述 專(zhuān)家評(píng)審
利用專(zhuān)業(yè)經(jīng)驗(yàn)判斷模型合理性和可用性
誤差分析
量化模型輸出與實(shí)際值之間的偏差
國(guó)產(chǎn)替代沙盤(pán)推演構(gòu)建國(guó)產(chǎn)EDA與進(jìn)口工具的功能映射模型,量化替代成本與風(fēng)險(xiǎn)。例如:用廣立微參數(shù)化測(cè)試工具替代Keysight ADS,節(jié)省45%成本在28nm以上成熟制程全面切換至華大九天平臺(tái)該策略使某物聯(lián)網(wǎng)芯片企業(yè)國(guó)產(chǎn)化率提升至68%,關(guān)稅敏感度下降53%105。
(3)技術(shù)自主性強(qiáng)化架構(gòu)
替代方案仿真器建立國(guó)產(chǎn)工業(yè)軟件與海外主流工具(如MATLAB/Simulink)的功能映射模型,量化替代成本與風(fēng)險(xiǎn)。某航天企業(yè)通過(guò)該模型,將某控制系統(tǒng)軟件國(guó)產(chǎn)化周期縮短58%。
Neuron Studio整合了多個(gè)MLKits工具,包含模型轉(zhuǎn)換、模型量化和模型調(diào)優(yōu),將關(guān)鍵模塊融合成一站式、可視化的完整開(kāi)發(fā)鏈路,開(kāi)發(fā)者不再需要“拼積木式”組合多個(gè)工具,只用一套工具就可以已全部搞定,極大提升開(kāi)發(fā)效率。
Neuron Studio 還支持自動(dòng)化調(diào)優(yōu)神經(jīng)網(wǎng)絡(luò)使用的帶寬及性能,在開(kāi)發(fā)過(guò)程中,將性能和內(nèi)存占用自動(dòng)優(yōu)化至最佳配置。而且,開(kāi)發(fā)者可以全程監(jiān)控大模型演化過(guò)程。
解決思路:3DCC提取支架與艦體安裝面的關(guān)鍵尺寸及公差,建立誤差傳遞模型,量化角度偏差對(duì)波束指向的影響。優(yōu)化零件關(guān)鍵公差,提高安裝精度,減少調(diào)試成本,確保雷達(dá)系統(tǒng)探測(cè)性能穩(wěn)定。
3DCC的應(yīng)用價(jià)值
3DCC公差分析軟件能夠幫助該研究院所解決船舶與海洋裝備的復(fù)雜公差問(wèn)題,通過(guò)精準(zhǔn)的公差仿真計(jì)算,提高裝配精度,降低試驗(yàn)成本,縮短研發(fā)周期。
</p><p><br></p><p>為了充分利用PhysicsAI,Hero首先將現(xiàn)有數(shù)據(jù)分為訓(xùn)練集和測(cè)試集:訓(xùn)練集用于基于歷史仿真數(shù)據(jù)訓(xùn)練機(jī)器學(xué)習(xí)模型,測(cè)試集則用于評(píng)估和量化AI模型的預(yù)測(cè)準(zhǔn)確性。由于Hero的產(chǎn)品線涵蓋多種車(chē)型(如運(yùn)動(dòng)型摩托車(chē)、探險(xiǎn)摩托車(chē)、通勤摩托車(chē)和巡航車(chē)等),團(tuán)隊(duì)使用了多樣化的把手?jǐn)?shù)據(jù)集,以確保AI模型能夠生成準(zhǔn)確的結(jié)果。