《鍛造行業智能制造發展回顧及新技術展望》(上)見《鍛造與沖壓》2020 年第19 期
K 近鄰算法在鍛造領域的研究
人工智能中的機器學習

圖7 人工智能的劃分領域
人工智能是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學,該領域的研究包含計算智能、機器感知、機器學習等,如圖7 所示。機器學習作為人工智能的一類,它是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。機器學習專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。機器學習在工業中的典型應用場景為:工況模式識別、設備故障診斷、產品質量分類等。本文將從機器學習中的K 近鄰算法來對鍛造領域進行研究與探討。
K 近鄰算法
K 近鄰法(k-nearest neiors)是機器學習中較基礎的一類算法,它是由Cover 和Hart 于1968 年提出的,是懶惰學習(lazy learning)的著名代表。K 近鄰算法中每個數據都存在一個標簽(label),即數據的最終特征,此外還包含了影響數據特征的各影響因素,K 近鄰算法的工作機制如下:首先給定一個測試樣本,計算它到訓練樣本的距離,然后取離測試樣本最近的k 個訓練樣本,最終用“投票法”選出在這k個樣本中出現最多的類別,就是預測的結果。樣本可以根據比例分為訓練集與測試集,訓練集負責用于模型的訓練,測試集負責模型的實際測試,測試集中測試成功數量與測試集總數量之比為準確率,準確率也是衡量K 近鄰算法好壞的唯一標準。圖8 是筆者運用傳統K 近鄰算法訓練傳統Mnist 數據集的程序。Mnist數據集是K 近鄰算法的基礎數據集,共有70000 條數據,每個數據集都是由人為手寫的數字構成,每條數據共含有784 條特征。其中,此程序用了20000 個數據集作為測試,50000 個數據集作為訓練,模型的準確率達到了97.6%,如圖9 所示,機器通過圖片將手寫的‘8’識別了出來。

圖8 典型K 近鄰算法程序

圖9 K 近鄰算法結果
下面本文將對鍛造行業的KNN 算法進行探索與研究,首先對精密鍛件工藝參數的集中管理和統一下達,并結合生產線集成控制系統對相應產品工藝參數的單件全面采集,形成車間生產過程的海量數據基礎。通過對工藝設定值與工藝反饋值的離差分析,探尋工件成形質量與生產工藝參數的關聯性。借助三維檢測等視覺系統判斷出當前鍛件尺寸是否符合要求,令鍛件尺寸作為輸出變量,按照鍛件尺寸可以將label 劃分為優、良、中、差四類,影響因素為打擊能量、溫度,潤滑、磨損等,利用生產線中積累的大數據進行生產模型搭建,分析出鍛件結果數據(鍛件尺寸、性能等)與過程數據(打擊能量、溫度、潤滑效果)之間的機理關系,算法流程如圖10 所示。算法的準確率高達97.41%

圖10 常規K 近鄰算法流程
K 近鄰算法中尋優過程
K 近鄰算法并不是單一固定的算法,其中包含了諸多影響因素,而這些影響因素是影響算法優劣的重要指標,本文將詳細介紹以下三類指標。
K 近鄰算法中,測試集中的樣本中的每個點是以訓練集中離該點最近的K 個點隸屬度來判斷該點的label,因此不同的K 值會產生不同的訓練模型,K 值過小會使得模型不準確,沒有參考意義,然而K 值過大可能會造成模型訓練時間過長,也同樣會造成模型偏離實際,因此K 值是K 近鄰算法中的重要指標。
權重也是影響算法的關鍵指標,如圖11 所示,當K=5 時,判斷該綠點周圍最近的5 個點中有3 個藍色點,2 個紅色點,按K 近鄰算法原理來說,綠點應該屬于藍色區域,然而明顯該點距離紅點更近,應該隸屬于紅色區域。因此在進行隸屬度判斷是,每個點對于測試點的判斷應該是不一樣的。近點的影響因素應該高于遠點,因此算法一般取距離的倒數來作為權重,來保證算法的真實性。

圖11 KNN 算法實例
該參數是衡量兩個樣本之間距離定義的關鍵因素,一般來說P=2 時表示的是歐氏距離,P=1 時表示的是曼哈頓距離,P 趨近于無窮時即為切比雪夫距離。通常情況下樣本采用歐式距離作為樣本間距。
為保證訓練的準確率最大化,就必須保證模型采用最合適的超參數來進行訓練,網格搜索法是指定參數值的一種窮舉搜索方法,通過將估計函數的參數通過交叉驗證的方法進行優化來得到最優的學習算法。通過遍歷各種超參數來優化模型,使得模型性能更優。網格搜索法模型尋優流程如圖12 所示。
在使用歐式距離以及distance 作為權重變量進行測試,網格搜索法的部分算法程序及結果如圖13、圖14 所示。
由訓練結果可知當K=8 時準確率最高,可以高達97.66%,要高于之前的準確率,模型得到了優化。模型的準確性可以量化不同材料下精密鍛件的成形工藝窗口,優化工藝參數區間,對生產過程中的穩定性起到了至關重要的作用。
深度學習算法的應用及展望
鍛造行業中數據影響因素較多,數據需要更高的穩定性及準確性。K 近鄰算法作為機器學習中一種典型的模糊分類方法,在工業中應用非常廣泛,然而,K 近鄰算法并不能獲取更精確的模型,因此需要更加完善的特征提取手段以及數據分析技術。
深度學習作為機器學習中的一種,近幾年在諸多互聯網公司得到了很多應用,然而在工業中應用卻少之又少,這是由于深度學習嚴重依賴數據,不光需要海量的數據,還需要海量的平衡數據。平衡數據就是不光要覆蓋所有場景,還需要讓所有場景下的數據呈平均分布,在工業中的數據形態未必有那么理想。目前深度學習僅在識別任務上大放異彩,較容易應用到工業目標的識別,如物件抓取,成品缺陷檢測,例如康耐視公司將深度學習算法融入到生產線中,可以實現缺陷自動檢測、產品質量自動分析等功能,目前也僅僅停留在生產級別的功能。
在未來更加完善的信息化工廠里,一定會有精密的傳感儀器,形成更加完善的數據儲備,這就為深度學習以及機器學習提供了一定良好的基礎。數據是企業信息化價值的核心,在數據的持續累積過程中,必定讓數據逐步發揮其應有的使用價值。
智能制造熱點技術
基于5G 的智能工廠大數據共享技術
當前鍛造企業車間自動化改造以及智能化提升依舊存在以下幾種問題:
⑴傳統的線纜通訊和無線通訊存在不少弊端,例如使用線纜通訊導致現場線纜眾多,容易損壞且不易檢修,更換線纜成本較高;而藍牙、WIFI 等無線通訊帶寬受限,時延較高,傳輸距離受限,導致面對大量數據采集和實時精確控制時顯得力不從心;
⑵鍛造企業對于物料的管理不夠完善,工序之間的物料流轉不夠透明,同時對于物料的搬運、存儲管理也比較粗放,缺少良好的物料流轉管理方式;
⑶企業面對采集上來的大量數據,不論是數據存儲與數據分析都將投入大量人力物力,提高企業成本,這給企業智能化升級造成了諸多困難。
針對企業面臨的上述問題,機電所提出基于5G技術的設備互聯、實時控制與高效物流,在簡化車間布線的同時,提高設備信息采集的傳輸速度與數據量,增強車間產線的控制精準度。并且基于5G 技術獲取的鍛造車間大量數據,利用云平臺提高企業的信息分析能力和信息可視化能力,并且為企業提供遠程運維、設備健康管理、故障診斷等服務。
⑴基于5G 的鍛壓裝備數據采集、互聯互通與精準控制。
利用5G 技術實現更加協調、高效的設備互聯,在保障數據實時性和可靠性的前提下,利用5G 的高通量特點獲取更多生產數據與參數,為企業數據分析提供基礎。研究利用5G 技術低延時特點的更加精準的實時控制,不僅可以增強不同工序之間的協調能力,加快生產節拍;也可以利用低延時特點,提高設備響應速度,確保安全有序生產,實現工業自動化閉環控制。
鍛造車間物料流轉是生產線中關鍵一環,物料流轉不僅需要在動態變化的環境中作出快速決策,同時也需要不斷獲取物料自身或物料搬運設備的位置信息。根據獲取的實時數據,計算交通模型,協調搬運流程和路線,提高整體系統性能。5G 技術將利用其高帶寬、穩定可靠、延時低的特點,不僅可以為物料流轉規劃最優路徑,同時也可以根據現場反饋,及時下達指令,保障物流交通的通暢與安全。
借助“5G+工業互聯網”技術,以生產車間覆蓋的5G 網絡系統為基礎,在工廠車間布設云網關,全面建設基于5G 云平臺和大數據的車間關鍵裝備的健康管理與運維平臺,實現對產線關鍵設備的全生命周期管理,云平臺集中式管理,為企業打造一站式服務。不僅為企業提供大數據存儲能力,也為企業提供數據處理與分析服務。
數字孿生技術
數字孿生是以數字化方式創建物理實體的虛擬模型,借助數據模擬物理實體在現實環境中的行為,通過虛實交互反饋、數據融合分析、決策迭代優化等手段,為物理實體增加或擴展新的能力。在全球制造業新一代革命的大背景下,數字孿生作為實現制造物理世界和虛擬信息世界交互融合的關鍵技術得到了制造行業的廣泛和高度關注。隨著以大數據、人工智能等為代表的新一代信息技術與制造業的融合與應用以及PLM、MES 等技術的發展完善,數字孿生在制造業的落地將更加便捷。
作為典型的制造企業,引入數字孿生技術后的鍛造企業將實現對產品的全生命周期管理。從產品的設計開發、生產加工、使用,直到最后的報廢環節,都將直觀地呈現給企業。在數字孿生的幫助下,企業將及時甚至提前發現存在的問題,從生產到管理的各個方面都將獲得質的提升。針對鍛造企業,本文粗略地總結了數字孿生的幾個典型應用場景,希望能給鍛造企業的智能制造升級有所啟發:
借助數字孿生技術,鍛造企業的工藝研發部門可以便捷地在虛擬空間進行設計研發。在無需實際生產測試的情況下,驗證諸如模具、工藝等設計在真實的物理世界的合理性。這將對鍛造企業產品設計研發環節產生巨大的影響,不僅節約了設計研發階段的試產等成本,還極大地提升了產品設計研發的效率。
在生產加工前,企業可以利用數字孿生提前對需要生產的各個工單進行排產、排程。根據工廠實際的設備產能、產品目標數量等參數建立對應的模型,找出最優的方案,有助于提升訂單的交付速度。在生產過程中,企業可以利用數字孿生對鍛造、熱處理、打磨修傷等各個生產工序之間的在制品進行調度優化,保證生產物料流轉的順暢,縮短了產品的生產周期。同時,數字孿生的運用還將為企業提供產品完整流程的質量管理數據,極大地方便了后期的質量追溯。
目前,很多鍛造企業的管理仍然存在很多不足的地方,各個生產要素和生產環節之間的脫節嚴重。在數字孿生的幫助下,企業能夠對人、機、料、法、環這些生產要素和研發、生產、銷售、物流等生產環節有一個清楚直觀的掌控。具體來說,對于生產過程中實際生產數據的實時采集傳輸,企業的管理者將能夠及時地根據生產的全盤情況進行更合理地決策,避免了生產和管理的脫節。此外,企業管理的數字孿生還能夠幫助管理者發現不合理的管理流程,為鍛造企業流程的暢通提供優化依據。
對于鍛造工廠來說,生產設備(如電動螺旋壓力機等)往往造價非常昂貴,并且具有結構復雜、工作環境惡劣等特點,一旦出現故障需要耗費大量的時間精力去排查、修復故障,將給企業生產帶來巨大的經濟損失。通過建立生產設備的數字孿生模型,企業將能夠實時監測設備的運行情況。同時還可以利用機器學習和知識圖譜等技術對設備數字孿生模型進行分析,實現對生產設備的預測性維護。
結束語
本文針對鍛造領域智能制造發展進行了深入研究,闡述了鍛造領域在智能制造發展進程及局限性。同時,本文歸納總結了鍛造行業實現智能制造的前期關鍵性工作。在完善的數字化車間體系架構基礎上,運用機器學習中的K 近鄰算法對鍛造生產過程進行研究與分析,最后,本文對鍛造領域進行了展望,列舉了兩項鍛造領域的智能制造熱點技術。智能制造是一個循序漸進的過程,既需要打通生產過程中的每個環節,又需要把各類信息充分利用起來,以實現其價值的最大化。再通過不斷對新型技術的探索和完善,必定會實現更加完善的智能制造體系架構,使鍛造領域生產過程效率最大化、更加智能化。
——文章來自《鍛造與沖壓》2020年第21期