面向智能決策的軍事數據工程建設
肖楚琬,劉 嘉,唐小峰
(海軍航空大學,山東 煙臺 264001)
摘 要:針對軍事智能決策對于數據的高速、高效、高融合等要求,在分析當前軍事數據面臨的數據需求、采集、分析和服務等困難的基礎上,提出了由需求層、數據層、知識層、服務層和評估反饋過程構成的軍事數據工程結構框架,指出了建設需要重點關注的元數據、數據質量、小樣本特征提取、服務體系構建等重點內容和關鍵技術,為開展軍事數據工程建設打下了基礎。
關鍵詞:智能決策;軍事數據工程;元數據;數據質量;數據服務
隨著人工智能技術的發展,智能軍事決策由于其解決不確定和不完全性問題的天然優勢,成為軍事運籌領域的重點研究方向[1]。Alpha Star在“星際爭霸II”中戰勝人類職業玩家,顯示了人工智能在軍事決策領域的巨大潛力。美軍在“深綠”計劃研究的基礎上,持續開展了空戰模擬系統“Alpha AI”、虛擬指揮官參謀(CVS)等一系列智能項目研究,軍事智能決策技術日益成熟,逐漸走向實戰[2-4]。
數據是智能決策的基礎。隨著互聯網技術的發展,云計算、大數據、數據挖掘等技術已逐步成熟,為軍事數據工程建設打下了基礎。但是,由于保密和專業性等要求,軍事數據分散在各獨立單元,尚難以達到大數據規模。其準確性、一致性、完整性差,橫向不合,縱向不通等問題突出,很難滿足軍事智能決策需求。因此,亟須將現有軍事數據資源整合,從體系架構、標準規范、服務管理等方面合理規劃,建設能夠支撐戰略仿真、計劃制定等智能決策需求的軍事數據工程體系,為建設新一代“軍事智腦”,打贏下一場智能戰爭打下基礎。
1 軍事智能決策
1.1 決策的一般模型
決策是人類意志的直接反映,傳統決策方法一般來源于人的經驗。本質上它是一個基于目標,對有限條件和方法進行分析評估的過程,通過對方案進行分析和論證,從而做出決策,并驗證評估效果。
軍事運籌學是決策的量化表達,一般包含決策者、決策目標、決策變量、環境變量(狀態變量)、決策后果等要素。在一定環境變量條件下,選擇特定的決策變量后,最終得到結果,實現決策目標。決策的一般描述可表示為
式中,d為決策變量,z為環境變量,Z為決策后果,U為評價變量[1]。由于變量之間的關聯,特別是主客觀因素之間的交互,給決策分析帶來前所未有的困難。
1.2 軍事智能決策
軍事智能決策是智能決策在軍事領域的具體實踐,主要針對快速和綜合信息處理等方面需求,為人腦提供輔助建議,應用于軍事領域的各個層次,如戰略決策、計劃制定、指控設計等方面。它能夠通過對歷史數據、相似性數據等方面的學習,不斷完善知識庫,優化搜索路徑,給出輔助策略建議。由于軍事決策的對抗特性,軍事智能決策學習過程主要是對手和自我經驗總結的學習,需要大量的數據支撐,通常采用基于前饋貝葉斯網絡與神經元網絡的深層學習方法[5]。
2 軍事數據工程及現狀分析
2.1 數據工程和軍事數據工程
20世紀80年代,美國電氣及電子工程師學會(IEEE)將數據工程定義為“關于數據生產和數據使用的信息系統工程”[7]。從應用角度看,它是生產者將制造的規范、語義清晰數據提供給數據消費者使用的信息系統工程;從生命周期角度看,是強調對數據的定義、采集、標準化、存儲、處理、運用和容災備份等過程進行全壽命管理的信息系統工程。其主要內容包括數據建模、數據標準化、數據管理、數據應用和數據安全等。
參考數據工程定義,軍事數據工程是針對軍事需求,綜合運用數據技術方法,對軍事數據進行建設、管理和運用的軍事信息系統工程。它主要包括軍事數據需求捕獲、標準化、管理、分析、產品、安全等內容。它將工程思維引入軍事數據領域,在軍事系統運行的特殊環境基礎上,將系統所需履行的任務作為依據,用工程化手段解決軍事系統建設有效性問題,為軍事決策提供基礎和支撐。
從生命周期角度來看,軍事數據工程的重點在于明確數據需求、確保數據質量、挖掘數據知識、形成數據服務。
2.2 面臨的主要困難
2.2.1 軍事數據需求不成體系
目前軍事需求分解缺乏頂層法規標準,軍事需求傳導過程和體系尚不健全,各個業務需求相對獨立,各層次之間缺乏固有邏輯關系,導致軍事需求分析零散、混亂,不成系統。數據需求來源于信息系統需求,并未形成針對軍事數據的統一規劃,導致軍事數據出現要素不全、重復建設、關系混亂等問題,很難實現以軍事需求牽引的數據工程建設。
2.2.2 軍事數據采集不標準
當前,軍事領域存在大量數據,由于缺乏規范、粒度不同、要素不全等,大多數無法被有效利用。軍事數據約束不嚴,缺乏完備的元數據和數據元標準,數據要素之間并未形成嚴格的邏輯關系,缺乏數據質量校驗工具,特別是需要手動錄入的數據,準確性差,給處理帶來困難。各類數據分散在各個業務部門,狀態零碎分散,一致性差。同一事物或同一事件存在眾多不同的數據,造成大量資源浪費。數據管理水平較低,還存在各有關部門各自為戰、各行其是的情況,缺乏集中統一的匯總渠道和管理體制。
2.2.3 知識挖掘不充分
數據人員和專業人員溝通渠道不暢,數據技術和專業知識結合不緊密,沒有形成聚合效應。大多數專業數據資源閑置,并未固化成專業知識庫。已有知識庫缺乏更新機制和手段,更新頻率低。跨專業數據資源之間融合差,大樣本網絡建設不健全,機器學習、人工智能等數據挖掘技術應用不充分,沒有形成明確的跨領域知識庫,對作戰和訓練任務支撐效果不明顯,在進行重大決策和處置緊急情況時,很難拿出公認的可信知識支撐。
2.2.4 數據服務不系統
數據服務停留在獨立業務系統層面,以單一對象為主,并未形成層次化、系統化服務。服務通用性不強,針對作戰、訓練、管理等不同層次的需求,難以提供標準的服務接口,大量重復建設造成了資源浪費,在執行作戰籌劃、訓練演練等任務規劃時,仍以傳統決策形式為主,數據的輔助決策服務核心功能效果不明顯,嚴重制約了決策效率提升。
3 面向智能決策的軍事數據工程建設
3.1 總體設計
軍事智能的應用需求非常豐富,從戰略設計、戰役指揮等頂層謀劃,到器材采購、飛行計劃等具體任務,對數據的內容、顆粒度、計算速度等需求各不相同。因此,需要將軍事數據作為獨立的研究對象,使其不僅僅依附于單一業務系統,能夠在相關數據融合的基礎上實現相關性比對、多維度描述、基礎知識儲備等功能,最終能夠為各類型、各層次的智能決策需求提供通用或專業的數據服務。因此,軍事數據工程建設應該充分考慮標準化、通用化、可擴展性等原則,兼顧結構和非結構化數據,按照系統工程要求進行整體設計。
本文按照“兼容開放、結構扁平”的思路,設計由需求層、數據層、知識層、服務層、應用層和評估反饋機制構成的軍事數據工程整體結構如圖1所示。
3.2 主要建設內容
3.2.1 軍事數據需求層建設
軍事智能決策需求捕獲是數據工程的基本出發點。美軍以國家和國防戰略為頂層需求,依次形成戰略需求、作戰需求、能力需求、資源需求等四類需求。其中,軍事數據由頂層需求分解而來,屬于資源和能力需求。軍事數據需求描述模型整體框架如圖2所示。
圖1 面向智能決策的軍事數據工程總體建設框圖
圖2 軍事數據工程需求描述模型
這就需要進一步規范軍事需求分解和傳遞規則,從頂向下構建一套軍事決策需求分析標準,明確需求模型和數據資源的形式化描述。依據此標準,領域專家可以根據不同領域需求,建立各領域軍事數據資源術語之間的邏輯關系,形成軍事數據資源概念術語集,從而建立軍事需求和軍事數據之間的“翻譯器”。在具體軍事需求開發時,不同人員可以從數據和需求兩方面對需求和資源進行分析,最大限度地合并“同類項”,增加“標準項”,實現軍事需求和數據資源的對接。
3.2.2 軍事數據層建設
軍事數據層是軍事數據工程的核心內容,包括基礎數據、專業數據以及數據管理策略三個部分,通過數據融合建立動態關聯。基礎數據主要是通過各種手段收集的原始數據,按照各領域分類存放在業務服務器中;專業數據是在基礎數據基礎上,針對某專業需求提前融合的數據集合。
針對各類數據種類多、格式不一致等現狀,需要進一步完善軍事元數據標準。面向不同決策應用需求,區分不同類型、層次等給出基本要素集,確定數據譜系信息,為數據采集和融合提供基本遵循。在技術層面,開展軍事數據融合和數據質量研究,開發清洗工具,綜合應用智能語義、模糊識別等技術,建立數據質量評估模型,保證數據源頭準確,實現數據之間的互通互享。在管理制度上,以軍事需求變更管理為主線,建立各層級管理部門和相應制度,打通管理鏈路,使軍事數據的采集、分析、增容、安全等各個方面都有章可循,形成軍事數據工程一盤棋態勢。
3.2.3 軍事數據知識層建設
軍事知識挖掘和固化決定了智能決策的搜索范圍、速度和準確度等關鍵要素,是數據決策服務的核心。它通過研究綜合運用機器學習、人工智能、語義識別等數據分析技術,建立跨類別、跨領域數據的內在聯系,實現知識的抽取和固化,建立軍事服務的基礎。在這一過程中,區分建設專業知識庫和通用挖掘模型。專業知識庫以固定的知識模型為主,可以快速服務決策;通用挖掘模型可以針對臨時產生的需求,通過預先學習形成的方法集合,快速組織形成相應知識。在實現形式上,重點是從集中式向分布式發展,按照專業領域打通各類型數據之間的壁壘。
3.2.4 軍事數據服務層建設
軍事決策服務是軍事數據工程的最終價值體現。其特點在于建立了獨立的服務層,為各類決策應用提供支撐,實現資源建設共享。它以數據頂層規劃法規為約束,通過建立涵蓋基礎級、中繼級、系統級的數據服務體系,形成快速響應、靈活配置、融合交互的軍事數據服務,支撐各類決策應用。其基本結構如圖3所示。
圖3 軍事數據工程服務體系框圖
3.2.5 軍事數據應用層建設
軍事數據應用是軍事數據效果最直接的體現。它在統一的軍事數據服務體系上,通過不同領域數據資源的靈活調用,和同一數據資源的不同數據屬性融合計算,開發智能決心、智能規劃、智能評估等各類智能決策應用系統,實現不同層級、不同領域的軍事智能決策功能。
3.2.6 軍事數據評估反饋機制
評估反饋是軍事數據工程的改進動力。隨著國防和戰略需求的變化,以及軍事智能技術的不斷發展,必須建立動態評估反饋和更新機制,編制數據服務應用的評估準則,以服務是否滿足需求為評判標準,分析數據服務存在的問題,重新檢視需求、采集、挖掘等過程,對數據工程各要素提出改進要求。
3.3 重點關注問題
3.3.1 元數據技術和管理
大多數軍事數據存放在各自獨立的系統中,彼此之間缺乏結構性關聯約束,因此,需要從技術和管理兩方面對軍事元數據進行研究。在元數據設計技術方面,根據決策的類型、層次等特點,研究元數據放置策略、存儲規則、緩存技術等涉及數據讀取速率、訪問規則的數據技術;在元數據分配技術方面,在傳統目錄樹、哈希等方法基礎上,重點研究流計算引擎、MPP數據庫、Apache Hadoop等新型數據庫[8]的元數據分配技術完成對結構/非結構化數據的全覆蓋標注,保證較高的并行度和響應時間。在元數據分析方面,統籌業務元數據和技術元數據,持續研究重點元數據結構變化對數據查找效率變化影響,確定重點特征進行監控。
在管理方面,可以參考美軍建立的國防部元數據注冊庫(MDR)機制[9],建立國家層面軍事元數據標準,通過注冊、申請機制保證各類數據之間的融合,大大提高元數據信息資源在軍事決策信息系統中的重用程度。
3.3.2 數據質量管理
針對軍事數據,特別是人工填報的軍事數據規范性不強,一致性不好的實際,需要加強數據關聯、約束、溯源、清洗等技術研究。通過對象識別、冗余相關分析、重復檢測、表象消歧義等方法[10-12],建立相似度量函數,找出不一致、冗余和不完整等數據錯誤;通過研究建立不同數據元素之間數據依賴程度模型,如內置謂詞函數依賴、連接依賴、多值依賴等,找出數據約束,確保數據的完整性和一致性[13]。為了更好地管控數據質量,需要尋找低質量數據譜系和傳播路徑,從而及時有效地控制問題數據傳播。
3.3.3 小樣本數據特征提取技術
軍事行動的有限性決定了獲取大樣本軍事數據的難度很大。因此,在有限樣本中快速得到有效的數據特征對于智能決策十分關鍵。一般來說,特征提取的目的是對初始高維特征進行有效降維,從高維特征空間中選擇一個最優特征子集[14]。但是,對高維特征空間的降維計算十分復雜,從最優特征子集的產生過程來看,可將特征提取方法分為Filter過濾式和Wrapper封裝式兩大類[15]。Filter過濾式方法相對高效,具有相對獨立性,根據評估函數不同,可以分為距離測度、信息測度、一致性測度、相關性測度四類。同時應注意到,目前在作戰等軍事實踐領域,真實數據獲取十分困難[16],應該注意在小樣本數據獲取的基礎上,通過模擬仿真方法,對可能存在的狀態空間進行仿真計算,以提高決策的準確性。
3.3.4 模塊化數據服務框架
軍事智能決策需求兼具通用性和專業性特點,應建立動態和靜態相結合的數據服務體系。靜態服務主要是收集固定的數據服務需求,如基礎級的數據統計、檢索等,面向固定的決策應用需求提供通用服務,從而實現快速高效響應。動態服務主要是針對實時計算要求高、需求變化快的決策需求,通過基礎決策模型庫,采取預先計算、存儲等方式,提供動態服務。同時,要建立服務的動態響應和調用機制,從基礎服務起步,不斷補充和完善服務資源,最終形成彼此獨立又相互關聯的模塊化數據服務體系。
4 結束語
未來戰爭必然是“人腦+智腦”的聯合,是軍事智能體之間的對抗。在人工智能技術不斷發展,軍事數據尚達不到大數據規模的情況下,軍事數據工程是實現軍事智能決策的基礎。本文從軍事智能決策的需求出發,構建了涵蓋數據層、知識層、服務層的數據工程體系,指出了需要重點關注的問題,為建設獨立的軍事數據工程體系提供了借鑒,為未來軍用智能決策拓展和應用打下了基礎。
參考文獻:
[1]卜先錦.當前軍事決策分析關注的幾個問題[J].軍事運籌與系統工程,2018,32(2):5-9.
[2]胡曉峰,榮明.作戰決策輔助向何處去——“深綠”計劃的啟示與思考[J].指揮與控制學報,2016,2(1):22-25.
[3]Nicholas Ernest,David Carroll,Corey Schumacher.Genetic Fuzzy based Artificial Intelligence for Unmanned Combat Aerial Vehicle Control in Simulated Air Combat Missions[J].Journal of Defense Management.2016,6:1.
[4]George I.Seffers:Commanding the Future Missio[EB/OL].[2016.5.1].www.afcea.org.
[5]曹杰.貝葉斯網絡結構學習與應用研究[D].合肥:中國科學技術大學,2017.
[6]李臘生,劉磊,劉文文.大數據與數據工程學研究[J].統計研究,2015,32(9):3-9.
[7]郭路生,劉春年.大數據時代應急數據質量治理研究[J].情報理論與實踐,2016,39(11):101-105.
[8]潘華,楊文宏,劉遠有.美軍數據標準及管理規定[M].北京:中國航空綜合技術研究所,2013.
[9]Tekada S,Knoblock C A,Minton S.Learning Domain-independent String Transformation Weights for High Accuracy Object Identification[C]∥Proceedings of the eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.ACM,2002:350-359.
[10]DONG X,Halevy A,Madhavan J.Reference Reconciliation Incomplex Information Spaces[C]∥Proceedings of the 2005 ACM SIGMOD International Conference on Management of Data.ACM,2005:85-96.
[11]胡艷麗,張維明,肖衛東,等.內置謂詞函數依賴及其推理規則[J].國防科技大學學報,2009,31(5):58-63.
[12]戴超凡,劉麗華,曾賽紅,等.數據質量與管理研究[J].指揮與控制學報,2016,2(4):322-328.
[13]劉慶和,梁正友.一種基于信息增益的特征優化選擇方法[J].計算機工程與應用,2011,47(12):130-132.
[14]徐冠華,趙景秀,楊紅亞,等.文本特征提取方法研究綜述[J].軟件導刊,2018,17(15):13-18.
[15]張曉海,操新文.基于深度學習的軍事智能決策支持系統.[J].指揮控制與仿真,2018,40(2):1-7.
[16]Wikipedia.John Boyd (Military Strategist)[EB/OL][2016-03-19].https:∥en.wikipedia.org/wiki/OODAloop.
Military Data Engineering Construction Oriented to Intelligent Decision-making
XIAO Chu-wan,LIU Jia,TANG Xiao-feng
(Naval Aviation University,Yantai 264001,China)
Abstract:Aiming at the requirement of high speed,high efficiency and high fusion of military intelligent decision-making data,based on the analysis of the difficulties of data requirement,collection,analysis and service faced by military data at present,a military data engineering framework composed of requirement layer,data layer,knowledge layer,service layer and evaluation feedback process is proposed.The key contents and technologies of metadata,data quality,small sample feature extraction and service system construction which need to be paid attention to are pointed out,which lays a foundation for the construction of military data engineering.
Key words:intelligent decision making;military data engineering;metadata;data quality;data service
中圖分類號:E11
文獻標志碼:A
DOI:10.3969/j.issn.1673-3819.2020.03.018
文章編號:1673-3819(2020)03-0097-05
收稿日期:2019-09-17
修回日期:2019-10-23
作者簡介:肖楚琬(1985—),男,湖南邵陽人,博士,副教授,研究方向為軍事裝備學、軍事數據工程。劉 嘉(1982—),男,博士,副教授。
工程師必備
- 項目客服
- 培訓客服
- 平臺客服
TOP




















