NASA眼中CFD的未來(5)知識提取

路線圖的知識提取領域包括集成數據庫和數據可視化方向的時間表。

NASA眼中CFD的未來(5)知識提取的圖1

該領域確定的總體目標與集成數據庫系統的開發相關,該系統管理和處理大量非穩定模擬數據和測試數據,以實現不確定性量化工作流程,并能夠對更大的數據集進行需求分析和可視化。

到2020年,目標技術里程碑是能夠分析和可視化100億節點的非定常CFD模擬,而且這個目標已經由NASA和NVIDIA在火星著陸器的仿真上實現。


什么是知識提取

知識提取 (Knowledge Extraction) 是指從結構化或非結構化數據源中提取有用的信息和知識。該技術可以用于從大量數據中提取出有用的信息、知識和模式,以幫助決策和智能分析。知識提取通常包括以下步驟:

  1. 數據收集和預處理:從各種數據源收集和整理數據,進行數據清洗和歸一化等預處理步驟,以使數據能夠被更好地分析。

  2. 實體識別:對數據中的實體(如人、地點、組織)進行識別和分類。

  3. 關系提取:識別實體之間的關系,并將它們表示為圖或關系模型。

  4. 事件提取:從數據中提取出事件的關鍵信息,并將其表示為結構化的形式。

  5. 屬性提取:提取出實體的屬性(如年齡、性別、職業等)。

  6. 知識表示和存儲:將提取的知識表示為結構化數據,如本體論或圖數據庫,并將其存儲在知識庫中。

知識提取在自然語言處理、計算機視覺、數據挖掘和機器學習等領域中得到廣泛應用,可以用于信息抽取、智能搜索、機器翻譯、自動問答和智能推薦等應用。

知識提取在計算流體力學(CFD)方面的應用可以幫助人們更好地理解流體力學問題并提高計算效率。以下是一些知識提取在CFD中的具體應用:

  1. 流場數據分析:CFD模擬產生的大量數據可以使用知識提取技術進行分析和處理。例如,可以使用機器學習方法提取出流場中的渦旋、湍流等特征,幫助工程師更好地理解流體力學問題。

  2. 幾何建模:在CFD模擬中,幾何模型是一個重要的輸入參數。使用知識提取技術,可以自動從三維掃描數據中提取幾何模型,減少手動建模的時間和成本。

  3. 建模參數選擇:CFD模擬中需要選擇一些建模參數,如網格大小、湍流模型等。使用知識提取技術,可以根據先前的模擬數據自動選擇最優的建模參數,提高計算效率。

  4. 流動控制:使用知識提取技術,可以從先前的模擬數據中提取出控制流動的關鍵參數,如舵角、噴氣方向等,幫助工程師制定更有效的控制策略。

總之,知識提取技術在CFD領域的應用可以幫助人們更好地理解流體力學問題,提高計算效率和預測精度。

行業進展

自發布該研究報告以來的六年中,CFD知識提取(KE)已經取得了重大進展。該研究認為,集成數據庫和可視化技術將是實現2030年目標的關鍵。

在集成數據庫方面,到2025年,將實現用于創建具有1000個非穩態CFD模擬加上所有數據源完整UQ的實時多保真度數據庫的技術演示。在可視化方面,到2020年將進行一項技術演示,即對一個包含100億點、非穩態CFD模擬進行按需分析/可視化。

有幾項工作正在進行,以實現2025年數據庫演示。劍橋大學的Graham Pullan一直在開發dbslice,這是一種基于Web的CFD后處理數據庫方法。

NASA眼中CFD的未來(5)知識提取的圖2

dbslice

同樣,Intelligent Light一直在開發Spectre-UQTM,這是一種用于不確定性量化的基于Web的環境。

NASA眼中CFD的未來(5)知識提取的圖3

Spectre

而ANSYS則正在開發Nexus,一種集成在Ansys EnSight產品中的報告生成、分析和數據存儲框架。

NASA眼中CFD的未來(5)知識提取的圖4

NASA眼中CFD的未來(5)知識提取的圖5

Ansys Nexus

Sandia Analysis Workbench(SAW)是另一個允許用戶在模型構建、網格生成、解決方案、后處理和UQ之間共享數據的功能。

NASA眼中CFD的未來(5)知識提取的圖6

Sandia

所有這四個工具都使用基于Web服務器的數據處理和分析。通常會集成關系型數據庫系統(例如Oracle?、PostGRES、SQLite),以存儲和提供元數據、模擬和實驗所需的數據,在分析、UQ或設計工作流程中不同部分需要使用它們。

雖然CFD社區內存在公開可用的數據庫,然而這些數據并不易于整個社區訪問,且對于高超聲速模擬驗證和驗證(V&V)數據的存儲庫仍有迫切需求。例如,在高超聲速模擬社區中,目前正在使用DNS模擬和實驗數據作為“真理”,以推動改進壁面分辨大渦模擬(WR-LES)、壁面模化大渦模擬(WM-LES)、非定常雷諾平均納維-斯托克斯方程(URANS)或RANS用于高超聲速飛行器仿真和設計。但是,現有數據庫是分布式的,并且不使用一致/協調的數據庫架構,這使得難以輕松共享和使用數據。

通過可視化進行知識提取已經可以處理100億個網格單元,在不穩定數據集的“按需分析/可視化”方面也取得了良好的進展。為了減少將大量數據寫入磁盤并讀回后再使用后處理工具進行可視化所帶來的I/O開銷,人們已經對原位/過境方法進行了相當多的開發。通過原位處理,流動求解器被配備了一個數據處理/可視化庫(例如VisIt-Libsim 或Paraview-Catalyst ),該庫與流動求解器共享內存空間。這種功能通常需要模擬代碼暫停,而數據被處理時則無法繼續運行。通過過境處理,模擬數據被傳輸到一組單獨的計算節點上進行處理,并允許在傳輸完畢后恢復模擬運行。VisIt-Libsim、Paraview-Catalyst和其他科學數據處理庫都具有獨特的可視化和分析能力,用戶可能想要在其特定模擬中使用它們。然而,開發人員可能不想只鎖定于一個庫中。Sensei是一種原位/過境基礎設施,在求解器配備它之后,求解器可以使用任何原位/過境方法的功能。

NASA眼中CFD的未來(5)知識提取的圖7

數據提取也可以是圖像。在模擬執行時,可以生成圖像文件。然而,如果用戶僅保存單個圖像或電影,則無法探索數據(縮放、平移、旋轉、動畫)。為了實現大型數據集的交互式可視化,洛斯阿拉莫斯國家實驗室的Cinema技術利用從求解器通過原位/中轉管道收集的許多不同視點的大量圖像提取物集合。然后可以通過Cinema查看器、Web應用程序甚至通過Jupyter notebook 來查看這些圖像。VisIt-Libsim和Paraview-Catalyst都能夠輸出Cinema提取數據庫。

2017年,Jansen等人展示了使用Sensei和Paraview可視化和分析垂直尾部上的活動噴氣分離流的50億單元DDES模擬,如以下視頻所示。

2015年,Tecplot開始探索可視化大規模數據集的要求。他們在桌面大小計算機系統上使用商業產品Tecplot來可視化來自經典1萬億單元數據集的數據集。

NASA眼中CFD的未來(5)知識提取的圖8

Tecplot處理120GB數據耗時

參考資料

  1. G. Pullan, "A Web-Based Database Approach to CFD Post-Processing," in 55th AIAA Aerospace Sciences Meeting, Grapevine, TX, AIAA 2017-0814. 2017.

  2. E. Duque and S. Lawrence, "Spectre: A Computational Environment for Managing Total Uncertainty Quantification of CFD Studies," AIAA AIAA 2019-2221. 2019.

  3. E. K. Friedman-Hill, E. L. Hoffman, M. J. Gibson, R. L. Clay and K. H. Olson, "Incorporating Workflow for V&V/UQ in the Sandia Analysis Workbench," Sandia National Lab, Albuquerque,NM, SAND2015-0425C. 2015.

  4. R. Cumming, "private communication," Director of the Hypersonic Vehicle Simulation Institute (HVSI), US Air Force Academy.

  5. B. Whitlock, J. M. Favre and J. S. Meredith, "Parallel In Situ Coupling of Simulation with a Fully Featured Visualization System," in Eurographics Symposium on Parallel Graphics and Visualization, 2011.

  6. U. Ayachit, A. Bauer, B. Geveci, P. O'Leary, K. Moreland, N. Fabian and J. Mauldin, "Paraview catalyst: Enabling in situ data analysis and visualization," in Proceedings of the First Workshop on In Situ Infrastructures for Enabling Extreme-Scale Analysis and Visualization, Austin, TX, 2015.

  7. M. Larsen, J. Ahrens, U. Ayachit, E. Brugger, H. Childs, B. Geveci and C. Harrison, "The ALPINE In Situ Infrastructure: Ascending from the Ashes of Strawman," in SC '17: The International Conference for High Performance Computing, Networking, Storage and Analysis, Denver, 2017.

  8. U. Ayachit, B. Whitlock, M. Wolf, B. Loring, B. Geveci, D. Lonie and E. W. Bethel, "The SENSEI generic in situ interface," in Second Workshop on In Situ Infrastructures for Enabling Extreme-Scale Analysis and Visualization (ISAV), AIAA 40-44. 2016.

  9. A. C. Kirby, Z. Yang, D. Mavriplis, E. P. Duque and B. J. Whitlock, "Visualization and data analytics challenges of large-scale high-fidelity numerical simulations of wind energy applications," AIAA 2018-1171. 2018.

  10. T. L. Turton, D. Banesh, T. Overmyer, B. H. Sims and D. H. Rogers, "Enabling Domain Expertise in Scientific Visualization With CinemaScience," IEEE Computer Graphics and Applications, vol. 40,no. 1, pp. 90-98, 2020.

  11. K. E. Jansen, M. Rasquin, J. A. Farnsworth, N. Rathay, M. Mostriano and M. Amitay, "Interaction of a Synthetic Jet Actuator on Separated Flow over a Vertical Tail," AIAA Journal, vol. 56, no. 7,pp. 2653-2668, 2018.

  12. S. T. Imlay, C. A. Mackey and D. E. Taflin, "Visualizing a Trillion-Cell Simulated CFD Solution on an Engineering Workstation," in AIAA Fluid Dynamics Conference, AIAA 2018-3725. 2018

文章來源:基算仿真

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP