‘神工坊’高性能仿真云平臺和其它云平臺的區別!

High Performance Industrial Simulation Online


‘神工坊’高性能仿真云平臺和其它云平臺的區別!的圖1  


目前,大量工業軟件紛紛上云,'神工坊'和這些云計算有什么區別?


當前,'神工坊'高性能仿真平臺的計算資源主要來源于國家超級計算無錫中心,超算在系統架構和服務體系都與現在的云計算有很大不同,今天我們聊聊超算的優異性。


‘神工坊’高性能仿真云平臺和其它云平臺的區別!的圖2  


總體來說,100%物理機性能、高效通信、快捷調度、大規模并行是‘神工坊’采用超算資源作為支撐帶來的主要優勢。對于計算規模和密度較大科學計算、工程模擬等領域,相比基于虛擬技術的云計算,超算是更好選擇



‘神工坊’高性能仿真云平臺和其它云平臺的區別!的圖3  



1.

100%物理機性能


超算天生為性能而生,所有的節點都是真實的物理機,作業直接運行于物理機,可以充分發揮CPU等核心部件的性能。


云計算大部分基于虛擬化基礎設施,用戶直接使用的是運行在宿主機上的虛擬機,性能相對物理機難免有一些損失。如果不是web服務等非計算密集型任務,可能造成比較明顯的影響。更重要的是,我們還不得不擔心一個對性能影響更大的問題——超賣


Tips

什么是超賣?

簡言之,云計算超賣指實際售出的虛擬資源數量,大于實際擁有的物理資源數量。

這里轉載了知乎某博主對于AWS各型號實例CPU超賣率的推斷(以下數據不代表本文觀點,請訪問https://zhuanlan.zhihu.com/p/24435587自行求證)


‘神工坊’高性能仿真云平臺和其它云平臺的區別!的圖4    



2.

高效通信


為了追求極致性能,超級計算機的所有節點都選擇集中放置,并通過高速低延遲的局域網進行連接。

例如,“神威·太湖之光”節點間都通過InfiniBand交換機進行連接,對分總帶寬約相當于70萬根單線千兆以太網,同時還有極低的延遲。


Tips

InfiniBand

InfiniBand(直譯為“無限帶寬”技術,縮寫為IB)是一個用于高性能計算的計算機網絡通信標準,它具有極高的吞吐量和極低的延遲,用于計算機與計算機之間的數據互連。InfiniBand也用作服務器與存儲系統之間的直接或交換互連,以及存儲系統之間的互連。


對分帶寬

將網絡分成節點數最接近的兩個子網,在所有分法中,連接兩個子網的鏈路帶寬最小值為該網絡的對分帶寬。



而基于虛擬化基礎設施的云計算,在網絡硬件一般不會采用昂貴的infiniBand,同時虛化也會對網絡效率帶來影響。


3.

快捷調度


超算通常采用作業調度系統給計算任務分配計算資源,資源充足時所消耗的時間用戶幾乎無法感知。

同時,國家超級計算無錫中心使用自研的調度系統,調度時間短、系統資源占用率小于0.1%、調度時間相比其他超算使用的調度器大幅縮減


‘神工坊’高性能仿真云平臺和其它云平臺的區別!的圖5  


而云計算一般需要采用虛擬機調度,啟停虛擬機通常需要帶來額外的時間開銷。另外,當虛擬機資源不滿足多變業務資源需求時,還需要反復重新配置和啟動虛擬機。


4.

大規模并行


超級計算機在“集中力量辦大事”方面具有天然優勢。超級計算機最核心的場景,就是利用所有的計算資源計算一個大科學問題。得益于超級計算機節點間高效通信網絡,科學計算和工程模擬等需要并行進程間實時通信的應用,在超級計算機上能獲得非常理想的加速比


Tips

加速比

加速比(speedup),是同一個任務在計算資源規模增加后,計算消耗時間降低的比例,用來衡量并行系統或程序并行化的性能和效果。



‘神工坊’高性能仿真云平臺和其它云平臺的區別!的圖6  


而在云計算環境中,單個虛擬機規模往往不能突破單個物理節點的規模限制。云計算在架構上,一般是眾多分布式物理集群的集合,而物理集群之間通過互聯網進行連接。因此,即使采用作業調度模式,云計算在跨集群計算時也無法克服互聯網帶來的物理網絡瓶頸。


十四五期間,工業數字化將是工業轉型升級的主路線。“神工坊”秉持“算力賦能、協同創新”的理念,爭做“先進算力到仿真算能的轉換器”、“離散機理和垂直仿真場景的連接器”,助力我國工程仿真技術實現跨越發展,支撐重大裝備研制創新和工業設計研發數字化轉型。

‘神工坊’高性能仿真云平臺和其它云平臺的區別!的圖7

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP

6
1