了解三種 PCIe 架構,以便挑選適合的 GPU伺服器
與傳統的 CPU 伺服器相比,GPU 已成為 AI 和 HPC 應用程式中高效能運算的實際解決方案。這些系統可以執行廣泛的應用程式,而且利用 GPU 的應用程式在性能上的提升已被廣泛記錄。時至今日,仍在不斷開發新的技術和應用程式來利用和優化日益強大的 GPU 性能。
雖然專注於 GPU 的伺服器包含Single CPU或Dual CPU,以及多達 10 個 PCIe GPU,但系統的架構方式會影響應用程式的速度和伺服器的靈活性。目前 GPU 伺服器有三種PCIe架構,可以使系統針對各種工作負載得到更優化。在選擇 GPU 伺服器時,CPU 與 GPU 之間的溝通頻寬至關重要。
PCIe GPU 存取選項
GPU 伺服器專為需要大量運算的應用程式而設計,例如分子動力學、AI 和深度學習以及各種 HPC 工作負載。雖然 1:1 的 CPU 對 GPU 比例在桌上型電腦、工作站和伺服器中很常見,但由於高運算工作負載比較重,需要使用多GPU配置的伺服器較為合適。
GPU 伺服器有兩種主要架構:
- 基於 PCIe 的伺服器(PCIe Based Servers): 具有多達 8 個或有時 10 個可用於 GPU 的 PCIe 插槽的 GPU 伺服器。
- 基於 SXM/OAM 的伺服器(SXM/OAM Based Servers): GPU 安裝並插接在載板上,並且只與 CPU 有 1 個 PCIe 連接的 GPU 伺服器。
GPU 伺服器也有Dual CPU配置的選項。兩個 CPU 通過高速通訊路徑進行溝通,Intel 伺服器稱之為 UPI,AMD 伺服器稱之為 xGMI。
不同的系統架構下,PCIe 如何連接
目前PCIe 伺服器,有 3 種不同的系統架構,專為各種工作負載而設計:
- Single Root (單根)
- Dual Root (雙根)
- Direct Attached (直通)