QuantaGird D52G-4U を使ったAIおよびHPCワークロード専用システム
Server
01 Jun. 2018

.

[サンノゼ、2018年5月31日] Quanta Cloud Technology(QCT)は、グローバルデータセンターソリューションプロバイダーです。AIおよびHPCコンピューティングのための最新のデュアルソケットIntel® Xeon スケーラブル搭載の専用型アクセラレーターサーバー QuantaGrid D52G-4Uを紹介します。D52G-4Uは様々なアプリケーションを最適化できるように、現在3つの異なるベースボードをサポートしています。最初の構成でD52G-4Uは、GPU-GPU間を300GB/sのNVLink™で接続された8枚のNVIDIA Tesla V100 SXM2 GPUアクセラレーターを搭載できます。深層学習を採用し、ビジネスモデルの革新を行うための究極のトレーニング性能とR&D開発期間を短縮が提供されます。

 

D52G-4Uは、Inception V3やより複雑なResnet-50(図1を参照)などの一般的な畳み込みニューラルネットワークで高性能を実現します。 さらに、GoogleNetを8枚のNvidia®TeslaV100で実行したときの効率は96.2%となりました(Image 2を参照)。 このような高いスケールアップ効率を実現するD52Gは、トレーニングモデルを高速化するマルチGPU環境における性能を最大化することができます。

図1:D52G-4Uを用いたTensorflow ディープラーニングフレームワークベンチマーク

図2:D52G-4Uを用いたNvCaffeベンチマーク

 

8枚のダブルワイドGPUを搭載できるPCIe ベースボードタイプでは、CPU-GPU間バンド幅の最適化、またはGPU-GPU間通信を最適化できるようGPUトポロジーを柔軟に変更可能なため、IT投資のリスクを減らし異なるHPCアプリケーション性能をファインチューニングすることができます。

最後に、高精度モデルのトレーニング後、ビジネス革新を成功させるための重要な要素は、事前トレーニングされたモデルをできるだけ多くのユーザーに効率的に提供する方法を検討することです。

 

20枚分のシングルスロットを備えたD52G-4Uベースボードは、NVIDIA Tesla®P4のような強力なシングルスロットタイプGPUを利用することで大量の推論需要を満たすことができます。 このSKUはまた、24台の低遅延NVMe SSDストレージベイと、性能をスケールアウトするための高帯域低遅延なInfiniBandをサポートすることで、I/Oリードタイムを削減するため大量のデータをこの強力なマシンに読み込ませることができます。

 

https://www.qct.io/product/index/Server/rackmount-server/GPGPU-Xeon-Phi

QCTの  Facebook および Twitter アカウントをフォローすることで、最新のニュースや発表を受け取ることができます。

.