歴代製品とX5570搭載新製品の性能比較
出典: トータル・ディスクロージャ・サイト(事実をありのままに)
このページでは2~3年前の製品とX5570搭載の新製品のベンチマーク性能比較をしています。
当時の製品をお持ちの方は、最新製品と性能を比較してみてください! X5570製品にご興味を持たれましたら、ぜひ HPCシステムズにお問い合わせください!
目次 |
STAR-CD
ベンチマーク環境
ノード内並列効率化効率
- Intel Xeon X5570において、ノード内のコアを半分だけ用いた4並列に比べ、全コアを使った8並列において約1.8倍の並列化効率を実現しています。従来の Intel Xeon5100 ~ 5400シリーズではありえなかった結果です。これは旧世代でのボトルネックを根本的に解消していることを示しています。
ノード間並列のパフォーマンスとメモリ帯域の関係
- コア数を固定してノードをまたいだ並列性能を確認すると、E5160は性能を伸ばしていますが、X5570の方は劣化しています。これはそれぞれのシステムのボトルネックが異なるためです。
- X5570では CPU時間に数%程度の差しかありません。ネットワークを介した並列による遅延が、パフォーマンス劣化の主因と考えられます。
- E5160が倍近いパフォーマンス向上を示しているのは、メモリがボトルネックになっている効果です。この世代のアーキテクチャで高速化した CPUを使い切るには、コアあたり 8~10GB/sec程度のメモリ転送帯域を要すると考えられ、全体で 22GB/secの帯域しかもたないこのシステムでは、ノード内2コアまでがリニアスケーリングの限界です。これを端的に示す証左となるのが、4ノード4コアと4ノード8コアの比較です。ノードあたり2コアまでなら、メモリがボトルネックにならないということが、きちんと倍の性能が得られていることから明白です。
全体性能について
- 旧世代の X5160でパフォーマンスを出すには、コアの使い方をネットワーク遅延と、メモリ帯域のバランスの中で複雑に考えないといけなかったのに比べ、X5570では全ての場合において素直に性能を出してくるため、システムの導入は最小限で済ませることが出来ます。
- その反面、ノード内に8コアも持つシステムでは、ノードをまたいだ並列に関して高速インターコネクタが必須です。古いバージョンの STAR-CDではうまく使えない場合もありますが、今回ベンチマークに使用した 3.26.118では問題なく動作します。従来のバージョンでのご利用に関してはご相談下さい。
- この結果を端的に表すとするならば「倍性能を出すのに、半分の台数で済む」ということになろうかと思われます。
Amber
この記事へのコメントをお寄せください
- サイトへの書き込みに差し支えございましたら トータルディスクロージャーサイトサポート係へメールをお送りください 。
- トータル・ディスクロージャ・サイトに投稿された文章と画像は、すべてその著作権がHPCシステムズ株式会社に帰属し、HPCシステムズ株式会社が著作権を所有することに同意してください。
- あなたの文章が他人によって自由に編集、配布されることを望まない場合は、投稿を控えてください。
- コメントを書き込む場合は名前にひらがなを織り交ぜてください。
- あなたの投稿する文章と画像はあなた自身によって書かれたものであるか、パブリック・ドメインかそれに類する自由なリソースからの複製であることを約束してください。あなたが著作権を保持していない作品を許諾なしに投稿してはいけません!
