DDR3 X5570 メモリースピードでの違い

出典: トータル・ディスクロージャ・サイト(事実をありのままに)

DDR3 memoryのスピードによる違い

(2009/9/8)

DDR3メモリは、マザーボードに挿すメモリの枚数を増やす場合、メモリの速度を遅くしなければなりません。6枚なら1333MHzまで出せますが、12枚なら1066MHz、18枚なら800MHzまで下がります。

このメモリ速度により、どのくらいパフォーマンスが低下するのかを調べました。 CPUはX5570 2.93GHz、OSはCent4.7です。

まずは、HPL2.0です。

ファイル:X8DTN-X5570-HPL-memspeed.jpg

殆んど変化はありません。ただ、HPLは、実アプリとの差が大きくなったとも言われていますので、amber10 factor_ixでの結果です。

ファイル:X8DTN-X5570-amber10-memspeeds.jpg

これも殆んど変化がありません。それでは、並列を行なった場合、スレッド間の通信が大変多い、VASP 4.6.35でも調べてみました。

ファイル:X8DTN-X5570-vasp-memspeeds.jpg

vaspでは、弱冠、差がでます。 この程度なら、メモリ搭載量が大きい方が魅力的に思えます。

しかし、実際の運用を考えてみると、8coreもあるのに、ある計算だけを1個だけ、実行する状態は、少し考え難いでしょう。 そこで、vaspを同時に1,2,4,8ジョブ実行した場合、たった1ジョブだけ実行した実行時間を100%として、実行時間がどの程度変化するかを、調べて見ました。

ファイル:X8DTN-X5570-multi-vasp-memspeeds.jpg

1333MHz,1066MHzでは、実行時間の増加は、3割程度までの低下ですが、800MHzでは、いきなり5割以上増えてしまいます。

こうした傾向は、様々なアプリケーションで、あります。我々が調べた中で、象徴的なものは次のWIEN2k_09.1の結果です。

ファイル:X8DTN-X5570-multi-wien-memspeeds.jpg

800MHzと、1066MHzまでではあまりにも違います。これでは、X5570を載せた甲斐が無いと言ってもいいかもしれません。

単純に並列数を稼ぐ場合であれば、大容量にメモリを登載して、メモリスピードが800MHzになっても構わないかもしれません。 しかし、多数のジョブを沢山実行させて、終る端からまたジョブを投入して、などの場合、WIEN2kの結果の様なジョブであると、1033MHzでは、12日で終るはずが、800MHzでは16日近くかかる計算になります。

単体性能だけを見た性能を見るだけでは、実際に使う場合の使い方で期待する性能が出ない亊もあります。


目次

この記事へのコメントをお寄せください

  • サイトへの書き込みに差し支えございましたら トータルディスクロージャーサイトサポート係へメールをお送りください
  • トータル・ディスクロージャ・サイトに投稿された文章と画像は、すべてその著作権がHPCシステムズ株式会社に帰属し、HPCシステムズ株式会社が著作権を所有することに同意してください。
  • あなたの文章が他人によって自由に編集、配布されることを望まない場合は、投稿を控えてください。
  • コメントを書き込む場合は名前にひらがなを織り交ぜてください。
  • あなたの投稿する文章と画像はあなた自身によって書かれたものであるか、パブリック・ドメインかそれに類する自由なリソースからの複製であることを約束してください。あなたが著作権を保持していない作品を許諾なしに投稿してはいけません!

Name (required):

Website:

Comment:


Comments

タカ said ...

大変興味深いデータでした。ありがとうございます。

800と1333を比較しメモリをフル実装した場合、35%程度の性能差が発生するのは興味深いです。

一方、1066と1333ではほとんど差がないのでほぼ同等といったところが実測値で出ているのは初めて知りました。

--タカ 2009年9月8日 (火) 12:47 (UTC)

コピオ said ...

とても興味深いデータですね。大変参考になります。 "6枚なら1333MHzまで出せますが、12枚なら1066MHz、18枚なら800MHzまで下がります。" とありますが、これは2cpuの場合と考えていいですよね。


--コピオ 2009年9月9日 (水) 01:01 (UTC)

ケンぼー said ...

ここでは「枚数」とわかりやすく表記していますが、厳密にはRANK数で決まります。

一般のユーザーはあまりご存知ないかもしれませんが、使っているメモリチップによって、メモリには Single RANK, 2Rank, 4Rank といったものが存在します。

これは建物で言うと「何階建て」にするか?という話に近いのですが、これの数が一定の数に達するとメモリクロックが下がるようになっています。なので、2Rank 4枚と、4Rank 2枚は同じ扱いになります(これも実は荒っぽいまとめかたではあるのですが・・)。

ランクの小さいメモリの方が有利なのは確かですが、チップの単価が上がるため、メモリの価格が高くなる傾向があります。

さらに、クロックが上がるとレイテンシも上がるのが常なので、グラフでも見られるように 1066 が最適、といった結論もでてきます。チューニングってめんどくさい作業です。


--ケンぼー 2009年9月9日 (水) 06:57 (UTC)

コピオ said ...

ご丁寧なご説明、有難うございます。HPCシステムズさんの製品は仕様を診る限りですと、1066MHZが主なラインアップのようですので、安心ですね。

--コピオ 2009年9月9日 (水) 23:42 (UTC)

個人用ツール