GTX TITANの32ビット整数シフト

出典: トータル・ディスクロージャ・サイト(事実をありのままに)

この記事は、GTX TITANの32ビット整数シフト を編集中 - 正統納豆天国ブログ - Yahoo!ブログの許可を取って、転載した記事です。

倍精度有効時のGeForce GTX TITANは、Tesla K20シリーズと同じスループットで命令を実行する。そんなふうに考えていた時期が俺にもありました。

目次

Compute Capability 3.xの命令スループット

GeForce GTX 680シリーズやTesla K10に代表される、GK104アーキテクチャのGPUは、Tesla K20のGK110アーキテクチャのGPUに比べて、倍精度命令のスループットが抑えられている、というのは有名な話。でも、スループットが抑えられているのは実は倍精度命令だけではない。

CUDA C Programming Guideにある命令のスループット一覧。Compute Capabilityの3.0と3.5の違いに注目して欲しい。倍精度命令のスループットが大きく落ちているのに紛れて、32-bit integer shift64から32に半減しているのが分かるだろう。倍精度計算を多用する科学技術計算だけでなく、ビット演算を多用する暗号計算についても、Teslaと下位製品とで分かりやすい性能差を付けているのだろう。

32ビット整数シフトのスループットを測る

測定用のプログラム。ひたすらshl.b32命令を繰り返すだけのプログラムである。

GeForce GTX 680

Clock: 1058500 KHz, # of MPs: 8
Elapsed Time: 4080.937988 milliseconds
# of Threads: 1024, # of SHLs : 1099511627776
Throughput: 31.816982

Compute Capability 3.0らしい、スループット32の結果が出ている。ここは予想通り。

GeForce GTX TITAN (LOW DP)

Clock: 875500 KHz, # of MPs: 14
Elapsed Time: 2476.519043 milliseconds
# of Threads: 1024, # of SHLs : 1099511627776
Throughput: 36.222129

36強という中途半端な数字が出ているが、おそらく本来はスループット32なのだが、倍精度無効時にCUDAのAPIで確認できない形での何らかの周波数上昇が起きて、結果CUDAのAPIでクエリできる値から計算したスループットが不自然に増えているのだろう。

GeForce GTX TITAN (HIGH DP)

Clock: 875500 KHz, # of MPs: 14
Elapsed Time: 2865.968750 milliseconds
# of Threads: 1024, # of SHLs : 1099511627776
Throughput: 31.299989

Compute Capability 3.0の下位製品と同等のスループット32。ちなみに、業務で触ったものであるので具体的な数字は出せないが、Tesla K20ではきちんとスループット64が出る*。倍精度無効時と違って謎の性能向上も無く、比較して性能が落ちている点には注意が必要である。

*弊社環境で測定したTesla K20Xの出力は以下の通り。

Clock: 732000 KHz, # of MPs: 14
Elapsed Time: 1681.955688 milliseconds
# of Threads: 1024, # of SHLs : 1099511627776
Throughput: 63.789054

Programming Guideにある通りのスループット64である。

結論

GeForce GTX TITANは、倍精度命令こそTesla K20シリーズと同等の性能であるが、それ以外の性能上の制限はそのまま引き摺っている。暗号計算などの整数シフト命令を多用する用途に使う場合はGTX TITANは向いているとは言えず、もう1ランク下位製品のGTX 690なり、もしくはいっそK20を用意するのが最善ではないだろうか。


この記事へのコメントをお寄せください

  • サイトへの書き込みに差し支えございましたら トータルディスクロージャーサイトサポート係へメールをお送りください
  • トータル・ディスクロージャ・サイトに投稿された文章と画像は、すべてその著作権がHPCシステムズ株式会社に帰属し、HPCシステムズ株式会社が著作権を所有することに同意してください。
  • あなたの文章が他人によって自由に編集、配布されることを望まない場合は、投稿を控えてください。
  • コメントを書き込む場合は名前にひらがなを織り交ぜてください。
  • あなたの投稿する文章と画像はあなた自身によって書かれたものであるか、パブリック・ドメインかそれに類する自由なリソースからの複製であることを約束してください。あなたが著作権を保持していない作品を許諾なしに投稿してはいけません!

<comments hideform="false" />


Comments

ノート:GTX TITANの32ビット整数シフト

個人用ツール