GeForce GTX TITAN: High Performance Linpackの性能評価速報

出典: トータル・ディスクロージャ・サイト(事実をありのままに)

この記事は、GeForce GTX TITAN: High Performance Linpack - 正統納豆天国ブログ - Yahoo!ブログの許可を取って、転載した記事です。

GeForce GTX TITANを手に入れたので、簡単なテストとしてHigh Performance Linpack (HPL)を動かしてみることにした。その前に、設定でもいくつか躓いた点が在るので、それらについても解説を行う。

設定

GeForce GTX TITANに対応するLinux向けドライバは、313.26以降のものである。このドライバは、NVIDIAのドライバ検索ページではGTX TITANを指定しないと出てこない(=古いGPU向けにダウンロードしたドライバは使えない)点に、注意が必要である。

また、このドライバに含まれるnvidia-smiのヘルプを読むと、--gomのオプションで倍精度(DP)モードのオン/オフができるように見えるが、実際にこのコマンドを実行しようとすると、

# nvidia-smi --gom=1
GOM features not supported for GPU 0000:01:00.0.
Treating as warning and moving on. All done.

のようなエラーが出て設定に失敗する。nvidia-settingsからの設定は有効であるので、一度Xを立ち上げて倍精度モードの設定をしておきたい。nvidia-settingsから行った設定は、Xを終了してホストを再起動してもそのまま有効になっているようだ。

HPL

以下の環境で、NVIDIAの開発者ページからダウンロードできるCUDA向けHPL (hpl-2.0_FERMI_v15)を実行した。

CPU: Phenom II X6 1090T (3.2 GHz, 6 cores)
GPU: ZOTAC GeForce GTX TITAN ZT-70701-10P
Memory: Transcend TS512MLK72V3N (4 GB, DDR3-1333) × 4
Motherboard: ASUS M4A89GTD PRO/USB3
OS: CentOS 6.4
Compiler: CUDA 5.0
BLAS: ACML 4.4.0
MPI: Open MPI 1.5.4 (attached with CentOS)

NB = 1792のときに 422.8 GFLOPSと、少々奮わない値が出た。このような結果が出た原因としては、PCI Express 2.0(ホスト環境は3.0に対応していないので、2.0自体は正常動作)の接続がなぜかx8で認識されているようで、ホストとの通信が大きなボトルネックになっていると考えられる。

なお、DGEMM自体は不自然なチューニングをしなくても1.3 TFLOPS以上の値が出るのを確認している。ホストのPCI Express接続の改善などのチューニングをしっかりすれば、NVIDIAの宣伝するような1 TFLOPS以上の実効性能が出ると思われる。


この記事へのコメントをお寄せください

  • サイトへの書き込みに差し支えございましたら トータルディスクロージャーサイトサポート係へメールをお送りください
  • トータル・ディスクロージャ・サイトに投稿された文章と画像は、すべてその著作権がHPCシステムズ株式会社に帰属し、HPCシステムズ株式会社が著作権を所有することに同意してください。
  • あなたの文章が他人によって自由に編集、配布されることを望まない場合は、投稿を控えてください。
  • コメントを書き込む場合は名前にひらがなを織り交ぜてください。
  • あなたの投稿する文章と画像はあなた自身によって書かれたものであるか、パブリック・ドメインかそれに類する自由なリソースからの複製であることを約束してください。あなたが著作権を保持していない作品を許諾なしに投稿してはいけません!

<comments hideform="false" />


Comments

ノート:GeForce GTX TITAN: High Performance Linpackの性能評価速報

個人用ツール