Many GPGPUマシン

出典: トータル・ディスクロージャ・サイト(事実をありのままに)

GPGPUを使う目的は、プログラムを高速に実行するためです。勿論そのためには、CPU用に書かれたプログラムを、GPGPU用に書き換える必要があります。それをどうやって実現するのか、そこが最大の問題だ、という話は後回しにします。今回は、1枚のGPGPUカードでは速度が不十分な場合の、Many GPGPUマシンを紹介します。Many GPGPUを構成するには、1.GPGPUカード1枚差しのマシンを複数台ネットワーク接続する、2.1台のマシンに複数枚のGPGPUカードを挿す、の2つの方法が考えられます。どちらが適しているかはプログラムによって異なります。が、計算はGPGPUに任せてCPUの計算能力はあまり必要ない、メモリは1台のマシンに乗る量(数十GB程度)で十分、という条件を満たせば(大部分のプログラムは満たすのでは?)、2の構成をお勧めします。理由は、プログラミングが容易、GPGPU間のデータ転送が高速、だからです。このような目的のために、HPCシステムズではGPGPU2枚差し、さらに4枚差しのマシンを販売しています。複数枚のGPGPUを1台のマシンに実装するのに必要な、十分な容量の電源ユニット、高効率の冷却システムを備えています。その中から、たまたま開発用に使用していた、2台のマシンを紹介します。ついでに本体としての性能も書いておきます。どちらのマシンも、CPUはIntel Xeon X5500番台を2CPU、メモリは12枚(安価な4GB/DIMMを使えば48GB、少し高価な8GB/DIMMを使えば96GB)実装できます。CPUだけでも8Coreでプログラムを実行できますので、OpenMP用のマシンとしても重宝します。2CPU当たりのメモリ帯域も64GB/S(前世代CPUでは21.33GB/S)と、かなり高速になっています。弊社の技術開発本部では、これらのマシンを開発用に使って、お客様からご依頼のあった、CPU用プログラムの高速化(主としてOpenMP使用)と、CPU用プログラムのGPGPU対応化(主としてCUDA使用)を行っています。


GPGPU2枚差しマシン GPGPU4枚差しマシン

-- ケンちゃん 2010年2月25日 (木) 14:09 (JST)


この記事へのコメントをお寄せください

  • サイトへの書き込みに差し支えございましたら トータルディスクロージャーサイトサポート係へメールをお送りください
  • トータル・ディスクロージャ・サイトに投稿された文章と画像は、すべてその著作権がHPCシステムズ株式会社に帰属し、HPCシステムズ株式会社が著作権を所有することに同意してください。
  • あなたの文章が他人によって自由に編集、配布されることを望まない場合は、投稿を控えてください。
  • コメントを書き込む場合は名前にひらがなを織り交ぜてください。
  • あなたの投稿する文章と画像はあなた自身によって書かれたものであるか、パブリック・ドメインかそれに類する自由なリソースからの複製であることを約束してください。あなたが著作権を保持していない作品を許諾なしに投稿してはいけません!

<comments hideform="false" />


Comments

ノート:Many GPGPUマシン

個人用ツール