休み5日目

 計算シミュレーションサーバー向けGPGPUを調査していまして、例えばデルのPowerEdge R730でもオプションで選択できるサーバー用GPUボードはたくさんあります。GPUでもHPC向けや仮想化向けなど用途によって種類があるようで、どのGPUが目的にあっているのか調べてみました。
 まずはAMDのFireProですがS7000とS9000シリーズの2種類がありまして、S7000が仮想化向けS9000が計算向けのようです。自分の用途は計算なのでS9000シーリズ。デルからはS9050、S9100、S9150の3種類が該当し、数字が大きいほど高性能ということです。主な仕様とデルでのWeb価格は以下のとおり。

モデル 倍精度(GFLOPS) メモリ 価格(デル8/17現在) 発売
S9050 806 12GB GDDR5 240,618円 2014年8月
S9100 2110 12GB GDDR5 337,773円 2014年10月
S9150 2530 16GB GDDR5 456,399円 2014年8月

 次にNVIDIAですがGRIDとTeslaがありまして、GRIDは仮想化向けTeslaが計算向けとなり、Teslaの中でもKとMがありましてGPUの世代でKがKepler、MがMaxwellであり、新しいMaxwellは単精度は速いのですが、倍精度はKeplerの方が速いスペックとなっています。うちの環境では倍精度が必要ですので必然的にKの方がよさそう。GPUがデルからはK40MとK80が該当します。ちなみにK40MはファンレスのK40ということらしく基本はK40と変わりありません。またK80は2つのGPUを1枚のボードに合わせており、GPUとしても2つあるように見える点は注意です。
 そしてこれは発売前のものなのですがつい最近出たPascalコアのP100が2016年第4四半期に発売されるとのこと。かなりの高性能となっていますので価格によっては候補となりますね。こちらの情報では80〜100万円とのことですが。

モデル 倍精度(GFLOPS) メモリ 価格(デル8/17現在) 発売
K40M 1430 12GB GDDR5 511,836円 2013年11月
K80 1864 24GB GDDR5 740,265円 2014年11月
P100 4700 12GBまたは16GB HBM2 2016年末

 最後にintelXeon Phiです。3120Pと7120PがありXeon Phiでは第1世代の製品となり、ちょっと古いです。他のはPCIe 3.0のX16で本体と接続されますが、このインテルの2つは2.0のX16ですのでその辺にも古さがあり、データの転送速度の点でも不利と予想されます。

モデル 倍精度(GFLOPS) メモリ 価格(デル8/17現在) 発売
3120P 1003 6GB GDDR5 350,268円 2012年11月
7120P 1208 16GB GDDR5 565,182円 2012年11月

 GPU搭載の利点はそれはもう計算速度で、ベースとなるマシンのCPUを1コア当たりの性能で一番高いXeon E5-2637 v4としても1CPUで倍精度204.8GFLOPSとのことですから2CPU積んでも409.6GFLOPS。1コア当たり51GFLOPSと、GPUとは全然桁が違います。
 GPUの性能から選択すると1GPUでは今のところFirePro S9150が候補となりますが、来年初めにも出てくるTeslaのP100を待つのもありかもしれません。安い買い物ではないだけにじっくりと検討します。