計算シミュレーションサーバー向けGPGPUを調査していまして、例えばデルのPowerEdge R730でもオプションで選択できるサーバー用GPUボードはたくさんあります。GPUでもHPC向けや仮想化向けなど用途によって種類があるようで、どのGPUが目的にあっているのか調べてみました。
まずはAMDのFireProですがS7000とS9000シリーズの2種類がありまして、S7000が仮想化向け、S9000が計算向けのようです。自分の用途は計算なのでS9000シーリズ。デルからはS9050、S9100、S9150の3種類が該当し、数字が大きいほど高性能ということです。主な仕様とデルでのWeb価格は以下のとおり。
モデル | 倍精度(GFLOPS) | メモリ | 価格(デル8/17現在) | 発売 |
---|---|---|---|---|
S9050 | 806 | 12GB GDDR5 | 240,618円 | 2014年8月 |
S9100 | 2110 | 12GB GDDR5 | 337,773円 | 2014年10月 |
S9150 | 2530 | 16GB GDDR5 | 456,399円 | 2014年8月 |
次にNVIDIAですがGRIDとTeslaがありまして、GRIDは仮想化向け、Teslaが計算向けとなり、Teslaの中でもKとMがありましてGPUの世代でKがKepler、MがMaxwellであり、新しいMaxwellは単精度は速いのですが、倍精度はKeplerの方が速いスペックとなっています。うちの環境では倍精度が必要ですので必然的にKの方がよさそう。GPUがデルからはK40MとK80が該当します。ちなみにK40MはファンレスのK40ということらしく基本はK40と変わりありません。またK80は2つのGPUを1枚のボードに合わせており、GPUとしても2つあるように見える点は注意です。
そしてこれは発売前のものなのですがつい最近出たPascalコアのP100が2016年第4四半期に発売されるとのこと。かなりの高性能となっていますので価格によっては候補となりますね。こちらの情報では80〜100万円とのことですが。
モデル | 倍精度(GFLOPS) | メモリ | 価格(デル8/17現在) | 発売 |
---|---|---|---|---|
K40M | 1430 | 12GB GDDR5 | 511,836円 | 2013年11月 |
K80 | 1864 | 24GB GDDR5 | 740,265円 | 2014年11月 |
P100 | 4700 | 12GBまたは16GB HBM2 | 2016年末 |
最後にintelのXeon Phiです。3120Pと7120PがありXeon Phiでは第1世代の製品となり、ちょっと古いです。他のはPCIe 3.0のX16で本体と接続されますが、このインテルの2つは2.0のX16ですのでその辺にも古さがあり、データの転送速度の点でも不利と予想されます。
モデル | 倍精度(GFLOPS) | メモリ | 価格(デル8/17現在) | 発売 |
---|---|---|---|---|
3120P | 1003 | 6GB GDDR5 | 350,268円 | 2012年11月 |
7120P | 1208 | 16GB GDDR5 | 565,182円 | 2012年11月 |
GPU搭載の利点はそれはもう計算速度で、ベースとなるマシンのCPUを1コア当たりの性能で一番高いXeon E5-2637 v4としても1CPUで倍精度204.8GFLOPSとのことですから2CPU積んでも409.6GFLOPS。1コア当たり51GFLOPSと、GPUとは全然桁が違います。
GPUの性能から選択すると1GPUでは今のところFirePro S9150が候補となりますが、来年初めにも出てくるTeslaのP100を待つのもありかもしれません。安い買い物ではないだけにじっくりと検討します。