StatsBeginner: 初学者の統計学習ノート

統計学およびR、Pythonでのプログラミングの勉強の過程をメモっていくノート。たまにMacの話題。

AWSの深層学習用GPUインスタンスのスペックと価格を一覧化した

つい先日も似たようなエントリを書きましたが、AWSのサイトでいまいち一覧化された情報がないことに怒りを感じたので、表にまとめました。
インスタンスを起動(作成)する画面からインスタンスの比較表をみることが出来ますが、そこではGPUの製品名やメモリは表示できません。で、各クラスの説明ページに飛ぶと、情報の有無がまちまちです。
結局知りたいことは以下のような点なので、ひとつの表にまとめました。

  • GPUの製品名(速度を左右する)
  • GPUメモリ(バッチサイズの限界を決めるので速度を左右する)
  • 時間あたりの価格
  • vCPU数(上限緩和申請をするときに必要)


下の画像のとおりですが、リージョンによって価格がけっこう違っていて、アメリカのリージョンにしておくほうが安いのでいいと思います。
vCPU上限はリージョンごとに管理され、申請も別々ですが、複数台同時に使うなら複数のリージョンで申請しておくのがいいと思います。というのも、利用実績が全くないアカウントで申請してみたところ、ディープラーニング用にGPUインスタンスを使うから上限緩和してくれと頼んでも、vCPU数8までしか認められず(笑)、それだとGPU1枚のインスタンスしか選べません。去年、50万円分ぐらい利用実績があったアカウントで頼むと、いきなりvCPU数64まで認められたので、GPU4連装のインスタンスも使えるようになりました。


ちなみにG4adってのもあるのですが、これはAMDのGPUが使えるやつです。私はCUDAを使うのでNVIDIAのGPUが載っているG4dnだけまとめています。
GPUメモリは合計値です。
表はクラスごとにvCPU数でソートしています。



ちなみに、GPUが搭載されたGクラスやPクラスのインスタンスは、慢性的にリソースが枯渇しているらしいです。東京リージョンの場合、p4はインスタンスの起動(作成)自体がなかなかできません。g5については、起動(作成)は出来たものの開始(利用)ができない状態が続いていたのですが、数時間待ってリトライしたらできました。
私は東京リージョンではGクラスでvCPU=192、PクラスでvCPU=96まで許可されていて、とりあえず東京リージョンで試しているのですが、アメリカのリージョンだともうちょっとリソースあるのかも知れません。アメリカのほうはまだ上限緩和申請中なので、あとで試します。