PRODUCTS GPU関連製品GPUコンピューティングボード

NVIDIA Tesla P4

スケールアウトサーバーで超効率的なディープラーニング

人工知能や、インテリジェントマシーンの新しい領域である、ディープラーニングは、歴史上、全く新しいコンピューティングモデルの世界を創造しています。インタラクティブスピーチ、画像検索や、ビデオレコメンデーションは、私たちが毎日使う、AI による多くのサービスの一部でしかありません。
正確さと応答性は、これらのサービスをユーザが利用するかどうかの重要な要素となります。ディープラーニングモデルが正確さや複雑さを増す中で、CPU だけでは、もはや応答性が要求されるユーザーエクスペリエンスを実現することができません。
NVIDIA Tesla P4 は、革新的なNVIDIA Pascal アーキテクチャを採用し、ディープラーニングワークロードを実行しているスケールアウトサーバの効率を加速するために設計されており、賢く、応答性の高いAI ベースのサービスを可能にします。ハイパースケールインフラストラクチャーにおいて、15分の1に推論レイテンシを削減し、CPU と比べて、60倍もの信じられないエネルギー効率を供給します。これにより、レイテンシの制限のために不可能であったこれまでのAI サービスに、新しい価値を解放します。



NVIDIA TESLA P4 アクセラレータの特徴とメリット

Tesla P4 は、リアルタイム推論性能を実現するように設計され、スケールアウトサーバでスマートなユーザーエクスペリエンスを可能にします。

リアルタイム推論で応答性学習
応答性は、インタラクティブスピーチ、画像検索、ビデオレコメンデーションのようなサービスをユーザーエンゲージメントするために極めて重要です。モデルが正確さと複雑さを増加するにつれて、CPU だけでは、もはや応答性の高いユーザーエクスペリエンスを実現することが不可能です。 Tesla P4 は、Int8 整数演算オペレーションをサポートし、22 TOPs の推論性能を実現します。レイテンシを、CPU と比べて、15分の1に減らします。
低消費電力のスケールアウトサーバーに前例のない効率性
Tesla P4 のスモールフォームファクターと 50W/75W の低消費電力デザインは、高密度に最適化されたスケールアウトサーバを加速します。また、ディープラーニング推論ワークロードにおいて、CPU よりも60倍以上も高いという驚くべきエネルギー効率を実現し、ハイパースケールカスタマーにAI アプリケーションの需要を飛躍的に増大させます。
専用デコードエンジンで新しいAI ベースのビデオサービスを提供
Tesla P4 は、GPU が並列に推論を実行するための専用のハードウェアデコードエンジンを搭載し、35までの HD ビデオストリームをリアルタイムに推論し、トランスコードできます。ビデオパイプラインにディープラーニングを導入することによって、カスタマーは、これまでは実現できなかった革新的でスマートなビデオサービスをユーザに提供できるようになります。
Tensor RT とDEEP STREAM SDK で高速なデプロイ
Tensor RT は、ディープラーニングモデルをプロダクションデプロイメント向けに最適化するためのライブラリです。トレーニングされたニューラルネットは、通常、32bit または、16bit のデータが使われます。精度を減らした INT8 オペレーションが、それらを最適化します。 NVIDIA DeepStream SDK は、Pascal GPU のパワーを活用し、ビデオストリームのデコードと分析を同時に行うことを可能にします。

NVIDIA Tesla P4

製品名 Tesla P4
GPUアーキテクチャ NVIDIA Pascal
CUDA コアプロセッサ数 2560コア
整数演算性能[INT8] 22TOPS(最大ブースト)
単精度演算性能 5.5TFLOPS(最大ブースト)
メモリ 8GB(バンド帯域幅 192GB/s)
最大消費電力 55W/75W
対応OS(*1) Windows® Server 2012 R2 64bit
Windows® 10 64bit / Windows® 8.1 64bit / Windows® 7 64bit / Linux 64bit
※32bit OSはサポート対象外
(*1) オンボードグラフィックスとの共存ができない場合もございますのでNVIDIA Quadro®/NVS®との組み合わせでのご利用を推奨致します。