リリース
NVIDIA,「CUDA 6.5」をリリース。64bit ARM環境でGPGPUが利用可能に
CUDA 6.5 | |||
配信元 | NVIDIA | 配信日 | 2014/08/25 |
<以下,メーカー発表文の内容をそのまま掲載しています>
ARM64のサポートをはじめとする新機能導入や機能強化によりアプリケーションのパフォーマンスと開発者の開発効率が向上
2014年8月20日 − カリフォルニア州サンタクララ −NVIDIA(本社:米国カリフォルニア州サンタクララ、社長兼CEO: ジェンスン・フアン(Jen-Hsun Huang)、Nasdaq:NVDA)は本日、並列コンピューティングのプラットフォームおよびプログラミングモデルとして世界一普及しているNVIDIA CUDAのバージョン6.5、プロダクション・リリースの提供を開始したと発表しました。
8月20日よりwww.nvidia.com/getcudaからの無償ダウンロードが始まったCUDA Toolkitのバージョン6.5では、GPUアクセラレーテッド・コンピューティングが64ビットARMプラットフォームでも利用できるようになりました。また、高効率でハイパフォーマンスのコンピューティング・オプションが増強されており、ハイパフォーマンスコンピューティング(HPC)やエンタープライズ・データセンターといった分野における多くの計算処理を要求する作業を高速化することができます。
CUDA 6.5は堅牢で使いやすいプラットフォームであり、ARMやx86 CPUベースのGPUアクセラレーテッド・システムで科学や工学、モバイル、HPCといったアプリケーションの開発が行えます。
CUDA 6.5で新たに導入されたパフォーマンスや生産性を高める機能として、以下のものが挙げられます。
- Microsoft Visual Studio 2013のサポート−ホスト・コンパイラのサポートを拡充し、Microsoft Visual Studio 2013 for Windowsが使えるようになりました。
- cuFFTコールバック機能−FFT処理の前や最中にGPUメモリが保持しているデータを操作するコールバック関数が指定できるので、入力データや出力データに対するカスタム処理のパフォーマンスが上がります。
- CUDA FORTRANアプリケーションに対するデバッギング機能の向上−FORTRANにおける行列のデバッギングを新たにサポートしたほか(Linuxのみ)、ソース・コードとアセンブリ・コードの対応向上や参考文書の改善を実現しました。
- Application Replayモード−ハードウェア・カウンタを複数使用して複雑なシナリオをすばやく分析することができます。
- CUDA Occupancy Calculator APIのアップデート−カーネル・ローンチをGPUアーキテクチャごとにマニュアルで構成するという煩雑な作業から解放されます。
- 新しい“nvprune”ユーティリティ−オブジェクト・ファイルやライブラリをスリム化し、ターゲットとしているアーキテクチャで必要なデバイス・コードのみとすることができます。アプリケーションのサイズが小さくなりますし、ロードの時間が短くなります。
- cuSPARSEルーチンでBSR疎行列フォーマットをサポート−Block Sparse Row(BSR)行列フォーマットをサポートし、疎行列の操作が充実しました。
CUDA 6.5における新機能や改善点の詳細は、Parallel Forallのブログ記事(英語)をご覧ください。
CUDAウェビナ(無償)
NVIDIAでは、CUDA 6.5 Toolkitの新機能や並列プログラミングについてウェビナを用意しています。CUDAの開発に役立つさまざまなプログラミングのヒントやベストプラクティス、実践的なチュートリアルを無料で学び、GPUアクセラレータのプログラミングを十二分に活用することができるのです。
近日公開予定のウェビナをいくつか紹介します。
- CUDA 6.5 Overview and Features−8月26日(火)10AM(太平洋標準時)
お申し込みはhttps://www2.gotomeeting.com/register/333702802へ。
- CUDA 6.5 Overview and Features−9月17日(水)10AM(太平洋標準時)
お申し込みはhttps://www2.gotomeeting.com/register/935110954へ。
ウェビナの全リストは、GTC Express Webinarsウェブサイトにあります。
「CUDA」公式サイト
- 関連タイトル:
CUDA
- この記事のURL: