レビュー
28nm世代のGK104コアを搭載し,「扱いやすい史上最速GPU」に
GeForce GTX 680
(GeForce GTX 680リファレンスカード)
その製品概要は別記事でお伝えしているが,ゲーマーとして気になるのは,NVIDIAの新世代ハイエンドGPUがどれだけの実力を秘めているかだ。当然のことながら,AMDの「Radeon HD 7970」(以下,HD 7970)対抗製品となるわけだが,実際のところHD 7970とどちらが速いのか。発表に合わせてNVIDIAのGTX 680リファレンスカードを入手できたので,まずは前編として,そのポテンシャルを探ってみたい。
CUDA Core数はGTX 580比3倍の1536基に
自動クロックアップ機能「GPU Boost」搭載がキモ
GTX 680 GPU。チップ上の刻印は「GK104-400-A2」だった |
GF100&GF110のブロック図 |
GTX 680のポイントを理解するにあたって,まずはFermiアーキテクチャをおさらいしてみると,GeForce 400&500世代では,最上位のGF100&GF110コアで32基,それ以外のGPUコアでは48基のCUDA Coreが一塊となり,L1キャッシュやテクスチャユニット,ジオメトリエンジン「PolyMorph Engine」などとセットになって「Streaming Multiprocessor」(以下,SM)を構成していた。
さらにSMが4基集まってミニGPUともいえる「Graphics Processing Cluster」(以下,GPC)を構成していたので,4 GPC仕様となるGTX 580の場合は 32 CUDA Core×4 SM×4 GPC=512 CUDA Core,“コア番号”的にGK104の1つ前にあたる「GF114」コアを採用した「GeForce GTX 560 Ti」だと 48 CUDA Core×4 SM×2 GPCで384 CUDA Core仕様という計算になる。
それに対してGTX 680では,SMが拡張されて「SMX」(Streaming Multiprocessor eXtreme)となり,SMXあたりのCUDA Core数も192基へと激増した。SMXではCUDA Core数が増えたことに伴ってWarpスケジューラが増強され,PolyMorph Engineがバージョン2.0へと進化している点もポイントとなる。
そして,SMXは2基でGPCを構成。そのGPCを4基搭載するため,GTX 680では192 CUDA Core×2 SMX×4 GPC=1536 CUDA Core。Fermiアーキテクチャのフルスペック比で,CUDA Core数は3倍になった計算である。
その一方で,64bit幅のメモリコントローラは4基に抑えられ,メモリインタフェースは256bitに留まっている。8基で1パーティションを構成するROPユニットはメモリコントローラと対を成す形で4基実装されるため,合計32 ROP。GTX 580やHD 7970と比べるとメモリ周りのスペックはむしろ一段落ちる印象が拭えない。
表1は,GTX 680のスペックをGTX 580およびHD 7970と並べたものだ。GTX 680でNVIDIAは実クロック1.5GHz相当のGDDR5メモリを搭載し,GTX 580より若干低い程度のメモリバス帯域幅を確保はしているものの,HD 7970との違いは明らかであり,高解像度や高負荷設定時の性能に多少なりとも懸念は残る。
これは,「想定された消費電力内で余力がある場合,自動的にGPUコアクロックとGPUコア電圧を高める」というもの。技術的な詳細を抜きにすれば,Intel製CPUに搭載された「Intel Turbo Boost Technology」と近い効果をもたらす機能とイメージしておけば分かりやすいだろう。
GTX 680の場合,消費電力の目安となるTDP(Thermal Design Power,熱設計消費電力)は195Wと公表されているのだが,それとは別に,GPU Boost動作の目安となる「Power Target」(電力ターゲット)が170Wと設定されている。そして,PCI Expressスロットと補助電源コネクタの両電源ラインをリアルタイムで監視し,それらの合計が170Wに満たない場合,170WラインにまでGPUコアクロックとコア電圧を自動的に高めることで,性能の向上を図るようになっているのだ。
面白いのは,Boost Clockが,クロック上限ではなく,「一般的なPC環境においてGPU Boostで到達できる平均的なクロック」とされていることだ。GPU Boostでは消費電力のほかにGPUのコア温度も見ているため,冷却能力に優れたGPUクーラーを取り付けた状態で,エアフローの良好なPCケースに組み込んだ場合は,これ以上のクロックに上がることも十分に考えられる。一方,小型のキューブPCなどでは,「一般的なPC環境」よりも排熱周りが苦しくなるため,Boost Clockまで上がらないことも起こり得る。ユーザーの利用環境によってGPU Boostの効果は変わってくるため,いわゆるコンサバな目安がBoost Clockとして示されている,というわけである。
GPU Boostの挙動については後編であらためて確認したいと思うので,本稿ではこれ以上突っ込まないが,
- GPU Boostは無効化できない
- カードベンダーが用意するオーバークロックツールを使えば,GPU Boostの挙動をカスタマイズできる
ことを最低限押さえておいてもらえればと思う。
標準で最大4画面出力対応。DVI×2+HDMI×1も可
補助電源は6ピン×2。より大容量もサポートか
GPUの概要を押さえたところで,入手したリファレンスカードを概観してみたいと思う。
用意される出力インタフェースはDual Dual-Link DVI-D,Dual Dual-Link DVI-I,DisplayPort,HDMI各1。ポイントは,標準で4画面出力に対応している
点で,おそらくNVIDIAは,「DVI×2とDiplayPortを利用すればカード1枚で3D Vision Surroundに対応できる」と謳いたいのだろうが,「DisplayPort−DVIのアクティブ変換アダプタを使わずとも,DVIとHDMIだけで3画面出力が行える」というのを歓迎する人も多いのではなかろうか。
GPUクーラーは,ファンからのエアフローがほぼ一直線にブラケット部へ向かうような構造になっている |
グラフィックス出力インタフェースは4系統。すべて同時利用が可能だ。3D Vision Surround+1画面という使い方もできる |
ちなみに補助電源コネクタ部だが,基板上には6ピン×2の片方を8ピンへ拡張できるようなランドや,もう1つの6ピンコネクタ用ランドが設けられていた。電源周りを強化したクロックアップモデルなどを考慮した冗長性が持たれているようだ。おそらく6ピンと8ピンを横並びで配置することを想定したものだろうが,“8ピンと6ピンの2階建てコネクタ”が存在するなら,PCI Expressの規格からは外れてしまうものの,6ピン×2+8ピン×1という構成も不可能ではない。
PCI Express補助電源ケーブルを差したところ。片方の接続が天地逆になるので,硬めのケーブルだと取り回しに難儀するかも |
電源コネクタ用のランドは,6ピン×2を6ピン×1+8ピン×1へ拡張したり,さらに6ピン×1を追加したりすることを考慮したものになっている |
GPUクーラーを覆うカバーを取り外すと,GPU用のパッシブヒートシンクと,補強板とファン台座を兼ねたメモリチップ&電源部用パッシブヒートシンクの2ピース構成であることが分かる。GPU用ヒートシンクでエアフローの出口側が斜めに切られているのは,ブラケット部のスリットから効率的に排気するための配慮とのことだった。
カバーを外したところ。カバー部も「一直線のエアフロー」を実現できるようデザインされている |
GPU用のヒートシンクだけ,メモリチップ&電源部用ヒートシンクから独立していた |
メモリチップ&電源部用ヒートシンクを外したところ。ヒートシンク側には熱伝導シートが貼られている |
電源部。基板は5+2フェーズ仕様だが,実装されている回路は4+2フェーズで,1フェーズ分は空きパターンになっている |
基板背面部に用意されたRichteck Technology製PWMコントローラ。2〜5フェーズに対応する |
Release 300世代のレビュワー向けドライバを利用
現時点ではPCIe 2.0動作となる点に注意
テスト環境の構築に入ろう。
比較対象として用意したGPUは,GTX 680で置き換えられることになるGTX 580と,直接の競合製品となる「Radeon HD 7970」(以下,HD 7970)の2つ。GTX 680のテストには,NVIDIAから全世界のレビュワーに配布された同GPU専用ドライバ「GeForce 300.99 Driver Beta」を用いる。NVIDIAはとくに説明していないが,GTX 680の登場に合わせて,ドライバはRelease 300世代へ移行するようだ。
「GPU-Z」(Version 0.6.0)実行結果。レビュワー向けドライバを導入した状態だとPCIe 2.0接続とレポートされる |
こちらはPCIe 3.0有効版ドライバを導入したところ。PCIe 3.0接続になった |
NVIDIAによると,「現在,Intelと協力して,PCIe 3.0接続時の動作安定性を確認中だが,現時点では確認作業が完全には終わっていないため,PCIe 3.0の片方向8GT/s動作は無効化している」とのこと。同社は「一般的なゲームで(この制限が)ベンチマークスコアに差を生むことはない」ともしているが,発表時点でこういう制限があることは憶えておきたい。
なお筆者は後から「GeForce 300.99 Driver BetaでPCIe 3.0動作を有効にした特別版」というドライバを入手したので試したところ,確かにPCIe 3.0動作を確認できた。ただし,NVIDIAから「エンドユーザーに配布する最初のバージョンもPCIe 2.0動作になる」というコメントが得られたため,今回はレビュワー向けドライバをそのまま用い,PCIe 2.0接続でテストを行う。よって,今回のテスト環境では,HD 7970のみがPCIe 3.0動作することになるわけである。
GTX 580とHD 7970のテストにあたっては,それぞれ,テスト開始時点の最新版となる「GeForce 296.10 Driver」「Catalyst 12.2」を用いている。
そのほかのテスト環境は表2のとおりだ。
テスト方法は4Gamerのベンチマークレギュレーション12.0準拠。テスト解像度は,ハイエンドGPUの検証ということで,1920×1080&2560×1600ドットを選択している。
なお,CPUの「Core i7-3960X Extreme Edition/3.3GHz」では,テスト時の状況によって自動クロックアップ機能「Intel Turbo Boost Technology」の効果に違いが生じる可能性を考慮し,同機能をマザーボードのUEFI(≒BIOS)から無効化していることをあらかじめお断りしておきたい。
Rampage IV Extreme ゲーマー向けのX79マザーボード メーカー:ASUSTeK Computer 問い合わせ先:テックウインド(販売代理店) [email protected] 実勢価格:4万〜4万5000円程度(2012年3月22日現在) |
SMD-16G68CP-16KL-Q-BK Micronチップ搭載のDDR3L-1600対応モジュール4枚セット メーカー:サンマックス・テクノロジーズ 問い合わせ先:パソコンショップ・アーク パソコンショップ・アーク販売価格:1万980円(※2012年3月22日現在) |
HD 7970を最大30%強上回るGTX 680
ただし,メモリ周りの弱さが露呈する場面も
テスト結果を順に見ていこう。
グラフ1は,「3DMark 11」(Version 1.0.3)の「Performace」と「Extreme」の各プリセットで総合スコアを取得してみたものだ。GTX 680のスコアはHD 7970に対して16〜20%ほど,GTX 580に対して40〜50%ほど高く,そのポテンシャルにはかなりの期待ができるといえそうだ。
なお,余談気味に述べておくと,先ほど述べたPCIe 3.0アンロック版ドライバを使うと,GTX 680のPerformanceスコアはP9281,ExtremeスコアはX3200となった。ほとんど変わらないものの,Performanceスコアは若干落ちているともいえるわけで,このあたりが正式サポートになっていない要因の1つなのだろう。
実際のゲームタイトルでも,このスコア差は維持できるだろうか。
グラフ2〜5は,DirectX 11世代のFPS「S.T.A.L.K.E.R.:Call of Pripyat」(以下,STALKER CoP)から,公式ベンチマークテストの「Day」「SunShafts」両シークエンスにおける結果を個別にまとめたものとなる。
まず,公式ベンチマークテスト中で最も描画負荷の低いDayから見ていくと,GTX 680は3DMark 11と似た傾向を示した(グラフ2,3)。アンチエイリアシングと異方性フィルタリングを適用していない「標準設定」ではHD 7970に対して18〜23%程度,GTX 580に対して24〜46%程度の差をそれぞれ付けているので,スコア向上率も3DMark 11とほぼ同じと述べていいだろう。
ただし,4xアンチエイリアシングと16x異方性フィルタリングを適用した「高負荷設定」だと,HD 7970とのスコア差が6〜12%へ縮まっており,先に懸念材料として挙げたメモリバス帯域幅が影響している可能性を指摘できそうである。
「GTX 680のメモリインタフェースが256bitに留まることによる問題」がより大きく出るのが,最も描画負荷の高いSunShaftsシークエンスである。グラフ4,5を見ると,GTX 680はHD 7970に明確なスコア差を付けられないばかりか,逆転すら許してしまった。超高解像度環境で高負荷なグラフィックス設定を行うと,足回りの弱さが露呈する印象だ。
一方,GTX 680が気持ちいいほど高いスコアを示したのが,「Battlefield 3」である。BF3はGeForceファミリーへの最適化が進んでいるタイトルではあるが,それにしてもグラフ6,7でGTX 680がHD 7970に対して22〜33%程度高いスコアを示した点は特筆すべきだろう。
なお,GTX 680は,GTX 580に対しても26〜40%程度高いスコアを示している。
さて,Fermiアーキテクチャの上位モデルは,テクスチャフィルタリング性能が高くないため,DirectX 9世代のゲームタイトルを前にすると,競合製品と比べて奮わないケースが多かった。この件は筆者も再三にわたって指摘してきたので,憶えてくれている読者も多いと思うが,「古いDirectX 9タイトルの代表」として採用し続けている「Call of Duty 4: Modern Warfare」(以下,Call of Duty 4)のテスト結果をグラフ8,9で見てみると,GTX 680が128基のテクスチャユニットを搭載してきた意味はあったと言うことができそうだ。
Call of Duty 4は負荷が低く,メモリ周りの性能がスコアを左右しにくいだけに,高負荷設定だと,テクスチャフィルタリング性能(≒テクスチャユニット数とコアクロック)がGPU Boostで効いて,GTX 680がHD 7970とのスコア差を広げているのだろう。
一方,同じDirectX 9世代でも,ゲームエンジンレベルで最新世代と言っていいだけの描画負荷があり,高解像度テクスチャパックを導入することでさらにグラフィックスメモリを圧迫するテスト条件を作り出している「The Elder Scrolls V: Skyrim」(以下,Skyrim)だと,GTX 680は再び足回りの弱点を見せる(グラフ10,11)。
GTX 680は標準設定の1920×1080ドットでHD 7970に対して約19%高いスコアを示すものの,景気がいいのはこれだけ。2560×1600ドットではわずかながらHD 7970の後塵を拝した。ハイエンドGPUとしてのGTX 680が抱える256bitメモリインタフェースという足枷は,軽くないようだ。
ただ,グラフ12,13にテスト結果を示した「Sid Meier's Civilization V」(以下,Civ 5)の結果については,安易に「メモリ周りが原因」とは言えないかもしれない。
そこで,テスト実行中におけるGPU Boostの挙動を調べてみると,コアクロックは最大1110MHzに達するのだが,シーン(≒表示キャラクター)が切り替わるごとに消費電力が乱高下しているのを確認できた。この激しい変動が,GPU Boostの挙動に何らかの影響を及ぼした可能性はあるだろう。そしてその場合,ゲームやベンチマークアプリケーション側の挙動次第ではGPU Boostがうまく動作しなかったりすることが考えられるわけだ。
あるいは,ベンチマークレギュレーションで採用するCiv 5の「Leader Benchmark」は3D性能だけでなくGPGPU性能も見るものなので,GK104のGPGPU性能が振るっていないという可能性も考えられる。
さて,通常どおりならCiv 5と似た挙動を示すことが多い「DiRT 3」の結果をまとめたものがグラフ14,15だ。今回はBF3と似たような傾向になっており,GTX 680は,HD 7970に対して19〜28%程度,GTX 580に対して45〜48%程度高いフレームレートを示している。
HD 7970より低い消費電力を実現
動作音はGTX 580より静か
前述のとおり,GTX 680のTDPは195Wだ。GTX 580の場合,示されている指標は244Wという公称最大消費電力値なので直接の比較はできないが,それでもあえて引き算すれば49Wであり,NVIDIAが強く謳う「消費電力あたりの性能の高さ」からしても,低消費電力に期待する人は多いと思われる。
一方で,GPU Boostは消費電力の余裕を使って動作クロックと動作電圧を引き上げる機能なので,GPU Boostを無効化できない以上,(上限の目安としてPower Targetが設定されているとはいえ)GPU BoostがGTX 680の消費電力を引き上げる可能性も否定できない。このあたりを検証しておこう。
テストにはログの取得が可能なワットチェッカー「Watts up? PRO」を用いることとし,同製品で,システム全体の消費電力で比較を行う。テストにあたっては,ゲーム用途を想定し,無操作時にもディスプレイの電源がオフにならないよう指定したうえで,OSの起動後30分放置した時点を「アイドル時」,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点を,タイトルごとの実行時とすることにした。
なお,今回マザーボードのUEFIを更新したところ,CPU側の省電力機能「Enhanced Intel SpeedStep Technology」を明示的に無効化しても機能したままとなってしまったため,アイドル時の消費電力は先に掲載したHD 7970のレビュー記事などと比べても若干低くなる。この点はあらかじめお断りしておきたい。
というわけで,結果はグラフ16のとおりだ。アイドル時の消費電力はGTX 680とHD 7970でほぼ互角。HD 7970の場合は,ディスプレイ出力が無効になってロングアイドルモードへ移行すると,「AMD ZeroCore Power Technology」によって消費電力は78Wまで低下するので,そこまで加味すればHD 7970に軍配が上がるものの,ゲーム画面を表示させながら放置するような状況下では同じと述べていいだろう。少なくとも,GTX 580より約20W下がった点は,28nmプロセス技術を採用した効果と述べてよさそうだ。
各アプリケーション実行時だと,GTX 680のスコアは306〜339W。公称最大消費電力250WのHD 7970よりも8〜34W低く,また,3D性能で最大50%程度の差を付けたGTX 580と比べて35〜61W低い結果となった。GTX 680で消費電力の低減が図られているのは間違いない。
テスト時の室温は24℃。システムはPCケースに組み込まず,いわゆるバラック状態でテストを行っているが,ご覧のとおり,GTX 680のGPU温度は,アイドル時に最も低くなった一方,高負荷時は比較対象とあまり変わらない結果に落ち着いた。
これは,GTX 680で,GPU Boostの温度閾値が80℃前後に置かれているためのようだ。今回のテスト環境では3DMark 11で最大で1110MHz動作を確認できたが,そのクロックで動作するようGPUコア電圧も引き上げられた結果,76℃というところに落ち着いているわけである。
気になるGPUクーラーの動作音だが,筆者の主観となることを断ってから進めると,ハイエンド市場向けグラフィックスカードとしては十分に静かという印象を受ける。NVIDIAはGTX 580リファレンスカードで搭載するGPUクーラーの動作音を51dB,GTX 680で同46dBとしているが,5dB分の違いがあるかどうかはさておき,並べて聞き比べればGTX 680のほうが明らかに静かだと確認できるレベルだ。
シングルGPU最速の座を奪還したGTX 680
電源周りの扱いやすさも魅力的
以上のテストから,GTX 680の弱点ははっきりしている。特定の高負荷状況においてメモリ周りがボトルネックになり得ることと,GPU Boostの挙動いかんでスコアが伸びきらない場合があることだ。
とくにメモリ周りはかなりの弱みとなる可能性があり,だからこそNVIDIAはFXAAやTXAAといった,グラフィックスメモリの負担が少ないアンチエイリアシング技法のプッシュを始めたのだろう(関連記事)。この作戦がうまく行くか行かないかは注意深く見守っていく必要がある。
GF100&GF110コアの後継となるビッグチップではないため,多少なりとも肩すかし感があるのは否めないが,だからといって「GeForce GTX 480」のようにピーキーすぎるのも考えもの。GeForceの新世代ハイエンドGPUが扱いやすいカードとして登場してきたことを,素直に歓迎したいところである。
なお,NVIDIAによると,北米市場における搭載カードの想定売価は499ドル。一方,国内だと“初値”は6万円以下になる模様で,さすがにちょっと高めだが,まあ,これはいつもの話といえばいつもの話だ。
GTX 680は,「モンスター」を待っていた人達以外の期待に広く応えられるGPUだとまとめたい。
「GeForce GTX 680」レビュー(後編)。NVIDIA版Turbo Boostになる「GPU Boost」とは何か
NVIDIA,「Kepler」ことGeForce 600ファミリーを発表。アーキテクチャの要点をまとめてチェック
GeForce公式情報サイトGeForce.com(英語)
NVIDIAのGeForce製品情報ページ
- 関連タイトル:
GeForce GTX 600
- この記事のURL: