連載
西川善司 / グラフィックス技術と大画面と赤い車を愛するジャーナリスト
(善)後不覚 |
長い間,更新が止まっていた西川善司の不定期コラムですが,今回からは,ゲームやPCに関連した話題をお届けしていきたいと思います。
ゲーム性能が高く評価されるようになったAppleのプラットフォーム
同年10月30日には,ノートPC「MacBook Pro」と小型デスクトップPC「Mac Mini」の搭載プロセッサとして,M4の上位モデルとなる「M4 Pro」「M4 Max」が追加で登場しました。
最近では,Appleのプラットフォームにも,著名なゲームが徐々に増え始めています。つまり,ゲーム開発側としては,これまでよりもAppleのプラットフォームを,ゲームプラットフォームとして認識し始めているということでしょう。
たとえば,カプコンは「バイオハザード」シリーズを,Ubisoft Entertainmentは「アサシンクリード」シリーズを,Macを初めとしたAppleプラットフォーム向けにリリースしています。12月10日には,iOS/Mac版の「バイオハザード RE:2」が発売されますし,新作の「アサシンクリード・シャドウズ」も発売予定となっています。
eスポーツ系MOBAの「League of Legends」や,PCやゲーム機で人気の高い「No Man’s sky」や「デス・ストランディング」などもリリースされており,著名なゲームタイトルが増えてきています。もちろん,ゲームをプレイすることだけを考えると,Windows PCと比べればラインナップはまだまだ貧弱ですが,これまでとは違ってきたなという印象を受けます。
これは,Apple独自のプロセッサ「M」シリーズの高性能ぶりを,ゲーム開発者が高く評価していることはもちろんですが,Windowsにおける「DirectX 12 Ultimate」などに構造の近いグラフィックスAPI「Metal 3」がAppleプラットフォームに搭載されたこととも関係が深いように思えます。
西川善司の3DGE:Appleのゲーム向けAPI「Metal 3」は,DirectX 12 Ultimateに一層近づいた
2022年6月に行われた開発者向けイベント「WWDC 2022」で,Appleは,macOSおよびiOS向けのグラフィックスAPI最新版となる「Metal 3」を発表した。Appleのプラットフォーム向けに,Windows PCや現行世代ゲーム機のタイトルを移植しやすくする可能性を持ったMetal 3の見どころを解説しよう。
M4シリーズはどんなプロセッサか
そんなMシリーズの最新版であるM4プロセッサとは,どういうものでしょうか。
比較するために,M4シリーズと前世代の「Apple M3」シリーズのスペックをまとめてみました(表1,2)。なお,表中の各モデルは,最上位モデルのみで,一部,非公開のスペックは筆者の推測値が入っています。
なお,Appleはこれまで,メモリバス帯域幅を1024^3換算(GiB/s)で示していましたが,近年は1000^3換算(GB/s)を採用するようになりました。単位が違う値を表に混在しては意味がないので,この表では1024^3換算で示しています。そのため,Apple公表値とは数字が異なる部分もありますが,表中の値同士は正しく比較できます。
まずは,最新のM4シリーズから見ていきましょう。
M4プロセッサは,TSMCの新しい3nmプロセス(N3E)で製造されるそうで,総トランジスタ数は約280億個とのこと。一方,先代のM3プロセッサは,TSMCの旧3nmプロセス(N3B)で製造され,総トランジスタ数は約250億個でした。
M3からM4へと名称が新しくなったわりに,規模やスペックの拡張は約12%ほど控えめです。その大きな要因は,基本設計は大きく変わっておらず,N3BからN3Eへと,プロセスノードの変更が中心のマイナーチェンジだからでしょう。
なお,こうした現象は,かつての「M1」(※TSMCのN5プロセス)から「M2」(同N5P)のときにもありました。AMDが「Zen」アーキテクチャから「Zen+」への移行で行ったように,技術の世代で型番を決めるのではなく,新しいプロセッサが出たときにナンバリングを更新するのは,Appleらしいマーケティング戦略だといえます。
さて,M4のCPUは,高性能コアがM3からの据え置きで4基(最大4基。3基モデルもあり。以下同)となるも,高効率コアはM3から2コア増えて6基となりました。
高性能コア/高効率コアの動作クロックはそれぞれ4.4GHz/2.9GHz。M3の4.05GHz,2.75GHzに対して,動作クロックも上昇率はわずか10%未満の向上に留まっています。これも,やはりプロセスノードがマイチェン止まりなことに起因しているのでしょう。この傾向は,後述するM4 Pro/Maxにも見られます
高性能コアが2基増えただけで,あまり代わり映えがないように思えるM4のCPUですが,実は,CPUのマイクロアーキテクチャが「Armv9.2-A」に進化しています。
M3以前のマイクロアーキテクチャは「Armv8.6-A」でしたから,大きく世代を更新したとわけです。「M3+」とせず,M4と名付けたことには,大きな意味があると言えるかもしれません。
なお,Armv9.2-Aでは,仮想メモリシステムの拡張や,AI関連処理の高速化に貢献する行列演算系拡張命令の強化が行われており,最新のニューラルネットワーク系ロジックの構築に適した「SME2」(Scalable Matrix Extensions 2)命令セットが利用できるようになっています。M4以降の今後のApple製プロセッサのCPUはすべて,Armv9.2-Aが採用されていくようです。
なお,iPhone 16用のSoC(System-on-a-Chip)も,「A18」からArmv9.2-Aを採用しています。
一方でM4のGPUコアは,M3の10コアのままで据え置きでした。ただ,動作クロックは,M3の1.6GHzから,M4では1.8GHzへと高くなっています。その結果,理論性能値は約4.61 TFLOPSとなりました。この値は「PlayStation 4 Pro」の4.3TFLOPSを超えるものです。
メモリバス帯域幅も,M3のLPDDR5-6400MHz 100GB/sから,LPDDR5X-7500MHzで117GB/sへと向上しました。
M4は,CPUと後述する推論アクセラレータ以外は,M3からのマイナーチェンジ版という印象です。実際,Appleの現行製品のうちM3搭載製品は,M4へすべて置き換わりました。
M4の推論アクセラレータの性能が大幅に向上した理由
さて,M4シリーズ内蔵の推論アクセラレータ「Neural Engine」(Neural Processing Unit,NPUとも)は,搭載コア数は16基でM3と変わりませんが,その理論性能値は,M3の18 TOPSから38 TOPSへと劇的に高くなりました。
ちなみに,iPhone/iPad向けの「Apple A15」プロセッサ以降と,「Apple M2」以降のApple製プロセッサにおけるNPUの理論性能値は,以下のようになります。
●iPhone/iPad系プロセッサ
- A18:35 TOPS
- A17:35 TOPS
- A16:17 TOPS
- A15:15.8 TOPS
●Mac/iPad系プロセッサ
- M4:38 TOPS
- M3:18 TOPS
- M2:15.8 TOPS
「Apple A16」から「Apple A17」へ,M3からM4へと進化した段階で,NPUの理論性能値が2倍以上となったのは,演算精度が16bitから8bitまで広くサポートとしたことが大きいようです。M4 Pro,M4 MaxのNPUも,仕様的にはM4と同じです。
なお,iPhone 16に合わせて登場した「Apple A18」は,前世代の「Apple A17 Pro」で実装となった新しいNPUを搭載しています。
PS5に迫るグラフィックス性能のM4 Pro
M4シリーズの上位モデルであるM4 Proは,製造プロセスはM4と同じです。トランジスタ数は非公開ですが,1世代前の「M3 Pro」の規模感から推測すると,400億前後ではないかと思われます。
CPUは,高性能コアが10コア,高効率コアが4コアという構成で,M3 Proに比べると,高性能コアが4コアも増えました。逆に高効率コアは,M3 Proから2基減っています。先述したとおり,製造プロセスがマイナーチェンジ程度なので,動作クロックはM4 Proと同じで,少し高くなった程度です。
GPUは,M3 Proから2コア増えて20コアになりました。動作クロックはこれまた少し向上した程度。GPUの理論性能値は,M3 Proの7.4 TFLOPSあたりから,9.2 TFLOPSへと向上しています。これは,PlayStation 5の10.28 TFLOPSに迫るグラフィックス性能を獲得したことになります。
最大メモリ容量は64GB。メモリの種類はLPDDR5X-8533で,これがM3 Proの192bitよりも広い256bitのメモリバスで接続されるため,約266GB/sというメモリバス帯域幅を実現しています。これは,一般的なWindows PC向けCPUの2倍に相当するほどで,とても優秀だと思います。
M3 Proのスペックは,正直に言えば中途半端に思えましたが,M4 Proになると,M4シリーズの中ではかなり完成度の上がったモデルとなっているように思えます。
PS5 Proを超えるグラフィックス性能のM4 Max
M4シリーズ最上位に君臨するのが,M4 Maxです。製造プロセスはM4と同じN3E。トランジスタ数は1000億前後とみられ,NVIDIAのハイエンドGPU「GeForce RTX 4090」(約763億個)を超えます。Appleは公表していませんが,M4 Maxはモノシリックダイ(単一ダイ)で製造されているようなので,だとすれば一般消費者向けの量産品としては,地球上で最も大規模なプロセッサである可能性があります。
CPUは,高性能コアが12コア,高効率コアが4コアという構成で,M3 Maxと変わりません。ただ,動作クロックが少し高いので,それなりの性能向上は期待できます。
GPUも同様で,M3 Maxと同じ40コア構成のままです。動作クロックは少し高くなったので,理論性能値は約18.4 TFLOPSにまで上がっています。PlayStation 5 ProのGPU演算性能は約16.7 TFLOPSと公表されているので,AppleのCPU内蔵GPUは,もはやPS5 Proすら超えているのです。事実,CPU内蔵GPUの性能としては,脅威的なスペックだと思います。
PC向けのCPUとGPUを統合したSoCにおいて,2024年11月時点で最もグラフィックス性能が高いのは「Ryzen AI 9 HX 370」系ですが,そのGPU理論性能値は,約11.9 TFLOPSに留まります。2023年登場のM3 Maxでも,GPU性能は約16.4 TFLOPSもあり,奇しくもPS5 Proの約16.7 TFLOPSに近いというのは,感慨深いものです。
最大メモリ容量は128GB。メモリチップはM4 Proと同じLPDDR5X-8533ですが,512bitのメモリインタフェースでCPUと接続しているので,メモリバス帯域幅は533GB/sにもなります。単体GPUと比較してもミドルハイクラス(※「GeForce RTX 4070」が504GB/s)並みで,PS5 Proのメモリバス帯域幅(576GB/s)に迫る値です。
■■西川善司■■ テクニカルジャーナリスト。PS5 Proと薄型PS5の比較をいろいろやっているという西川氏。しかし,持っているゲームの多くがBlu-rayディスク版なので,別売りのBDドライブユニットが必要なのですが,「全然売っていない」そうです。ゲームのインストールや起動のたびに,薄型PS5からBDドライブユニット外してPS5 Proに取り付けているそうで,「2024年にBDドライブユニットの不足に困るなんて,さすがに想像できなかった」と愚痴っておられました。ちなみに,近々,PS5 Proの話題を執筆予定だそうです。お楽しみに。 |
- 関連タイトル:
MAC本体
- この記事のURL: