Arm Mali-G77 GPU-完全なインとアウト

著者: Randy Alexander
作成日: 3 4月 2021
更新日: 1 J 2024
Anonim
ARM Cortex-A76、Mali-G76、Mali-V76
ビデオ: ARM Cortex-A76、Mali-G76、Mali-V76

コンテンツ


新しいCortex-A77 CPUコアと並んで、Armは次世代スマートフォンSoC向けの次世代GPUを発表しました。 Mali-G77は、新しいMali-D77ディスプレイプロセッサと混同しないように、ArmのBifrostアーキテクチャの出発とValhallへの移行を示しています。

新しいアーキテクチャの詳細についてはすぐに説明します。まず、パフォーマンスの向上という点でユーザーが期待するものに飛び込みます。

Mali-G77パフォーマンスの概要

アームは、今日のMali-G76モデルと比較して、次世代のMali-G77デバイスで最大40%のグラフィックパフォーマンスの向上を誇っています。この数は、プロセスとアーキテクチャの改善を考慮しています。 Mali-G77は7〜16個のシェーダーコアから構成可能であり、各コアはG76コアとほぼ同じサイズです。つまり、ハイエンドのスマートフォンは、現在と同様のGPUコアカウントで出荷される可能性が高いことを意味します(10代前半)。便利なことに、これにより、既存のチップセットに対して投機的なパフォーマンス評価を行うことができます。

人気のあるManhattan GFXBenchベンチマークを見ると、パフォーマンスが40%向上しているため、現在の世代のハードウェアに対してかなりのリードが得られます。 Qualcommの次世代Adrenoチップは、競技場レベルを維持するために、独自の大幅なパフォーマンスアップグレードが必要になります。テーブルはArmに有利になっているようです。

アーキテクチャ面では、ゲームのパフォーマンスは20〜40%向上し、機械学習は60%向上します

このやや粗雑なボールパークに基づいて、10コアのMali-G77(Huaweiからよく見られる構成)は、この世代の最高レベルのモバイルグラフィックハードウェアをほとんど追い詰めようとしています。通常サムスンのExynosに見られる12コア構成は、Armの最新GPUに大きなリードを提供します。もちろん、実際のベンチマークは、プロセスノード、GPUキャッシュメモリ、LPDDRメモリ構成、テストするアプリケーションの種類など、他の要因に依存します。したがって、大量の塩を使用して上記のグラフを取得してください。


新しいアーキテクチャだけで言えば、Armは、Mali-G77がエネルギー効率とパフォーマンス密度を平均30%改善すると述べています。 INT8ドット製品サポートのおかげで、機械学習アプリケーションの60%も大幅に向上しました。ゲームのパフォーマンスの期待値は、タイトルと提供されているグラフィックスワークロードの種類に応じて、20〜40%のブーストの間に設定されます。

Armがこのパフォーマンスの向上をどのように達成したかを正確に理解するために、アーキテクチャをさらに詳しく見てみましょう。

Bifrostの後継者であるValhallに会う

VahallはArmの第2世代のスカラーGPUアーキテクチャです。これは16ワイドワープ実行エンジンであり、本質的には、GPUがサイクルごと、処理ユニットごと、コアごとに16の命令を並列に実行することを意味します。それはBifrostの幅4と8から上がっています。

その他の新しいアーキテクチャ機能には、完全にハードウェアで管理される動的な命令スケジューリングと、Bifrostと同等の動作を維持するまったく新しい命令セットが含まれます。その他には、ArmのAFBC1.3圧縮形式、FP16レンダーターゲット、レイヤードレンダリング、頂点シェーダー出力のサポートが含まれます。

Mali-G77は、G76よりも33%多くの計算を並行して実行します。

主要なアーキテクチャの変更を理解するための鍵は、コア内の実行ユニットを調べることで見つかります。 GPUのこの部分は、数値演算を担当します。

実行エンジン内

Bifrostでは、各GPUコアには3つの実行エンジンが含まれ、一部のローエンドMali-G52デザインの場合は2つが含まれていました。各エンジンには、iキャッシュ、レジスタファイル、およびワープコントロールユニットが含まれています。 Mali-G72では、各エンジンが1サイクルあたり4つの命令を処理しますが、昨年のMali-G76では8命令に増加しました。これらの3つのコアに分散させることで、サイクルごとに12および24の32ビット浮動小数点(FP32)融合積和(FMA)命令が可能になります。


ValhallとMali-G77では、各GPUコア内に実行エンジンが1つだけあります。前と同様に、このエンジンにはワープコントロールユニット、レジスタ、およびicacheが格納されており、これらは2つの処理ユニット間で共有されています。各プロセッシングユニットは、サイクルあたり16ワープ命令を処理し、コアあたり32 FP32 FMA命令の合計スループットを実現します。これは、Mali-G76よりも命令のスループットが33%向上します。

Armは3つのGPUコアから1つの実行ユニットに移行しましたが、G77コア内には2つの処理ユニットがあります。

さらに、これらの処理ユニットにはそれぞれ2つの新しい数学関数ブロックが含まれています。新しい変換ユニット(CVT)は、基本的な整数、ロジック、分岐、および変換命令​​を処理します。特殊関数ユニット(SFU)は、整数の乗算、除算、平方根、対数、その他の複素整数関数を高速化します。

標準のFMAユニットでは、1サイクルあたり16 FP32命令、32 FP16、または64 INT8ドット積命令をサポートするいくつかの調整が行われています。これらの最適化により、機械学習アプリケーションのパフォーマンスが60%向上します。

クワッドテクスチャマッパー

Mali-G77のもう1つの重要な変更点は、前世代のデュアルテクスチャマッパーからクアッドテクスチャマッパーが導入されたことです。テクスチャマッパーは、シーン内の3Dポリゴンを、画面に表示される2D表現にマッピングします。角度のある動きのあるコンテンツを滑らかにして、粗い低品質のエッジを避けるために、サンプリング、補間、フィルタリングを行います。

低コストのアンチエイリアシングは、画像品質を支援するために適切な場所に残っていますが、ここではテクスチャパフォーマンスを2倍にすることが大きな利点です。テクスチャユニットは、以前の2からクロックあたり4バイリニアテクセル、クロックあたり2トライリニアテクセルを処理し、より高速なFP16およびFP32フィルタリングを処理します。

クワッドテクスチャマッパーは2つのパスに分割され、キャッシュ内のコンテンツにヒットするスレッドに短いパイプラインを提供します。フォーマット変換とテクスチャ圧縮解除を処理するミスパスは、L2キャッシュへのより広いインターフェイスを備えています。これは、メモリから新しいデータを頻繁に取り込む必要がある機械学習ワークロードにも役立ちます。

Mali-G77ですべてをまとめる

Armは、Mall-G77に対して、バルホールアーキテクチャの主要な変更に合わせて、他の多くの調整を行いました。制御ブロックは単一の実行ユニットの設計により簡素化されていますが、内部の動的スケジューラーは実際には各コア内でより柔軟な命令発行を可能にします。各コアのスループットが高くなると、データパスも短くなり、レイテンシが短くなり、以前の8サイクルからわずか4サイクルになりました。

新しい設計は、Vulkan APIとの整合性も向上しており、ドライバー記述子を簡素化してドライバーのオーバーヘッドを削減し、「金属への」パフォーマンスを向上させています。

要約すると、Mali-G72とValhallは、ゲームおよび機械学習アプリケーションのパフォーマンスを大幅に向上させることを約束するBifrostから重要な変更を行います。重要なのは、設計がBifrostと同じ電力および面積の予算内に収まることで、モバイルデバイスが熱、電力、およびシリコンのコストを心配することなく、より高いピークパフォーマンスを提供できるようにします。パフォーマンスの予測に基づいて、Mali-G77はQualcommの次世代Adrenoをそのお金でうまく走らせることができるはずです。

Microoft Authenticatorは、2要素認証用のセキュリティアプリです。 Google Authenticator、Authy、LatPa Authenticator、その他いくつかと直接競合します。 Microoftアカウントの設定を更新するとき、またはそこで二要素認証を有効にするときに、アプリが実行される場合があります。または、独自のセキュリティ目的でTFAを使用できるようにす...

テクノロジーの世界は急速に成長しており、その過程で多くの刺激的なキャリアの扉が開かれています。それらのドアに足を踏み入れる1つの方法は、稼ぐことです マイクロソフト認定.Microoft Technology Aociate Matery Bundleは、準備が整ったことを保証します エーススリー 基礎IT試験 マイクロソフトから。現在、わずか29.99ドルで提供されています。...

編集者の選択