Versal HBM シリーズ

高速メモリ、データ保護機能、適応型演算機能を統合

製品の特長

Versal HBM シリーズは、高速メモリ、セキュア コネクティビティ、適応型演算機能を統合したプラットフォームであり、機械学習、データベース アクセラレーション、次世代ファイアウォール、高度なネットワーク テスターなどのメモリ バウンドで計算負荷の高いワークロードの処理機能およびメモリのボトルネックを解消できます。絶えず進化するアルゴリズム、プロトコル、データ レートに対応できるように基礎から構築されています。詳細は、 紹介ビデオ  をご視聴ください。

HBM2e DRAM を搭載した Versal HBM シリーズは、Versal プレミアム シリーズと比較して消費電力を 65% 削減し、最大 6 倍の帯域幅を実現します*。量産実績のある Versal プレミアム アダプティブ SoC をベースとする Versal HBM アダプティブ SoC は、消費電力に最適化されたマルチテラビット級のコネクティビティ IP と 112G PAM4 トランシーバーを統合しているため、新しいネットワーク プロトコルやモジュールに柔軟に適応できます。トランシーバーの速度を 2 倍にすると同時に、Versal HBM シリーズは、統合された暗号化エンジンによって、ネットワーク インフラのすべての階層が保護されます。プログラムマブル NoC (ネットワーク オン チップ) の使用により、最大 2.2 Tb/s のオンチップ接続が可能になり、アーキテクチャ コンポーネント間の配線密度が緩和されます。さらに、Versal HBM シリーズは、前世代 HBM ソリューションの 2 倍のロジック密度を提供し、進化するアルゴリズムやプロトコルに対応するために最大限の性能を備えることができます。

* AMD 社内解析に基づく (2023 年 5 月実施) - HBM2E を搭載した Versal HBM VH1542 デバイスと、4 つの LPDDR4-4266 コンポーネントを使用する Versal プレミアム VP1502 デバイスのインプリメンテーションを比較。読み出し/書き込みトランザクションが 40% で、シーケンシャルなメモリ アクセスを想定。電力値の計算には、AMD Power Design Manager とサードパーティのシステム電力計算ツールを使用。設定によっては異なる結果が生じる可能性がある。(VER-013) 

Versal HBM Series block diagram

主な特長

統合された HBM2e

最大帯域幅 819 GB/s、容量 32 GB を提供する HBM2e メモリが統合されているため、計算負荷の高いアプリケーションで消費電力、エリア、レイテンシを最小限に抑えることができます。Versal HBM アダプティブ SoC は、スタックド メモリを演算ファブリックのすぐ隣に配置することで、Versal プレミアム シリーズの最大 6 倍の帯域幅で 65% の消費電力削減が可能です1。統合 HBM メモリへのアクセスは、プログラマブル NoC を介すことで、デバイス上のどこからでもグローバルに可能です。内蔵メモリ コントローラーと機能強化されたハードのスイッチ機能を使用することで、どのポートからでも任意のメモリ ロケーションにアクセスできます。

1.AMD 社内解析に基づく (2023 年 5 月実施) - HBM2E を搭載した Versal HBM VH1542 デバイスと、4 つの LPDDR4-4266 コンポーネントを使用する Versal プレミアム VP1502 デバイスのインプリメンテーションを比較。読み出し/書き込みトランザクションが 40% で、シーケンシャルなメモリ アクセスを想定。電力値の計算には、AMD Power Design Manager とサードパーティのシステム電力計算ツールを使用。設定によっては異なる結果が生じる可能性がある。(VER-013)

Versal HBM シリーズ製品パンフレット

Versal HBM シリーズを使用すると、高速メモリ、適応型演算機能、セキュアな接続を 1 つのプラットフォームに集約できます。

Versal HBM Series Product Brief

アプリケーションと業界

機械学習の高速化

AI (人工知能) と ML (機械学習) が急速に進化しています。アルゴリズムが複雑化し、膨大なデータを処理するためには広いメモリ帯域が必要です。従来の演算アーキテクチャでは、複数の CPU コアが同時に動作すると、外部メモリからのデータ転送速度が遅くなり、システムがフリーズして最終的に動作が停止してしまいます。一方、Versal HBM シリーズでは、適応型エンジンとインテリジェント エンジンによる超並列処理と統合 HBM による広いメモリ帯域幅を両方実現できます。このため、Versal HBM シリーズを使用することで、Cosine Similarity や Louvain Modularity などのさまざまな AI/ML プロセスで、正確かつ迅速なデータ分析が可能になります。Vitis™ 統合ソフトウェア プラットフォームの性能が最適化された豊富なライブラリを活用することで、データセンターやクラウドでの急速に進化する AI に対応する優れた AI/ML 性能と効率を実現できます。

前処理とバッファリング

固定機能の演算デバイスで最良の結果を得るには、データの前処理が非常に重要です。実世界 ML モデルのデータセット サイズは、テラバイトを優に超えるため、ターゲット アクセラレータには、これらのデータセットを効率的に処理するための大規模な前処理フレームワークが必要になります。適応型エンジンと帯域幅 819 GB/s の HBM を備えた Versal HBM シリーズでは、不要なデータを除去して指定したデータを変換し、その後データを拡張してターゲット アクセラレータ用に予測入力を生成します。高速 112G PAM4 トランシーバー搭載の Versal HBM シリーズは、レイテンシを最小限に抑えながら最高のスループットとシステム性能を実現します。

次世代ファイアウォール

ネットワーク事業者は、企業内ネットワークのデータ保護やマルウェア対策を行うと同時に、中断なく、インテリジェントに管理できる堅牢なネットワークを求めています。
物理層から、データリンク層、VPN、トランスポート層に至るまで多層防御を柔軟に実装できる Versal HBM シリーズは、独自のポリシーと制御で数千万の同時セッションを可能にします。さらに、統合された複数の 400G 高性能暗号化 (HSC) エンジンにより、性能を犠牲にすることなく、ラインレートのスループットと低レイテンシを維持できます。16G HBM を使用する次世代セキュリティ アプライアンスは、複数のルックアップ テーブルを管理して、ネットワーク フローのバッファリングやリオーダリングを実行できます。112G PAM4 トランシーバーは、最新の光伝送規格とプロトコルをサポートし、より高いスループットへ柔軟に拡張できるため、次世代ファイアウォールにも対応できます。また適応型エンジンによって、ML アルゴリズムを進化させることができ、新たな脅威に対応するセキュリティ アーキテクチャを構築できます。

アプリケーションの性能テスト装置

データセンター、クラウド、AI ネットワークが 800G の光接続へと移行する一方で、データセンター ネットワーク事業者やクラウド プロバイダーは、相互運用性や演算負荷の高いアプリケーションの堅牢なネットワーク インフラを確保するために最先端のテスト機器を必要としています。
Versal HBM デバイスの 112G PAM4 トランシーバーは、データセンター ネットワーク事業者やクラウド プロバイダーが、新しいプロトコルや光接続との相互運用性に適応できるネットワークを構築する際に最も重要なブロックの一つとなります。専用のチャネライズド マルチレート イーサネット コアは、32G HBM とプログラマブル NoC の近くに個別にアクセス可能な HSC、MAC、PCS、FEC ブロックを備えているため、大規模なトラフィック バッファリング、効率的なデータ転送、インテリジェントなデータフロー制御、トラッキング、L4-L7 テスト機器用のレポート機能など、複雑なテスト ロジックを実装できます。

製品仕様

メモリの特徴

  VH1522 VH1542 VH1582 VH1742 VH1782
HBM DRAM (GB) 8 16 32 16 32
総ブロック RAM (Mb) 89 89 89 132 132
UltraRAM (Mb) 366 366 366 541 541
総 PL メモリ (Mb) 509 509 509 752 752

DSP エンジンの機能

  VH1522 VH1542 VH1582 VH1742 VH1782
DSP エンジン 7,392 7,392 7,392 10,848 10,848

プログラマブル ロジックの機能

  VH1522 VH1542 VH1582 VH1742 VH1782
システム ロジック セル (K) 3,837 3,837 3,837 5,631 5,631
LUT 数 1,753,984 1,753,984 1,753,984 2,574,208 2,574,208

プロセッサ サブシステムの機能

  VH1522 VH1542 VH1582 VH1742 VH1782
アプリケーション プロセッシング ユニット デュアル コア Arm® Cortex®-A72、48 KB/32 KB L1 キャッシュ (パリティおよび ECC 付き)、1 MB L2 キャッシュ (ECC 付き)
リアルタイム プロセッシング ユニット デュアル コア Arm Cortex-R5F、32 KB/32 KB L1 キャシュ、および 256 KB TCM (ECC 付き)
メモリ 256 KB オンチップ メモリ (ECC あり)
コネクティビティ Ethernet (x2)、UART (x2)、CAN-FD (x2)、USB 2.0 (x1)、SPI (x2)、I2C (x2)

プラットフォームの機能

  VH1522 VH1542 VH1582 VH1742 VH1782
GTYP トランシーバー (32.75 Gb/s) 681 681 681 681 681
GTM トランシーバー (56 G (112 G)) 20 (10) 20 (10) 20 (10) 60 (30) 60 (30)
DMA 内蔵 PCIe® (CPM5) 2 x Gen5x8 2 x Gen5x8 2 x Gen5x8 2 x Gen5x8 2 x Gen5x8
PCI Express (PLPCIE5) 8 x Gen5x4 8 x Gen5x4 8 x Gen5x4 8 x Gen5x4 8 x Gen5x4
400G 高速暗号化エンジン 2 2 2 3 3
100G Multirate Ethernet MAC 4 4 4 6 6
600G Ethernet MAC 1 1 1 3 3
600G Interlaken 0 0 0 1 1

1.16 GTYP トランシーバーは、PCI Express を使用する場合の CPM5 専用です。

すべての開発者向け

AMD は、アダプティブ SoC および FPGA を使用した設計をサポートするソフトウェア開発環境を提供しています。これには、ツール (コンパイラ、シミュレータなど)、IP、およびソリューションが含まれます。

この環境を利用することで、ワットあたりの性能が高いデザインを短期間に構築できます。これらのツールは、AI サイエンティストから、アプリケーション/アルゴリズム エンジニア、エンベデッド ソフトウェア開発者、従来のハードウェア開発者に至るまで、あらゆる開発者が AMD アダプティブ コンピューティング ソリューションを活用できるようサポートします。

開発を開始

実証済みの HW/SW サポート、ツール、デザイン サンプル、およびキットに対応した関連資料を利用することで、すぐに設計を開始して製品の市場投入までの期間を短縮できます。

Versal HBM Series VHK158 Evaluation Kit

Versal HBM シリーズ VHK158 評価キットで開発を開始

VH1582 デバイスを搭載した VHK158 評価キットを使用して、Versal HBM シリーズの機能を評価できます。このプラットフォームには HBM が統合されているため、計算負荷およびメモリ負荷が高いアプリケーションの開発に最適です。実証済みの HW/SW サポート、ツール、デザイン サンプル、およびキットに対応した関連資料を利用することで、すぐに設計を開始して製品の市場投入までの期間を短縮できます。

リソース

最新情報を入手

Versal 通知リストに登録された方には、この製品に関する最新情報をいち早くお届けします。