AI エンジンと DSP エンジンで構成されるインテリジェント エンジンは、AI 推論、画像処理、モーション コントロールなど、エッジ アプリケーションで一般的な幅広いワークロードをサポートします。AI エンジンは、ベクトル プロセッサと分散メモリがアレイ状に配置された拡張性のある画期的なアーキテクチャであり、ワットあたりの AI 性能を大幅に向上させます。DSP エンジンは、前世代の Zynq™ アダプティブ SoC で実績のあるスライス アーキテクチャをベースに浮動小数点演算のサポートを追加しているため、ワイヤレスや画像の信号処理、データ分析、モーション コントロールなどに最適なエンジンです。
プログラマブル ロジックにより、差別化と将来を見据えた適応性をもたらし、進化し続けるアルゴリズムに対応するカスタム演算ブロックの開発が可能です。さまざまなメモリ エレメントを備え、プログラム可能な I/O と緊密に結合された適応型エンジンは、あらゆるアプリケーションに対応できる強力なアクセラレータを実現します。
多様なアプリケーション要件に対応するために、スカラー エンジンを備えています。アプリケーション プロセッシング ユニットは OS でサポートされる複雑なアプリケーションに、リアルタイム プロセッシング ユニットは低レイテンシを必要とするアプリケーションに最適です。最後に、独立したプラットフォーム管理コントローラーは、システムの起動、セキュリティ、およびデバッグを管理します。
Versal プレミアム シリーズの 112G PAM4 トランシーバーは、電力効率に優れた 800G ネットワーク システムの実現に不可欠です。Versal プレミアム アダプティブ SoC は、1 つのデバイスに 32G、58G、および 112G トランシーバーを備えているため、ベンダーはメインストリームの 100G システムを 400G に拡張したり、将来的には 800G またはそれ以上にも対応させることができます。
Versal プレミアム アダプティブ SoC は、1.6Tb/s ラインレートの暗号化スループットを実現し、安全なネットワークに最適なプラットフォームです。 適応可能なプラットフォームに業界唯一のハード化された 400G のチャネライズド高速暗号化 (HSC) エンジンが統合されています。HSC エンジンは、AES-GCM 暗号化/復号化、MACsec、および IPsec をサポートする多層セキュリティを提供します。
専用のコネクティビティ IP により、多くのデータレートとプロトコルをサポートするセキュアなテラビット単位のイーサネットを実現できます。100G イーサネット コアと 600G イーサネット コアを組み合わせることで、最大 5Tb/s のスループットを実現でき、アクセス ネットワークからメトロ、さらにはコアまで、すべて単一のプラットフォームで対応できます。
デバイスに統合された Interlaken コアは、最大 600Gb/s までサポートし、ビルトインのフロー制御機能による信頼性の高い広帯域幅のデータ伝送が可能になります。Versal プレミアム デバイスには、RS-FEC 機能が統合されているため、電力に最適化されたエラー訂正が可能です。ネットワーク システムの I/O 数を削減でき、消費電力を最小限に抑えながらチップ間のスケーラブルな相互接続をサポートします。
PCIe®Gen5 は、次世代の計算アプリケーション向けにサーバー CPU とアクセラレータ間の通信を高速化し、プログラム可能な NoC とハード化された DMA エンジンを使用することで、ワークロードのプロビジョニングと運用のためのスケーラブルなターンキー型の仮想化を実現します。
プログラム可能なネットワーク オン チップ (NoC) は、Versal アダプティブ SoC アーキテクチャ内の演算エンジンと統合 IP ブロック間に最適化済みのテラビット単位のインターコネクトを提供します。これにより、タイミング クロージャが容易になり、ロジック リソースも節約できます。NoC コンパイラは合理的なプログラミング フローを提供し、ユーザーが重要なデータパスのレイテンシと QoS を管理できるようになります。
フェーズド アレイ レーダー向けの適応型ビームフォーミングは、スペクトルが競合する環境で正確なトラッキングやガイダンスを実行します。AI エンジンを搭載した Versal™ プレミアム デバイスは、前世代デバイスより 4 倍優れた信号処理能力1 を提供し、ビームフォーミングなどの演算負荷が高い機能の実装に最適です。AI エンジンと DSP エンジンは、レーダー アプリケーションで最も重要視されているダイナミック レンジの拡大を可能にするため、高効率な単精度浮動小数点などの多様なデータ型をネイティブ サポートしています。
Versal プレミアム シリーズは、112G PAM4 トランシーバーを備え、電力に最適化された IP を多数統合しています。これにより、アンテナからバックエンドまでの安全なネットワーク接続を確保でき、レイテンシと消費電力を最小限に抑えた統合システムを簡単に構築できます。Versal アーキテクチャ ベースの革新的なヘテロジニアス デバイスは、多くのレーダー システムで小型化、軽量化、低消費電力化 (SWaP) を実現します。
1: 総合的な DSP エンジンの性能を Virtex™ UltraScale+™ VU13P FPGA と比較
5G ワイヤレス、xHaul、PON、およびケーブル アクセスに対する帯域幅要件が高まるにつれて、メトロ/トランスポート ネットワークでは、ネットワーク トラフィックを集約してインテリジェントに処理することが求められます。Versal™ プレミアム シリーズは、112G PAM4 トランシーバーを備え、600G のチャネル化されたマルチレート イーサネットや FEC 機能付き 600G Interlaken などの専用接続 IP を統合しているため、複雑なメトロ/コア トランスポート ネットワークの熱効率の高い設計が可能です。
従来のハードウェア プログラマブル デバイスの 2 倍の計算密度を提供する Versal プレミアムは、ハードウェアの差別化や新規格への適応性に優れ、また AI/ML 機能を組み込むことで自律的なインテリジェント ネットワークを実現できます。
Versal プレミアムは、ヘテロジニアス プラットフォームとして世界最高の演算密度を備えており、ゲノム解析、ビデオ トランスコーディング、検索、機械学習などの幅広いワークロードに対応するクラウド アクセラレーション機能を実現できます。
Dynamic function exchange (DFx) を使用することで、数ミリ秒で計算カーネルを交換し、アクセラレータをプロビジョニングして、クラウド インフラストラクチャを最も効率的に使用することが可能になります。Versal プレミアムは、大容量のオンチップ メモリと広帯域幅アクセス、さらに従来型 FPGA アクセラレータの 2 倍の演算密度を備えているため、優れた計算性能と合理化された統合が可能になります。
クラウド インフラとシームレスに統合するためにゼロから構築された Versal プレミアムには、起動時にホスト サーバーとシステム メモリ間の通信が可能になるようにシェルが搭載されているため、設計者は接続に時間をかけることなく、差別化に集中できます。
データセンターの規模が大きくなるにつれて、データセンター間の相互接続通信 (DCI) 技術を進化させて、大容量、優れた拡張性、高い電力効率を実現する必要があります。Versal プレミアム シリーズは、最大 112G のスケーラブルなトランシーバー、最大 5Tb/s のイーサネット スループット、および 1.6Tb/s ラインレートの暗号化スループットを提供してデータセンター間の高速かつセキュアな接続を可能にするため、サービス プロバイダーは柔軟性のあるトランスポート技術を運用できます。
データセンターから 5G までのネットワーク技術を開発するには、相互運用性と堅牢なネットワーク トラフィック管理を確保するために、最先端の通信テスト装置が必要です。Versal プレミアム シリーズに統合された AI エンジンと DSP エンジンは、業界最高クラスの信号処理性能とロジック容量を備えているため、自動テスト、データフロー制御、トラッキング、レポーティングなど複雑なテスト ロジックを実装できます。
112G PAM4 トランシーバーは、新しいプロトコルに対応した KP4 FEC 機能を備え、光やバックプレーンとの相互運用性も備えています。総スループット 5Tb/s のチャネル化された専用のマルチレート イーサネット コアは、個別にアクセス可能な MAC、PCS、および FEC ブロックに加え、カスタム エラー挿入や統計解析に使用できるプログラム可能なロジック リソースを備えています。
VP1002 | VP1052 | VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
アプリケーション処理ユニット | デュアル コア Arm® Cortex®/32KB L1 キャッシュ (パリティおよび ECC あり)、1MB L2 キャッシュ (ECC あり) | |||||||||||
リアルタイム プロセッシング ユニット | デュアル コア Arm Cortex/32KB L1 キャシュ、および 256KB TCM (ECC あり) | |||||||||||
メモリ | 256KB オンチップ メモリ (ECC あり) | |||||||||||
コネクティビティ | Ethernet (x2)、UART (x2)、CANFD (x2)、USB 2.0 (x1)、SPI (x2)、I2C (x2) |
VP1002 | VP1052 |
VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
AI エンジン | - | - | - | - | - | - | 472 |
- | - | - | 472 | - |
DSP エンジン | 1,140 | 1,572 | 1,904 | 3,984 | 2,672 | 7,440 | 7,392 | 7,392 | 10,896 | 14,352 | 14,304 | 6,864 |
VP1002 | VP1052 | VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
システム ロジック セル (K) | 833 | 1,186 | 1,575 | 1,969 | 2,233 | 3,763 | 3,738 | 3,837 | 5,558 | 7,352 | 7,326 | 18,507 |
LUT 数 | 380,800 | 542,080 | 719,872 | 900,224 | 1,020,928 | 1,720,448 | 1,708,672 | 1,753,448 | 2,540,672 | 3,360,896 | 3,349,120 | 8,460,288 |
VP1002 | VP1052 | VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
GTY トランシーバー (32.75 Gbps) | 20 | 20 | - | - | - | - | - | - | - | - | - | |
GTYP トランシーバー1 (32.75 Gbps) | - | - | 8 | 281 | 8 | 281 | 281 | 681 | 281 | 281 | 281 | 128 |
GTM トランシーバー (58G (112G)) | 24 (12) | 48 (24) | 64 (32) | 20 (10) | 96 (64) | 60 (30) | 60 (30) | 20 (10) | 100 (50) | 140 (70) | 140 (70) | 32 (16) |
CCIX PCIe® (DMA 付き) (CPM4) | 2 x Gen4x4 | 2 x Gen4x4 | - | - | - | - | - |
- | - | - | - | - |
CCIX PCIe (DMA 付き) (CPM5) | - |
- |
- | 2 x Gen5x8 | - |
2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | - |
PCI Express® | 1 x Gen4x8 | 1 x Gen4x8 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 8 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 16 x Gen5x4 |
100G マルチレート イーサネット MAC | 3 | 5 | 6 | 2 | 6 |
4 | 4 | 4 | 6 | 8 | 8 | 12 |
600G イーサネット MAC | 2 | 3 | 7 | 1 | 11 | 3 | 3 | 1 | 5 | 7 | 7 | 4 |
600G Interlaken | 1 | 2 | 0 | 0 | 0 | 1 | 1 | 0 | 2 | 3 | 3 | 0 |
400G 高速暗号化エンジン | 1 | 1 | 3 | 1 | 4 | 2 | 2 | 2 | 3 | 4 | 4 | 0 |
1.16 GTYP トランシーバーは、PCI Express を使用する場合の CPM5 専用です。
AMD は、Versal アーキテクチャを活用する開発を支援するため、さまざまな資料、リソース、設計手法を提供しています。Versal アダプティブ SoC を使用して開発を始めるときに、まず何から着手すべきか分からない場合には、インタラクティブなガイダンスを提供するデザイン フロー アシスタントを利用して開発の戦略を立てることができます。また、デザイン プロセス ハブでは、Versal に関するすべての資料が設計段階ごとに分類および表示されているため、必要な情報をすぐに入手できます。
本質的にソフトウェアでプログラム可能なシリコン インフラストラクチャを持つ Versal™ アダプティブ SoC は、ゼロから設計されたソフトウェア中心の製品です。機能強化された AMD の Vivado™ML Edition は、トラフィック アナライザー、NoC コンパイラ、データフロー モデリングなどの新しいシステム設計手法と開発環境を提供します。統合型の高速デバッグ環境を利用することで、スカラー エンジン、適応型エンジン、インテリジェント エンジンのデバッグとトレースを高速実行できます。
Vivado ML Edition をダウンロード >
AMD の Vitis™ 統合ソフトウェア プラットフォームは、包括的なコア開発キットとハードウェア アクセラレーション テクノロジを使用するライブラリを提供します。このプラットフォームは、クラウドからエッジまで効率的で使いやすい統合ソフトウェア環境を提供します。オープンソース コミュニティに貢献する一員として、AMD は Vitis 統合ソフトウェア プラットフォームをオープンソースとして無償で提供しています。
Vitis™ 統合ソフトウェア プラットフォームをダウンロード >
AMD の Vitis Model Composer は、Simulink® および MATLAB® 環境でデザインを短時間で試行できるモデル ベースのデザイン ツールです。これにより、RTL および HLS ブロックを AI エンジン カーネルやグラフと一体化させて同じシミュレーションに組み込むことができるため、AI エンジン ADF グラフ開発やシステムレベルでのテストが効率化されます。Versal AI エンジンを Vitis Model Composer で活用する方法は、AI エンジン リソース ページをご覧ください。
Versal プレミアム デバイスは、Versal プライム シリーズおよび Versal AI コア シリーズと同じアーキテクチャを採用しています。評価キットには、開発に必要なものがすべて含まれているため、システム検証の実施、主要インターフェイスの評価、アダプティブ SoC 設計手法の適用などをスムーズに行うことができます。
Versal プレミアム シリーズ VPK120 評価キットを今すぐ購入 >
AI エンジン向け Versal AI コア シリーズ VCK190 評価キットの購入 >
その他の一般的なアーキテクチャ ブロック向けの Versal プライム シリーズ VMK180 評価キットの購入 >
AMD のトレーニングおよび資料は、開発者が次回のプロジェクトで十分な生産性を発揮できるように実践的スキルと基礎知識を提供します。
Versal ACAP を使用したデザイン: アーキテクチャと設計手法
Versal ACAP を使用したデザイン: ネットワーク オン チップ
Versal ACAP を使用したデザイン: 消費電力およびボード デザイン
Versal AI エンジンを使用したデザイン 1: アーキテクチャおよびデザイン フロー
Versal AI エンジンを使用したデザイン 2: AI エンジン カーネルを使用したグラフ プログラミング
Versal AI エンジンを使用したデザイン 3: カーネル プログラミングと最適化
AMD は、Versal アーキテクチャを活用する開発を支援するため、さまざまな資料、リソース、設計手法を提供しています。Versal アダプティブ SoC を使用して開発を始めるときに、まず何から着手すべきか分からない場合には、インタラクティブなガイダンスを提供するデザイン フロー アシスタントを利用して開発の戦略を立てることができます。また、デザイン プロセス ハブでは、Versal に関するすべての資料が設計段階ごとに分類および表示されているため、必要な情報をすぐに入手できます。