
AI処理の効率化が進む中、この技術動向を追う同僚や技術関心のある友人と共有する価値があります。

AI処理を加速する新命令「ACE」 記事の流れと主な事実
IntelとAMDが主導するx86エコシステムの諮問グループ(EAG)が、AI処理を高速化するための新しい命令セット『AI Compute Extensions(ACE)』のホワイトペーパーを公開しました。ACEは従来の行列積和演算ではなく、外積演算に特化した設計で、ZMMレジスタと新設されるタイルレジスタを組み合わせてAIワークロードの効率を高めます。特に8bitや16bitの低精度演算に最適化されており、OCPが策定したMXフォーマットにも対応することで、少ないビット数でも精度を保った計算が可能になります。
この技術は、AI推論処理をCPU上でより効率的に実行することを目指しており、GPUやNPUに頼らずとも端末からデータセンターまで一貫したAI処理基盤を構築する足がかりとなります。現時点では具体的なプロダクトへの搭載時期は不明ですが、IntelのAMXやArmのSME2と異なり、ZMMレジスタを直接入力に使える点や、コア数とアクセラレータ数が一致しない柔軟な構成が見込まれており、実装の自由度が高いのが特徴です。
一方で、ACEが各コアに搭載されるわけではないため、ピーク性能はGPUや専用AIチップに及ばない可能性があります。しかし、既存のx86インフラにスムーズに統合できる点が強みで、AIアプリケーションの開発者にとってシームレスな環境が期待されます。今後の仕様確定と、実際のプロセッサへの実装が注目されます。
主な事実
- 2026年4月27日、IntelとAMDが主導するx86エコシステム諮問グループ(EAG)がACE(AI Compute Extensions)のホワイトペーパーを公開。
- ACEはZMMレジスタを用いた外積演算に特化し、8bit(INT8)と16bit(BF16)のAI処理を高速化する。
- OCPが策定したMXフォーマット(MXFP8/MXFP6/MXFP4)をサポートし、低ビット演算でも精度を確保可能。
- ACEはAVX512比で1サイクルあたり最大16倍の演算性能向上を実現するが、実装数により実効性能は異なる。
- 筆者にはAMDのMichael Clark氏とIntelのPradeep Dubey氏ら著名なアーキテクトが名を連ねている。
Cantoのビジュアルニュース解説です。制作にはAIツールが補助的に使われることがあります。 編集方針





