シングルチップは1PetaOps /秒を提供します
GroqはそのアーキテクチャをTensor Streaming Processor(TSP)と呼んでいます。 2年前、Googleのテンソルプロセッシングユニット(TPU)を開発した10人のうち8人を採用したと発表しました。
同社は6230万ドルの資金を調達した。
Groqのアーキテクチャは、1秒あたり1兆演算、つまり1e15 ops / sに相当し、1秒あたり最大250兆の浮動小数点演算(FLOPS)が可能です。
「トップGPU企業は、今後数年以内に1つのPetaOp / sパフォーマンスを提供できることを望んでいると顧客に伝えています。 Groqは本日発表しました」とGroqのCEOであるJonathan Rossは述べています。最初のシリコンバック、初日の電源投入、最初の週に実行されるプログラムがあり、6週間未満でパートナーと顧客にサンプリングされ、A0シリコンが生産されました。」
ソフトウェアを第一に考えたGroqのTSPアーキテクチャは、従来のGPUおよびCPUアーキテクチャの同期オーバーヘッドなしに、計算の柔軟性と大規模な並列処理の両方を実現すると主張しています。
Groqのアーキテクチャは、従来の機械学習モデルと新しい機械学習モデルの両方をサポートでき、現在、x86システムと非x86システムの両方の顧客サイトで運用されています。
このアーキテクチャは、コンピュータビジョン、機械学習、その他のAI関連のワークロードのパフォーマンス要件に合わせて特別に設計されています。
実行計画はソフトウェアで行われるため、動的な命令実行専用のシリコン領域を解放できます。
このアーキテクチャによって提供される厳格な制御は、安全性と精度が最優先事項であるアプリケーションに特に価値のある確定的な処理を提供します。
CPU、GPU、FPGAに基づく従来の複雑なアーキテクチャと比較して、Groqのチップは認定と展開を合理化し、顧客がスケーラブルなワットあたりの高性能システムを簡単かつ迅速に実装できるようにします。
