Google présente sa nouvelle génération de TPU optimisée pour l’inférence

Le 22/04/2025 à 10:56 par Fleur Brosseau

Lors de sa conférence annuelle Cloud Next ‘25, Google a présenté son lot de nouveautés dédiées à l’intelligence artificielle (IA) générative. Parmi elles, sa septième génération de TPU (Tensor Processing Units), baptisée Ironwood. Ces circuits intégrés servent à accélérer les systèmes d’IA, mais cette nouvelle version est plus spécifiquement optimisée pour les tâches d’inférence. Elle a ainsi été conçue pour soutenir la charge de calcul inhérente aux « modèles de pensée » (grands modèles de langage, mélanges d’experts, etc.). Des modèles de référence comme Gemini 2.5 ou AlphaFold, développés par DeepMind, tournent déjà sur des TPU.
Par rapport à la génération précédente, Ironwood offre cinq fois plus de capacité de calcul et six fois plus de capacité de mémoire à large bande passante. Chaque puce affiche une puissance de calcul maximale de 4614 téraflops. Dans leur configuration maximale (9216 puces par module), ces TPU peuvent délivrer 42,5 exaflops – soit une puissance de calcul 24 fois supérieure à celle du supercalculateur le plus puissant du monde ! Ces nouveaux modèles seront disponibles à la fin de l’année.

Copy link
Powered by Social Snap