Avec ses 26 exaFlops de puissance, le GPU A3 de Google doit permettre aux entreprises de former plus rapidement des modèles d’IA complexes.
Google a annoncé lors de sa conférence Google I/O, le lancement du GPU A3, un nouveau supercalculateur qui doit fournir l’infrastructure nécessaire afin de former les modèles d’IA, très gourmandes en quantité de calcul. « Les supercalculateurs Google Compute Engine A3 sont spécialement conçus pour former et servir les modèles d'IA les plus exigeants qui alimentent l'IA générative d'aujourd'hui et l'innovation des grands modèles de langage. », détaille la firme de Mountain View dans un communiqué.
26 exaFlops de puissance
Mais alors, qu’est-ce que ce supercalculateur a sous le capot ? Le GUP A3 combine la puissance de 8 GPU H100 de NVIDIA, à un processeurs Intel Xeon Scalable de nouvelle génération et 2 To de mémoire hôte via des modules DIMM DDR5 à 4 800 MHz. L’infrastructure de l’A3 embarque également du Processing Unit (IPU) 200 Gbps qui multiplie par 10 la bande passante réseau, comparé aux machines virtuelles A2.
Le supercalculateur A3 sera en mesure de fournir jusqu'à 26 exaFlops de puissance. « Ce qui améliore considérablement le temps et les coûts de formation de grands modèles ML (Machine learning Ndlr). », promet la firme. Ces performances doivent donner les moyens techniques aux clients de Google pour former des modèles de langage plus complexes à vitesse grand V.
Les machines virtuelles A3 peuvent être déployées sur la plateforme Vertex AI, sur Google Kubernetes Engine (GKE) et Compute Engine. Mais les places sont rares. Les entreprises intéressées devront s’inscrire sur liste d’attente, sans garantie d’être sélectionnées.