IBM a dévoilé les détails de sa puce du nom de Telum conçu pour apporter l'inférence du « deep learning » aux applications des entreprises afin de lutter contre la fraude en temps réel.
L’inférence est une opération logique par laquelle on admet une proposition en vertu de sa liaison avec d'autres propositions déjà tenues pour vraies. Telum est le premier processeur d'IBM qui contient une accélération sur puce pour l'inférence de l'IA pendant qu'une transaction est en cours. Sa conception a demandé trois ans de développement. Un premier système reposant sur cette technologie est prévu pour le premier semestre 2022.
La puce contient 8 cœurs de processeur avec un important pipeline d'instructions non séquencées super-scalaire, fonctionnant à une fréquence d'horloge de plus de 5 GHz, optimisée pour les exigences des applications hétérogènes de classe entreprise. L'infrastructure de cache et d'interconnexion des puces, entièrement repensée, fournit 32 Mo de cache par cœur et peut évoluer jusqu'à 32 puces Telum. La conception du module à deux puces contient 22 milliards de transistors et un peu plus de 30 km de fils sur 17 couches métalliques.