Connect with us

AI

IBM lancia il nuovo processore Telum II e l’acceleratore Spyre

Published

on

Nel 2021, IBM ha presentato il processore Telum, caratterizzato dal suo primo acceleratore AI avanzato integrato direttamente sul chip, progettato per l’inferencing. Questo processore ha rappresentato un pilastro fondamentale per il successo del programma mainframe IBM z16, grazie alla capacità di offrire risultati concreti ai clienti in un panorama tecnologico sempre più esigente.

Oggi, durante la conferenza Hot Chips 2024 a Palo Alto, California, IBM ha annunciato la nuova generazione del calcolo aziendale nell’era dell’intelligenza artificiale con il processore Telum II e un’anteprima dell’acceleratore Spyre. Entrambi i prodotti saranno disponibili nel 2025 e promettono di ridefinire gli standard di performance e efficienza nel settore.

Caratteristiche tecniche del Telum II

Sviluppato utilizzando la tecnologia Samsung a 5 nm, il processore IBM Telum II è dotato di otto core ad alte prestazioni che operano a 5,5 GHz. Una delle principali innovazioni del Telum II è l’aumento del 40% della capacità della cache on-chip, con la cache virtuale L3 che arriva a 360 MB e la cache L4 a 2,88 GB. Il processore integra una nuova unità di elaborazione dati (DPU) specializzata per l’accelerazione I/O e una nuova generazione di accelerazione AI on-chip. Questi miglioramenti hardware sono stati progettati per offrire prestazioni significativamente superiori rispetto alle generazioni precedenti.

L’infusione dell’intelligenza artificiale nelle transazioni aziendali è diventata essenziale per molti clienti IBM, con soluzioni di rilevamento delle frodi basate sull’AI che permettono risparmi di milioni di dollari ogni anno. Basandosi sul successo dell’acceleratore AI del processore Telum, il nuovo Telum II vede un miglioramento della potenza di calcolo degli acceleratori di 4 volte, raggiungendo i 24 trilioni di operazioni per secondo (TOPS).

Oltre ai numeri impressionanti, è l’architettura dell’acceleratore a fare la differenza. Il Telum II è progettato per eseguire modelli di AI accanto ai carichi di lavoro aziendali più esigenti, garantendo un’inferencing ad alta velocità e bassa latenza. Inoltre, il supporto per il tipo di dati INT8 migliora la capacità di calcolo e l’efficienza, permettendo l’utilizzo di modelli più recenti e complessi.

Il futuro dell’AI con l’acceleratore Spyre

Durante la conferenza, IBM ha anche presentato l’acceleratore Spyre, sviluppato in collaborazione con IBM Research e IBM Infrastructure Development. Questo nuovo acceleratore conterrà 32 core AI, con un’architettura simile a quella integrata nel Telum II. Più acceleratori Spyre possono essere collegati al sottosistema I/O di IBM Z tramite PCIe, aumentando significativamente la capacità di accelerazione disponibile.

Questi avanzamenti tecnologici non solo supportano una gamma più ampia di modelli AI, ma consentono anche l’uso di metodi AI ensemble, che combinano la forza di più modelli AI per migliorare la precisione delle previsioni e delle analisi.

Il processore Telum II e l’acceleratore Spyre sono progettati per supportare una gamma più ampia di casi d’uso AI, accelerando e migliorando i risultati aziendali per i clienti IBM. Con queste soluzioni aziendali di nuova generazione, IBM continua una tradizione di innovazioni rivoluzionarie, co-create con i propri clienti per rispondere alle esigenze in evoluzione dei carichi di lavoro transazionali critici.

Continue Reading