IBM ha anunciado una nueva generación de sistemas de procesamiento de información para inteligencia artificial: procesador Telum II y acelerador de IBM Spyre. Ambos productos están diseñados para acelerar la inteligencia artificial y aumentar el rendimiento de las aplicaciones institucionales. Telum II ofrece mejoras significativas con caché más grande y núcleos de alto rendimiento. Spyre Acelerator completa esto para proporcionar un rendimiento aún mejor para las aplicaciones de inteligencia artificial.
Según el blog de la compañía, el nuevo procesador IBM Telum II, desarrollado utilizando la tecnología de 5 nanómetros de Samsung, estará equipado con ocho semillas de alto rendimiento que se ejecutan a una velocidad de 5.5 GHz. Mientras que la cantidad de caché en el chip aumentó en un 40 %, el caché L3 virtual aumentó a 360 MB y el caché L4 a 2.88 GB. Otra innovación es la Unidad de Procesamiento de datos integrada (DPU) para operaciones G/O más rápidas y la nueva generación de inteligencia artificial que se acelera.
Telum II ofrece mejoras de rendimiento significativas en comparación con las generaciones anteriores. El acelerador de inteligencia artificial construido alcanza los 24 billones de procesamiento (TOPS) por segundo al proporcionar cuatro veces más potencia de procesamiento. El Acelerator Architecture está optimizado para trabajar con grandes modelos de idiomas y admite una amplia gama de modelos de inteligencia artificial para un análisis complejo de datos de texto. Además, el nuevo procesador admite el tipo de datos INT8 para aumentar la eficiencia de cálculo. Sin embargo, a nivel del sistema, Telum II permite una distribución de carga más eficiente al permitir que cada núcleo del procesador acceda a cualquiera de los ocho aceleradores de IA en un solo módulo y alcanza 192 TOPS RENDIMIENTO GENERAL.
IBM también introdujo el acelerador Spyre desarrollado conjuntamente con IBM Research y el desarrollo de infraestructura de IBM. Spyre está equipado con un núcleo de acelerador de 32 AI, similar a la arquitectura del acelerador integrado en el chip Telum II. La capacidad de conectar múltiples aceleradores de espía al subsistema de IBM/O a través de PCIe aumenta significativamente los recursos existentes para acelerar las cargas de trabajo de inteligencia artificial.
Telum II y Spyre están diseñados para apoyar una amplia gama de ejemplos de uso de inteligencia artificial, incluida la inteligencia artificial. Este método utiliza el uso de múltiples modelos de inteligencia artificial al mismo tiempo para mejorar el rendimiento y la precisión de la estimación general. Un ejemplo de esto es la determinación del fraude de seguros, en el que las redes neuronales tradicionales se combinan con éxito con grandes modelos de idiomas para aumentar la eficiencia del análisis.
Ambos productos fueron introducidos en la conferencia Hot Chips 2024 el 26 de agosto en Palo Alto (California, EE. UU.). Se planean ser liberados 2025.