IBM hat eine neue Generation von Informationsverarbeitungssystemen für künstliche Intelligenz angekündigt - Telum II -Prozessor und IBM Spyre Accelerator. Beide Produkte sind so konzipiert, dass sie künstliche Intelligenz beschleunigen und die Leistung institutioneller Anwendungen erhöhen. Telum II bietet signifikante Verbesserungen bei größeren Cache und hohen Kern. Spyre Accelerator vervollständigt dies, um künstliche Intelligenzanwendungen eine noch bessere Leistung zu bieten.
Laut dem Blog des Unternehmens wird der neue IBM Telum II -Prozessor, der mit der 5 -Nanometer -Technologie von Samsung entwickelt wurde, mit acht Hochleistungssamen ausgestattet, die mit einer Rate von 5,5 GHz laufen. Während die Menge an Cache auf dem Chip um 40 %stieg, stieg der virtuelle L3 -Cache auf 360 MB und der L4 -Cache auf 2,88 GB. Eine weitere Innovation ist die integrierte Datenverarbeitungseinheit (DPU) für schnellere G/O -Operationen und die neue Generation der Beschleunigung der künstlichen Intelligenz.
Telum II bietet im Vergleich zu früheren Generationen signifikante Leistungsverbesserungen. Der gebaute Beschleuniger für künstliche Intelligenz erreicht eine 24 -Billionen -Verarbeitung (TOPS) pro Sekunde, indem er viermal mehr Verarbeitungsleistung bereitstellt. Die Accelerator -Architektur ist so optimiert, dass sie mit großsprachigen Modellen zusammenarbeiten und eine breite Palette künstlicher Intelligenzmodelle für die komplexe Analyse von Textdaten unterstützt. Darüber hinaus unterstützt der neue Prozessor den INT8 -Datentyp, um die Berechnungseffizienz zu erhöhen. Auf Systemebene ermöglicht Telum II jedoch eine effizientere Lastverteilung, indem jeder Prozessorkern in einem einzelnen Modul auf einen der acht AI -Beschleuniger zugreifen kann und 192 Tops -Leistung erreicht.
IBM stellte auch den Spyre Accelerator vor, der gemeinsam mit IBM Research und IBM Infrastructure Development entwickelt wurde. Spyre ist mit 32 KI -Beschleunigungskern ausgestattet, ähnlich der Architektur des integrierten Beschleunigers in den Telum II -Chip. Die Fähigkeit, mehrere Spionagebeschleuniger mit dem IBM/O -Subsystem über PCIe zu verbinden, erhöht die vorhandenen Ressourcen erheblich, um künstliche Intelligenz -Arbeitsbelastungen zu beschleunigen.
Telum II und Spyre sind so konzipiert, dass sie eine breite Palette künstlicher Intelligenz verwenden, einschließlich künstlicher Intelligenz. Diese Methode verwendet gleichzeitig die Verwendung mehrerer künstlicher Intelligenzmodelle, um die allgemeine Schätzungsleistung und -genauigkeit zu verbessern. Ein Beispiel hierfür ist die Bestimmung des Versicherungsbetrugs, in dem traditionelle neuronale Netze erfolgreich mit großsprachigen Modellen kombiniert werden, um die Effizienz der Analyse zu steigern.
Beide Produkte wurden am 26. August auf der Hot Chips 2024 in Palo Alto (Kalifornien, USA) eingeführt. Sie sollen 2025 freigelassen werden.