IBM, yapay zekaya yönelik yeni nesil bilgi işlem sistemlerini duyurdu – Telum II işlemci ve IBM Spyre hızlandırıcı. Her iki ürün de yapay zekayı hızlandırmak ve kurumsal uygulamaların performansını artırmak için tasarlandı. Telum II, daha büyük önbellek ve yüksek performanslı çekirdeklerle önemli iyileştirmeler sunuyor. Spyre hızlandırıcı, yapay zeka uygulamaları için daha da iyi performans sağlamak üzere bunu tamamlıyor.
Şirketin bloguna göre Samsung’un 5 nanometre teknolojisi kullanılarak geliştirilen yeni IBM Telum II işlemcisi, 5,5 GHz hızında çalışan sekiz adet yüksek performanslı çekirdekle donatılacak. Çip üzerindeki önbellek miktarı %40 artarken, sanal L3 önbelleği 360 MB’a, L4 önbelleği ise 2,88 GB’a çıktı. Diğer bir yenilik ise daha hızlı G/Ç işlemleri için entegre veri işleme birimi (DPU) ve yeni nesil yerleşik yapay zeka hızlandırıcıdır.
Telum II, önceki nesillere göre önemli performans iyileştirmeleri sunuyor. Yerleşik yapay zeka hızlandırıcı, dört kat daha fazla işlem gücü sağlayarak saniyede 24 trilyon işleme (TOPS) ulaşır. Hızlandırıcı mimarisi, büyük dil modelleriyle çalışmak üzere optimize edilmiştir ve yapılandırılmış ve metin verilerinin karmaşık analizi için çok çeşitli yapay zeka modellerini destekler. Ayrıca yeni işlemci, hesaplama verimliliğini artırmak için INT8 veri türünü destekler. Ancak sistem düzeyinde Telum II, her işlemci çekirdeğinin tek bir modül içindeki sekiz AI hızlandırıcıdan herhangi birine erişmesine izin vererek daha verimli yük dağıtımı sağlar ve 192 TOPS’luk genel performansa ulaşır.
IBM ayrıca IBM Research ve IBM Infrastructure Development ile ortaklaşa geliştirilen Spyre hızlandırıcısını da tanıttı. Spyre, mimarisi Telum II çipine entegre hızlandırıcının mimarisine benzeyen 32 AI hızlandırıcı çekirdeği ile donatılmıştır. Birden fazla Spyre hızlandırıcıyı PCIe aracılığıyla IBM Z I/O alt sistemine bağlama yeteneği, yapay zeka iş yüklerini hızlandırmak için mevcut kaynakları önemli ölçüde artırır.
Telum II ve Spyre, topluluk yapay zekası da dahil olmak üzere çok çeşitli yapay zeka kullanım örneklerini destekleyecek şekilde tasarlanmıştır. Bu yöntem, genel tahmin performansını ve doğruluğunu iyileştirmek için birden fazla yapay zeka modelinin aynı anda kullanılmasından yararlanır. Bunun bir örneği, analiz verimliliğini artırmak için geleneksel sinir ağlarının büyük dil modelleriyle başarılı bir şekilde birleştirildiği sigorta dolandırıcılığı tespitidir.
Her iki ürün de 26 Ağustos’ta Palo Alto’da (Kaliforniya, ABD) düzenlenen Hot Chips 2024 konferansında tanıtıldı. Serbest bırakılmaları 2025 için planlanıyor.