OpenAI, önümüzdeki birkaç hafta içinde geliştirici ve tüketici çözümlerine sunulacak güçlü bir çok modlu üretken yapay zeka (AI) modeli olan GPT-4o’yu tanıttı. GPT-4o’nun adındaki “o”, omni (kapsamlı) anlamına geliyor ve GPT-4o’nun çok modlu olduğunu gösteriyor.
OpenAI CTO’su Mira Murati, San Francisco’daki (ABD) OpenAI ofisinde bir ürün sunumu sırasında GPT-4o’nun “GPT-4 düzeyinde” zekaya sahip olduğunu, ancak metin, görsel ve ayrıca sesle çalışma konusunda daha büyük yeteneklere sahip olduğunu söyledi. Murati , “GPT-4o sesi, metni ve görsel görüntüleri anlıyor ” dedi. ” Ve makinelerle aramızdaki etkileşimin geleceğini düşündüğümüzde bu son derece önemli.”
Önceki model olan GPT-4 Turbo, görsel ve metin kombinasyonuyla eğitilmişti. Resimlerden metin üretmek ve hatta bu resimlerin içeriğini tanımlamak gibi görevleri gerçekleştirmek için resimleri ve metni analiz edebiliyor. Buna karşılık GPT-4o bu yeteneklere konuşmayı da ekledi. GPT-4o, 128 bin jetonluk bir bağlam penceresi aldı.
GPT-4o’nun yapay zekalı chatbot ChatGPT’nin performansını önemli ölçüde artıracağı aktarılıyor. İkincisi, sohbet robotu yanıtlarının metinden konuşma modeli kullanılarak yazıya geçirildiği bir ses modunu uzun süredir desteklemektedir, ancak GPT-4o bu özelliği güçlendirerek kullanıcıların sohbet robotuyla daha çok bir asistan gibi etkileşime girmesine olanak tanıyacaktır. Örneğin ona bir soru sorabilir ve cevap verdiğinde sözünü kesebilirsiniz. OpenAI’ye göre, GPT-4o modeli “gerçek zamanlı” yanıt sağlıyor ve hatta kullanıcının sesindeki duyguları yakalayarak mevcut duruma göre “farklı duygusal tarzlarda” yanıt olarak bir ses üretebiliyor.
GPT-4o aynı zamanda ChatGPT’nin görsel yeteneklerini de geliştirecek. ChatGPT, önerilen bir fotoğrafa veya masaüstü ekranına göre artık “Bu kodda neler oluyor” dan “Bu kişi hangi marka gömlek giyiyor?” a kadar ilgili soruları hızlı bir şekilde yanıtlayabilecek.
Gelecekte modelin yetenekleri genişletilecektir. Eğer GPT-4o artık örneğin fotoğrafı çekilen bir menüyü başka bir dile çevirmeye izin veriyorsa, gelecekte ChatGPT’nin yardımıyla bir spor karşılaşmasını canlı olarak “izleyebileceğini” ve size kuralları açıklayabileceğini söylüyor Murati.
Bugünden itibaren GPT-4o, hem ücretli hem de ücretsiz ChatGPT kullanıcılarına sunulacak, ancak ücretli ChatGPT Plus ve Team planlarının aboneleri için mesaj sınırı “5 kat daha yüksek” olacak. Sınır aşılırsa ChatGPT, ücretsiz kullanıcılar için otomatik olarak GPT-3.5’e, ücretli kullanıcılar için ise GPT-4’e geçiş yapacaktır.
ChatGPT’nin ücretsiz kullanıcıları, GPT-4o ile etkileşimde bulunurken, daha önce yalnızca ücretli abonelerin kullanımına sunulan bazı özelliklere erişebilecek. Güncellenen chatbot, yalnızca yapay zeka modelinde değil aynı zamanda internette de bilgi arayabilecek; verileri analiz etmek ve grafikler oluşturmak; özel görseller ve dosyalarla çalışacak; ve ayrıca önceki kullanıcı etkileşimlerini daha iyi hatırlayabilecek. Ücretsiz kullanıcılar da GPT Mağazasına erişebilecek.
OpenAI, GPT-4o’nun 50 farklı dilde gelişmiş performansla daha fazla dili desteklediğini söyledi. OpenAI API’sinde GPT-4o, GPT-4’ten (özellikle GPT-4 Turbo) iki kat daha hızlı, yarı fiyatlı ve daha yüksek hız limitlerine sahiptir.
Ses desteği şu anda tüm istemciler için GPT-4o API’sine dahil değildir. OpenAI, kötüye kullanım riski nedeniyle, yeni GPT-4o ses yeteneklerine yönelik desteği önümüzdeki haftalarda ilk kez “küçük bir güvenilir ortak grubuna “ sunmayı planladığını açıkladı .