OpenAI, 15 saniyelik bir örneğe dayanarak girilen metni gerçekçi bir şekilde seslendirebilen ve konuşmacının ses ve konuşma özelliklerini doğru bir şekilde aktarmaya çalışan Voice Engine AI modelinin ön testinin sonuçlarını sundu.
Ses Motorunun ilk gelişmeleri 2022’nin sonunda ortaya çıktı ve metni konuşmaya dönüştürmek için API’de ve ayrıca ChatGPT Voice ve Read Aloud ile birlikte kullanıldı. OpenAI, sentezlenmiş ses teknolojisinin olası yanlış kullanımının sonuçlarının farkında olduğundan olası tehlikeler ve uygulama alanları hakkında halktan geri bildirim almayı umuyor.
Videolar ve podcast’ler gibi içeriklerin çevrilmesi, yazarların ve şirketlerin bilgileri kendilerinin ve çalışanların sesleriyle ileterek dünya çapındaki hedef kitlelerini genişletmelerine olanak tanıyacak. Öncülerden biri , ürün pazarlamasından satış sunumlarına kadar çeşitli amaçlar için insansı avatarlar oluşturmak üzere tasarlanmış, kurumsal müşterilere yönelik bir yapay zeka görsel hikaye anlatma platformu olan HeyGen’dir . Ses Motoru konuşmacının ana aksanını korur, böylece Fransızca konuşan biri İngilizce metin konuştuğunda Fransız aksanı duyulacaktır.