OpenAI’nin yapay zeka destekli sohbet robotu ChatGPT artık ‘görebiliyor, duyabiliyor ve konuşabiliyor’

OpenAI, Üretken yapay zeka (AI) ChatGPT ile chatbot’u yaratan şirket, bu Pazartesi günü duyurdu popüler aracının yüksek sesle “görme, duyma ve konuşma” yeteneğine sahip yeni bir versiyonu kullanıcılarla.

Şimdiye kadar ChatGPT’nin farklı sürümleriyle yalnızca yazılı olarak etkileşim kurabiliyordunuz, ancak “iki hafta” içinde ödeme yapan kullanıcılar yüksek sesle sohbet edebilecek ve makinenin yanıtlarını dinleyebilecek, ayrıca fotoğraf, resim, ekran görüntüsü ve belge gönderebilecek. Belirli yanıtlar almak için sohbete gidin.

OpenAI’ye göre, bu aracın ücretsiz sürümünü kullananlar bu yeni güncellemelerden “kısa bir süre sonra” yararlanabilecekler.

“Ses ve görüntü size Hayatınızda ChatGPT’yi kullanmanın daha fazla yolu. Şirket, yaptığı açıklamada, “Evdeyken, akşam yemeğinde ne olduğunu görmek için buzdolabınızın ve kilerinizin fotoğraflarını çekin (ve adım adım tarif için sorular sorun),” diye belirtiyor.

Şirket, ses aracının nasıl kullanılabileceğini örneklemek için “bir hikaye anlatmak veya bir tartışmayı çözmek” için kullanılabileceğini söylüyor.

Amazon’un Alexa’sına ve Apple’ın Siri’sine benzeyen bu sesli asistan şimdilik iOS ve Android için mevcut olacak ancak PC’de mevcut olmayacak.

Beş farklı ses arasından seçim yapabilirsiniz, ancak varsayılan olarak gelen ve bugünkü örneklerde görünen ses, bu tür araçlarda genellikle yaygın olduğu gibi, genç ve görünüşte beyaz bir kadının sesini taklit eden bir sestir.

Sesi yazıya dökmek için yapay zeka kullanan bir OpenAI aracı olan Whisper kullanıldığında, kullanıcının sesi metne dönüştürülüyor ve şirket daha sonra makinenin yanıtı için yeni metinden konuşmaya modelini kullanıyor.

Alakalı haberler

“Yeni ses teknolojimiz yalnızca birkaç saniyelik gerçek sesten gerçekçi sentetik sesler oluşturma kapasitesine sahiptir. Bu, birçok yaratıcı uygulamanın kapısını açar ve erişilebilirlik araçları sağlar. Ancak bu yetenekler, kötü niyetli aktörlerin kamuya mal olmuş kişileri taklit etme veya dolandırıcılık yapma olasılığı gibi yeni riskleri de beraberinde getiriyor” diye uyarıyor şirket.

OpenAI ayrıca bugün müzik platformunun Spotify’ın kullandığını duyurdu. “bu teknolojinin bazı podcast’lerinizi “ek dillere çevirme, ancak sunucuların ve misafirlerin kendi seslerini koruma” gücü.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir