30 Mart 2024 Yapay Zeka · Teknoloji

OpenAI, insan sesini kopyalayan Voice Engine aracını duyurdu

OpenAI tarafından geliştirilen Voice Engine, kullanıcının 15 saniyelik bir ses örneği ile gerçek bir insan sesini ayırt edilemeyecek şekilde kopyalayabilen bir yapay zeka aracıdır. Bu teknoloji, kullanıcının kopyalanan sesle istediği metni okutmasına ve sesi farklı dillere çevirmesine olanak tanır. Voice Engine ayrıca konuşma bozukluklarına sahip bireylere yardımcı olmayı hedeflemektedir. Ancak, ses klonlama teknolojisinin potansiyel riskleri nedeniyle henüz geniş çapta kullanıma sunulmamıştır.

Benzer haberler

OpenAI araştırmacıları, GPT-4o gibi yapay zeka sohbet motorlarının kullanıcılar üzerinde olumsuz etkiler yaratabileceği konusunda uyarıyor. Bu motorların gerçekçi ve insan sesine benzeyen sohbet şekli, kullanıcıların yapay zekaya insan gibi güvenmesine ve yanlış bilgilere inanmasına yol açabilir. Özellikle yalnız bireylerin yapay zekaya duygusal bağımlılık geliştirebileceği ve bu durumun insanlarla sağlıklı ilişkiler kurma ihtiyacını azaltabileceği belirtiliyor. Şirket, Scarlett Johansson’ın sesine benzetilen Sky ses seçeneğini durdurmuştu.
11 Ağustos 2024

OpenAI, 'Hey ChatGPT' komutuyla çalışan yeni sesli asistanı GPT-4o'yu tanıttı. Bu asistan, şarkı söyleme, canlı konuşma ve duygusal ses yeteneği gibi özellikleriyle Siri'yi geride bırakmayı hedefliyor. GPT-4o, konuşmacının nefesini tespit edebilme, duyguları algılama ve gerçek zamanlı çeviri yapabilme gibi yeteneklere sahip. Ayrıca, doğal ve dramatik ses tonlarıyla hikaye anlatma ve şarkı söyleme yetenekleri de bulunuyor.
13 Mayıs 2024

OpenAI, ChatGPT'nin gerçekçi seslendirme özelliğinin kullanıcılar arasında duygusal bağımlılığa yol açabileceği konusunda uyarıda bulundu. Şirket, sesli modun 232 milisaniyelik yanıt süresinin ve sesin doğallığının, kullanıcılar ile yapay zeka arasında duygusal bir bağ kurulmasına neden olabileceğini belirtti. Bu durumun, kullanıcıların yapay zekaya bağımlı hale gelmesine yol açabileceği ifade edildi.
9 Ağustos 2024

Apple, konuşma ve görme yetisini kaybetme riski olan kişilere yardımcı olacak 'Personal Voice' adlı bir özelliği tanıttı. Bu özellik sayesinde, kullanıcılar iPhone veya iPad'lerinde 15 dakikalık bir metni okuyarak kişisel seslerini oluşturabilecekler ve bu ses, yazılı mesajları sesli olarak iletmek için kullanılabilecek. Ayrıca, Apple bilişsel engelleri olan kullanıcılar için temel uygulamaların kolaylaştırılmış sürümlerini de sunuyor. Bu yeniliklerin iOS 17 sürümü ile kullanıma sunulması bekleniyor.
18 Mayıs 2023

OpenAI, ChatGPT'de Scarlett Johansson'a benzetilen seslendirme seçeneği olan Sky'ın geçici olarak kaldırılacağını duyurdu. Şirket, yapay zeka seslendirmelerinin ünlülerin özgün seslerini taklit etmemesi gerektiğini belirtti. Sky'ın sesi, Johansson'ın sesine benzetilse de, aslında farklı bir profesyonel oyuncunun doğal konuşma sesi kullanılarak oluşturulmuştu. ChatGPT'nin ses modu, Eylül 2023'te kullanıma sunulmuş ve kullanıcılar arasında popüler olmuştu.
21 Mayıs 2024
Daha fazla

Haberde tanıtılan Voice Engine teknolojisinin hem olumlu hem de olumsuz yönleri bulunmaktadır. Teknoloji, konuşma bozukluklarına sahip bireyler için yardımcı olabilecek potansiyele sahip olması gibi olumlu yönleri barındırırken, ses klonlama teknolojisinin potansiyel riskleri nedeniyle geniş çapta kullanıma sunulmamış olması gibi olumsuz yönleri de içermektedir. Bu nedenle, haberin doğası nötr olarak değerlendirilmiştir.

İşaretlediklerim