Yapay Zeka Sesleri İle Gerçek İnsan Sesleri Arasındaki Farklar Ortadan Kalkıyor
Bir araştırmada, katılımcılara toplamda 80 farklı ses örneği sunuldu. Bu seslerin 40’ı gerçek insan sesi iken diğer 40’ı yapay zeka kullanılarak oluşturulmuş seslerdi. Yapılan incelemede, sıfırdan üretilen yapay seslerin sadece %41’inin insan sesi olarak algılandığı görüldü. Ancak gerçek insan sesleri baz alınarak kopyalanan ses klonları için bu oran %58’e yükseldi. Gerçek insan seslerinin tanınma oranı ise yalnızca %62 olarak belirlendi. Bu durum bilim insanlarını, gerçek ve yapay sesler arasında istatistiksel olarak anlamlı bir fark olmadığına yönlendirdi.
Çalışmanın lider yazarı ve Queen Mary Üniversitesi’nden psikoloji uzmanı Nadine Lavan, teknolojinin geldiği noktayı değerlendirerek, “Alexa veya Siri gibi yapay sesler genellikle mekanik ve düz bir tonlamaya sahipti. Ama şu anda yapay zeka çok daha doğal, insana benzer konuşmalar üretebiliyor.” şeklinde konuştu.
Lavan, ses klonlama işlemlerinin sadece 4 dakikalık bir ses kaydının kullanılmasıyla gerçekleştirilebileceğini ve bu sürecin az bir uzmanlık gerektirdiğini belirtti. “Bu işlem neredeyse hiç maliyet gerektirmiyor. Bu kadar kolay ve etkili hale gelmesi oldukça dikkat çekici.” dedi.
Ancak bu gelişmenin sadece teknik açıdan değil, aynı zamanda etik, güvenlik ve telif hakları açısından önemli riskler içerdiğinin altını çizdi. Ses tanıma ile yapılan kimlik doğrulamalar potansiyel tehlikeye yol açabilir; dolandırıcılar, bir kişinin sesini taklit ederek yakınlarını aldatma riski taşımaktadır.
Bu tür bir durumun yaşandığına dair bir örnek vermek gerekirse, 9 Temmuz’da Sharon Brightwell, telefonla arandığında ağlayan kızının sesi olduğunu düşündüğü bir deepfake sesi yüzünden 15.000 dolar dolandırıldı. Bu durum karşısında Brightwell, “Beni kandıran sesin ona ait olmadığını kimseye anlatamazsınız” şeklinde ifade etti.
Aynı şekilde, Avustralya’da Steven Miles adlı Queensland Eyalet Başbakanı’nın sesi kopyalanarak insanları sahte bir Bitcoin yatırımına yönlendirmeye çalışan bir dolandırıcılık vakası yaşandı.
Lavan, yapay zeka seslerinin olumsuz etkilerinin yanı sıra erişilebilirlik ve eğitim gibi olumlu kullanım alanlarına da sahip olabileceğini belirterek, bu teknolojinin özel yapılan seslerle iletişim gücünü artırabileceğini vurguladı.