Resemble AI Yeni Nesil Ses Tespit Modeli Detect-2B'yi Çıkardı

Resemble AI, yapay zeka ile oluşturulan ses dosyalarını tanımlamada etkileyici bir yüzde 94 doğruluk oranına sahip olan yeni nesil AI ses tespit modeli Detect-2B'yi piyasaya sürdü.

Bu önemli gelişme, modelin, ses dosyalarını inceleyip gerçek ses ile sahte olanı ayırt eden izleri tespit eden bir dizi önceden eğitilmiş alt model ve ince ayar kullanan gelişmiş mimarisine bağlanıyor. Detect-2B'nin alt modelleri, temel katmanlarına bir uyarlama modülü yerleştirilmiş donmuş bir ses temsil modeli ile oluşturulmuştur, bu da ona, genellikle gerçek sesi sahte olandan ayırt eden izlere odaklanma yeteneği kazandırıyor. Modelin mimarisi ise, statik veriler veya yinelenen desenlere dayanmayan Mamba-SSM ya da durum uzayı modellerine dayanıyor. Bunun yerine, farklı değişkenlere daha iyi yanıt veren stokastik, yani rastgele olasılık modelini kullanıyor. Bu mimari, bir ses kaydındaki farklı dinamikleri yakaladığı, ses sinyalinin durumları arasında uyum sağladığı ve kayıt kalitesiz olsa bile performansını sürdürdüğü için ses tespiti ile iyi çalışıyor.

Modeli değerlendirmek amacıyla, Resemble Detect-2B'yi daha önce analiz edilmemiş konuşmacılar, deepfake ile üretilmiş sesler ve farklı diller içeren bir test setinden geçirdi ve altı dilde deepfake ses tespitinde en az yüzde 93 doğruluk oranına ulaştı. Detect-2B'nin yüksek doğruluğu ve dirençliliği, özellikle 2024 ABD Başkanlık Seçimleri yaklaşırken, derin sahtekarlıklarla mücadelede değerli bir araç yapıyor. Bu dönemde, seçmenleri yanıltmak ve yanlış bilgi yaymak amacıyla yapay zeka ile üretilmiş sesler veya videolar kullanılabilir. Model, bir API aracılığıyla kullanıma sunulacak ve farklı uygulamalara entegre edilebilecek, böylece video ve ses sahtekarlıklarını kamuoyuna ulaşmadan önce tespit etme ve kanıtlama konusunda önemli bir adım sağlayacak.

452 görüntüleme

29 Haz 2024