Meta Yeni Ses, Metin ve Watermarking Yapay Zeka Modellerini Tanıttı

Meta, ses üretimi, metinden görsele ve watermarking alanlarında araştırmaları ilerletmeye yönelik yeni yapay zeka modelleri ve araçlar serisi yayınladı. Şirketin Temel AI Araştırma (FAIR) ekibi, bu erken araştırma modellerini halka açık bir şekilde paylaşarak, yapay zekanın daha sorumlu kullanımı ve gelişimini teşvik etmeyi amaçlıyor. Öne çıkan modellerden biri olan JASCO, metin girdilerine dayalı müzik üretebilen ve kullanıcıların akorlar, davullar ve melodiler gibi özellikleri ayarlamasına olanak tanıyan bir model. JASCO, MIT lisansı altında kullanılabilir olacak, önceden eğitilmiş model ise ticari olmayan Creative Commons lisansı altında yayımlanacak. Bir diğer önemli yenilik ise, uzun bir ses klibi içinde yapay zeka tarafından üretilen konuşmayı tespit edebilen bir watermarking aracı olan AudioSeal.

Bu teknoloji, yapay zeka tarafından üretilen segmentleri hızlı ve verimli bir şekilde tanıyor ve diğer modellere göre 485 kat daha hızlı. AudioSeal, ticari bir lisans altında sunulacak. Ayrıca, Meta iki boyutta metin modelini, Chameleon'u piyasaya sürüyor. Chameleon, resim altyazısı gibi görevleri yerine getirebiliyor. Ancak, Chameleon görüntü oluşturma modeli bu aşamada yayınlanmayacak. Bu yeni yapay zeka modelleri ve araçlar, müzik, medya ve araştırma gibi çeşitli endüstriler üzerinde önemli bir etki yaratma potansiyeline sahip. Meta, bu modelleri kullanıma sunarak, yapay zeka topluluğunda daha fazla yenilik ve işbirliği teşvik etmeyi umuyor.

419 görüntüleme

20 Haz 2024