Anthropic'in Yapay Zeka Güvenliği İçin 15.000$'lık Hata Bulma Programı

Yapay zeka güvenliği araştırmalarına odaklanan Anthropic, kısa süre önce yapay zeka sistemlerindeki açıkların tespit edilip azaltılmasını hedefleyen bir hata bulma programı "bug bounty" başlattı.

Bu girişim, etik hacker'lara kimyasal, biyolojik, radyolojik ve nükleer ve siber güvenlik gibi yüksek riskli alanlarda kritik açıkları ortaya çıkarabilecek yenilikçi, evrensel jailbreak saldırılarını keşfetmeleri için 15,000 dolara kadar ödül sunuyor. Güvenlik ve emniyet araştırmacılarından oluşan global topluluğu dahil ederek, yapay zeka modellerinin güvenlik ve emniyetini güçlendirmeyi hedefliyor. Bu girişim, Beyaz Saray tarafından duyurulan Gönüllü Yapay zeka Taahhütleri ve G7 Hiroşima Süreci kapsamında geliştirilen Gelişmiş Yapay Zeka Sistemleri Geliştiren Kuruluşlar İçin Davranış Kuralları gibi taahhütlerle uyumlu.

Anthropic'in programına katılanlar, en yeni güvenlik mekanizmalarını test etmek için erken erişim elde edecek ve olası açıkları veya güvenlik önlemlerini aşmanın yollarını belirlemeye yönelik kontrollü bir ortamda meydan okumalarla karşılaşacak. Katılımcılara detaylı talimatlar ve geri bildirimler sağlanacak ve program başlangıçta sadece davetle sınırlı olacak, ancak gelecekte daha geniş çapta yayılacak.

75 görüntüleme

09 Ağu 2024