Meta Llama 3.1 405B: En Güçlü Açık Kaynaklı Yapay Zeka Modeli

Meta, resmi olarak en gelişmiş yapay zeka modeli olan Llama 3.1'i, tam 405 milyar parametre ile tanıttı.

Bu büyük yükseltme, Meta'nın modellerini açık kaynak olarak sunma stratejisini genişletiyor, böylece herkes bu modelleri kullanabilecek. Yeni model, daha küçük modelleri "eğitebiliyor" ve sentetik veri üretebiliyor, bu da onu OpenAI ve Google'ın özel modelleri ile oldukça rekabetçi hale getiriyor.

Meta'nın Yapay Zeka Program Yönetimi başkan yardımcısı Ragavan Srinivasan'a göre, Llama 3.1, açık kaynaklı modeller için en ileri performansı sağlayacak ve birçok öncü, kapalı kaynaklı, endüstri lideri alternatiflerle rekabet edebilir olacak. 405 milyar parametreli model, Portekizce, İspanyolca, Almanca, Fransızca ve Hintçe gibi birden fazla dili destekleyecek şekilde tasarlandı. Model, çeşitli görevlerde önde gelen temel modellerle eşdeğer performans göstererek, 150'den fazla benchmark veri seti üzerinde kapsamlı testlerden geçti. Modelin bağlam penceresi 128.000 token'i kapsayacak şekilde artırıldı, bu da kullanıcıların neredeyse 400 sayfalık bir romanın eşdeğerini metin olarak girebilmelerine olanak tanıyor. Buna ek olarak, Meta tüm modellerin lisanslamasını, model distilasyonu ve sentetik veri oluşturulmasını içerecek şekilde revize etti, bu da kullanıcıların daha büyük yapay zeka modellerinden elde edilen bilgileri daha küçük varyantlara aktarabilmelerini sağlıyor.

Llama 3.1'in duyurulması, modeli farklı platformlarda kullanabilecek geliştiriciler arasında heyecan yarattı. Modelin yetenekleri ve açık kaynak doğası, işletmeler için üretken yapay zekadan elde edilecek yatırım getirisini ortaya çıkarabilecek bir araç olmasını sağlıyor. Ancak, daha yetenekli modellerin doğru şekilde düzenlenmezse kötü amaçlar için kullanılabileceği konusundaki endişeler, güçlü teknolojinin potansiyel kötüye kullanımı ile ilgili kaygıları beraberinde getiriyor.

475 görüntüleme

24 Tem 2024