Meta Yeni Yapay Zeka Modellerini Araştırma İçin Kullanıma Sundu

Meta, yapay zeka alanında büyük bir atılım yaparak araştırma için çoklu token tahmin modellerini piyasaya sürdü.

Bu yeni yaklaşım, büyük dil modellerini (LLM'ler) yalnızca bir sonraki kelimeyi tahmin edecek şekilde eğitlendiren geleneksel yöntemden ayrılıyor. Bunun yerine, Meta'nın modelleri birden fazla gelecekteki kelimeyi aynı anda tahmin etmek üzere tasarlandı ve daha iyi performans ve oldukça kısaltılmış eğitim süreleri vadediyor.

Bu buluşun etkileri oldukça geniş. Birden fazla token'ı birden tahmin ederek, bu modeller dil yapısı ve bağlamını daha ince anlamlandırabilir ve kod oluşturma ve yaratıcı yazma gibi görevlerde iyileşmeler sağlayabilir. Bu, yapay zeka ile insan seviyesindeki dil anlama arasındaki farkı kapatabilir. Ancak, bu kadar güçlü yapay zeka araçlarının demokratikleşmesi, potansiyel kötüye kullanım ve sağlam etik çerçevelerin ve güvenlik önlemlerinin gerekliliği konusunda endişeleri de beraberinde getiriyor. Bu modellerin ilk sürümü, yapay zeka destekli programlama araçlarına olan büyüyen pazar talebini yansıtarak kod tamamlama görevlerine odaklanıyor. Meta'nın bu modelleri Hugging Face üzerinde ticari olmayan bir araştırma lisansı altında yayımlama kararı, şirketin açık bilim taahhüdüyle uyumlu ve yapay zeka topluluğunda yenilik ve yetenek edinimini hızlandırabilir.

18 görüntüleme

05 Tem 2024