Microsoft, Meta ve Google, daha az parametreye sahip, oluşturulması ve eğitilmesi daha ucuz olan yeni sürümler yayınladı. Şirketler bu küçük lisan modellerinden büyük kârlar elde ediyor.
Yapay zeka ürünlerini güçlendirmek gayesiyle büyük lisan modelleri oluşturmak için milyarlarca dolar harcayan yapay zeka şirketleri artık gelirlerini artırmak için küçük lisan modellerine yöneldi.
Apple, Microsoft, Meta ve Google kısa bir süre önce daha az parametre içeren fakat tekrar de güçlü yeteneklere sahip yeni yapay zeka modellerini piyasaya sürdü.
Genel olarak, parametre sayısı ne kadar yüksek olursa, yapay zeka yazılımının performansı o kadar iyi olur ve misyonları o kadar karmaşık ve incelikli olabilir. OpenAI’nin en son modeli GPT-4o ve Google’ın bu hafta duyurduğu Gemini 1.5 Pro’nun 1 milyondan fazla parametreye sahip olduğu tahmin ediliyor ve Meta, açık kaynaklı Llama modelinin 400 milyar parametreli bir versiyonunu eğitiyor.
PAHALI BULUNUNCA UCUZ VERSİYONUNU YAPTILAR
Ancak şirketler, kurumsal müşterileri üretken yapay zeka ürünlerini çalıştırmak için gereken büyük meblağları ödemeye ikna etmekte zorlanmaya başladı.
Bu durum Meta ve Google benzeri teknoloji kümelerini, yalnızca birkaç milyar parametreye sahip küçük lisan modelleri üretmeye itti. Şirketler küçük lisan modellerini, hassas dataları de koruyabilen daha ucuz, enerji tasarruflu, özelleştirilebilir alternatifler olarak sunmaya başladı.
Google, Meta, Microsoft ve Fransız start-up Mistral, ilerleyen yetenekler gösteren ve belli uygulamalara daha iyi odaklanabilen küçük lisan modelleri de yayınladı.
Meta’nın küresel ilişkiler başkanı Nick Clegg, Llama 3’ün yeni 8 milyar parametreli modelinin GPT-4 ile karşılaştırılabilir olduğunu söyleyerek “Bence aklınıza gelebilecek çabucak hemen her ölçümde üstün performans görüyorsunuz” dedi.
Microsoft ise 7 milyar parametreye sahip Phi-3-küçük modelinin OpenAI modelinin evvelki bir versiyonu olan GPT-3.5’ten daha iyi performans gösterdiğini söyledi.
CEP TELEFONLARINDA DA ÇALIŞIYOR
Daha küçük modeller aynı vakitte yapay zeka özelliklerinin cep telefonu benzeri aygıtlarda çalışmasına da imkan tanıyor. Microsoft’tan Boyd, daha küçük modellerin “telefonlara ve dizüstü bilgisayarlara kadar farklı uygulamalara” yol açacağını söyledi.
Ayrıca Apple da en çok satan iPhone’unda çalışacak yapay zeka modelleri geliştirdiğini ima etti. Geçtiğimiz ay Silikon Vadisi devi, metin tabanlı vazifeleri yerine getirmek üzere tasarlanmış küçük bir model olan OpenELM modelini piyasaya sürdü.
OpenAI başkanı Sam Altman kasım ayında yaptığı açıklamada San Francisco merkezli start-up’ın müşterilerine “ayrı maksatlara hizmet eden” farklı boyutlarda yapay zeka modelleri sunduğunu ve bu seçenekleri oluşturmaya ve satmaya devam edeceğini söyledi. Atman, “Daha küçük modellerin hakikaten iyi çalışacağı kimi şeyler var” diye ekledi.
Bununla birlikte Altman, OpenAI’nin akıl yürütme, misyonları planlama ve yürütme ve nihayetinde insan seviyesinde zekaya ulaşma yeteneği de dahil olmak üzere ölçeklendirilmiş yeteneklere sahip daha büyük yapay zeka modelleri oluşturmaya odaklanmaya devam edeceğini de söyledi.