
Link: https://www.ictbusiness.info / vijesti / meta-je-objavila-nove-llama-4-ai-modele
Meta je objavila nove Llama 4 AI modele
Meta je objavila svoje najnovije Llama 4 AI modele u subotu nakon dva odgađanja. Tvrtka je istaknula multimodalni aspekt sustava Llama 4 Scout i Maverick, koji mogu obrađivati i integrirati različite vrste podataka. Sada su dostupni programerima za isprobavanje na Meta aplikacijama i web stranici Meta.ai.
Meta je dodala da lansiranje označava početak nove ere za Llama ekosustav jer rade kao modeli otvorenih težina, što znači da su sposobni raditi s nizom medija izvan teksta, poput videozapisa, slika i zvuka. Tvrtka tvrdi da su modeli najbolji u svojoj klasi, nadmašujući konkurente, uključujući OpenAI-jev GPT4o i Gemini 2.0 Flash, na širokom rasponu široko prijavljenih mjerila. Međutim, nagovijestila je da najbolje tek dolazi. Vlasnik Facebooka rekao je da daje pregled Llama 4 Behemotha, jednog od najpametnijih velikih jezičnih modela (LLM) na svijetu i njihovog dosad najmoćnijeg modela koji će služiti kao učitelj za nove modele.
Meta bi mogla dodatno odgoditi izdavanje Llama 4 zbog problema s performansama nakon što je lansiranje već dva puta bilo odgođeno. Jedan od razloga za kašnjenje je taj što Llama 4 nije ispunjavala očekivanja tvrtke na tehničkim mjerilima, poput zadataka zaključivanja i matematike. Meta je također bila zabrinuta da Llama 4 nije toliko sposobna kao OpenAI-jevi modeli kada je riječ o vođenju razgovora glasom nalik ljudskom. Div društvenih medija izjavio je da planira uložiti između 60 milijardi i 65 milijardi dolara u 2025. kao dio plana za proširenje svoje AI infrastrukture.
Meta tvrdi da su Llama 4 modeli najbolji u klasi, nadmašujući konkurenciju poput OpenAI-jevog GPT4o i Gemini 2.0 Flash na različitim benchmark testovima.
Meta se suočila s izazovima tijekom razvoja ovih modela. Lansiranje Llama 4 odgođeno je zbog slabijih rezultata na tehničkim mjerilima poput zaključivanja i matematičkih zadataka te zbog ograničenja u vođenju razgovora nalik ljudskim glasovima. Unatoč tome, Meta planira uložiti između 60 i 65 milijardi dolara do kraja 2025. kako bi proširila svoju AI infrastrukturu.
Ključne značajke modela
Llama 4 Scout:
Ima ukupno 109 milijardi parametara, od kojih je aktivno 17 milijardi po tokenu.
Koristi arhitekturu "Mixture of Experts" (MoE) s 16 eksperata.
Podržava kontekstualni prozor od čak 10 milijuna tokena, što omogućuje obradu velikih količina podataka, poput višedokumentnog sažimanja i analize opsežnih korisničkih aktivnosti.
Llama 4 Maverick:
Ukupno ima 400 milijardi parametara, također s 17 milijardi aktivnih parametara po tokenu.
Sadrži 128 eksperata unutar MoE arhitekture.
Optimiziran je za visokokvalitetno razumijevanje teksta i slika te nadmašuje konkurenciju u zadacima poput kodiranja, zaključivanja i obrade više jezika.
Llama 4 Behemoth (još u razvoju):
Ima gotovo dva trilijuna parametara.