Llama 4 Iepazīstinās ar 10M Tokenu Kontekstu un MoE Arhitektūru – 3 Jauni Modeļi
Jaunākā AI modeļu sērija no Meta
Meta oficiāli ir palaidusi klajā savu jaunāko AI modeļu sēriju 2025. gada 5. aprīlī. Šajā laidienā ir iekļauti četri modeļi: Scout, Maverick, Behemoth un L4emoth. Šie modeļi ir veidoti ar uzsvaru uz multimodālajām spējām un skaitļošanas efektivitāti, izmantojot ekspertu maisījuma (MoE) arhitektūru. MoE pieeja ļauj modeļiem sadalīt uzdevumus apakšuzdevumos, kurus apstrādā speciāli “ekspertu” komponenti, uzlabojot veiktspēju un vienlaikus samazinot skaitļošanas izmaksas.
Attēls: Meta
Scout un Maverick jau ir pieejami caur Meta platformām un partneriem, piemēram, Hugging Face, savukārt Behemoth joprojām atrodas apmācības stadijā. Scout darbojas ar 109 miljardiem parametru un izceļas ar garu kontekstu dokumentu apstrādi, atbalstot līdz pat 10 miljoniem tokenu. Maverick, kuram ir 400 miljardi parametru, ir optimizēts vispārīgiem palīgu lietojumiem, tostarp radošai rakstīšanai un daudzvalodu uzdevumiem. Behemoth, kad tas tiks izlaists, paredzams kā Meta jaudīgākais modelis, kas paredzēts STEM nozarēm.
Llama 4 reasoning coming soon 👀 https://t.co/LD3Y0bO4uT pic.twitter.com/JaE3d5I9kg
— TestingCatalog News 🗞 (@testingcatalog) April 5, 2025
Meta ir integrējusi jaunos modeļus savā AI palīgā tādos pakalpojumos kā WhatsApp, Messenger un Instagram 40 valstīs. Tomēr daudzveidīgie līdzekļi pašlaik ir pieejami tikai angļu valodā runājošiem lietotājiem ASV. Uzņēmums arī saskaras ar licencēšanas ierobežojumiem ES regulatīvo prasību dēļ, un uzņēmumiem ar vairāk nekā 700 miljoniem ikmēneša aktīvo lietotāju nepieciešamas īpašas licences.
Šis laidiens ir Meta atbilde uz pieaugošo konkurenci no tādiem uzņēmumiem kā OpenAI un Ķīnas DeepSeek. Lai gan iekšējie rādītāji liecina par uzlabojumiem salīdzinājumā ar dažiem konkurentiem konkrētos uzdevumos, modeļi joprojām atpaliek no Google un Anthropic piedāvātajiem risinājumiem, piemēram, spriešanas jomā. Meta uzsver, ka šis laidiens iezīmē jaunu posmu Llama ekosistēmas attīstībā.
Šis laidiens parāda Meta centienus attīstīt atvērtā koda AI, vienlaikus pārvarot izaicinājumus, ko rada regulatīvie ietvari un globālā AI līderu konkurence.
https://www.testingcatalog.com/llama-4-brings-10m-token-context-and-moe-architecture-with-3-new-models/