DeepSeek AI atklāj DeepSeek-V3-0324: Ātrākais veiktspējas līmenis Mac Studio un sīva konkurence ar OpenAI
Jaunākā AI modeļa jauninājumi un sasniegumi
Mākslīgais intelekts (AI) pēdējos gados ir veicis nozīmīgus sasniegumus, taču joprojām pastāv izaicinājumi, lai sasniegtu efektīvus, lētus un augstas veiktspējas modeļus. Lielo valodu modeļu (LLM) izstrāde bieži prasa ievērojamus skaitļošanas resursus un finanšu ieguldījumus, kas daudzām organizācijām var būt nepārvarami šķēršļi. Turklāt ir svarīgi nodrošināt, ka šiem modeļiem ir spēcīgas spriešanas spējas un ka tos var efektīvi izmantot pat parastā lietotāja datorā.
DeepSeek AI ir atrisinājis šīs problēmas, izlaidot jaunāko DeepSeek-V3-0324 modeli, kas ir nozīmīgs uzlabojums iepriekšējās V3 versijas salīdzinājumā. Šis jaunais modelis ne tikai uzlabo veiktspēju, bet arī darbojas ar iespaidīgu ātrumu — 20 tokeni sekundē Mac Studio ierīcē, kas ir paredzēta plašam patēriņam. Šis sasniegums pastiprina konkurenci ar tādiem līderiem kā OpenAI, parādot DeepSeek centienus padarīt augstas kvalitātes AI modeļus pieejamākus un efektīvākus.
Tehniskie uzlabojumi un veiktspēja
DeepSeek-V3-0324 ieviesa vairākus tehniskos uzlabojumus. Piemēram, tas uzrāda ievērojamu progresu spriešanas spējās, ko apliecina testu rezultāti:
- MMLU-Pro: 75.9 → 81.2 (+5.3)
- GPQA: 59.1 → 68.4 (+9.3)
- AIME: 39.6 → 59.4 (+19.8)
- LiveCodeBench: 39.2 → 49.2 (+10.0)
Šie uzlabojumi liecina par labāku sarežģītu uzdevumu izpratni un apstrādi. Turklāt modelis ir uzlabojis tīmekļa izstrādes prasmes, radot izpildāmāku kodu un vizuāli pievilcīgākas tīmekļa lapas un spēļu saskarnes. Tāpat uzlabota ir modeļa spēja rakstīt ķīniešu valodā, īpaši vidēja un liela apjoma satura veidošanā. Papildus tika uzlabota funkciju izsaukumu precizitāte, novēršot iepriekšējās versijas nepilnības.

Atvērtā koda pieejamība un pieejamība
DeepSeek-V3-0324 tika publiskots ar MIT licenci, kas parāda DeepSeek AI atbalstu atvērtā koda kopienai. Tas ļauj izstrādātājiem visā pasaulē brīvi izmantot un papildināt šo tehnoloģiju bez ierobežojošiem licencēšanas nosacījumiem. Modeļa spēja darboties ar augstu ātrumu pat parastās ierīcēs, piemēram, Mac Studio, padara to īpaši pievilcīgu lietotājiem, kuri nevēlas ieguldīt dārgu specializētu aparatūru.
Noslēgumā var teikt, ka DeepSeek AI ar šo jauno modeli ir sasniedzis nozīmīgu sasniegumu AI jomā. Uzlabojot veiktspēju, samazinot izmaksas un nodrošinot plašāku pieejamību, DeepSeek nostiprinājis savu pozīciju kā spēcīgs konkurents OpenAI un citiem līderiem. Šī modeļa atvērtā koda pieejamība veicinās tālāku inovāciju un tā plašāku izmantošanu dažādās nozarēs.
Plašāku informāciju par modeli var atrast Hugging Face platformā. Visu atzinību par šo pētījumu ir pelnījuši tā autori. Sekojiet mums arī X (Twitter) un pievienojieties mūsu 85k+ lielajai mašīnmācīšanās kopienai Reddit.
https://www.marktechpost.com/