Skip to main content

Milzīgie modeļi nav galvenais skaitļošanas krīzes cēlonis

AI infrastruktūras izaicinājumi: nākotne ir miljonos modeļu, nevis vienā

Ik reizi, kad parādās jauns AI modelis — GPT atjauninājumi, DeepSeek, Gemini — cilvēkus pārsteidz šo milzīgo modeļu apjoms, sarežģītība un arvien lielākais skaitļošanas resursu apetīte. Daudzi pieņem, ka tieši šie milzu modeļi nosaka AI revolūcijas resursu vajadzības.

Šis pieņēmums ir kļūdains.

Jā, lielie modeļi patiešām ir skaitļošanas resursu patērētāji. Taču lielākā slodze uz AI infrastruktūru nenāk no dažiem milzu modeļiem — tā nāk no klusās AI modeļu proliferācijas visās nozarēs, kur katrs modelis ir pielāgots konkrētiem pielietojumiem un patērē resursus nebijušos mērogos.

Lai gan lielo valodu modeļu (LLM) jomā varētu izveidoties “uzvarētājs saņem visu” situācija, kopumā AI vide necentralizējas — tā fragmentējas. Uzņēmumi ne tikai izmanto AI — viņi apmāca, pielāgo un izvieto privātus modeļus, kas pielāgoti viņu vajadzībām. Tieši šī situācija radīs infrastruktūras pieprasījumu, kuram mākoņu pakalpojumu sniedzēji, uzņēmumi un valdības nav gatavi.

AI izplatība: kāpēc nozare virzās uz daudzveidību

Finanses, loģistika, kiberdrošība, klientu apkalpošana, P&M — katrai nozarei ir savi AI modeļi, kas optimizēti konkrētām funkcijām. Organizācijas neapmāca vienu universālu modeli visām operācijām. Viņi apmāca tūkstošiem. Tas nozīmē vairāk apmācības ciklu, lielāku skaitļošanas resursu un krātuves pieprasījumu, kā arī infrastruktūras izplatību.

2024. gada McKinsey pētījums atklāja, ka organizācijas vidēji izmanto AI trijās biznesa funkcijās, un vadošās nozares ir ražošana, piegādes ķēdes un produktu izstrāde (McKinsey).

Veselības aprūpe ir labs piemērs. Uzņēmums Navina, kas integrē AI elektroniskajās veselības dokumentācijās, lai identificētu klīniskās atziņas, nesen piesaistīja 55 miljonus dolāru no Goldman Sachs (Business Insider). Enerģētikas nozarē līderi ir dibinājuši Open Power AI konsorciju, lai ieviestu AI optimizāciju tīklu un ražošanas iekārtu darbībā (Axios).

Nepietiekami diskutētie skaitļošanas resursu izaicinājumi

AI jau tagad pārkāpj tradicionālās infrastruktūras modeļus. Pieņēmums, ka mākoņskaitļošana var bezgalīgi mērogoties, lai atbalstītu AI izaugsmi, ir kategoriski nepareizs. AI nestrādā tāpat kā tradicionālie darba slodzes. Pieprasījuma līkne nav pakāpeniska — tā ir eksponenciāla, un hiperskalētāji nespēj tikt tam līdzi.

  • Enerģijas ierobežojumi: AI datu centrus tagad būvē, vadoties pēc enerģijas pieejamības, nevis tikai tīkla savienojamības.
  • Tīkla problēmas: Hibrīdās IT vides kļūst nepārvaldāmas bez automatizācijas, ko AI tikai pasliktinās.
  • Ekonomiskais spiediens: AI darba slodzes var patērēt miljonus vienā mēnesī, radot finanšu neprognozējamību.

Datu centri jau patērē 1% no pasaules elektroenerģijas patēriņa. Īrijā tie patērē 20% no valsts elektrotīkla, un šī daļa līdz 2030. gadam ievērojami pieaugs (IEA).

Tam pieskaitāma GPU pieprasījuma pieauguma problēma. Bain & Company brīdina, ka AI izaugsme rada pusvadītāju trūkumu datu centru līmeņa mikroshēmu pieprasījuma dēļ (Bain).

Tajā pašā laikā pieaug AI ilgtspējas problēma. 2024. gada pētījums žurnālā “Sustainable Cities and Society” brīdina, ka AI plašs izmantošanas veselības aprūpē var ievērojami palielināt nozares enerģijas patēriņu un CO2 emisijas (ScienceDirect).

AI izplatība ir vairāk nekā tirgus jautājums — tā ir valsts varas lieta

Ja domājat, ka AI izplatība ir tikai korporatīva problēma, kļūdāties. Lielākais AI fragmentācijas virzītājspēks nav privātie uzņēmumi — tās ir valdības un militārās aizsardzības aģentūras, kas izvieto AI mērogā, kādu neviens hiperskalētājs nevar sasniegt.

ASV valdība vien jau izmanto AI vairāk nekā 700 lietojumos 27 aģentūrās (FedTech Magazine).

Kanada iegulda līdz 700 miljoniem dolāru, lai paplašinātu vietējo AI skaitļošanas jaudu (Innovation, Science and Economic Development Canada).

Pieaug aicinājumi pēc “Apollo programmas” AI infrastruktūrai — uzsverot, ka AI ir kļuvusi no komerciālas priekšrocības par nacionālu imperatīvu (MIT Technology Review).

Militārā AI nebūs efektīva, koordinēta vai optimizēta izmaksu ziņā — to virzīs nacionālās drošības mandāti, ģeopolitiska steiga un nepieciešamība pēc slēgtām, suverēnām AI sistēmām. Pat ja uzņēmumi ierobežos AI izplatību, kas liks valdībām bremzēt?

Jo, kad runa ir par nacionālo drošību, neviens neprasa, vai elektrotīkls to izturēs.

https://www.unite.ai/mega-models-arent-the-crux-of-the-compute-crisis/

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *