Skip to main content

Bez Nvidia, bez problēmām: kā Ķīnas AI uzņēmums klusi veica pārmaiņu aparatūras jomā

Dažreiz nozīmīgākie sasniegumi nāk nevis ar uguņošanu un trokšņainām preses konferencēm, bet klusi, gandrīz nejauši. Tieši tāds ir stāsts par vienu no interesantākajiem notikumiem Ķīnas mākslīgā intelekta ainavā pēdējā laikā. Labi pazīstamā Ķīnas AI kompānija Zhipu AI paziņoja, ka ir apmācījusi jaunākās paaudzes attēlu ģenerēšanas modeli, izmantojot tikai un vienīgi Huawei ražotas mikroshēmas. Bez Nvidia GPU. Bez Rietumu aparatūras “drošības tīkla”. Tikai vietējais silīcijs, kas veic smago darbu. Tas vien liek apstāties un pajautāt: paga, kā tas vispār ir iespējams?

Kas notika? GLM-Image un Huawei Ascend kopā uz skatuves

Modelis saucas GLM-Image, un tas ir jaudīgs instruments attēlu radīšanai no teksta aprakstiem. Taču pats interesantākais nav modelis pats par sevi, bet gan vide, kurā tas tika audzināts. Zhipu AI inženieri veica šī modeļa apmācību, izmantojot Huawei izstrādātās Ascend mikroshēmas. Šis ir nozīmīgs solis, jo līdz šim Nvidia grafiskie procesori (GPU) ir bijuši gandrīz nepārvarama vara lielo valodu un attēlu modeļu apmācībā visā pasaulē. To izmantošana ir kļuvusi tik pašsaprotama, ka daudzi speciālisti to dēvē par “nozeltoto standartu”. Zhipu AI ir parādījis, ka alternatīva pastāv.

Kāpēc tas ir tik svarīgi? No tehniskā brīnuma līdz stratēģiskajai neatkarībai

Šis sasniegums ir vairāk nekā tikai tehniskā drosme. Tam ir dziļa stratēģiska un politiska nozīme.

Pirmkārt, tas demonstrē Ķīnas tehnoloģiju nozares spēju radīt pilnvērtīgu AI infrastruktūru bez atsaucēm uz Rietumu piegādātājiem. ASV pastiprināti eksporta ierobežojumi attiecībā uz augsto tehnoloģiju, it īpaši jaudīgajiem GPU, ir radījuši reālu draudu Ķīnas AI ambīcijām. Atbilde ir vienkārša, bet ļoti sarežģīta īstenošanā: jāveido savs.

Otrkārt, tas parāda, ka Huawei Ascend platforma ir nobriedusi praktiskai, smagai darba slodzei. Apmācīt lielu attēlu ģenerēšanas modeli ir neticami resursietilpīgs process, kas prasa milzīgu skaitļošanas jaudu. Fakts, ka ķīniešu inženieri to ir paveikuši, izmantojot vietējo aparatūru, liecina par ievērojamu progresa soli gan programmatūras, gan aparatūras integrācijas jomā.

Kā viņi to paveica? Izaicinājumi un iespējamie risinājumi

Dabiski rodas jautājums: kā Zhipu AI tika galā ar tehniskajiem izaicinājumiem, kas noteikti radās, pārejot no Nvidia ekosistēmas uz Huawei? Nvidia CUDA platforma ir rūpīgi izstrādāta un izplatīta vide, kas AI izstrādātājiem ir kļuvusi par otru dabu.

Informācija liecina, ka kompānija ir ieguldījusi ievērojamas pūles, lai pielāgotu savu programmatūru un apmācības procesus Huawei Ascend shēmām. Tas, visticamāk, ir ietveris:

1. Kodas pārrakstīšana un optimizācija

Pāreja no CUDA uz Huawei savu platformu (CANN) prasa kodola līmeņa izmaiņas programmās. Inženieriem bija jāpārraksta un jāoptimizē koda daļas, lai tās efektīvi darbotos ar jauno aparatūru.

2. Sadalītās apmācības meistarība

Lielo modeļu apmācība parasti tiek sadalīta pa simtiem vai tūkstošiem GPU. Pārkārtojot šo procesu uz citas arhitektūras shēmām, ir jāpārdomā visa datu plūsma, komunikācija starp shēmām un slodzes sadalījums. Ka jau tas ir izdevies, norāda uz augstu inženiertehnisko kompetenci.

3. Pašu “kaudzes” izstrāde

Iespējams, ka Zhipu AI ir izstrādājusi vai būtiski pielāgojusi savus iekšējos rīkus un bibliotēkas, lai radītu vienotu un efektīvu darba vidi no augsta līmeņa modelēšanas rīkiem līdz zemā līmeņa draiveriem.

Ko tas nozīmē nākotnei? Pasākumi globālajā AI sacensībās

Šis klusais pārrāviens varētu būt nākotnes priekšvēstnesis vairākos aspektos.

Daudzpolu AI pasaule: Tā kā ASV pastiprina tehnoloģiju ierobežojumus, un Ķīna turpina investēt savā pašpietiekamībā, mēs varam redzēt, kā veidojas divas paralēlas AI ekosistēmas: viena balstīta uz Nvidia/Mikroshēmu/Rietumu tehnoloģijām, bet otra – uz Ķīnas ražotām alternatīvām, kā Huawei Ascend vai Phytium procesori. Tas varētu novest pie tehnoloģiju “šķelšanās”.

Inovāciju stimuls: Konkurence vienmēr ir laboratorija inovācijām. Nvidia dominances izaicināšana var radīt veselu jaunu pieeju skaitļošanas arhitektūrai un programmatūras optimizācijai, no kā galu galā varētu gūt labumu visa nozare.

Ķīnas AI paātrinājums: Ja Ķīnas uzņēmumi varēs uzticami apmācīt lielos modeļus uz vietējās aparatūras, viņu atkarība no ārējiem faktoriem ievērojami samazināsies. Tas varētu paātrināt izstrādi un izvietošanu, īpaši valsts nozarēs un stratēģiskajos sektoros.

Vai tas ir Nvidia “nāves zvans”? Ne tik ātri

Ir svarīgi uztvert šo notikumu pareizā proporcijā. Nvidia joprojām ir milzīgs attālums priekšā tehniskajā pieredzē, ekosistēmas nobriedumā un izstrādātāju atbalstā. Lielākā daļa AI pētnieku un uzņēmumu visā pasaulē turpinās izmantot to aparatūru. Taču Zhipu AI pierādījums par konceptu parāda, ka ceļš nav aizvērts. Tas ir signāls tirgum un konkurentiem, ka monolīts var tikt ieraukts.

Galvenais secinājums no šī stāsta ir tas, ka tehnoloģiju vēsturi neraksta tikai tie, kas skaļi paziņo par saviem plāniem. Dažreiz to raksta klusi inženieri, kuri konferenču zāļu vietā izvēlas datu centru, un kuri ar kodolu, kompiliatoru un neatlaidību pierāda, ka pat šķietami neiespējamais ir iespējams. Zhipu AI veiktais ir tieši tāds solis – kluss, bet neparasti skaļš savā nozīmīgumā. Un tas, visticamāk, ir tikai sākums.

Avots: https://ai2people.com/no-nvidia-no-problem-how-a-chinese-ai-firm-quietly-pulled-off-a-hardware-power-move/

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *