Microsoft izstrādā Maia 200: Īpašs AI čips, lai padarītu lētāku un ātrāku katru jūsu sarunu ar chatbotu
Iedomājieties pasauli, kurā digitālais asistents ne tikai atbild uz jautājumu, bet arī pilnībā pabeidz sarežģītu darbību virkni – rezervē lidmašīnas biļetes, salīdzina cenas, pārbauda jūsu kalendāru un pat iesaka apmeklējamas vietas. Šādu daudzpakāpju AI aģentu laiks ir pienācis, taču to darbināšanai pašlaik nepieciešams milzīgs skaitļošanas spēks, kas nozīmē augstas izmaksas un lielu enerģijas patēriņu. Tieši šo problēmu mērķē atrisināt Microsoft, ar savu jaunāko šķērsli – specializētu AI čipu ar nosaukumu Maia 200.
Šis nav parasts procesors. Maia 200 ir veidota no pamatiem, lai optimāli izpildītu tā saukto “inferences” – brīdi, kad jau apmācītais AI modelis (piemēram, tas, kas darbina ChatGPT vai Microsoft Copilot) analizē jūsu vaicājumu un ģenerē atbildi. Kā uzņēmums pasludina, čips ir radīts, lai uzlabotu veiktspēju, izmaksu efektivitāti un ietaupītu enerģiju tieši šajā kritiskajā posmā. Tas varētu būt nākamais lielais solis, lai padarītu jaunākās AI iespējas pieejamākas ikvienam.
Kāpēc mums vispirms vajag speciālu AI čipu?
Lai saprastu Maia 200 nozīmi, ir svarīgi atšķirt divus galvenos AI darbības posmus: **apmācību** un **inferences**.
**Apmācība** ir sākotnējais, milzīgo datu kopu un milzīga skaitļošanas jauda patērējošais process, kurā modelis “iemācās” no milzīga teksta, attēlu un cita satura daudzuma. Tas notiek datu centros, izmantojot ļoti jaudīgas GPU (grafiskās procesoru vienības).
**Inferences** (secinājumu veidošana) ir tas, ar ko saskaramies mēs – lietotāji. Kad jūs ierakstat jautājumu chatbotā, modelis, izmantojot savas apmācītās zināšanas, “secina” un ģenerē atbildi. Katrs šāds pieprasījums ir salīdzinoši mazs uzdevums, taču, ja tos ir miljards dienā, kopsummā tie prasa milzīgu resursu daudzumu. Un lietas kļūst vēl sarežģītāk, ja mēs runājam par daudzpakāpju aģentiem.
Daudzpakāpju AI aģentu izaicinājums
Tradicionāls AI modelis atbild uz vienu jautājumu. Daudzpakāpju aģents spēj patstāvīgi izpildīt veselu uzdevumu, kas sastāv no vairākiem soļiem. Piemēram, jūsu vaicājums “Plāno manu darba braucienu uz Londonu nākamnedēļ” varētu izraisīt šādu darbību ķēdi:
1. Pārbaudīt jūsu kalendāru brīvās dienas.
2. Atrast un salīdzināt lidojumu izmaksas.
3. Rezervēt viesnīcu, pamatojoties uz jūsu preferencēm.
4. Izveidot ieteikumu sarakstu par tūrisma objektiem.
5. Apkopot visu informāciju vienā kopsavilkumā.
Katrs no šiem soļiem prasa atsevišķu “inferences” pieprasījumu vai pat vairākus. Pašlaik šādas operācijas ir ļoti dārgas un enerģijas patērējošas, ja tās veic uz aparatūras, kas nav tam pielāgota. Maia 200 ir veidota, lai šādas secības apstrādātu daudz efektīvāk, samazinot gan laiku, gan izmaksas katram solim.
Maia 200 iekšējā arhitektūra: Kas padara to īpašu?
Microsoft nav vienīgais, kas strādā pie speciālām AI čipu shēmām (ASIC). Taču Maia 200 ir ievērojama ar savu integrāciju visā Microsoft mākoņa ekosistēmā.
Pirmkārt, čips ir **optimizēts tieši lielo valodu modeļu (LLM) darbībai**, kādi tiek izmantoti Azure Open AI servisos. Tā arhitektūra ir veidota, lai efektīvi apstrādātu milzīgo datu plūsmu un sarežģītos aprēķinus, kas raksturīgi teksta ģenerēšanai un sapratnei.
Otrkārt, un iespējams, pat svarīgāk, Microsoft izstrādājis čipu kopā ar **pielāgotu programmatūras un sistēmas slāni**. Tas nozīmē, ka izstrādātāji, kuri izmanto Azure AI pakalpojumus, varēs gūt labumu no Maia 200, pat nezinot par tā pastāvēšanu. Veiktspējas uzlabojumi un izmaksu ietaupījumi nāks “no kastītes”, jo visa sistēma – no čipa līdz mākoņa platformai – ir veidota, lai saderētu viena ar otru.
Enerģijas taupīšana: Vides un ekonomiskais impulss
Viens no lielākajiem uztraukumi par AI uzplaukumu ir tā milzīgais enerģijas patēriņš. Trenēt lielos modeļus patērē daudz elektrības, bet ikdienas “inferences” pieprasījumi no miljardiem lietotāju kopumā patērē vēl vairāk. Maia 200 ir projektēta, lai veiktu vairāk darba ar vienu vatu elektroenerģijas, salīdzinot ar vispārīgām GPU vai CPU shēmām.
Uzņēmumiem, kas izmanto Azure, tas nozīmēs zemākas darbības izmaksas. Videi – mazāku oglekļa pēdu. Microsoft šo virzību uz pielāgotu aparatūru tieši saista ar savu ilgtermiņa mērķi kļūt par oglekļa negatīvu, ūdens pozitīvu un atkritumu brīvu uzņēmumu līdz 2030. gadam.
Ko Maia 200 nozīmē uzņēmumiem un parastiem lietotājiem?
Tūlītēju revolūciju jūs, iespējams, nepamanīsiet. Bet ilgtermiņā šī tehnoloģija var radīt vairākus taustāmus ieguvumus.
**Uzņēmumiem:**
* **Zemākas AI ieviešanas izmaksas.** Izmaksu ietaupījumi “inferences” fāzē var padarīt izstrādāto AI aģentu izmantošanu ikdienas darba procesos daudz ekonomiski izdevīgāku.
* **Iespēja izvērsties.** Projekti, kas agrāk bija pārāk dārgi darbināt lielā mērogā, kļūs iespējami.
* **Ātrāka atbildes laika.** Optimizēta aparatūra nozīmē mazāku aizkavi, padarot mijiedarbību ar AI gludāku un produktīvāku.
**Parastiem lietotājiem:**
* **Pieejamākas un bagātīgākas pakalpojumu iespējas.** Kad izmaksas par aizmuguri samazinās, pakalpojumu sniedzēji var piedāvāt jaunus, sarežģītākus AI rīkus par tādu pašu vai pat zemāku cenu.
* **Uzticamāki un spējīgāki digitālie palīgi.** Daudzpakāpju aģenti, kas darbosies efektīvi, kļūs par standartu, padarot mūsu digitālo pieredzi daudz intuitīvāku un pārdomātāku.
* **Netiešs vides ieguvums.** Enerģijas efektīvāka tehnoloģija ir laba ziņa visiem.
Nākotnes perspektīva: Pielāgotu čipu laikmets AI mākonī
Microsoft Maia 200 ir spilgts signāls nozarei: lai AI pilnībā attīstītos un kļūtu par ikdienas rīku, nepieciešams pāriet no vispārīgas skaitļošanas jaudas uz specializētu, optimizētu aparatūru. Tas nav tikai sacensību jautājums ar Nvidia, kas dominē GPU tirgū. Tas ir par pilnīgu sistēmas optimizāciju – no silīcija čipa līdz lietotāja saskarnei.
Ja Maia 200 un tai līdzīgi projekti izrādīsies veiksmīgi, mēs varēsim redzēt paātrinātu AI funkciju ieviešanu visās nozarēs. Mākoņa pakalpojumi kļūs par vēl spēcīgāku un efektīvāku AI dzinēju, kas darbosies fonā, lai atrisinātu sarežģītākas problēmas, radītu jaunus izstrādes rīkus un galu galā mainītu to, kā mēs strādājam, mācāmies un radām.
Vienkārši sakot, Maia 200 ir vēl viens solis, lai padarītu mākslīgo intelektu ne tikai gudrāku, bet arī praktiskāku, lētāku un videi draudzīgāku ikvienam. Un tas ir mērķis, kas atspējina visus.
Avots: https://aibusiness.com/generative-ai/microsoft-aims-for-better-inference-efficiency