Perplexity un CoreWeave noslēdz līgumu, kas paātrina mākslīgo intelektu: kāpēc tas ir svarīgi?
Mākslā intelekta pasaules straujā attīstība nerimst ne dienu, un šīs nozares līderi nepārtraukti meklē jaunus veidus, kā padarīt tehnoloģijas ātrākas, efektīvākas un pieejamākas. Viens no jaunākajiem un nozīmīgākajiem soļiem šajā virzienā ir sadarbības līgums starp meklēšanas dzinēja uz AI bāzes Perplexity un mākoņa infrastruktūras gigantu CoreWeave. Šis darījums ne tikai pastiprina konkurenci mākoņa pakalpojumu tirgū, bet arī skaidri parāda, ka nākamais lielais AI attīstības fronte ir **inferencing** – jeb spēja izmantot jau apmācītu modeli reāllaika lietojumiem.
Kas patiesībā notika? Darījuma būtība
Jaunā ziņa, kas pārņēma AI biznesa portālus, ir par to, ka uzņēmums Perplexity, kas radījis revolucionāru meklēšanas dzinēju, kas atbild uz jautājumiem tieši, nevis sniedz tikai saites, ir noslēdzis liela apjoma līgumu ar CoreWeave. CoreWeave ir specializēts mākoņa pakalpojumu sniedzējs, kas koncentrējas uz GPU (grafisko procesoru) jaudu, kas ir absolūti nepieciešama sarežģītu AI modeļu darbināšanai.
Saskaņā ar līgumu, CoreWeave nodrošinās Perplexity ar milzīgu skaitu jaudīgu GPU, īpaši Nvidia H100 procesoru, lai darbinātu Perplexity AI meklēšanas platformu. Tas nav vienkārši datu centra noma. Tas ir stratēģisks solis, lai optimizētu tieši **inferencing** procesu – brīdi, kad apmācītais AI modelis (piemēram, lielā valodu modeļa) analizē jūsu jautājumu un ģenerē atbildi dažu sekunžu laikā.
Kāpēc inferencing kļūst par galveno prioritāti?
Lai saprastu šī darījuma nozīmi, ir svarīgi atšķirt divus galvenos AI dzīves cikla posmus:
1. **Apmācība (Training):** Šis ir milzīgi resursietilpīgais process, kad modelis “apgūst” no terabaitiem datiem. Tas prasa milzīgu skaitu GPU ilgu laiku un ir ļoti dārgs.
2. **Inferencing (Vērtēšana/Izmantošana):** Šis ir process, kad jau apmācītais modelis tiek izmantots reāllaikā, lai veiktu prognozes vai ģenerētu saturu – atbildētu uz jautājumu, tulkotu tekstu, radītu attēlu.
Ilgu laiku uzmanības centrā bija apmācība. Taču tagad, kad daudzi pamata modeļi jau ir izveidoti, nozīme pāriet uz to, kā šos modeļus **efektīvi, ātri un lēti izmantot miljoniem lietotāju vienlaikus**. Tieši šeit spēlē lomu CoreWeave. Viņi specializējas tieši uz optimizētu infrastruktūru, kas var apstrādāt milzīgu inferencing pieprasījumu plūsmu ar minimālu aizkavi, kas ir kritiski svarīgi lietotājiem, kuri grib atbildi uzreiz, nevis pēc minūtes.
CoreWeave: no kriptovalūtu kalnrača līdz AI infrastruktūras līderim
CoreWeave stāsts ir interesants pagrieziens. Uzņēmums sāka savu darbību kā Ethereum kriptovalūtas kalnraču firma, bet izmantojā iespēju pārkvalificēties, izmantojot savas milzīgās GPU parka zināšanas. Viņi pārtapa par specializētu mākoņa pakalpojumu sniedzēju, kas konkurē ar tādiem milžiem kā AWS, Google Cloud un Microsoft Azure, piedāvājot tikai to, kas AI izstrādātājiem vajadzīgs visvairāk: tīru, neierobežotu GPU jaudu bez liekām kompleksām pakalpojumu slānēm.
Perplexity izvēle par CoreWeave ir spēcīgs vēstījums nozares. Tas nozīmē, ka liels un inovatīvs AI uzņēmums uzticas CoreWeave kā **galvenajam inferencing partnerim**. Šis darījums ļauj CoreWeave ne tikai teorētiski, bet arī praksē pierādīt savas spējas kā vadošā inferencing infrastruktūras piegādātāja. Viņi demonstrē, ka var apkalpot milzīgus, globālus lietotāju plūsmus ar augstu uzticamību un ātrumu.
Kāds ir ieguvums Perplexity?
Perplexity šī darījuma rezultātā iegūst vairākas priekšrocības:
* **Mērogojamība:** Viņi var bez problēmām apkalpot strauji augošo lietotāju skaitu visā pasaulē.
* **Ātrums:** Optimizēta inferencing infrastruktūra nozīmē ātrākas atbildes lietotājiem, kas ir kritiski meklēšanas dzinēja konkurences priekšrocība.
* **Izmaksu efektivitāte:** Specializēts risinājums var būt izdevīgāks nekā izmantot vispārīgus mākoņa pakalpojumus.
* **Fokuss:** Perplexity var koncentrēties uz savas meklēšanas algoritmu un lietotāju pieredzes uzlabošanu, nevis uz infrastruktūras uzturēšanas sarežģījumiem.
Ko šis darījums nozīmē plašākai AI nozarei un nākotnei?
Perplexity un CoreWeave sadarbība ir daudz ko runājošs signāls visai nozarei. Tā parāda vairākas tendences:
1. **Inferencing ir jaunais karstais punkts.** Investīcijas un inovācijas tagad virzās uz to, kā padarīt AI lietojumus reāli lietojamus ikdienā. Tirgus specializēto inferencing risinājumu pieaugs.
2. **Specializācija uzvar.** Vispārējie mākoņa pakalpojumi vairs nav vienīgā iespēja. Uzņēmumi kā CoreWeave, kas nodod visu savu enerģiju vienai problēmai (GPU infrastruktūrai AI), kļūst par ļoti pievilcīgiem partneriem.
3. **Konkurence mākoņa tirgū kļūst sātīgāka.** Lielie spēļu lauki vairs nemonopolizēs AI infrastruktūru. Tas dod iespējas jauniem spēlētājiem un veicina labāku cenu un pakalpojumu kvalitāti.
4. **AI kļūst pieejamāks.** Efektīvāks un lētāks inferencing beigās nozīmē, ka arvien vairāk uzņēmumu un izstrādātāju varēs izveidot un piedāvāt jaunus AI produktus, jo infrastruktūras barjeras samazinās.
Kādas ir sekas parastajam lietotājam?
Parastais lietotājs, iespējams, nepamanīs tehniskās detaļas. Taču viņš noteikti jutīs rezultātus:
* **Ātrākas un precīzākas atbildes** meklēšanas dzinējos kā Perplexity.
* **Jauni, sarežģītāki AI lietojumi**, kas darbojas gludi, bez aizkavēm.
* **Potenciāli zemākas cenas** par AI pakalpojumiem, jo piegādes ķēde kļūst efektīvāka.
Noslēgumā var teikt, ka Perplexity un CoreWeave darījums ir vairāk nekā tikai biznesa ziņa. Tas ir skaidrs norādījums uz nākotni, kurā mākslā intelekta jauda tiks piegādāta ātri, vienmērīgi un visur, kur tā nepieciešama. Tas paātrina visu nozares attīstību un tuvina brīdi, kad AI kļūs par tikpat dabīgu un nepamanāmu daļu no mūsu digitālās pieredzes kā internets šodien. Un tieši inferencing – spēja gudri izmantot jau esošās zināšanas – ir atslēga, kas atvērs šīs nākotnes durvis.
Avots: https://aibusiness.com/generative-ai/perplexity-coreweave-deal-boosts-inferencing