Intervija ar Sjan Fanu: Kā daudzveidīgā mācīšanās un iemiesotā intelekta veidos nākotnes AI
Ik gadu pasaulē tiek izvēlēta neliela, bet ārkārtīgi talantīgu doktorantu grupa, lai piedalītos prestižajā AAAI/SIGAI Doctoral Consortium. Šī iniciatīva sniedz iespēju nākotnes zinātniekiem apspriest un izpētīt savus pētījuma virzienus un karjeras mērķus starpdisciplinārā darbnīcā kopā ar pieredzējušu pētnieku paneļa. Pēdējo gadu laikā mums ir bijusi iespēja satikties ar vienu no šādiem spožiem prātiem – Sjan Fanu, kura pētījumi vērsti uz daudzveidīgo (multi-modal) mācīšanos un iemiesotā intelekta (embodied intelligence) attīstību. Šajā intervijā mēs ielūkosimies viņa darbā un uzzināsim, kā šīs divas jomas veido mākslīgā intelekta nākotni.
Kas ir AAAI/SIGAI Doctoral Consortium un kāpēc tas ir tik nozīmīgs?
AAAI/SIGAI Doctoral Consortium ir ne tikai vēl viena konference. Tas ir unikāls forums, kas pulcē nākotnes AI pētnieku eliti no visas pasaules. Dalība tajā ir balstīta uz stingru atlasi, un tā tiek uzskatīta par lielu atzinību un iespēju. Mērķis ir nodrošināt jaunajiem zinātniekiem tiešu dialogu ar lauka veterāniem, iegūt padomus par pētījumu metodoloģiju un veidot savienojumus, kas bieži vien noved pie pārrēķinošiem sadarbības projektiem. Sjan Fana dalība šajā programmā runā par viņa pētījuma novatoriskumu un potenciālu ietekmēt nozares attīstību.
Daudzveidīgā mācīšanās: AI, kas saprot pasauli ar visām maņām
Viens no Sjan Fana galvenajiem pētījuma virzieniem ir daudzveidīgā mācīšanās. Bet ko tas īsti nozīmē? Tradicionālie AI modeļi bieži vien darbojas tikai ar viena veida datiem – vai nu tekstu, vai attēlu, vai audio. Multi-modalā mācīšanās mērķis ir izveidot sistēmas, kas spēj apvienot un saprast informāciju no vairākiem avotiem vienlaikus, gluži kā to dara cilvēks.
Piemēri no reālās dzīves
Iedomājieties sistēmu, kas vienlaikus analizē video attēlu, skaņas celiņu (piemēram, bļaušanu) un subtitrus, lai pilnībā izprastu filmas scenu. Vai arī robotu, kas, veicot darbību, apvieno sensoru datus no kamerām, taktiliem sensoriem un mikrofona, lai labāk izprastu savu vidi. Tieši šāda veida integrācija ir daudzveidīgās mācīšanās kodols. Sjan Fana darbs tieši vērsts uz šādu modeļu attīstību, kas padarītu AI daudz izpratīgāku, elastīgāku un lietderīgāku sarežģītās, daudzveidīgās cilvēku vidēs.
Iemiesotais intelekts: No datiem līdz fiziskai darbībai
Ja daudzveidīgā mācīšanās ir par uztveri, tad iemiesotais intelekts ir par darbību. Šī joma pēta, kā AI var mijiedarboties ar fizisko pasauli, izmantojot robotu vai citu fizisku iemiesojumu. Tas vairs nav tikai algoritms, kas analizē datus ekrānā; tas ir sistēma, kurai ir “ķermenis” un kura mācās, darbojoties reālajā pasaulē.
Kāpēc tas ir revolucionāri?
Lielākā daļa mūsdienu AI, piemēram, lielie valodu modeļi, pastāv tikai digitālajā telpā. Iemiesotais intelekts sola pārvērst šīs spējas par rīku, kas spēj fiziski palīdzēt – no mājas darbu veikšanas līdz sarežģītu ražošanas operāciju veikšanai. Sjan Fana pētījumi šajā jomā, iespējams, koncentrējas uz to, kā apvienot augsta līmeņa sapratni (no daudzveidīgajiem modeļiem) ar fizisko veiklību, lai radītu robotus, kas ne tikai “redz” un “saprot”, bet arī “jūt” un “rīkojas” ar kontekstuaļu sapratni.
Divu lielo ideju simbioze: Nākotnes AI pamatā
Patiesā jaunrade rodas, apvienojot šīs divas jomas. Iedomājieties robotu palīgu, kas:
1. **Daudzveidīgi uztver:** Ar kameru redz izlietni pilnu ar traukiem, ar mikrofona palīdzību dzird ūdens tecēšanas skaņu un ar taktiliem sensoriem jūt trauka virsmas gludumu vai tauku klātbūtni.
2. **Iemiesoti rīkojas:** Pamatojoties uz šo daudzveidīgo informāciju, tas lemj, cik daudz šķidruma ziepju izmantot, kādu spiedienu pielikt, lai netiktu sabojāts trauks, un kā efektīvāk novietot izmazgāto trauku žāvētājā.
Šāda veida integrēta sistēma ir daudz viedāka un piemērotāka cilvēku vidē nekā jebkura šaurā specializēta tehnoloģija. Tieši šādu pētījumu krustpunktu, iespējams, izpēta Sjan Fans savā darbā, un AAAI/SIGAI Doctoral Consortium ir ideāla vieta, lai šādas idejas apspriestu un attīstītu kopā ar mentoriem.
Kāpēc šie pētījumi ir svarīgi mums visiem?
Daudzveidīgās mācīšanās un iemiesotā intelekta attīstība nav tikai akadēmisks uzdevums. Tās ir tehnoloģijas, kas nākotnē varētu:
* Radīt daudz intuitīvākus un spējīgākus robotus mājās un ražošanā.
* Uzlabot palīgtehnoloģijas cilvēkiem ar īpašām vajadzībām.
* Veicināt autonomas transporta sistēmas, kas pilnībā izprot sarežģītus ceļu scenārijus.
* Revolucionēt izglītību un apmācību, izmantojot imersīvas, mijiedarbīgas AI sistēmas.
Intervija ar Sjan Fanu, vienu no talantīgākajiem jaunajiem pētniekiem šajā laukā, atgādina, ka AI nākotne netiek veidota tikai lielo tehnoloģiju uzņēmumu laboratorijās. To veido arī zinātkāri un talantīgi doktoranti visā pasaulē, kuri, izmantojot iespējas, piemēram, AAAI/SIGAI Doctoral Consortium, pārvērš savas ambiciozās idejas par nākotnes realitāti. Viņu darbs pie daudzveidīgās mācīšanās un iemiesotā intelekta ir solis pretī AI, kas ne tikai aprēķina, bet patiešām saprot un mijiedarbojas ar mūsu fizisko pasauli.