Skip to main content

Vadības Labs ievieš jauna veida interpretējamu valodu modeli, kas atver melno kasti

Mākslīgā intelekta pasaulē, kur milzīgi valodu modeļi kā GPT-4 vai Claude bieži tiek saukti par “melnajām kastēm”, pēkšņi parādās gaismas stars. Jaunizveidotā uzņēmuma Guide Labs pētnieki ir izstrādājuši jauna veida lielo valodu modeli (LLM), kura darbība nav noslēpums, bet gan atvērta grāmata. Viņi ne tikai to ir izveidojuši, bet arī atvērti publicējuši – modeli ar nosaukumu Steerling-8B. Vai tas ir solis pretī atbildīgam un uzticamam AI, ko mēs patiesībā varam saprast?

Kas ir Steerling-8B un kāpēc tā interpretējamība ir tik svarīga?

Iedomājieties, ka jūs lūdzat AI palīdzību pieņemt svarīgu lēmumu, piemēram, par investīcijām vai medicīnisku diagnozi. Jūs saņemat atbildi, bet jums nav ne jausmas, kāpēc modelis ieteica tieši šo, nevis kādu citu iespēju. Tas ir standarta scenārijs ar lielāko daļu mūsdienu AI. Guide Labs izstrādātais Steerling-8B, 8 miljardu parametru liels valodu modelis, tiecas šo problēmu atrisināt. Tā kodols ir jauna arhitektūra, kas radīta ar vienu galveno mērķi – padarīt modeļa domāšanas procesu un lēmumu pieņemšanu cilvēkam viegli interpretējamu un izskaidrojamu.

Praksē tas nozīmē, ka, iegūstot atbildi no Steerling-8B, izstrādātāji un gala lietotāji varēs “redzēt” iekšējos mehānismus, kas noveda pie konkrēta secinājuma. Tā kā modelis ir atvērtā koda, tas dod bezprecedenta iespēju pētnieku kopienai ieskatīties tā darbībā, novērtēt kļūdu avotus un saprast, kā tas “domā”. Šī pārredzamība ir kritiski svarīga, lai veidotu uzticību, atklātu neobjektivitāti un nodrošinātu, ka AI lēmumi ir droši un ētiski.

Kāda ir jaunā arhitektūra? Pārtraukums ar tradicionālajiem transformatoriem

Lai panāktu šo pārredzamību, Guide Labs pētnieki attālinājās no tradicionālajām transformatoru arhitektūrām, kas ir lielākās daļas mūsdienu LLM pamatā. Viņu izstrādātā pieeja koncentrējas uz tā saukto “steerable” jeb “vadāmo” mehānismu. Vienkāršoti izsakoties, modelis ir veidots tā, lai tā iekšējās darbības būtu strukturētas un kategorizētas specifiskā veidā, nevis būtu milzīgs, neskaidrs parametru jūras burbulis.

Tas ļauj izsekot, kuri modeļa iekšējie ceļi un “domāšanas soļi” tika aktivizēti, lai ģenerētu konkrētu teksta fragmentu. Tā ir tāda kā AI domāšanas procesa kartēšana. Šī struktūra ne tikai atvieglo interpretāciju, bet arī, pēc uzņēmuma aplēsēm, padara modeli efektīvāku apmācībā un lietošanā, jo tas var koncentrēties uz svarīgākajiem domāšanas ceļiem.

Kāpēc atvērtā koda publikācija ir nozīmīgs solis?

Publicējot Steerling-8B kā atvērtā koda projektu, Guide Labs veic vairākus stratēģiskus un ētiskus gājienus. Pirmkārt, tas iesaista globālo pētnieku un izstrādātāju kopienu, lai kopīgi uzlabotu interpretējamās AI tehnoloģijas. Otrkārt, tas rada konkurenci lielajiem, slēgtajiem modeļiem, piespiežot nozares līderus domāt par pārredzamību. Treškārt, tas veicina standartizāciju – ja vairāki spēlētāji sāk strādāt ar līdzīgiem interpretējamības principiem, var rasties jaunas nozares normas.

Lietotājiem tas nozīmē, ka drīz varētu būt pieejami rīki un pakalpojumi, kas balstīti uz šādu pārredzamu tehnoloģiju, piedāvājot lielāku kontroles sajūtu un uzticēšanos AI ģenerētajam saturam. Izstrādātājiem tas ir vērtīgs instruments, lai izveidotu specializētus risinājumus, piemēram, juridiskos palīgus vai medicīniskos diagnostikas atbalsta sistēmas, kur izskaidrojamība ir likumā vai ētikas kodeksā noteikta prasība.

Nākotnes izaicinājumi un iespējas

Protams, ceļš uz pilnībā interpretējamu un uzticamu AI vēl ir garš. Steerling-8B ar saviem 8 miljardiem parametriem ir daudz mazāks par līderu modeļiem, kuriem ir simtiem miljardu vai pat triljoni parametru. Jautājums ir, vai šī interpretējamā arhitektūra būs mērogrojama līdz tādiem milzīgiem izmēriem, saglabājot savas priekšrocības.

Tomēr šis ir skaidrs signāls nozares maiņai. Fokuss pāriet no tīri “lielāka un jaudīgāka” uz “labāk saprotamu un uzticamāku”. Tas varētu novest pie jaunas AI līmju paaudzes, kurās mēs ne tikai brīnāmies par to, ko tās spēj, bet arī patiešām uzticas tam, kā tās to dara. Steerling-8B varētu būt tas pavērsienis, kas sāk likt pamatus AI sistēmām, kas ir ne tikai gudras, bet arī atbildīgas un, galvenais, saprotamas saviem radītājiem un lietotājiem.

Avots: https://techcrunch.com/2026/02/23/guide-labs-debuts-a-new-kind-of-interpretable-llm/

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *