Efektīva izlases laika mērogošana plūsmu modeļiem: izlases daudzveidības un skaitļošanas resursu sadales uzlabošana
Pētījums par efektīvu secināšanas laika mērogošanu plūsmas modeļiem
Nesenie progresi mākslīgā intelekta (AI) mērogošanas likumos ir pārvēršušies no vienkārša modeļa izmēra un apmācības datu palielināšanas uz secināšanas laika aprēķinu optimizēšanu. Šī pieeja, kuru ilustrē tādi modeļi kā OpenAI o1 un DeepSeek R1, uzlabo modeļa veiktspēju, izmantojot papildu skaitļošanas resursus secināšanas laikā. Testēšanas laika budžeta piespiešana ir kļuvusi par efektīvu tehniku lielvalodu modeļos (LLM), ļaujot uzlabot veiktspēju ar minimālu tokenu izlasi. Līdzīgi secināšanas laika mērogošana ir ieguvusi popularitāti difūzijas modeļos, īpaši balstu balstītā izlasē, kur iteratīva uzlabošana palīdz ģenerēt izvadi, kas labāk atbilst lietotāju vēlmēm.
Secināšanas laika mērogošanas metodes difūzijas modeļiem var tikt iedalītas uzlabotās apmācības un daļiņu izlases pieejās. Uzlabotā apmācība uzlabo modeļa saskaņošanu ar konkrētiem uzdevumiem, taču prasa pārapmācību katram lietojumgadījumam, ierobežojot mērogojamību. Turpretī daļiņu izlase — ko izmanto tādos paņēmienos kā SVDD un CoDe — iteratīvi atlasa augstas vērtējuma paraugus denoizēšanas laikā, ievērojami uzlabojot izvades kvalitāti. Kaut arī šīs metodes ir bijušas efektīvas difūzijas modeļiem, to pielietojums plūsmas modeļiem ir bijis ierobežots to deterministiskās ģenerēšanas procesa dēļ.
Inovatīvas pieejas plūsmas modeļiem
KAIST pētnieki ir ierosinājuši secināšanas laika mērogošanas metodi priekšapmācītiem plūsmas modeļiem, risinot to ierobežojumus daļiņu izlasē. Viņi ievieš trīs galvenos jauninājumus: (1) SDE balstītu ģenerēšanu, lai nodrošinātu stohastisku izlasi, (2) VP interpolanta pārveidošanu, lai uzlabotu paraugu daudzveidību, un (3) Rollover Budget Forcing (RBF) adaptīvai skaitļošanas resursu sadalei. Eksperimentālie rezultāti parāda, ka šīs metodes uzlabo saskaņošanos ar vērtējumu tādos uzdevumos kā kompozicionālā teksta-attēla ģenerēšana.
Secināšanas laika atalgojuma saskaņošanas mērķis ir ģenerēt augstas vērtējuma paraugus no priekšapmācīta plūsmas modeļa bez pārapmācības. Lai risinātu deterministiskās izlases ierobežojumus, tiek ieviesta secināšanas laika stohastiskā izlase, pārveidojot deterministiskos procesus par stohastiskiem. Turklāt interpolanta pārveidošana paplašina meklēšanas telpu, saskaņojot plūsmas modeļu izlasi ar difūzijas modeļiem.
Eksperimentālie rezultāti un secinājumi
Pētījumā tiek prezentēti rezultāti par daļiņu izlases metodēm secināšanas laika atalgojuma saskaņošanai. Rezultāti norāda, ka secināšanas laika stohastiskā izlase uzlabo efektivitāti, turpretī interpolanta pārveidošana papildus uzlabo veiktspēju. Plūsmas modeļu daļiņu izlase rada augstāka vērtējuma izvadi, salīdzinot ar difūzijas modeļiem, neupurējot attēla kvalitāti. Piedāvātā RBF metode optimizē budžeta sadali, sasniedzot labākos rezultātus atalgojuma saskaņošanā un precizitātē.
Noslēgumā pētījums ievieš secināšanas laika mērogošanas metodi plūsmas modeļiem, iekļaujot trīs galvenos jauninājumus: ODE uz SDE pārveidošanu, lineārā uz VP interpolanta pārveidošanu un RBF adaptīvai skaitļošanas resursu sadalei. Eksperimentālie rezultāti parāda, ka šī metode pārspēj esošās secināšanas laika mērogošanas metodes, uzlabojot veiktspēju, saglabājot augstas kvalitātes izvadi plūsmas balstītajos attēlu un video ģenerēšanas modeļos.
Aplūkojiet pētījumu. Visu atzinību par šo pētījumu izpildi saņem tā autori. Sekojiet mums arī Twitter un pievienojieties mūsu 85k+ ML kopienai Reddit.
https://www.marktechpost.com/