Skip to main content

AI Halucināciju Izmantošana Attēlu Realisma Novērtēšanai

Pētnieki izmanto mākslīgo intelektu, lai novērtētu attēlu realitāti

Krievijas zinātnieki ir izstrādājuši jaunu metodi nereālu, ar mākslīgo intelektu (MI) radītu attēlu noteikšanai. Tā balstās nevis uz modeļu precizitātes uzlabošanu, bet gan uz to tendenci radīt maldīgas informācijas jeb “halucinācijas”.

Divu attēlu salīdzinājums no WHOOPS! datu kopas. Kreisajā pusē reāls attēls ar konsekventiem aprakstiem, bet labajā pusē neparasts attēls, kas izraisa modeļa kļūdas.

Divu attēlu salīdzinājums no WHOOPS! datu kopas. Kreisajā pusē reāls attēls ar konsekventiem aprakstiem, bet labajā pusē neparasts attēls, kas izraisa modeļa kļūdas.

Kā darbojas metode

Pētnieki izmanto lielus vizuāli-verbālos modeļus (LVLM), lai ģenerētu vairākus vienkāršus apgalvojumus (“atomiskos faktus”) par attēlu. Pēc tam, izmantojot dabiskās valodas secināšanas (NLI) modeli, tiek analizētas pretrunas starp šiem apgalvojumiem.

Metodes darbības shēma.

Metodes darbības shēma.

Pētījumā tika izmantota WHOOPS! datu kopa, kas satur 500 sintētiskus attēlus un vairāk nekā 10 000 anotāciju. Šie attēli ir speciāli izveidoti, lai pārbaudītu MI modeļu spēju saprast un analizēt nereālas situācijas.

Piemēri no WHOOPS! datu kopas.

Piemēri no WHOOPS! datu kopas.

Rezultāti un nozīme

Metode parādīja līdzīgus vai pat labākus rezultātus salīdzinājumā ar speciāli apmācītiem modeļiem. Svarīgi, ka šo pieeju var īstenot ar atvērtā koda rīkiem, padarot to pieejamu plašākam lietotāju lokam.

Dažādu metožu veiktspējas salīdzinājums.

Dažādu metožu veiktspējas salīdzinājums.

Pētnieki atzīst, ka šī metode ir atkarīga no pašreizējo valodu modeļu īpašībām radīt kļūdas. Tomēr šī pieeja piedāvā jaunu perspektīvu MI radītu attēlu novērtēšanā, pārvēršot modeļu vājās puses par stiprībām.

Pēdējoreiz atjaunināts 2025. gada 25. martā

https://www.unite.ai/

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *