JPEG AI Izplūdina Robežu Starp Reālo un Sintētisko
Jaunā JPEG AI tehnoloģija izplūdina robežu starp īstenību un sintēzi
2025. gada februārī tika publicēts JPEG AI starptautiskais standarts pēc vairāku gadu pētījumiem, kuru mērķis bija izmantot mašīnmācīšanās metodes, lai radītu mazāku un vieglāk pārraidāmu un uzglabājamu attēlu kodeku bez uztveres kvalitātes zuduma.

Salīdzinājums starp Peak Signal-to-Noise Ratio (PSNR) un JPEG AI mašīnmācīšanās palīdzīgā pieeja. Avots: https://jpeg.org/jpegai/documentation.html
Viens no iespējamiem iemesliem, kāpēc šis atklājums nesaņēma plašu publicitāti, ir tas, ka galvenie PDF dokumenti šim paziņojumam nebija pieejami bezmaksas portālos, piemēram, Arxiv. Tomēr Arxiv jau bija publicējis vairākus pētījumus, kas analizēja JPEG AI nozīmi dažādos aspektos, tostarp metodes neparastos kompresijas artefaktus un tās nozīmi forenzikā.
Problēmas ar teksta kvalitāti

Pētījums salīdzināja kompresijas artefaktus, tostarp agrīnā JPEG AI prototipa, atklājot, jaunajai metodei ir tendence izplūdināt tekstu – kas nav mazsvarīgi gadījumos, kad kodeks varētu būt pierādījumu ķēdē. Avots: https://arxiv.org/pdf/2411.06810
Tā kā JPEG AI maina attēlus veidos, kas atgādina sintētisko attēlu ģeneratoru artefaktus, esošajiem forenzes rīkiem ir grūtības atšķirt īstus attēlus no viltojumiem:

Pēc JPEG AI kompresijas vadošie algoritmi vairs nevar uzticami atšķirt autentisku saturu no manipulētajiem reģioniem lokalizācijas kartēs, saskaņā ar nesen publicētu pētījumu (2025. gada marts). Avots: https://arxiv.org/pdf/2412.03261
Kvantizācijas loma
Viens no iemesliem ir tas, ka JPEG AI tiek apmācīts, izmantojot modeļa arhitektūru, kas līdzīga tām, ko izmanto ģeneratīvās sistēmas, kuras forenzes rīki mēģina atklāt:

Jaunais pētījums ilustrē līdzību starp AI vadītu attēlu kompresiju un faktiski ar AI ģenerētiem attēliem. Avots: https://arxiv.org/pdf/2504.03191
Abi modeļi var radīt līdzīgus vizuālos raksturlielumus no forenziskā viedokļa.
Kvantizācijas process
Šī pārklāšanās rodas kvantizācijas dēļ, kas kopīga abām arhitektūrām un ko mašīnmācīšanās izmanto gan kā metodi nepārtrauktu datu pārveidošanai diskrētos punktos, gan kā optimizācijas tehniku, kas var ievērojami samazināt apmācīta modeļa faila izmēru.
Šajā kontekstā kvantizācija attiecas uz procesu, kurā nepārtrauktās vērtības attēla latentajā reprezentācijā tiek pārveidotas par fiksētiem, diskrētiem soļiem. JPEG AI izmanto šo procesu, lai samazinātu datu apjomu, kas nepieciešams attēla glabāšanai vai pārsūtīšanai, vienkāršojot iekšējo skaitlisko reprezentāciju.
Lai gan kvantizācija padara kodēšanu efektīvāku, tā arī uzliek strukturālus regulāritātus, kas var atgādināt ģeneratīvo modeļu atstātos artefaktus – pietiekami smalkus, lai izvairītos no uztveres, bet traucējošus forenzes rīkiem.
Forenziskās metodes
Atbildot uz to, jauna pētījuma autori ar nosaukumu Trīs forenziskās norādes JPEG AI attēliem piedāvā interpretējamas, ne-neironu tīklu metodes, kas atklāj JPEG AI kompresiju; nosaka, vai attēls ir pārkompresēts; un atšķir kompresētus īstus attēlus no tiem, kas pilnībā ģenerēti ar AI.
Krāsu korelācijas
Pētījumā tiek piedāvātas trīs “forenziskās norādes”, kas pielāgotas JPEG AI attēliem: krāsu kanālu korelācijas, kas tiek ieviestas JPEG AI priekšapstrādes posmā; mērāmi traucējumi attēla kvalitātē atkārtotu kompresiju laikā, kas atklāj pārkompresēšanas notikumus; un latentās telpas kvantizācijas modeļi, kas palīdz atšķirt JPEG AI kompresētus attēlus no AI modeļu ģenerētiem attēliem.

Salīdzinājums, kā JPEG AI kompresija maina krāsu korelācijas attēlos.
Bitrātes un kvalitātes attiecība
Bitrātes un kvalitātes attiecības norāde identificē JPEG AI pārkompresēšanu, izsekojot, kā attēla kvalitāte, mērīta ar Peak Signal-to-Noise Ratio (PSNR), samazinās prognozējamā veidā vairāku kompresiju piegājienu laikā.

Ilustrācija, kā atkārtota kompresija ietekmē attēla kvalitāti dažādos kodekos.
Kvantizācijas modeļu analīze
Kā redzējām iepriekš, viena no grūtākajām forenziskajām problēmām, ko rada JPEG AI, ir tā vizuālā līdzība ar difūzijas modeļu ģenerētiem sintētiskajiem attēliem. Abas sistēmas izmanto kodētāja-dekodētāja arhitektūru, kas apstrādā attēlus kompresētā latentā telpā, un bieži atstāj aiz sevis smalkus uzparašanas artefaktus.

Furjē spektru piemērs atklāj, ka gan JPEG AI kompresēti attēli, gan ar difūzijas modeļiem ģenerēti attēli uzrāda regulārus režģa veida modeļus frekvenču jomā.
Pētījuma rezultāti
Lai novērtētu, vai to krāsu korelāciju norāde var uzticami atklāt JPEG AI kompresiju, autori pārbaudīja to uz augstas kvalitātes nekompresētiem attēliem no RAISE datu kopas, kompresējot tos ar dažādām bitrātēm, izmantojot JPEG AI atsauces implementāciju.

JPEG AI kompresijas noteikšanas precizitāte, izmantojot krāsu korelācijas pazīmes.
Pārkompresijas noteikšana
Lai novērtētu, vai JPEG AI pārkompresiju var uzticami atklāt, pētnieki pārbaudīja bitrātes un kvalitātes attiecības norādi uz attēlu kopu, kas kompresēta ar dažādām bitrātēm – daži tikai vienu reizi, citi otrreiz, izmantojot JPEG AI.

Rezultāti nejaušā meža klasifikācijas precizitātei, kas apmācīts uz bitrātes un kvalitātes attiecības pazīmēm.
JPEG AI un sintētisko attēlu atšķiršana
Pēdējā testēšanas kārtā autori pārbaudīja, vai viņu kvantizācijas pazīmes var atšķirt JPEG AI kompresētus attēlus no pilnībā sintētiskiem attēliem, ko ģenerējuši modeļi, piemēram, Midjourney, Stable Diffusion, DALL-E 2, Glide un Adobe Firefly.

Sintētisko attēlu piemēri Synthbuster datu kopā. Avots: https://ieeexplore.ieee.org/document/10334046

Klasifikācijas precizitāte, izmantojot kvantizācijas pazīmes, lai atšķirtu JPEG AI kompresētus attēlus no sintētiskajiem attēliem.

Divdimensiju UMAP vizualizācija JPEG AI kompresētiem un sintētiskiem attēliem, balstoties uz kvantizācijas pazīmēm.
Secinājumi
Nav garantēts, ka JPEG AI gūs plašu pieņemšanu. Viena no problēmām ir esošā infrastruktūras parāds, kas rada berzi jebkura jauna kodeka ieviešanā; un pat “tradicionālam” kodekam ar labu reputāciju un plašu vienprātību par tā vērtību, piemēram, AV1, ir grūtības izspiest ilgi pastāvošās metodes.
Attiecībā uz sistēmas potenciālo sadursmi ar AI ģeneratoriem, raksturīgie kvantizācijas artefakti, kas palīdz pašreizējās paaudzes AI attēlu detektoriem, var tikt samazināti vai galu galā aizstāti ar cita veida pēdām vēlākās sistēmās (pieņemot, ka AI ģeneratori vienmēr atstās forenziskas pēdas, kas nav droši).
Tomēr, ja JPEG AI turpinās darboties kā de facto “AI mazgāšanas” līdzeklis, ievērojami izplūdinot robežu starp īstiem un ģenerētiem attēliem, būtu grūti izvirzīt pārliecinošu argumentu tā pieņemšanai.
Pirmo reizi publicēts 2025. gada 8. aprīlī
https://www.unite.ai/jpeg-ai-blurs-the-line-between-real-and-synthetic/