Petek, 1. 3. 2024, 22.43
2 tedna, 2 dneva
Fotografija iz McDonaldsa buri duhove: kaj je v ozadju?
Številni uporabniki družbenih omrežij so ta teden nostalgično vzdihovali ob fotografiji, ki je po mnenju mnogih prikazovala enega od idealov preteklega, lepšega in brezskrbnejšega časa – brkatega moškega z bujnimi lasmi, brezrokavnikom iz džinsa in prižgano cigareto v restavraciji s hitro hrano McDonald's. Toda s fotografijo je narobe marsikaj, obenem moški na njej sploh ne obstaja, temveč si ga je izmislil računalnik.
Zgornja fotografija je samo na družbenem omrežju X, nekdanjem Twitterju, od srede zbrala že več kot 22 milijonov prikazov, poobjavljati pa so jo začeli tudi uporabniki drugih družbenih omrežij, kot so Instagram, Facebook in TikTok. V precej primerih so fotografijo pospremili pripisi in komentarji v slogu "včasih so živeli veliko lepše", virtualne nostalgične solze pa so se utrnile predvsem uporabnikom v ZDA, saj fotografija domnevno prikazuje slog tipične ameriške restavracije s hitro hrano v 70. ali 80. letih prejšnjega stoletja.
Uporabnik Twitterja, ki je prvi objavil fotografijo, je sicer zapisal, da naj bi nastala leta 1989:
Peak male specimen at McDonald’s. 1989. pic.twitter.com/aMbrSec9ia
— Grandaddy Jeff (@GrandaddyJeff) February 27, 2024
Toda fotografije v resnici ni posnel nihče, temveč je nastala z uporabo tako imenovane generativne umetne inteligence, ki lahko slikovni material izdela na podlagi uporabnikovega namiga oziroma ukaza v besedilni obliki. Trenutno je na voljo že precej zelo zmogljivih umetnointeligenčnih modelov, ki so zmožni ustvariti fotorealistične prizore. Nekateri, na primer Microsoftov Copilot, so tako dostopni, da se jih lahko hitro priuči tudi povsem povprečno ali celo podpovprečno računalniško razgledani uporabnik.
Kaj vse je narobe s fotografijo oziroma kakšni so znaki, da jo je izdelala umetna inteligenca?
Za trenutek odmislimo dejstvo, da je fotografijo, ki jo je na družbeno omrežje X v torek objavil uporabnik @GrandaddyJeff, sicer vizualni umetnik, kot izdelek umetne inteligence že opisal zaznamek Community Notes.
Ker je fotografija videti tako resnično, a ima hkrati precej napak, ki jih takoj ne bo opazil vsak, sploh pa ne nekdo, ki še ne ve, kako prepričljive prizore je že mogoče izdelati s tako rekoč vsakomur dostopno umetno inteligenco, gre za zelo dober poligon za prepoznavanje umetnointeligenčnih fotografij oziroma lažje ločevanje umetnointeligenčnih fotografij od pravih.
Pojdimo kar po vrsti in začnimo s prsti, katerih verodostojno poustvarjanje je za umetnointeligenčne modele v mnogo primerih še vedno kot zakleto, čeprav so se na tem področju v zadnjem letu precej izboljšali. Ne le, da ima moški na fotografiji na levi roki nenavadno dolge prste, videti je tudi, kot da sploh nima zapestja oziroma je to pomaknjeno na sredino njegove podlahti.
Če so prsti brkatega dolgolasega moškega morda še videti nekoliko prepričljivo, tega ne moremo trditi za gosta restavracije v ozadju, ki ima glede na različne interpretacije enega ali dva prsta preveč ali pa je njegova celotna dlan nerazpoznavna gmota prstov in še česa. V nenavadnem položaju je tudi njegova druga podlaket, da o obrazu nekoliko neobičajne oblike, kar je pri fotografijah, ustvarjenih z umetno inteligenco, značilno za osebe, ki niso v središču pozornosti oziroma osrednji motiv fotografije, ne govorimo.
Nekaj čudnega se medtem dogaja tudi z osebo, domnevno žensko, na skrajno levi strani fotografije, ki je videti, kot da ne nosi majice oziroma da se je ta dobesedno zlila z njenim telesom.
Nato se je treba osredotočiti na podrobnosti. Nekatere so bolj, nekatere manj očitne. Če začnemo pri mizi v ospredju, natančneje pri obroku na njej, lahko opazimo, da na lončku s pijačo ni napis Coca-Cola, temveč nečitljive vijuge, ki na črke spominjajo zgolj od daleč. Na mizi je za dlanmi moškega še en lonček, toda ali je res na mizi? Sodeč po tem, kako poteka rob mize, bi moral manjši lonček tako rekoč lebdeti v zraku. Zraven je še McDonaldov krompirček, vendar v embalaži z napačno barvno kombinacijo (v celoti bi moral biti rdeč z rumenim logotipom restavracije), za nameček pa iz njega štrli slamica. Obenem tudi ni jasno, kaj se dogaja s hamburgerjem, ki ni na krožniku – je na mizi ali ga moški drži v rokah?
Bizaren prizor je tudi v zgornjem desnem kotu fotografije, kjer bi moral biti napis McDonald's in logotip verige restavracij s hitro hrano, vendar na znaku ne piše MCDONALDS, temveč "MODLIDANI". Logotip podjetja je medtem sicer podoben polovici resničnega pisanega "M", vendar ima tudi prečno črtico, zaradi katere je videti kot velika tiskana črka a.
Pozorno oko bo opazilo tudi zanimivo podrobnost na brezrokavniku iz džinsa, in sicer neujemanje razmaka med gumboma na levi strani oblačila in odprtinama za gumba na desni.
Z orodjem Microsoft Copilot smo poskusili ustvariti nekaj podobnih fotografij. Na njih so razvidne določene podobnosti z zgornjo izvirno fotografijo, ki razkrivajo in hkrati opozarjajo, da je ključ do prepoznavanja umetnointeligenčnih fotografij vsaj za zdaj še vedno v podrobnostih:
Namig: število prstov na roki, ki drži cigareto.
Namig: kaj se dogaja desno za glavo mladeniča v ospredju?
Namig: napis na lončku s pijačo.
Namig: prsti, število cigaret, kaj vse je na mizi?
Namig: število (in deformacija) prstov, napis na lončku.
Namig: napis na lončku, fotografije na papirnati podlagi na pladnju s hrano.