Nazaj na Siol.net

TELEKOM SLOVENIJE

Matic Tomšič

Petek,
1. 3. 2024,
22.43

Osveženo pred

1 mesec, 3 tedne

Termometer prikazuje, kako vroč je članek. Skupni seštevek je kombinacija števila klikov in komentarjev.

Termometer prikaže, kako vroč je članek. Skupni seštevek je kombinacija števila klikov in komentarjev.

Thermometer Orange 7,37

Natisni članek

nasvet Umetna inteligenca

Petek, 1. 3. 2024, 22.43

1 mesec, 3 tedne

Fotografija iz McDonaldsa buri duhove: kaj je v ozadju?

Matic Tomšič

Termometer prikazuje, kako vroč je članek. Skupni seštevek je kombinacija števila klikov in komentarjev.

Termometer prikaže, kako vroč je članek. Skupni seštevek je kombinacija števila klikov in komentarjev.

Thermometer Orange 7,37
Umetna inteligenca MCD | Ameriški ustvarjalec vizualnih vsebin Frank J. Fleming je na družbenem omrežju X zapisal, da gre konkretno za zelo zanimiv primer, kako je lahko umetnointeligenčna fotografija pretentala toliko ljudi. "Na kocki je v tem primeru pravzaprav tako malo. Kazalnikov, da gre za umetnointeligenčno fotografijo, je veliko in so zelo očitni, a ker niso osrednji motiv fotografije ter ker v tem primeru tako rekoč nihče ne bo pomislil, da ga nekdo hoče pretentati, skoraj nihče tudi nima razloga, da bi jo podrobno analiziral. | Foto @GrandaddyJeff / X/ Umetna inteligenca

Ameriški ustvarjalec vizualnih vsebin Frank J. Fleming je na družbenem omrežju X zapisal, da gre konkretno za zelo zanimiv primer, kako je lahko umetnointeligenčna fotografija pretentala toliko ljudi. "Na kocki je v tem primeru pravzaprav tako malo. Kazalnikov, da gre za umetnointeligenčno fotografijo, je veliko in so zelo očitni, a ker niso osrednji motiv fotografije ter ker v tem primeru tako rekoč nihče ne bo pomislil, da ga nekdo hoče pretentati, skoraj nihče tudi nima razloga, da bi jo podrobno analiziral.

Foto: @GrandaddyJeff / X/ Umetna inteligenca

Številni uporabniki družbenih omrežij so ta teden nostalgično vzdihovali ob fotografiji, ki je po mnenju mnogih prikazovala enega od idealov preteklega, lepšega in brezskrbnejšega časa – brkatega moškega z bujnimi lasmi, brezrokavnikom iz džinsa in prižgano cigareto v restavraciji s hitro hrano McDonald's. Toda s fotografijo je narobe marsikaj, obenem moški na njej sploh ne obstaja, temveč si ga je izmislil računalnik.

Spolne zlorabe otrok, žalost, otrok, nasilje
Novice "Uresničila se je najhujša nočna mora"

Zgornja fotografija je samo na družbenem omrežju X, nekdanjem Twitterju, od srede zbrala že več kot 22 milijonov prikazov, poobjavljati pa so jo začeli tudi uporabniki drugih družbenih omrežij, kot so Instagram, Facebook in TikTok. V precej primerih so fotografijo pospremili pripisi in komentarji v slogu "včasih so živeli veliko lepše", virtualne nostalgične solze pa so se utrnile predvsem uporabnikom v ZDA, saj fotografija domnevno prikazuje slog tipične ameriške restavracije s hitro hrano v 70. ali 80. letih prejšnjega stoletja. 

Uporabnik Twitterja, ki je prvi objavil fotografijo, je sicer zapisal, da naj bi nastala leta 1989:

Toda fotografije v resnici ni posnel nihče, temveč je nastala z uporabo tako imenovane generativne umetne inteligence, ki lahko slikovni material izdela na podlagi uporabnikovega namiga oziroma ukaza v besedilni obliki. Trenutno je na voljo že precej zelo zmogljivih umetnointeligenčnih modelov, ki so zmožni ustvariti fotorealistične prizore. Nekateri, na primer Microsoftov Copilot, so tako dostopni, da se jih lahko hitro priuči tudi povsem povprečno ali celo podpovprečno računalniško razgledani uporabnik.

Kaj vse je narobe s fotografijo oziroma kakšni so znaki, da jo je izdelala umetna inteligenca?

Za trenutek odmislimo dejstvo, da je fotografijo, ki jo je na družbeno omrežje X v torek objavil uporabnik @GrandaddyJeff, sicer vizualni umetnik, kot izdelek umetne inteligence že opisal zaznamek Community Notes.

Papež Frančišek
Trendi Fotografije papeža preplavile splet – ste tudi vi verjeli, da so resnične?

Ker je fotografija videti tako resnično, a ima hkrati precej napak, ki jih takoj ne bo opazil vsak, sploh pa ne nekdo, ki še ne ve, kako prepričljive prizore je že mogoče izdelati s tako rekoč vsakomur dostopno umetno inteligenco, gre za zelo dober poligon za prepoznavanje umetnointeligenčnih fotografij oziroma lažje ločevanje umetnointeligenčnih fotografij od pravih.

Pojdimo kar po vrsti in začnimo s prsti, katerih verodostojno poustvarjanje je za umetnointeligenčne modele v mnogo primerih še vedno kot zakleto, čeprav so se na tem področju v zadnjem letu precej izboljšali. Ne le, da ima moški na fotografiji na levi roki nenavadno dolge prste, videti je tudi, kot da sploh nima zapestja oziroma je to pomaknjeno na sredino njegove podlahti.

McDonald's AI | Foto: @GrandaddyJeff / X/ Umetna inteligenca Foto: @GrandaddyJeff / X/ Umetna inteligenca

Če so prsti brkatega dolgolasega moškega morda še videti nekoliko prepričljivo, tega ne moremo trditi za gosta restavracije v ozadju, ki ima glede na različne interpretacije enega ali dva prsta preveč ali pa je njegova celotna dlan nerazpoznavna gmota prstov in še česa. V nenavadnem položaju je tudi njegova druga podlaket, da o obrazu nekoliko neobičajne oblike, kar je pri fotografijah, ustvarjenih z umetno inteligenco, značilno za osebe, ki niso v središču pozornosti oziroma osrednji motiv fotografije, ne govorimo.

McDonald's AI | Foto: @GrandaddyJeff / X/ Umetna inteligenca Foto: @GrandaddyJeff / X/ Umetna inteligenca

Nekaj čudnega se medtem dogaja tudi z osebo, domnevno žensko, na skrajno levi strani fotografije, ki je videti, kot da ne nosi majice oziroma da se je ta dobesedno zlila z njenim telesom.

McDonald's AI | Foto: @GrandaddyJeff / X/ Umetna inteligenca Foto: @GrandaddyJeff / X/ Umetna inteligenca

Nato se je treba osredotočiti na podrobnosti. Nekatere so bolj, nekatere manj očitne. Če začnemo pri mizi v ospredju, natančneje pri obroku na njej, lahko opazimo, da na lončku s pijačo ni napis Coca-Cola, temveč nečitljive vijuge, ki na črke spominjajo zgolj od daleč. Na mizi je za dlanmi moškega še en lonček, toda ali je res na mizi? Sodeč po tem, kako poteka rob mize, bi moral manjši lonček tako rekoč lebdeti v zraku. Zraven je še McDonaldov krompirček, vendar v embalaži z napačno barvno kombinacijo (v celoti bi moral biti rdeč z rumenim logotipom restavracije), za nameček pa iz njega štrli slamica. Obenem tudi ni jasno, kaj se dogaja s hamburgerjem, ki ni na krožniku – je na mizi ali ga moški drži v rokah?

McDonald's AI | Foto: @GrandaddyJeff / X/ Umetna inteligenca Foto: @GrandaddyJeff / X/ Umetna inteligenca

Bizaren prizor je tudi v zgornjem desnem kotu fotografije, kjer bi moral biti napis McDonald's in logotip verige restavracij s hitro hrano, vendar na znaku ne piše MCDONALDS, temveč "MODLIDANI". Logotip podjetja je medtem sicer podoben polovici resničnega pisanega "M", vendar ima tudi prečno črtico, zaradi katere je videti kot velika tiskana črka a. 

McDonald's AI | Foto: @GrandaddyJeff / X/ Umetna inteligenca Foto: @GrandaddyJeff / X/ Umetna inteligenca

Pozorno oko bo opazilo tudi zanimivo podrobnost na brezrokavniku iz džinsa, in sicer neujemanje razmaka med gumboma na levi strani oblačila in odprtinama za gumba na desni. 

McDonald's AI | Foto: @GrandaddyJeff / X/ Umetna inteligenca Foto: @GrandaddyJeff / X/ Umetna inteligenca

Z orodjem Microsoft Copilot smo poskusili ustvariti nekaj podobnih fotografij. Na njih so razvidne določene podobnosti z zgornjo izvirno fotografijo, ki razkrivajo in hkrati opozarjajo, da je ključ do prepoznavanja umetnointeligenčnih fotografij vsaj za zdaj še vedno v podrobnostih:

Namig: število prstov na roki, ki drži cigareto. | Foto: Microsoft Copilot / Umetna inteligenca Namig: število prstov na roki, ki drži cigareto. Foto: Microsoft Copilot / Umetna inteligenca

Namig: kaj se dogaja desno za glavo mladeniča v ospredju? | Foto: Microsoft Copilot / Umetna inteligenca Namig: kaj se dogaja desno za glavo mladeniča v ospredju? Foto: Microsoft Copilot / Umetna inteligenca

Namig: napis na lončku s pijačo. | Foto: Microsoft Copilot / Umetna inteligenca Namig: napis na lončku s pijačo. Foto: Microsoft Copilot / Umetna inteligenca

Namig: prsti, število cigaret, kaj vse je na mizi? | Foto: Microsoft Copilot / Umetna inteligenca Namig: prsti, število cigaret, kaj vse je na mizi? Foto: Microsoft Copilot / Umetna inteligenca

Namig: število (in deformacija) prstov, napis na lončku. | Foto: Microsoft Copilot / Umetna inteligenca Namig: število (in deformacija) prstov, napis na lončku. Foto: Microsoft Copilot / Umetna inteligenca

Namig: napis na lončku, fotografije na papirnati podlagi na pladnju s hrano. | Foto: Microsoft Copilot / Umetna inteligenca Namig: napis na lončku, fotografije na papirnati podlagi na pladnju s hrano. Foto: Microsoft Copilot / Umetna inteligenca

 

Ne spreglejte