Trgovec Spar Slovenija je pred dnevi predstavil svoj prvi oglas, ki so ga v celoti izdelali s pomočjo umetnointeligenčnih orodij. Vse kadre v videoposnetku si je tako izmislila umetna inteligenca, ki ji je bilo v pomoč zgolj nekaj fotografij zunanjosti in notranjosti supermarketov slovenske trgovske verige ter besedilo s scenarijem oziroma z zelo natančnimi navodili, kaj vse naj bo prikazano v oglasu. Ta je na prvi pogled sicer res videti zelo prepričljivo, a njegovo poreklo izdajajo določene podrobnosti, s katerimi ima umetna inteligenca vsaj za zdaj še vedno kar precejšnje težave.

Zgornji videoposnetek najprej prikaže zunanjost trgovine Spar, nato sledi sosledje hitrih in nekoliko abstraktnih kadrov, ki prikazujejo pot jabolka od vzklitja jablane, kar se zgodi kar sredi trgovinskih polic, do končnega kupca, v konkretnem primeru nasmejane ženske.

Kot so sporočili iz podjetja Spar Slovenija, je zgornji videoposnetek prvi v seriji oglasov, ki so ga oziroma jih bodo ustvarili s pomočjo umetne inteligence. Videoposnetki so nastali s pomočjo tehnoloških platform Runway 3 in Dream Machine, v sklopu katerih razvijajo napredna orodja za produkcijo generativnih videovsebin, ustvarjalci pa so za končni izdelek uporabili tudi orodja Mid Journey, Krea in Magnific, so pojasnili.

Naštetim orodjem in platformam je bilo v pomoč pri zamišljanju kadrov zgolj nekaj fotografij zunanjosti in notranjosti trgovin Spar, sicer pa je zgornji videoposnetek v celoti ustvarjen po principu pretvorbe besedilo v video, kar pomeni, da umetnointeligenčna orodja strogo sledijo besedilnemu opisu vsebine, ki jo želi v končnem izdelku videti ustvarjalec.

Kot so pojasnili v podjetju Spar Slovenija, so se projekta ustvarjanja umetnointeligenčnega oglasa lotili takoj, ko je bilo jasno, da bodo začele na trg prihajati rešitve za kakovostno produkcijo videoposnetkov prek principa "besedilo v video". Foto: Spar Slovenija

Dobro, a še daleč od popolnosti in tudi dober poligon za prepoznavanje značilnosti umetnointeligenčnih videoposnetkov

Videoposnetek na prvi pogled deluje zelo prepričljivo in bi katerega od gledalcev ob odsotnosti pripisa "Ustvarjeno z umetno inteligenco" v spodnjem desnem kotu morda lahko celo prepričal, da gre za deloma studijski večpredstavnostni izdelek.

Umetna inteligenca ima še vedno velike težave s poustvarjanjem delov človeškega telesa. To je jasno razvidno v tem posnetku dlani, ki sta se ji domnevno skupaj zlila najmanj dva prsta. Foto: Posnetek zaslona / Spar Slovenija

Pozorni gledalci, sploh tisti, ki so se že kdaj srečali ali se poglabljali v umetnointeligenčno produkcijo, bodo sicer hitro opazili podrobnosti, ki so več ali manj značilne za tovrstne videoposnetke (tudi fotografije).

Umetnointeligenčno poreklo videoposnetka tako izdaja več elementov

- Večji napisi oziroma napisi v ospredju so še dobro razločljivi, medtem ko so drugi napisi, na primer v ozadju trgovine ali na etiketah, bodisi nerazločljivi ali napisani v "vesoljščini".

Napis na eni od etiket. Foto: Posnetek zaslona / Spar Slovenija

- Motivi, ki jih videoposnetek izpostavlja, so v večini primerov jasni in brez večjih napak, elementi v ozadju pa so pogosto ali nenavadnih dimenzij, ukrivljeni, na primer hladilniki v trgovini, ali pa nelogični, kot so paradižniki, ki jim padec z roba trgovinskih polic, čez katerega se jasno nagibajo, preprečuje nevidna sila, ali pa jabolka, zložena na policah, ki so dobesedno pogreznjene v tla supermarketa.

Trgovinske police v ozadju razkrivajo, da gre za kader, ki je nastal v domišljiji umetne inteligence. Foto: Posnetek zaslona / Spar Slovenija

- Umetna inteligenca ima občasno še vedno velike težave z reprodukcijo delov človeškega telesa, kar je razvidno tudi v tem videoposnetku, saj dekletu v trgovini lasje rastejo kar skozi uho. V kadru, ki sicer traja le delček sekunde in v katerem ujame padajoče jabolko, je jasno razvidno, da sta najmanj dva njena prsta zlita v enega.

