Lucija Mulej: Slovenija, dežela srečnih volivcev – ali razočaranih državljanov?

Vračajo se Rusi in Belorusi

Carlsen šestič svetovni prvak v pospešenem šahu

Sreda, 13. 12. 2017, 18.30

8 let

AlphaZero: Poraz in zmaga razuma

Avtor:
Žiga Turk

Termometer prikaže, kako vroč je članek.

5,50

Umetna inteligenca | Foto Thinkstock — Foto: Thinkstock

Že več kot dvajset let računalniki premagujejo najboljše šahiste na svetu. Brez težav. Do prejšnje srede smo se lahko tolažili s tem, da so boljši, ker so jih pač ljudje dobro sprogramirali in opremili s šahovskim znanjem človeštva. Tisto sredo pa se je Googlov računalniški program, imenovan Alpha Zero, naučil igrati šah.

V 24 urah se je sam naučil igrati bolje od vseh ljudi in od vseh računalniških programov. Že prej se je sam naučil igrati go in japonski šah. Ko sem bral novice o tem, sem dobil kurjo polt. Za ljudi se je svet 6. decembra za vedno spremenil. Med nami so stroji, ki nas premagujejo v tistem, kar je najbolj človeško – intuiciji.

Kraljeva igra

Šah dobro igrajo pametni ljudje. Ko je šahovski računalnik Deep Blue leta 1996 z rezultatom 4:2 premagal Garija Kasparova, smo dobili prvo opozorilo, da računalniki in roboti ne ogrožajo samo rutinskih, preprostih poklicev, ampak tudi tiste, ki so menda rezervirani za najpametnejše. Ker se groba računska moč računalnikov po Moorovem zakonu vsako leto ali dve podvoji, človek ni imel več nobene možnosti, da si povrne naslov. Računalniki so čedalje hitrejši, človeški možgani pa taki, kot so bili pred sto tisoči let. Na vprašanje, kakšno strategijo bi ubral proti računalniku, je neki velemojster odgovoril, ''prinesel bi kladivo''.

Šahovski računalnik Deep Blue je leta 1996 z rezultatom 4:2 premagal Garija Kasparova, Foto: Reuters

Šahovska prvenstva so poslej imela kategorije za računalnike in za ljudi. In še eno, prosti (freestyle) šah, v kateri so sicer med seboj tekmovali ljudje, a so si pri tem lahko poljubno pomagali z računalniki. Izkazalo se je, da take ekipe igrajo najboljši šah – ko si človeška intuicija pomaga z grobo analitično močjo stroja.

Tudi zaradi uspešnosti sodelovanja človek-stroj sta nas Erik Brynjolfsson and Andrew McAfee z uspešnicama 'Race Against the Machine' in 'Second Machine Age' pomirjala, da nam stroji, roboti in umetna inteligenca le ne bodo uničili vseh služb (prosti vir). Garij Kasparov nas je miril, naj se inteligentnih strojev ne bojimo, ampak naj z njimi sodelujemo (vir).

Pomirjujoče za človeški ego je bilo tudi dejstvo, da je vse, kar so računalniški programi znali, človeško znanje, ki so ga v programe vgradili ljudje: koliko je vredna kakšna figura, koliko je vredno obvladovanje tega ali onega dela šahovske deske, kako mojstri že stoletja igrajo otvoritve, kakšne zakonitosti veljajo v končnicah (vir). Na osnovi teh izkušenj, ki so jih šahisti nabirali tisočletja, računalniški programi potem preizkušajo različne poteze. Slabši programi na počasnejših računalnikih manj potez naprej, boljši več. A vendar ne posebej globoko v prihodnost, ker število pozicij, ki jih je treba preračunati, narašča eksponentno.

Premagani v naši igri

Ljudje igrajo drugače. Seveda v glavi preračunavajo mogoče naslednje poteze. Katere velja premisliti, jim pove intuicija, občutek.

Moralne intuicije smo v veliki meri podedovali, številnih drugih pa se naučimo. In ustvarjeni smo tako, da se spodbujamo k učenju. Otroku se zdi zelo zabavno, ko nekaj izpusti, da pade na tla. Morda zaropota, morda se razbije, morda se na grozo staršev razlije po tleh. In otroku je vse to neskončno smešno. Smeh je nagrada za spoznanje, da se zgodi, kar je pričakoval. Da če nekaj izpustiš, ne ostane v zraku, ampak pade na tla. Otrok ne razume Newtonovih zakonov, oblikoval pa je intuicijo, da stvari padajo na tla. Pristop je v umetni inteligenci znan kot 'spodbujevalno učenje'.

Podobno se je Alpha Zero učil šaha (poljudni vir, znanstveni vir). Igral je sam s sabo. Najprej je vlekel poteze popolnoma naključno. In potem se je naučil, da nekatere vodijo k zmagi, druge k porazu. Večkrat ko se nekaj izkazalo za pot k zmagi, bolj se je utrdilo 'znanje', da je ta poteza dobra. Po 24 urah se je naučil igrati bolje od vseh drugih programov. Do tedaj najboljši šahovski program Stockfish je premagal z rezultatom 28:0 ob 72 remijih.

Heker, računalnik | Foto: Thinkstock Foto: Thinkstock

Program Stockfish analizira 70 milijonov mogočih potez na sekundo, Alpha Zero pa samo 80 tisoč. In zmaguje, ker ima boljši 'občutek za to', o čem velja razmisliti in o čem ne. Občutek je tisočkrat vrednejši od grobe sile in pravil.

Zmaga občutka

Uspeh programa Alpha Zero je zmaga občutka, intuicije nad razumom, nad tistim znanjem, ki ga pospravimo v pravila, algoritme in formule; nad tistim razumom, zaradi katerega Descartes pravi: ''Mislim, torej sem.'' In za katerega se je Hayek pritoževal, da je človeštvo žrtev ''netolerantnega in popadljivega racionalizma'' (vir).

Tudi ljudje se zelo dobro in zelo hitro odločamo po občutku. Ampak zapletene težave po občutku dobro rešujejo samo geniji, s pomočjo pravil in receptov pa tudi telebani, ki znajo vstavljati spremenljivke v formule. Zato skozi celotno izobraževanje mladini razlagamo pravila in recepte. In ob tem, žal, ubijamo intuicijo. Modremu človeku ne verjamemo, če ne zna pojasniti, zakaj je tako. Hočemo vedeti količnik, zaradi katerega je poteza 'kraljica na D4' boljša kot 'skakač na B5'.

Je na potezi kraljica ali skakač? Foto: Vid Ponikvar

Težava z občutki je, da jih ne znamo pojasniti. Ali pa, da si pojasnilo izmislimo. Spet to najlepše opazujemo pri otrocih, ki so izjemno ustvarjalni, ko si izmišljajo pojasnila (vir). Če znamo nekaj pojasniti, se počutimo bolj varno. Pretvarjamo se, tako Haidt (vir), da jezdec racionalne zavesti upravlja slona intuicije, v resnici pa samo poskuša pojasniti, zakaj se je slon tako odločil.

Čudoviti novi svet

Prihaja čas, ko nam bodo stroji znali nekaj svetovati, a ne bomo vedeli, zakaj je to za nas dobro. Enake postopke samoučenja kot za šah je namreč mogoče uporabiti za diagnosticiranje bolezni, zdravljenje raka, upravljanje avtomobilov in letal, sestavljanje urnikov, nakup delnic, usmerjanje evropskega denarja, določanje minimalne plače …

Računalniku smo sposobni priznati, da je nekaj prav izračunal, če vemo, zakaj se je tako odločil. Bi bili pripravljeni sprejeti odločitev, ki je ne zna pojasniti? Recimo, da je ocenil vrednost vaše nepremičnine za potrebe prihajajočega davka na nepremičnine. 'Po občutku' to naredi točnejše kot po formulah, ki so jih spisali na Dursu. Bi tisto oceno sprejeli? Verjetno ne. Naslednja naloga zato je, da se bodo računalniki naučili pojasnjevati svoje odločitve. Nikoli ne bomo vedeli, ali so se res odločili 'zato' ali pa to samo pravijo, da bi bili mi s tem zadovoljni. To odpira skoraj teološko debato, namreč, ali svet 'res' funkcionira po pravilih, kakršna je naša znanost odkrila, ali pa je znanost samo iznašla način, ki pomiri našo željo po predvidljivosti sveta.

In vendar

In vendar je Alpha Zero zmaga razuma. Nastal ni po občutku. Mu je pa uspelo, ker celotna veja raziskav na področju umetne inteligence že dolgo verjame, da inteligenca ni samo tista logična in racionalna. Nanjo včasih pozabljamo in njo je Einstein mislil, ko je rekel: ''Edina res vredna stvar je intuicija.'' No, zdaj so nas računalniki ujeli tudi tukaj.

Le kdo se danes smeje? Mi Einstenu. Na žalost. Foto: Thomas Hilmes/Wikimedia Commons