Nazaj na Siol.net

TELEKOM SLOVENIJE

Srdjan Cvjetović

Četrtek,
3. 10. 2013,
19.37

Osveženo pred

1 leto, 2 meseca

Termometer prikazuje, kako vroč je članek.

Termometer prikaže, kako vroč je članek.

Thermometer Blue 2

Natisni članek

Natisni članek

Srdjan Cvjetović

Četrtek, 3. 10. 2013, 19.37

1 leto, 2 meseca

Statistične prevare

Srdjan Cvjetović

Termometer prikazuje, kako vroč je članek.

Termometer prikaže, kako vroč je članek.

Thermometer Blue 2

Z zlorabo statistike je, tako v naravoslovju kakor tudi v družboslovju, mogoče dokazati karkoli. Predvsem tisto, kar naročnik (beri: plačnik) želi in pričakuje.

Statistika je zelo natančna veda, ki temelji na vsaj enako natančni vedi – matematiki. Zakaj so potem ugotovitve tako natančne vede lahko (nenamerno, morda celo bolj pogosto namerno) napačne ali tendenciozne?

Preprosteje povedano, kako lahko enake statistične sklepe diametralno nasprotno misleče strani argumentirano tolmačijo vsaka v svoj prid?

Ali poznamo to, kar merimo?

Začne se že pri tem, ali to, kar ugotavljamo, sploh poznamo do te mere, da vemo, kateri dejavniki in v kakšni meri na to vplivajo.

Primera iz naravoslovja: koliko so podnebna gibanja odvisna od nihanja številnih naravnih pojavov, koliko pa od posledic človeškega dejanja; koliko na manjšanje površine gorskih ledenikov vplivajo toplogredni plini, koliko pa sajasti delci in/ali kaj tretjega.

Primera iz družboslovja: kaj in do kakšne mere so poglavitni vzroki, da so volilne udeležbe vedno nižje; kateri dejavniki in v kakšni meri vplivajo na ceno nepremičnin v Sloveniji (pri čemer bi pričakovali, da za Ljubljano veljajo druga merila kot na primer za Prekmurje)?

Naročnik (beri: plačnik) neke raziskave v odsotnosti zanesljivih meril lahko poudari tiste dejavnike, ki so njemu v prid, in temu primerno zajema podatke. Kaj je s tem mogoče narediti (morda bi moral napisati prirediti), je zelo slikovito povedal eden od največjih matematikov prejšnjega stoletja John von Neumann: "Če v funkciji lahko spreminjam štiri parametre, lahko njeno krivuljo prilagodim obliki slona, s petimi parametri pa bo ta slon celo migal z rilcem."

Ali merimo objektivno?

Naslednja siva cona je zajem podatkov – ali je to, kar merimo, sploh to, kar želimo meriti.

Z vsako meritvijo merjeni sistem zmotimo in ta ni več enak sistemu pred začetkom merjenja. Meritev je veljavna le, če je ta motnja neznatna.

Primer iz naravoslovja: če potopimo termometer v veliko posodo z vodo, ki vre, bo ta pokazal približno 100 stopinj Celzija (zanemarimo vplive zračnega tlaka), a če termometer potopimo v naprstnik z vrelo vodo, bo ta pokazal več deset stopinj manj – in ne bo kazal narobe. Vnos termometra je namreč v obeh primerih spremenil merjeni sistem, saj je vrela voda začela ogrevati razmeroma mrzel termometer. V veliki posodi je bilo vrele vode dovolj in se zaradi ogrevanja termometra ni zaznavno ohladila, a v naprstniku je bilo vrele vode malo in se je ta ob vnosu termometra bistveno ohladila, preden se je temperatura vode izenačila s temperaturo termometra.

Nič ni bilo narobe s termometrom, kajti on vedno odraža temperaturo svojega tipala, ne pa zraka, vode ali česa drugega, a je bila druga meritev nesporno neveljavna.

Podobno lahko razmišljamo pri družboslovnih meritvah: ni vseeno, ali smo anketiranca zbudili iz postelje, dobili, ko se mu kam mudi ali ko ga je kaj drugega spravilo v pretirano slabo (ali dobro voljo) …

Tu pravzaprav še manj vemo, koliko merjenje (anketiranje) zmoti resnično stanje in ali bi v kakih drugih okoliščinah in v drugem trenutku isti anketiranec na ista vprašanja odgovarjal popolnoma drugače.

Ko nevšečni podatki preprosto izginejo

Med še tako pravilno zajetimi podatki so vedno tisti, ki ne ustrezajo tistemu, kar naročnik (beri: plačnik) želi dokazati. Take podatke je najlažje pozabiti oziroma izgubiti oziroma ne upoštevati.

Primer iz naravoslovja: odvisno od tega, kako širok razpon in katero obdobje temperaturnih podatkov upoštevamo, je krivulja lahko zelo različna in je mogoče dokazati karkoli od kataklizmičnega ogrevanja do dramatičnega ohlajanja (vztrajanje na premici oziroma linearni odvisnosti pri zapletenih naravnih pojavih pa je tudi zanimiv način manipulacije).

V družboslovju je še lažje: preprosto izgubiš odgovore tistih, ki niso zaželeni. Tako pridemo do tistih navedb v oglasih, da je nekaj dokazano na 99 odstotkih vprašanih. Seveda, zaželenih vprašanih, a tega ne povedo.

Relativnost tolmačenja

Čeprav nisem še niti približno izčrpal možnosti za "kreativen zajem in obdelavo podatkov", moram omeniti še tisti spin, ko pride na vrsto na samem koncu: kreativno interpretacijo podatkov, ki učinkuje še na tako nespornih dejstvih.

Vzemimo primer iz športa: tekmujeta A in B (samo onadva), pri čemer A zmaga. Poročilo, naklonjeno A-ju, bo zapisalo, da je A triumfalno zmagal, medtem ko je bil B zadnji, tisto, naklonjeno poražencu, pa bo zapisalo, da je bil A predzadnji, medtem ko je B zasedel odlično drugo mesto. Morda malo za lase prevlečeno, a vendarle: vse je res, sporočili pa sta bistveno drugačni. Oba naročnika (beri: plačnika) zadovoljna.

Ne spreglejte