Nazaj na Siol.net

TELEKOM SLOVENIJE

Srdjan Cvjetović

Ponedeljek,
9. 3. 2015,
11.29

Osveženo pred

6 let, 6 mesecev

Termometer prikazuje, kako vroč je članek. Skupni seštevek je kombinacija števila klikov in komentarjev.

Termometer prikaže, kako vroč je članek. Skupni seštevek je kombinacija števila klikov in komentarjev.

Thermometer Blue Green 3

Natisni članek

Google Larry Page

Ponedeljek, 9. 3. 2015, 11.29

6 let, 6 mesecev

Ali bo Google postal "ministrstvo za resnico"?

Srdjan Cvjetović

Termometer prikazuje, kako vroč je članek. Skupni seštevek je kombinacija števila klikov in komentarjev.

Termometer prikaže, kako vroč je članek. Skupni seštevek je kombinacija števila klikov in komentarjev.

Thermometer Blue Green 3
Google načrtuje razvrščanje zadetkov iskanja po "resničnosti" - kako si oni predstavljajo ta pojem in, kar je še pomembnejše, kako bodo to izmerili?

V svojem nedavnem sporočilu je Google napovedal, da bo zadetke iskanja razvrščal po "kakovosti podatkov spletnih mest" namesto po priljubljenosti spletnih mest, kot to počnejo zdaj. S trenutnim algoritmom PageRank (imenovan po enem od Googlovih ustanoviteljev Larryju Pageu višjo uvrstitev dobijo tista spletna mesta, do katerih vodi več povezav z drugih spletnih mest.

Na prvi pogled všečna misel, ki bo lahko prižgala rdečo luč lažem, trolanju, zarotam in drugim neželenim vsebinam, ki jih na spletu mrgoli, po drugi strani odpira zelo pomembna vprašanja. Med drugim tudi, kako se bo določala "kakovost" in "resničnost" podatkov ter kako zagotoviti nepristranskost oziroma preprečiti predsodke in interese nekaterih (političnih ali gospodarskih) skupin. Kar je morda za nekoga videti zarota, je lahko vsaj včasih povsem legitimno drugačno mnenje. Podatke je preprosto vrednotiti, kaj pa mnenja in stališča? Kot primer, s katerim želijo podpreti svoj nov načrtovani algoritem, navajajo rojstni kraj ameriškega predsednika Obame: spletna mesta, ki napačno navajajo, da se je rodil v Keniji, bodo porinjena nižje, medtem ko bodo tista, ki za njegov rojstni kraj pravilno navajajo ZDA, dobila višjo uvrstitev.

V tako preprostih primerih dvomov ni, a pri bolj zapletenih vprašanjih, kjer ne gre samo za točnost ali netočnost navedbe, temveč tudi za interpretacijo podatkov, se že pojavljajo strahovi, da bo s tem Google hote ali nehote postal cenzor. Zelo pomemben in vpliven, kajti prek Googla potekata dobri dve tretjini vsega svetovnega spletna iskanja, po nekaterih virih celo več.

Washington Post je že zapisal, da je "Google že pred veliko časa prerasel iz preprostega seznama internetnih vsebin v oblikovalca internetne realnosti, ki prispeva k opredeljevanju, kaj vidimo in kako vidimo". Ali sploh kdaj pogledate četrto, peto, šesto … stran zadetkov? Ustanovitelji Googla so v javnosti že močno izražali svoja stališča glede nekaterih perečih vprašanj, kot sta ameriška politika priseljevanja ali podnebje, zato se drugače misleči bojijo, da bi Googlova sprememba načina uvrstitev in njihovo vrednotenje "resnice" in "kakovosti" lahko njihova drugačna stališča potisnila nižje med uvrstitvami.

Saj, kolikokrat greste že zdaj pogledat zadetke na četrti ali peti strani? In kdo jamči, da že zdaj ni posegov v uvrstitve, če bi to nekomu zelo pomembnemu in vplivnemu ustrezalo? V trezorju znanja 2,8 milijarde podatkov Pri Googlu sicer vztrajajo, da je nov koncept razvrščanja zadetkov za zdaj šele eden od več kot sto raziskovalnih projektov letno, a nekaj podrobnosti o novem algoritmu je vendarle znanih. Vrednotenje resnice bo temeljilo na zbirki podatkov, ki so jo imenovali Knowledge Vault (trezor znanja), trenutno pa zajema okrog 2,8 milijarde podatkov iz virov, ki jih imajo za zanesljive.

Poleg uradnih vladnih virov so to zbirke, kot sta Wikipedia in Freebase, ki se polnijo s prispevki množic in se zanašajo na to, da bodo množice poskrbele tudi za točnost navedb. Po navedbah Googlovih strokovnjakov je tako mogoče zanesljivo predvideti merodajnost za 119 milijonov spletnih strani in 5,6 milijona spletnih mest.

Ali bo trezor znanja vedno nepristranski? Nasprotniki predlaganega novega sistema pa so zaskrbljeni tudi zato, ker se bo po vzpostavitvi kakršnegakoli algoritma ta izvajal rutinsko, "s strojem pa ni pogovora", je za Fox News povedal eden od nasprotnikov novosti. Zagovorniki pa so prepričani, da so predlagane spremembe odličen temelj za vzpostavitev sistema relevantnosti in objektivnosti.

Profesor računalništva na univerzi Maryland Jim Purtilo je za FoxNews.com povedal, da predlagani Googlov algoritem poleg odpiranja vrat za politično pristranskost lahko tudi upočasni splošni znanstveni napredek, ker bo s takim vrednotenjem težje izzivati ali celo nasprotovati konvencionalno sprejetim idejam in stališčem. "Tako bo mladim pametnim ljudem težje uresničiti naslednjo znanstveno revolucijo – ne pozabimo, da je večina danes uveljavljene znanosti nastala zato, ker je nekdo izzival čredno mentaliteto preteklosti," je še povedal Purtilo. Emergent preverja govorice (večina so prevare) Trenutni sistem razvrščanja zadetkov iskanja omogoča visoko uvrstitev tudi vsebinam z napačno vsebino, če je to všeč velikemu številu ljudi. Zato so se razvila orodja, ki uporabnikom pomagajo pri ločevanju kakovostnih vsebin od tistih, ki to niso.

LazyTruth je razširitev brskalnika, ki pregleduje dohodno elektronsko pošto in izloča lažna elektronska sporočila, Emergent, ki so ga razvili na oddelku za novinarstvo priznane newyorške univerze Columbia, pa zbira govorice iz "rumenih" virov, nato jih primerja z drugimi viri ter na podlagi teh primerjav opredeli kot verjetne ali nesprejemljive.

Ne spreglejte