Sreda, 28. 5. 2014, 13.50
6 let, 6 mesecev
Jure Leskovec, predavatelj na Stanfordu: Zasebnosti ni ne na vasi ne na internetu (video)
dr. Jure Leskovec je po diplomi na Fakulteti za računalništvo in informatiko Univerze v Ljubljani leta 2004 v želji po novih znanjih odpotoval v ZDA, kjer je leta 2008 doktoriral na univerzi Carnegie Mellon v Pensilvaniji, podoktorski študij pa nadaljeval na univerzi Cornell v zvezni državi New York. Od leta 2009 je docent na eni najbolj znamenitih ameriških univerz, na univerzi Stanford v Silicijevi dolini, kjer množice študentov navdušuje nad računalništvom. Obenem v množici nepreglednih podatkov na spletu odkriva nove zakonitosti človeštva in družbe.
Po treh desetletjih obstoja je internet postal sestavni del našega vsakdana. Tako na internetu danes mrgoli na milijarde različnih in predvsem nepreglednih podatkov. Na stotine milijonov uporabnikov na internetu za seboj pušča digitalne sledi in s tem odpira vrata v svojo zasebnost. Med temi podatki se zelo dobro znajde in celo uživa računalniški strokovnjak dr. Jure Leskovec, ki z njihovimi analizami ponuja odgovore o delovanju družbe.
Kot strokovnjaka za računalniške študije vas zanimajo predvsem nepregledne množice podatkov na internetu. S kakšnimi analizami konkretno se ukvarjate? Predvsem nas zanimajo internet in informacijske tehnologije kot senzor v človeški vsakdan. Vprašanje je, kakšne nove meritve in odkritja so mogoča z uporabo takega senzorja. Informacijske tehnologije uporabljamo kot neke vrste teleskop za preučevanje tako posameznika kot celotne družbe. V zadnjem letu smo se osredotočili na dve zanimivi zadevi. Ena, relevantna tudi za slovenski prostor, je vedenje uporabnikov na spletnih forumih. V sodelovanju s CNN in še nekaterimi drugimi mediji v Ameriki smo opazovali vedenje uporabnikov, ko komentirajo članke ter drug drugemu dajejo pluse in minuse. Preučevali smo trole (neolikane uporabnike, ki razbijajo diskusijo, op. a.) in ugotovili, da je edina obramba proti njim ignoranca, vse preostalo trole samo še bolj podžge.
Trenutno v sodelovanju s Facebookom raziskujemo viralnost na spletu, kdaj članki, slike in videi postanejo viralni in se začnejo hitro širiti na socialnih omrežjih. Delali smo tudi računalniške sisteme, ki samodejno optimizirajo viralnost zgodbe v smislu, kdaj in kako bi jo napisali ter kje bi jo objavili, da bi bila čim bolj odmevna na spletu. Zgodbe, ki jih je optimiziral naš sistem, so bile v povprečju trikrat uspešnejše kot tiste, ki so jih objavili ljudje.
Kako lahko spodbudimo viralnost zgodbe? V povprečju zelo majhen delež vseh zgodb na spletu in na socialnih omrežjih postane viralnih. Nas je zanimalo predvsem to, ali je mogoče napovedati, ali bo nekaj postalo viralno ali ne. Pomen viralnosti se namreč spreminja skozi čas. Na začetku je zelo pomembno, kdo je začetnik zgodbe, ko je zgodba starejša, pa je pomembno, po kakšnem delu socialnega omrežja se razvija, hitrost in struktura razvoja. Vse te značilnosti skupaj nam na koncu povedo, kako uspešna bo zgodba.
Kako dobite podatke, ki jih analizirate, in ali ste v študije že vključili tudi slovensko spletno družbo? Podatke dobimo v sodelovanju s podjetji. S Facebookom imamo zelo dober odnos, delamo skupaj z njihovimi raziskovalci. Pri tem se ukvarjamo z anonimnimi podatki na njihovih računalnikih, tako da ti nikoli ne zapustijo samega Facebooka. Med drugim delamo tudi s Twitterjem, Boeingom, Volkswagnom in zavarovalnico Swiss Re. Z vsakim od teh podjetij najdemo skupen jezik glede projekta, ki rešuje realen problem, a je hkrati tudi dovolj zahteven in znanstveno zanimiv. Reševanje realnih problemov, za katero so podjetja pripravljena plačati, je najboljši recept za dobro in odmevno znanost.
S slovenskimi podjetji se trudimo sodelovati, a je težava običajno, kot že vsi vemo, v tem, da je zelo veliko birokratskih ovir, sporazumov in razne papirologije. Na koncu je žal tako, da je veliko lažje delati s CNN, kjer se po približno eni telekonferenci in dveh elektronskih poštah vse dogovoriš in se stvari naredijo. Lažje je delati s tujci kot s Slovenci. Žal je to treba reči.
Na enem izmed predavanj ste dejali, da rudarjenje po mrgoleči množici podatkov na spletu ponuja nove priložnosti v znanosti in industriji. Kakšne? Priložnosti je nešteto. Nekaj primerov naših trenutnih industrijskih projektov: Boeing zanima, kako ugotoviti, kaj se bo na letalu pokvarilo, še preden se to res zgodi. Z analizo zgodovinskih podatkov o delovanju letal lahko najdemo vzorce, ki se pojavijo, preden nekaj na letalu odpove. Zavarovalnico Swiss Re zanima, kako naj najbolje ocenijo tveganje in sprejmejo boljše poslovne odločitve, kaj zavarovati in kaj ne. Volkswagen sodeluje z nami, ker jih zanima, kako bi se spremenila voznikova izkušnja, če bi bil avtomobil povezan z internetom.
Na drugi strani pa veliko sodelujemo tudi s preostalimi fakultetami. Z medicinsko fakulteto na Stanfordu na primer preučujemo zdravstvene kartoteke več kot deset milijonov ljudi, da bi ugotovili, kako neka bolezen napreduje skozi različne faze ali stopnje. S pravno fakulteto trenutno analiziramo dva milijona sodnih primerov in modeliramo odločitveni proces sodnikov, to, kdaj delajo napake, ter jim pomagamo, da bodo sprejemali boljše odločitve. Zanimivo je, da so sodniki v ZDA glede tega presenetljivo odprti in želijo sistem preizkusiti tudi v praksi.
Računalniška analiza podatkov skratka pronica v vse veje, v industriji je že globoko zasidrana, zdaj prihaja še v znanost.
Pravite, da je internet senzor v človeška življenja. Kaj nam ta lahko pove o delovanju družbe? Imamo neki nov "teleskop", ki ga prej nismo imeli in s katerim zelo natančno vidimo in merimo stvari, ki so okrog nas že od pamtiveka, a so bile prej "nevidne". Naše vedenje pa napreduje takrat, ko nevidno postane vidno. Tako je v astronomiji in fiziki, pa tudi družboslovju in humanistiki.
Ta novi teleskop je uporaben tako za temeljne raziskave na eni strani kot tudi zelo uporabne in komercialne študije na drugi. Na primer razumevanje, kako ljudje uporabljajo internet, kako iščejo informacije, kako stopajo v stik drug z drugim, kako pomembno je to za oglaševanje in za predstavitev vsebin, ki ljudi zanimajo, za personalizacijo in prilagajanje vsebin vsakemu posamezniku, ki so mu zanimive, in tako naprej.
Čeprav si življenja brez spleta ne znamo več predstavljati, smo se z njim dobesedno razgalili, saj vse, kar počnemo, pusti digitalni pečat. Lahko v tem pogledu sploh še govorimo o zasebnosti? Saj na vasi tudi ni nobene zasebnosti več, pa ljudje še vedno živijo tam. Na spletu zasebnosti ni, je pa anonimnost. To je pogosto dovolj. So pa stvari zasebne v tem smislu, da ljudje ne vedo, kdo ta oseba je. To ni nekaj, kar bi bil velik problem. Mislim, da je na internetu več zasebnosti, kot je je v realnem življenju, na vasi, v mestu, kjerkoli. Povsod vas ljudje vidijo, in če vam hoče kdo slediti, vam lahko tudi v mestu, pa so stvari še veliko bolj strašljive kot na internetu.
Na internetu se namreč zasebnost v veliki meri rešuje z anonimnostjo, ko poznamo le akcije posameznika, ne vemo pa, kdo to je. Sicer pa je bolj kot zasebnost na internetu težava varnost podatkov. V Ameriki namreč velikokorat slišimo, kako so razna podjetja izgubila številke kreditnih kartic svojih kupcev in podobno.