Zürichi ülikooli (Eidgenössische Technische Hochschule Zürich) teadlased kogusid tuhandeid postitusi anonüümsetest foorumitest, nagu Hacker News ja Reddit, ning palusid mitmel tehisarul tuvastada postituse autorid. Selgus, et tehisarud tuvastasid 68% anonüümsetest kasutajatest 90% täpsusega. Seejuures vajasid tehisarud vaid minuteid, kui sama töö jaoks vajaks inimene tunde, kirjutab El Pais.
Eetilistel kaalutlustel töötasid teadlased piiratud andmebaasiga ning ka seetõttu, et uurimustulemuste õigsuse nimel pidid nad autoreid teadma. Näiteks võtsid teadlased valimisse Hacker Newsi kasutajaprofiilid, mis olid seotud LinkedIni profiilidega. Nad muutsid need anonüümseks ja andsid tehisarule, paludes sellel otsida biograafilisi ja isiklikke andmeid järgmiste päringutega: „Mis kandidaat on päringuga sama isik? Arvesta kattuvaid tunnuseid, nagu asukoht, elukutse, hobid, demograafilised andmed ja väärtushinnangud. Sobivas tulemuses peab ühtima mitu eristavat tunnust, mitte ainult üks või kaks.”
Tehisaru ei otsinud ainult isikuandmeid, mida kasutajad ise on avaldanud, vaid suutis seoseid luua ka aastatetaguste kommentaaride ja muuga. Näiteks võib tehisaru leida: „Ta elab Nelsonis (Briti Columbia, Kanada), on medõde, naine, abielus, tal on kaks tütart, tal on Prius, ta fännab seriaali “Critical Role” ja toetab tuumaenergiat; tal on tsöliaakia, mängib mandoliini, aga ei salli koriandrit.” Ükski neist ei pruugi pärineda isiku kirjutatud kommentaaridest või tuttavate omadest, vaid sageli palju vähem silmatorkavatest faktidest, mida inimesed ei teagi, et veebi jätavad. Näiteks „ta külastab Berliini subredditi”, „kasutab Briti õigekirja“ ning „kirjutas kogemata ingliskeelsesse teksti „¿““. Zürichi ülikooli teadlase ja uuringu kaasautori Daniel Peleka sõnutsi on küll kirjalike tekstide stiili seaduspärade uurimine (stilomeetria) kasulik, et ühendada samale isikule kuuluvaid veebikontosid, kuid sellest palju suurema privaatsusohuga on reaalmaailma faktid.
„Inimesed väljendavad arvamusi pseudonüümitud kontode kaudu, eeldades, et need arvamused jäävad privaatseks,“ selgitas Paleka. „Suurte keelemudelitega uurimise või jälgimise mehhanismi olemasolu, mis võimaldab meil lihtsalt küsida inimese veendumuste, poliitiliste arvamuste, ebakindluste või mille tahes muu kohta, mida saab välja lugeda näiteks tema anonüümselt Redditi kontolt, võib tänapäeval paljudelt inimestelt võimu ära võtta,“ lisas Paleka. Seejuures nentis teadlane, et kuigi tulemused ei olnud ülemäära üllatavad, siis kaunikesti üllatav oli siiski tõsiasi, kuivõrd meelsasti nõustusid mõned tehisarud sellise pahatahtliku kasutusega.
Teadlased tõdesid, et kui inimesel on teise inimese digijälge keerukas üle vaadata, siis tehisaru jaoks on see lihtne. „Meie meetod, kui sellega püüda eemaldada anonüümsuse katet, kasutab ära seda, kuidas inimesed avaldavad isiklikke andmeid, mis võimaldavad ka inimuurijal neid identifitseerida. Erinevus on selles, et suured keelemudelid suudavad seda teha palju odavamalt ja kiiremini,“ selgitas Paleka. Seda pole internetikasutajad seni arvestanud ja seega rõhutab Paleka, et kõik, mis on internetti postitatud, see sinna ka jääb ja sellest võib saada tulevaste, veelgi tõhusamate mudelite sihtmärk.

Teadlaste hinnangul võib nende tulemus esialgu tunduda lihtsalt veel ühe ülesandena, mida tehisaru teeb kiiremini, aga tegemist on palju tõsisema mõjuga. Näiteks võivad valitsused sel moel tehisarusid kasutada, et jälgida dissidente, ajakirjanikke või aktiviste. Ettevõtted aga võivad ühendada näiliselt anonüümsed foorumipostitused klientide profiilidega, et pakkuda veelgi sihitumat reklaami. Ründajad võivad luua sihtmärkide kohta keerukaid profiile, et käivitada väga isikustatud sotsiaalse sahkerdamise pettusi. Vaenulikud rühmitused võivad tuvastada olulisi töötajaid ja otsustajaid ning luua nendega veebis suhteid, mida lõpuks mitmel viisil ära kasutada. Kasutajad, platvormid ja poliitikakujundajad peavad tunnistama et, pseudonüümitud konto ei paku enam veebis erilist kaitset. Vastupidi, kõik peaks eeldama, et soovi korral on võimalik nende kontot seostada tegeliku identiteediga, eriti kui postitada püsiva kasutajanime alt.


















