Internet

Falske spor i Søgeland

Google Yahoo og MSN glemmer aldrig dine elektroniske spor. Men et lille program narrer alverdens søgemaskiner og sikrer brugernes privatliv.

Iphone og Facebook. Ifølge Google Zeitgeist er det to af de mest søgte ord på nettet i hele verden lige nu. Og det er helt sikkert. Tallene er uimodsigelige og Google Zeitgeist har flotte grafer og hitlister over stort set alting fra showbusiness til teknologi. Det er den slags oplysninger som Google lever rigtig godt af at være i besiddelse af. Når firmaet ved den slags, er det fordi vi brugere søger, og fordi Googles servere ikke glemmer. Google, Yahoo og MSN husker som elektronisk elefanter og den hukommelse er guld værd. Både for annoncørerne og for de firmaer, der køber sig ind til detaljerne. Men måske er Googles harddiske ikke længere helt troværdige. 330.000 net-brugere har nemlig installeret et program, der forvirrer søgemaskinerne, så de ikke ved, hvad vi egentlig søger efter. Formålet er at sikre brugernes privatliv.

Modstandsbevægelse
Programmet hedder TracMeNot, TMN, en plugin til Firefox-Browsere, som PROSAbladet allerede har omtalt i et tidligere nummer. Siden da har vi talt med idekvinden bag, professor Helen Nissenbaum fra New York University, og fået indsigt i dele af en endnu ikke offentliggjort rapport, hun og programmøren Daniel C. Howe har skrevet om programmet.

- Det bekymrende er, at ingen af de firmaer har særligt klare regler for, hvad der sker med de data de gemmer. At vores personlige profil er i hænderne på firmaer, der ikke kan eller vil fortælle, hvad de gør med dem, siger Nissenbaum.

TrackMeNot, TMN, er skabt som et værktøj til en modstandsbevægelse mod profilering. Og modsat andre privatlivs-teknologier arbejder det ikke med at kryptere data eller ved at skjule søgerens IP-adresse.

Falske og sande søgninger
TMN er skrevet i Javascript, C++ og XUL og er designet til at gemme brugerne bag en strøm af afledningsøgninger. TMN hugger ord og sætninger fra internettet, føjer dem til en liste af ord, der allerede indgår i programmet fra begyndelsen, blander det hele med resultater fra brugernes egne søgninger og sender det til de søgemaskiner, som man selv har valgt fra TMNs menu. Det kan virke absurd og dumt at blande brugernes egne søgninger ind, når man nu netop vil undgå at blive registreret, men der er faktisk en mening med det. De store søgemaskiner kan nemlig hurtig finde ud af at sortere i helt falske data. Men det bliver meget, meget svært, hvis der er et vist mål af sandhed i det hele. For at gøre det hele endnu sværere for søgemaskinerne, sender TMN ikke sine søgeord ud hele tiden. Programmet venter pænt til brugeren selv laver en rigtig søgning og dækker den så med en salve af andre, tilfældige kriterier.

Ingen tabuord
Nissenbaum og Daniel C. Howe har tænkt meget over, hvordan TMN kan forvirre uden at vække mistanke, uden at kunne beskyldes for at være et DDOS-angreb eller et program, der generer spam. Frem for alt må det ikke tage for meget båndbredde og gøre brugernes computere langsommere. Men der er også andre hensyn, de har været nød til at tage. I USA taler man om "HOT KEY"-søgning. At man søger på ord eller begreber, der kunne antyde, at man var terrorist, politisk aktivist, led af HIV eller var stofmisbruger, kort sagt alle de emmer, der er tabu for de fleste. Oprindeligt mente Nissenbaum og Howe, at der burde være en række "HOT KEY"-søgeord indbygget i TMN, netop som en slags røgslør. Men det brød brugerne sig bestemt ikke om. For ud over HOT KEYS, har amerikanerne også et andet begreb: "NSFW"-søgninger, Not Safe For Work. Som en bruger skrev:

- Jeg har lige opdaget, at et af de søgekriterier TMN har genereret er "Free Russian Porn Boys". Jeg kan godt forstå ideen bag TMN, men hvordan passer det med at min IP-adresse bliver set i sammenhæng med bøsse-porno? Hvis min arbejdsgiver loggede det her, ville mit job være i fare!

Howe og Nissenbaum valgte derfor at sortere HOT KEY ord fra og i stedet bruge en liste over almindeligt, ofte søgte udtryk på nettet, ord som Britney Spears, Nintendo og så videre.

Ingen gratis frokost
Nissenbaum og Howe ser deres program som et stykke politik. En meddelelse til søgemaskinerne om, at de skal spille med åbne kort og klargøre, hvori den virkelige handel består. For: "Theres no such thing as a free lunch", som et kynisk amerikansk mundheld lyder. Selvom det ser sådan ud. For ud over søgemaskinerne bruger vi MySpace, Facebook og YouTube, mens vi bilder os ind, at det er gratis. Vi gør det for at få nye venner, for at netværke og interagere med andre. Vi siger til hinanden, at det er en ny tid, og at det vel ikke betyder noget, at firmaerne bag i princippet ejer alt hvad vi skriver og tager billeder af.

- Det, der lægges på for eksempel Myspace kan deles med andre firmaer. Det tror jeg ikke en 16-årig er klar over, og hvad er Myspace så er det et sted, hvor man finder venner eller et sted, hvor vi profileres for penge? Vi er nødt til at holde øje med, om der langsomt kryber uretfærdigheder ind i systemerne, siger Nissenbaum.

Om Google har lavet en modstrategi er uvist, men kampen mellem de to interesser vil fortsætte.

Sådan virker det
Ordene herover er den liste af ord, som TMN fødes med, når man installerer det som plugin til sin FIREFOX-browser.

fashion, tv guide, barbie, neopets, bit torrent, xbox, angelina jolie, nintendo, jennifer lopez, jennifer aniston, local weather, anime, jokes, recipes, music lyrics, games, iraq, global warming, north korea, hillary clinton, barack obama, dick cheney, zodiac, music and lyrics, bone cancer, lena katina, iran, canada, veronica mars, lost, the constitution, valerie plame, karl rove, halliburton, Iceberg, global warming, world map, earth day, southern cross, spiderman 3, 300 movie, borat, shrek, bill of rights, ghost rider, Hawaii, dubai, mexico, freedom of speech, Chelsea, London, kurt vonnegut, shaha riza, yuri Gagarin, knut, Virginia tech, wellness, copyright law, health, yoga, fishing, golf, Israel, Syria, Iraq, Pakistan

Ordene skiftes ud undervejs, som man søger sig gennem nettet, idet TMN tager fraser og ord ud af de søgninger, man selv har lavet, og blander med ordlisten.

Howe og Nissenbaum kalder det for "Dynamic Query-Lists", og efter et stykke tid ser ens ordliste måske sådan her ud:

Turning carbon dioxide into fuel, Online Student Services, free essential software, business globalization solutions, National Pasta Association, Share your life with friends, Demand Financial Suite, este calitatea produselor, Chicago Symphony Orchestra, This film contains violence, Expects below Average, Emergency Contact, bodies have been established, residential real estate, American Heritage Month, Manhattan Athletic Club, healthcare support occupations, people cannot realize their dreams, green chemistry breakthroughs, Free online versions, Also find tools, Hope Press Releases Archive, Winamp Media Player, KRICE Kuali Rice

grafik

TMN søger ikke hele tiden. Et Real-time-Search-Awareness modul checker hver udgående forespørgsel fra browseren og sætter TMN igang med at udføre sine egne søgninger samtidig, hvorved en bevidst søgning "drukner" i flere tilfældige andre. TrackMeNot er gratis og Open Source under Creative Commons License(cc2007) og kildekode følger med, når man downloader programmet fra mrl.nyu.edu/~dhowe/trackmenot/



LINKS:
GOOGLE ZEITGEIST: prosa.dk/link/33

New York Times artikler
om profilering:
prosa.dk/link/34