– Gør du grin med mig? Vil I have en computer til at spille Jeopardy!? Det var sommeren 2010, og Ken Jennings lyttede med vantro til stemmen i den anden ende af telefonen.
Men da den 36-årige programmør og Jeopardy!-rekordholder med 74 sejre i træk lidt efter lægger røret på, har han sagt ja til et projekt, der vil skrive computerhistorie: Et spil Jeopardy! med verdens klogeste computer.
Datoen bliver sat til januar 2011, og resultatet af kampen skulle senere blive udlagt som et bevis på, at teknologiudviklingen bæres frem med en kraft, der i løbet af få år vil skabe kunstig intelligens så ægte, at den ikke kan skelnes fra den menneskelige. Med forfatteren, opfinderen og erhvervsmanden Ray Kurzweils ord skulle Watson vise sig som et "slående eksempel på computernes voksende evne til at overtage egenskaber, der ellers skulle være unikt menneskelige".
Sproglige finurligheder
Fra IBM's side var alle sejl sat til. I fire år havde David Ferruci og hans team arbejdet med IBM's flagskibsprojekt opkaldt efter firmaets grundlægger, Thomas J. Watson. Målet var at vise, hvor langt kunstig intelligens i dag var nået. På en måde, så verden ville forstå perspektiverne.
Jeopardy! blev valgt som showcase, fordi quizzen havde den rette folkelige appel. IBM ville gentage bedriften fra 1997, hvor de med "Deep Blue" udfordrede skakverdensmesteren Gary Kasparov – og vandt i intelligensspillet over alle.
Selvom Deep Blues sejr havde imponeret, var der, viste det sig, alligevel lang vej til computere, hvis aktivitet kunne sammenlignes med menneskelig intelligens. Skak er nemlig et fuldstændigt entydigt og regelbundet spil. Og sådan er den virkelige verden ikke. I hvert fald ikke, hvis den skal give mening for os mennesker, og hvis den skal forstå, hvordan vi taler om den. Hverdagssproget er nemlig upræcist og flertydigt, underforstået og afhængigt konteksten.
Derfor var Jeopardy! særligt velegnet som mål for Watson-projektet. Quizzen er nemlig lige dele sproglige finurligheder og paratviden, helt ned til spørgsmålene, der stilles som svar, og svarene, der skal gives som spørgsmål.
Dette spørgsmål skulle blive en af Jeopardy!-testens store udfordringer:
– Dens største lufthavn er opkaldt efter en Anden Verdenskrigs-helt, dens næststørste efter et slag.
Underforstået er det, at det er en by, vi skal have navnet på. Og 'slag' betyder i denne sammenhæng et sammenstød mellem to hære og ikke for eksempel en bevægelse med armene i luften. Garneret i en drilsk sætningskonstruktion.
Læg dertil, at Jeopardy!-spørgsmål kan handle om alt mellem himmel og jord, og at der ingen steder på Jorden findes pænt strukturerede tabeller, hvor svarene kan slås op, og du har en værdig udfordring.
Kæmpemæssige fritekst-lagre
Når Ferucci og IBM selv omtaler Watson, taler de om en "massively parallel probabilistic evidence-based architecture". Watson slår nemlig ikke op i tabeller for at finde de rigtige svar. Dens DeepQA-software analyserer spørgsmål, gennemsøger kæmpemæssige fritekst-lagre for mulige svar og vurderer sandsynligheder i en iterativ proces.
Sandsynlighederne kommer ind, både når inputtet skal vurderes: Når 'slag' omtales sammen med en 'krig', er der størst sandsynlighed for, at det betyder sammenstød mellem to hære. Når systemet slår op i sin ustrukturerede tekstmasse og skal vurdere, hvilke af de mange kilder, der byder sig til med mulige svar, er mest sandsynligt at bruge. Og når de endelige svar gives.
Watsons svar har nemlig alle sandsynligheds-angivelser. Og ud over hovedsvaret oplyser Watson også om de to næstmest sandsynlige alternativer.
I Jeopardy! er tiden et parameter. I gennemsnit går der tre sekunder, fra spørgsmålet vises og læses op for deltagerne og samtidig rammer Watson i ascii, til den første deltager trykker sig ind med et svar. Det er en tidsgrænse, der er svær at slå, og som nødvendiggør den distribuerede parallelle tilgang, for på en almindelig enkeltkerne 2,66 gigahertz cpu tager processen over to timer. Det er derfor, Watson kører på 90 IBM Power 750-servere, hver med fire sockets og hver socket med otte kerner. Det gør Watson i stand til at foretage 80.000 milliarder operationer i sekundet – og giver en gennemsnitlig svartid på 2,5 sekunder.
Når Watson startes, loader den hele vidensbasen op i sit 15TB store delte RAM-lager. Igen for at skabe hurtig adgang til de hundreder af millioner af sider – Wikipedia, IMDB og alverdens opslagsværk – som Feruccis team har fyldt den op med. Skulle de hentes fra servernes egne kun 500 GB store harddiske eller det 21,6TB store Scale-Out NAS, ville det tage for lang tid.
Watsons svaghed
Der var nerver på for alle, da den store dag oprandt, selv om Ken Jennings følte sig i relativt sikre rammer.
– Jeopardy! er et minefelt, forklarer han i dag og fortsætter:
– Fyldt med hints, fælder og jokes. Hver gang Watson svarede rigtigt, var det sådan: Ja, gør det igen!
Og Watson svarede virkelig rigtigt. Lige indtil spørgsmålet om byen med de to lufthavne, som blev stillet i som alle-skal-svare-spørgsmål i kategorien "US cities". Ken svarede Chicago. Mens Watson mente, at det rigtige svar måtte være ... canadiske Toronto.
Heldigvis for Watson ændrede det forkerte svar ikke ved den samlede stilling, og Watson kunne efter to dage trække sig tilbage som samlet vinder.
Det forkerte svar viste imidlertid Watsons svaghed. Når du ikke har noget på rygraden og heller ikke kan finde svaret i en facitliste, kan du tage grueligt fejl. Selvom det til Watsons forsvar skal siges, at den aldrig ville have svaret, hvis ikke den var blevet tvunget til det. Den var nemlig langtfra sikker på svaret.
De få glip holder imidlertid ikke Ray Kurzweil tilbage: Selvom Watson ikke har rigtig kunstig intelligens, er det blot et spørgsmål om tid i en verden, hvor prisen på computerkraft halveres for hvert år, der går, mener han.
Faktisk har han væddet 10.000 dollar på, at det sker inden 2029.