En heftig cocktail af Java-programmering, sandsynlighedsregning og sprogvidenskab står på programmet denne regnfulde sommerhus-eftermiddag i påsken, hvor den øvrige familie damper resterne af frokost-snapsen af i sofaer og bløde lænestole.
Dog ikke Prosabladets udsendte reporter, der i et ubevogtet øjeblik har tilmeldt sig et onlinekursus i computerbaseret sprogbehandling, eller natural language processing (NLP), som disciplinen kaldes på engelsk.
Det amerikanske universitet Stanford eksperimenterede for et par år siden med fjernundervisning i kæmpeskala, ved hjælp af videoforelæsninger og automatiserede prøver via nettet. Resultatet var så positivt, at undervisere fra universitetet oprettede nonprofitorganisationen Coursera, der udbyder virtuelle udgaver af universitetets kurser kvit og frit til alle interesserede over hele kloden. Ud over Stanford bidrager en række andre amerikanske top-universiteter, såsom Harvard, også i programmet.
Net-undervisning med 60.000 elever
Indholdet svarer til universiteternes sædvanlige kurser. Men deltagerantallet er ganske meget større end på Stanfords californiske campus: 60.000 elever over hele verden, inklusive Prosabladets udsendte reporter, har meldt sig til NLP-kurset, som gennemgår de grundlæggende programmeringsmæssige teknikker, der er i spil, når computerprogrammer skal behandle naturlig tekst, skrevet af mennesker.
Det er funktioner som stavekontrol, kategorisering af filmanmeldelser i positive og negative omtaler, genkendelse af navne og andre elementer i sætninger, der skal behandles af algoritmer.
Dette område af datalogien har skabt store gennembrud i de seneste år, med resultater som iPhone-programmet Siri, der mere eller mindre godt kan svare på næsten alle spørgsmål, til IBM-computeren Watson, der kan slå de bedste menneskelige deltagere i tv-quizzen "Jeopardy", og som nu skal assistere cancerforskere i deres arbejde.
Den virtuelle laptop-skolebænk
Tilbage i sommerhuset handler programmeringspåskens opgave om at finde optimale forslag til forkerte ord ved stavekontrol, med udgangspunkt i fire forskellige sandsynlighedsmodeller.
Ligesom da jeg studerede matematik og datalogi for mange herrens år siden, prøver jeg at springe over, hvor gærdet er lavest, og sjusse mig frem til resultatet. Mon ikke den rigtige formel er den, som præsenteres 10 minutter inde i videoforelæsningen, downloadet på laptoppen?
Jeg er dog usikker på, hvad der skal stå i nævneren i den sandsynlighedsmæssige brøk, som er essensen i opgavens formel, men med hjælp fra min nevø får jeg stykket 50 linjers Java-kode sammen, mens vi propper os med påskeæg og mystiske øl fra mikrobryggerier.
Heldigvis har kursusmaterialet givet et lille testsæt med facitliste, og en del års programmeringserfaring kommer til gode, når småfejlene i koden skal findes og rettes. Det giver pote – for første (og sidste) gang i kurset får jeg top-point for en programmeringsopgave.
Skolen kræver tid
Men de efterfølgende uger går det knap så godt. Jeg har travlt med andre sager og får ikke brugt tid nok på opgaverne, der samtidig stiger i sværhedsgrad. Pludselig oplever jeg den kolde sved fra universitetstiden, på kanten af eksamen – det hele er for svært, og måske er jeg ikke lige så skarp i hovedet, som jeg plejede at være, her på den forkerte side af de 40 år.
Teorien går alligevel ind på lystavlen, i et eller andet omfang. De påkrævede 10 timers ugentligt arbejde med programmeringsopgaverne er ikke lige til at finde i en travl hverdag, men det går bedre med multiple choice-opgaverne, som jeg stadig kan besvare med fire ud af fem rigtige.
I hvert fald har jeg nu fået en ide om, hvordan teorien bag NLP-problemerne ser ud, og det er ganske meget mere kompliceret, end jeg troede til at starte med.
Der er ingen kongevej til viden, som grækeren Pythagoras påpegede i gamle dage, men med Courseras kurser kan man komme tættere på dagens forskningsresultater inden for datalogi og få nye udfordringer til hjernecellerne. Og det koster ikke en klink.