Internet

Det semantiske web har kurs mod dit intranet

Det semantiske web er en vision om et internet, hvor computere kan læse og forstå websidernes indhold. Det er ikke science fiction, men kommer snart til en søgemaskine nær dig.

Tilbage i 2001 formulerede Tim Berners-Lee, opfinderen af World Wide Web, en vision om et nyt web, hvor informationerne på hjemmesiderne kan læses af computerprogrammer. Webbet har været en kæmpesucces for udveksling af informationer mellem mennesker, men computere har det svært med at læse meningen med tingene på websiden.

Berners-Lee benyttede tilbage i 2001 ideen om software-agenter til at sælge dette semantiske - meningsgivende - web. Hvis man skal løse en bestemt opgave, for eksempel tilrettelægge en rejse, kan det hele gøres via webbet. Man kan booke fly- og hotelbilletter og så videre, men det kræver, at der sidder et menneske bag skærmen. Problemet er, at de data, der findes på webbet, ikke giver mening for computere. Hvis informationen var opmærket på en eller anden facon, og et sæt regler angav sammenhænge imellem forskellige størrelser, kunne softwareagenter selv danne sammenhænge og udføre trivielle opgaver.

Det semantiske web går ud på at opmærke information på en sådan måde, at det kan udtrækkes og behandles af programmer. Men ideen om softwareagenter er måske som det berygtede internet-køleskab, der i 90'erne skulle forklare de store perspektiver i webbet. Og internet-køleskabet var en rigtig dårlig ide.

Teknologien stikker hovedet frem
Alligevel begynder det semantiske web at gøre sig gældende i al ubemærkethed. Som med andre nye teknologier kan det semantiske web anvendes på måder, som opfinderne ikke havde tænkt på.

Det danske firma Autiq benytter det semantiske web til at løse problemer inden for it-management, der løser problemer, der har en høj kompleksitet, og som det er vanskeligt at programmere sig ud af. Firmaet har f.eks. bygget et produkt, som kan overvåge og diagnosticere computernetværk, ud fra viden, som firmaet har indsamlet og omsat til regler i sproget OWL.

Autiq har valgt at bruge semantisk web-teknologi, fordi det er det, der vil blive brugt i fremtiden, forklarer udvikler Anders Lehmann. Samtidig er det den hurtigste teknologi på markedet. Han gætter på, at det semantiske web vil slå igennem bredt i løbet af de næste 10 års tid. Teknologien er i hvert fald på plads.

- Der er nogen, der siger, at webbet først tog rigtigt fart, da det blev brugt som intranet, og at det er den måde, det semantiske web vil udvikle sig på. Når det er modent, vil det gå på tværs af virksomheder, og så vil det være alle steder.

Intelligente søgemaskiner
Hvis det er rigtigt, så peger tendensen i hvert fald i den rigtige retning. Rune Stilling fra konsulentfirmaet RDFined rådgiver virksomheder og offentlige institutioner om, hvordan de kan udnytte semantic web-teknologien. På mange offentlige websites benytter man tags eller emneord til at fortælle om, hvad indholdet på en side handler om. Men tags er ikke stærke nok til mere komplekse sammenhænge, fortæller han. Ved at bruge OWL kan man udtrykke mere komplekse forhold.

- Kunderne er så småt gået i gang. I næste skridt vil de også dele viden med partnere og andre institutioner.

På sigt vil det gøre det muligt at udføre søgninger, som giver mere information tilbage.

- Man får mere overblik over den viden, der ligger i organisationens systemer. Du vil hurtigere og nemmere kunne trække viden ud fra f.eks. et firmaintranet. I dag skal du sidde og grave i mange timer og læse mange dokumenter. Kvantespringet vil være den hastighed med, hvor man kan finde og dele viden. Det, at vi kan være så effektive i vores datamining, vil give nye muligheder.

Problemet med at mærke informationen op, så computere kan læse det, er, at det er en tidskrævende og kedelig opgave. Derfor er der behov for programmer, som i hvert fald noget af vejen selv kan opmærke tekst.
Nyhedsbureauet Reuters har udviklet en gratis webtjeneste www.opencalais.com, som automatisk kan finde navne på firmaer, steder og personer og de fakta, som et nyhedstelegram kan indeholde.

Det er ikke bare firmaintranet, som vil få gavn af semantic web-teknologierne. Et mere skræmmende perspektiv er efterretningstjenester, der vil kunne gennemlæse emails automatisk og trække væsentlig mere mening ud af beskederne end ved simpel søgning på ord.

- På den bane gør folk sig ikke begreb skabt om, hvilken overvågning der desværre vil kunne komme ud af det her, slutter Rune Stilling.

Det semantiske web
Det semantiske - meningsgivende - web er en tænkt udvidelse af World Wide Web, hvor indhold på websider kan beskrive på en måde, så soft-wareagenter kan finde og kombinere information.

RDF
Resource Description Framework. En måde at beskrive informationer om data. RDF består af en tripel, hvor en størrelse har en bestemt egenskab, og egenskaben har en værdi, som for eksempel ("Århusgade", "har-postnummeret", "2100"). Størrelsen er ofte angivet med en URI, som er en slags generaliseret URL. RDF er ikke knyttet til nogen bestemt form, men XML bruges ofte til RDF-data.

OWL
Web Ontology Language. Et sprog til at publicere og dele data på World Wide Web ved hjælp af ontologier. OWL bygger oven på RDF.

Ontologi
I filosofi betyder ontologi læren om tings væsen. Inden for kunstig intelligens bruges det om et dokument, der formelt definerer relationer mellem termer. Fx kan en ontologi beskrive en sammenhæng mellem vejnavne og postnumre på en sådan måde, at hvis et geografisk sted er knyttet til et vejnavn, og vejnavnet er knyttet til et postnummer, kan et program tillade sig at konkludere, at stedet hører sammen med postnummeret.

Læs mere om emnet i linksamlingen for martsnummeret af Prosabladet på:
www.prosa.dk/prosbladet/links