Hardware, Internet

Googles database kender klokken

Beskyttet med tavshed og sjældent halet frem i dagens lys. Googles Spanner Database-teknologi er for første gang beskrevet i et forskningspaper fra søgegiganten selv.

En database, som skalerer til millioner af computere placeret i datacentre spredt over hele verden. Googles hemmelighedsfulde Spanner Database er ikke blot større end de fleste databaser, Spanner tillader også applikationer som anvender databasen at diktere hvor specifikke data skal gemmes, så latenstiden kanm reduceres, når data skal genfindes.

Detaljerne om Spanner-databasen kommer frem i flere online-medier efter et forskningspaper om Googles globalt distribuerede database er offentliggjort.

Bruger GPS og atomur

 

Det der får selve ideen bag den globale database til at virke, er det som Google kalder True Time API. Det udnytter kombinationen af et atomur og et GPS-ur til at tidsstemple data, så disse kan synkroniseres på tværs af så mange datacentre og computere, som det ønskes.

"Data bliver gemt i skemalagte semirelationelle tabeller; data versioneres og hver version bliver automatisk tidstemplet med det tidspunkt, hvor den er lagt ind. Gamle versioner tilknyttes garbage-collection-regler og applikationer kan kan tilgå tidsstemplerne på data. Spanner understøtter alle mulige transaktioner og anvender et SQL-baseret forespørgselssprog", hedder det i Googles forskningspaper.

Analysesitet Gigaom har gransket Googles forskningspaper og fremhæver følgende features i den unikke Spanner-database:

Spanner har indbygget logik, der sørger for at migrere data på tværs af computere og datacentre, så belastningen fordeles jævnt og fejlsituationer på et enkelt datacenter ikke påvirker adgangen til data.

Spanner stiller en datamodel til rådighed baseret på semi-relationelle tabeller og et forespørgselssprog.

Spanners datamodel er ikke rent relationel. Rækker kræver ikke navngivning, men de må have et arrangeret antal af primære nøgle-kolonner. De primære nøgler danner navnet på en række og hver tabel definerer en mapning fra de de prærnøgle kolonner til de ikke primærnøglekolonner. Ifølge paperet er denne struktur nyttig, fordi den tillader en applikation at kontrollere hvor data skal placeres (datacenter, computer)gennem valget af nøgler.

Forskningspaperet afslører Spanner som en moderne datateknologi og giver et indblik i hvordan søgegiganten opbygger en datainfrastruktur, som kan drive et dynamisk miljø, hvor hardware, software og selve de data som bliver behandlet konstant skifter.

Googles paper om Spanner: static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en/us/archive/spanner-osdi2012.pdf