Software

Data-tsunamien kommer

Qi Zhang, lektor og leder af Computer Engineering Program ved Aarhus Universitet, har i spidsen for forskerholdet Network Computing, Communications and Storage forsket i nye måder at komprimere IoT-data, så det er muligt at udføre dataanalyse direkte på komprimerede filer.

Hvad bygger den nye teknik på?
Den nye komprimeringsteknik giver mulighed for at udføre dataanalyse direkte på komprimerede filer. Det gør det muligt at komprimere IoT-data – som typisk er data i tidsserier – i realtid, inden data sendes i skyen. Herefter kan dataanalysen udføres direkte på de komprimerede data. Der er således ikke behov for at dekomprimere alle eller store fraktioner af data for at udføre analysen.

Hvordan fungerer det?
Hvis du i dag skal bruge 1 Byte data fra en 100 MB komprimeret fil, er du som regel nødt til at dekomprimere en stor del af filen for at få adgang til data. Vores teknologi giver hurtig adgang til de komprimerede data. Det betyder, at du kan få adgang til 1 Byte data ved at dekomprimere mindre end 100 Bytes, hvilket er flere størrelsesordener lavere end andre moderne teknologier. Det kan få kæmpe betydning for datatilgængelighed, databehandlingshastighed og skylagrings-infrastrukturen.

Hvad vil I opnå med projektet?
Det kan potentielt afhjælpe det stadigt stigende pres på kommunikation og infrastruktur til datalagring, og det kan bidrage til udviklingen af bæredygtige IoT-løsninger. I dag streames IoT-data konstant til skyen, og som en konsekvens af de enorme mængder af IoT-enheder, der implementeres globalt, forventes en eksponentiel datavækst. For at imødekomme hurtig dataindsamling og dataanalyse foretrækker man ofte i dag at lagre data ukomprimeret. Ulempen ved det er, at det bruger meget lagerplads. Men hvis man lagrer data i komprimeret form, tager det tid at dekomprimere data, før man kan få adgang til dem og analysere dem. Dette projekt har derfor potentiale til ikke blot at reducere datalagringsplads, men også at fremskynde dataanalyse.

Hvad er næste skridt?
Sammen skal vi nu videreudvikle metoden og danne ramme for en end-to-end-løsning, der kan hjælpe med at nedskalere de eksponentielt stigende datamængder fra IoT-enheder.

Projektet, der hedder Analytics Straight on Compressed IoT Data (Light-IoT), er støttet af Danmarks Frie Forskningsfond med 2,9 millioner kroner.