Undersøgelse af datavarehuse

Flere offentlige myndigheder har fået betydelig fokus på anvendelse af registerdata til styring og analyse. På flere ministerområder er der igangsat projekter for opbygning af datavarehusløsninger for at sikre større viden om effekter af indsatser. Etableringen af datavarehuse rummer store perspektiver for et øget samarbejde mellem forskningen og analytikere, men også for et øget koordinationsbehov, blandt andet for at sikre ensartethed i begrebsanvendelse og i forhold til dokumentationsstandarder.

Tværgående udfordringer

KOR ønsker at der i forlængelse af opbygning af ministerielle datavarehuse sikres en tværgående koordinering. Konkret bør der tages hånd om at sikre mere aktuelle data og forbedre datakvaliteten, herunder sikre anvendelse af ensartede definitioner mv. Uden koordinering er risikoen, at man ikke taler samme sprog eksempelvis at data med samme betegnelse ikke udtrykker samme værdi, fordi de er genereret i forskellige systemer. Ligeledes kan information være registreret på en måde, der ikke umiddelbart gør data anvendelige til statistiske analyser. En problemstilling i den sammenhæng er, at der ikke på alle områder er tale om landsdækkende systemer.

KOR har gennemført en spørgeskemaundersøgelse

Formålet med spørgeskemaet var at indsamle oplysninger om hvilke ministerier og styrelser, der har datavarehuse på velfærdsområdet, herunder
1) oplysninger om datavarehusløsning,
2) oplysning om centrale populationer,
3) muligheder for adgang til data og
4) datadokumentation.
KOR sendte spørgeskemaet ud til de 28 offentlige organisationer, der er medlemmer af referencegruppe for registerforskning. Heraf svarede 75 % på undersøgelsen, og 14 svarede, at de havde et datavarehus.

Undersøgelsens resultater

Overordnet set er anvendelsen af datavarehuse i ministerier og styrelser ikke så udbredt, som forudset af Registerforskningsudvalget i 2013. I praksis er der stadig de tre hovedaktører på området, som udvalget pegede på. Disse områder er blevet konsolideret siden. Det drejerser sig om datavarehuse om 1) uddannelse (dog ikke videregående uddannelser), der er forankret i Styrelsen for IT og læring, Beskæftigelse, der er forankret i styrelsen for arbejdsmarked og rekruttering, samt sundhed, der er er drevet af sundhedsdataprogrammet som et samarbejde mellem bl.a. Sundhedsdatastyrelsen og RKKP.

Datavarehusene anvendes hovedsageligt til ledelsesinformation og statistik og i meget mindre grad til forskning, administration m.v. Derudover er der stor forskel på, hvilke tekniske løsninger der er valgt, samt hvordan data stilles til rådighed for offentligheden.
Den tilvejebragte oversigt over populationer i datavarehusene og deres karakteristika bør kunne give forskere og analytikere et overblik over hvilke oplysninger, organisationerne har registreret i deres datavarehuse. Det er bemærkelsesværdigt, at der ikke er nogen datavarehus initiativer med oplysninger om det sociale område.
Kun seks styrelser udleverer data til forskere på anmodning, herunder alle de ovenfor nævnte hovedaktører. Der er muligvis et uudnyttet potentiale for forskere og analytikere, hvis der træffes aftaler om udlevering af data fra datavarehuse i (mindre) organisationer, der ikke har nogen praksis for dette.
Overordnet set er der ikke det store fokus på dokumentationsstandarder eller harmonisering med øvrige organisationer, bortset fra på sundhedsområdet. Eventuel harmonisering er sket i forbindelse med anvendelse af Danmarks Statistiks miniserieordning.

Status

Undersøgelsen har været drøftet i referencegruppe for registerforskning. På baggrund af disse drøftelser vil KOR tage initiativ til følgende

  • KOR vil invitere datavarehus-ejere til en drøftelse af muligheder for fælles dokumentationsstandarder, samt hvordan forskerne kan bidrage.
  • KOR vil gå i dialog med Styrelsen for Uddannelse og Forskning (eventuelt i samarbejde med Datatilsynet) til at lave vejledning til myndigheder om, hvordan de kan give forskere adgang til deres administrative data, hvad de skal være opmærksomme på, en standard databehandleraftale etc.
  • KOR vil drøfte, om der er særlige populationer eller hele datavarehuse, som der er særlig interesse for i forskningsmiljøerne.

Læs afrapportering her:

Bilag over populationer
Bilag med grundoplysninger
Bilag med spørgeskemaet
Bilag med hele undersøgelsen