Multigenerationsregistret – Infrastruktur for fremtidens forskning

Registret består af familierelationer mellem alle danskere født fra 1920 og frem til CPR-registret. Det bliver en forskningsinfrastruktur, der kombineret med de unikke danske registre og biobanker, giver dansk forskning i folkesundhed og sociale forhold en helt ny dimension. Registret er blevet muligt med en bevilling fra Novo Nordisk Fonden på 38 mio. kroner.

Multigenerationsregistret (MGR) udvikles af Rigsarkivet i samarbejde med Københavns Universitets Center for AI og Aarhus Universitets Center for Registerforskning og Det Koordinerende Organ for Registerforskning (KOR). Det har været muligt på grund af en generøs bevilling fra Novo Nordisk Fonden. Udviklingen af registret påbegyndes i 2021, og det er klar til at indgå i danske forskningsprojekter i 2025.

Læs om de data, metoder og processer vi bruger til udvikling af MGR

Kirkebøger var rygraden i den danske civiladministration – og i Multigenerationsregistret

I 1645 påbød Christian IV alle sogne at føre kirkebøger over befolkningen i Danmark. Kirkebøgerne var indtil CPR-registret oprettelse i 1968 rygraden i den danske administration af befolkningen. I kirkebøgerne er alle fødsler samt forældrene til den fødte registreret.
Fortidens forudseenhed i civiladministrationen gør det således muligt at skabe ny viden om familiebetingende forhold inden for sundhed og sociale muligheder.

Kirkebog over fødte fra 1942

Strøm til kirkebøgerne

Med hjælp fra Artificial Intelligence vil projektet så at sige sætte strøm til den gamle analoge civiladministration, og samle det i ét register over befolkningens familierelationer siden 1920. Det er en vanskelig opgave at digitalisere håndskrevne oplysninger, der fordeler sig på ca. 2300 sogne over en periode på knap 60 år, og Gud ved hvor mange præster og degne. Forskere fra Københavns Universitet vil udvikle algoritmer, der kan læse de tusindvis af håndskrifter, og forskere fra Aarhus Universitet vil linke identiske individer fra kirkebøger over fødte, forældre, viede og døde sammen i ét stort stamtræ over den danske befolkning.

Visionen er bedre forskning

Ideen med multigenerationsregistret er for det første at give mulighed for at analysere fænomener over længere tid gennem flere generationer, men også i bredden mellem fætre og kusiner eller i familienetværk med særlige karakteristika.
For det andet vil det give stærkt forbedrede muligheder for at undersøge teorier om årsag

ssammenhænge, som man hidtil kun har kunnet belyse svagt. Den nye viden, som herved kan opnås, kan medføre bedre behandlingsmuligheder og forebyggelsesindsats på mange områder både sundhedsmæssige og sociale f.eks. inden for psykiatriske lidelser.
For det tredje vil det styrke den samfundsmæssige nytteværdi af de unikke danske registre og biobanker, fordi forskere herved vil kunne knytte data bedre sammen. Dette vil kunne bidrage markant til at forstå årsagerne til, hvorfor der ophobes sygdomme i bestemte familier, eller hvordan man kan bryde den sociale arv.

Hvad er nyt?

I CPR-registret er der kun registreret forældre til børn, der er født efter 1960. Det betyder, at forskere kun kan kombinere sundhedsdata over 1-2 generationer. Med Multigenerationsregistret vil forskerne kunne kombinere data over 3-4 generationer. Mange af de store danske registre går tilbage til 1970’erne, med MGR kan forskere etablere fx sygdomsbilleder af 3. generations sundhedslidelser i 1970’erne, 2. generations i 1990’erne, 1. generations i 2010’erne og deraf forhåbentligt kunne udvikle screening

Projektet bygger på erfaringerne fra KORs pilotstudier, der er publiceret i en hvidbog fra 2018

er, forebyggelse og behandlinger der er målrettet dem, der endnu er unge og dermed endnu ikke i risikogruppen for at udvikle de samme lidelser som de tidligere generationer.

Ulighed i sundhed

Sundhedsstyrelsen konkluderer, at ulighed i sundhed og sygdom er systematisk skævt fordelt i samfundet, og social position og levevilkår har betydning for menneskers sundhed, sygdom, levetid og sundhedsrelateret livskvalitet. Et Multigenerationsregister vil kunne afdække familierelaterede forhold vedr. sundhed og dermed bidrage med viden om den familiære komponent i ulighed i sundhed.

Personlig medicin

Når ambitionen om at målrette medicinske behandlinger til de enkelte individer, skal realiseres er data om familiære relationer helt centrale, da forskerne har behov for viden om, hvilke grupper af patienter der har gavn af hvilke behandlinger. Dette er ofte genetisk betinget, og med et Multigenerationsregister vil forskerne kunne undersøge, hvorfor sygdomme forekommer i nogle familier og ikke i andre.

Sociale forhold

De sociale og økonomiske vilkår i den familie et barn fødes ind i sætter i høj grad rammerne for barnets fremtidsudsigter. MGR kan bidrage til at forstå den familiære komponents betydning for uddannelse, livsindkomst og sociale forhold, og dermed hvordan den sociale arv kan brydes, og hvordan grupper af individer støttes bedre i bestræbelserne på at få en bedre livsbane.

Fakta

3,6 mio. fødsler fra 1920-1968
1,9 mio. døde fra 1920-1968
8500 kirkebøger skal scannes
38 mio. kroner koster udviklingen af MGR
Kirkebøgerne er frit tilgængelige på Rigsarkivets hjemmeside
Forskere kan få adgang til MGR efter reglerne i databeskyttelsesloven

Styregruppen

  • Rigsarkivar Anne-Sofie Jensen, Rigsarkivet (Formand)
  • Professor Henrik Toft Sørensen, Det Koordinerende Organ for Registerforskning
  • Direktør Niels Ploug, Danmarks Statistik
  • Afdelingsleder Jan Kenneth Poulsen, Sundhedsdatastyrelsen
  • Kontorchef Johnny K. Mogensen, Uddannelses og Forskningsstyrelsen
  • Professor Anders Søgaard, DIKU (projektleder MGR)
  • Professor Carsten Bøcker Pedersen, CIRRAU (projektleder MGR)
  • Chefkonsulent Jeppe Klok Due, Rigsarkivet (projektleder MGR)

Eksempler på anvendelse MGR

KOR udarbejdede i 2018 en Hvidbog for, hvordan der kan etableres et Multigenerationsregister. I hvidbogen redegør forskere og forskningsinfrastrukturer for de muligheder de ser for forskningen, hvis forskerne har adgang til et Multigenerationsregister. Følgende er uddrag fra “Hvidbog for et dansk Multigenerationsregister”, redaktør Jeppe Klok Due 2018, side 92-104.

Hent hele hvidbogen her

PERSIMUNE (Centre of Excellence for Personalized Medicine of Infectious Complications in Immune Defiency ) ved centerleder, professor Jens Lundgren

MGR rummer en række potentielle fordele for den fremadrettede forskningsaktivitet hvad angår en bedre forståelse af interaktionen mellem arv og miljø for befolkningen sundhed og sygdom. KOR’s forslag er således i tråd med visionen om at bruge den velregistrerede danske befolkning som et samlet ”forskningslaboratorium” af disse forhold og derved yderligere styrke denne styrkeposition også internationalt. Denne proces er en engangsforeteelse som fremtidige generationer og deres forskere så vil kunne drage nytte af.

Såfremt vi fik adgang til data fra MGR, ville vi kunne koble sundhedsdata og biologiske prøver sammen gennem flere generationer. Derved vil vores forskning kunne blive endnu mere informativ til at afklare de underliggende mekanismer for, hvorfor der er så stor variation i sygdomsudvikling blandt personer med lidende immunfunktion. I den forbindelse bør MGR fokuserer på også at få pålidelige data på non-fatale sygdom tilbage til registrets start i 1920.

Danmarks Nationale Biobank, direktør Helle Bossen Konradsen

Danmarks Nationale Biobank (DNB) ser store perspektiver i et præ-1968 CPR register. DNB indeholder millioner vigtige biologiske prøver indsamlet længe før CPR-registeret blev oprettet i 1968. De biologiske prøver er ofte taget i forbindelse med diagnostiske undersøgelser eller screeninger for bestemte markører, og vil kunne anvendes til en række forskningsrelaterede undersøgelser, herunder kortlægning af generne. Prøver for personer der er døde før 1968 kan selvsagt ikke relateres til nogen slægtninge. Et relationsregister for disse personer vil kunne gøre disse biologiske prøver anvendelige til forskningsprojekter i øget omfang, da de så kan anvendes i genetiske analyser over flere generationer.

Yderligere vil muligheden for at identificere fjernere slægtninge kunne gavne kvaliteten af genetiske SNP-array data for personer, som allerede er i CPR-registeret og DNB. Idet man kan bruge kendskab til slægtskab længere tilbage i tiden til at foretage en mere præcis imputation af nulevende personers genetiske data. Hvis man har SNP-array data for 1 million SNPs for en person kan man ved hjælp af et referencedatasæt forudsige (imputere) yderligere genetiske varianter (typisk omkring 10 millioner flere), som man ellers ikke har analyseret i laboratoriet for personen. Ved kendskab til personens slægtninge tilbage i tid kan denne forudsigelse ske utrolig præcist. Denne fremgangsmåde benyttes i stor stil i Island, hvor man har digitaliseret kirkebøgerne flere hundrede år tilbage i tiden.

Sundhedsdatastyrelsens Forskerservice ved afdelingschef Jan Kenneth Poulsen

Familiære årsager til sygdom udgør for mange sygdomme en stor del af ætiologien. Det kan både være genetiske årsager og livsstilsmæssige sammenhænge, der relaterer sig til familien. En stor del af de forskningsprojekter, der søger om data via Forskerservice, ønsker derfor at få identificeret de familiære relationer. Nye teknologier gør det muligt at finde hidtil usete (og utænkte) sygdomsårsager og sygdomsmønstre. Disse teknologier kigger på mønstre i store mængder af data og bidrager til nye hypoteser omkring årsager til sygdom. Forbedret adgang til familiære relationer i den danske befolkning, vil forbedre disse teknologiers mulighed for at finde nye mønstre og årsagssammenhænge til glæde for den danske befolkning.

DRDS Danish Research Data for the Social Sciences ved direktør Carsten Sørensen

Et multigenerationsregister vil gøre det muligt i større grad at undersøge socioøkonomiske forhold på tværs af generationer. Dette vil bidrage til bedre at kunne klarlægge sammenhængen mellem generationers indkomstforhold, og hvordan eventuelt uddannelse eller andre forhold kan bryde den ”sociale arv”. Et af DRDS indsatsområder er at medvirke til udarbejdelsen af bedre data til forståelse af sammenhænge mellem arv, miljø og eksempelvis politisk-økonomiske tiltag eller andre udefra kommende påvirkninger. MGR-data vil i den forbindelse give en markant forbedring af data- og analysemulighederne.

MGR-data vil også kunne anvendes til bedre at kunne udrede magtstrukturer i forskellige samfundssammenhænge, eksempelvis i forbindelse med virksomhedsstrukturer. Det er et indsatsområde for DRDS at forbedre kvaliteten af danske virksomhedsdata samt øge muligheden for at kombinere disse med persondata. MGR-data vil kunne kombineres med ejer- og ledelsesstrukturer på tværs af selskaber og generationer med henblik på at analysere og bedre forstå værdien af familieejerskab versus diversitet i ledelse og ejerskab for virksomheder og deres performance.

OPEN på SDU ved daglig leder, professor Torben Barington

OPENs primære formål er at understøtte sundhedsforskning generelt herunder når den er baseret på data i biobanker og sundhedsregistre. OPEN forestår også selv forskning inden for disse felter. I denne sammenhæng vil et nyt multigenerationsregister af den foreslåede karakter give helt nye perspektiver specielt hvad angår den genetiske dimension i OPENs aktiviteter. Etablering af MGR vil generelt give dansk registerbaseret sundhedsforskning et tiltrængt løft i retning af ligestilling med lande, vi i andre sammenhænge gerne vil sammenligne os med.

Danmarks Statistik ved direktør for persondata Niels Ploug

Danmarks Statistik ser meget positivt på etableringen af et multigenerationsregister. Det vil kunne anvendes både som basis for statistikproduktionen i relation til såvel longitudinel statistik, som der er stor interesse for på flere statistikområder bl.a. befolkning, uddannelse og beskæftigelse, som i relation til den løbende fejlsøgning af Danmarks Statistiks registre. Og så vil der være stor interesse for de muligheder et sådant register giver i de ordninger for forskere og ministerielle analytikere (forskerordningen og ministerieordningen), hvor Danmarks Statistik stiller sine mikrodata til rådighed.

iPSYCH ved videnskabelig direktør professor Preben Bo Mortensen

Hovedformålet med IPSYCH-initiativet er at identificere årsager og sygdomsmekanismer for de mest almindelige psykiske lidelser.

Gennem de sidste ti år har genetikere identificeret flere relevante arvelige faktorer, der disponerer bestemte individer for psykiske sygdomme. Men på trods iPSYCH’s unikke, befolkningsbaserede design, er det ikke muligt at behandle en række vigtige spørgsmål om risikoen for psykiske lidelser, der relateres til partnervalg og familiestrukturer.

Dansk arvelighedsforskning er begrænset af, at man kun kan gå få generationer tilbage. Et Multigenerationsregister med slægtsrelationer tilbage til starten af det 20. århundrede vil give iPSYCH datagrundlag til at identificere sociale og miljømæssige årsager til psykiske lidelser, med en præcision, der ikke kan eftergøres noget sted i verden.

Novo Nordisk Foundation Center for Protein Research, KU ved professor Søren Brunak

En af de store udfordringer for sundhedssektoren er, at behandle patienter med mere end en sygdom, såkaldt multimorbiditet. Disse patienter er meget omkostningskrævende og har typisk en eller flere kroniske sygdomme som får følge af flere og flere komorbiditeter. På grund af den stigende levealder er problemet voksende. Et af de store spørgsmål, som også er af stor relevans i forhold til avanceret præcisionsmedicin, er at afklare i hvilket omfang patientforløb er arvelige og i hvilket omfang de kan ændres ved ændret kost eller andre eksponeringer. De danske sundhedsdata gør det muligt at danne såkaldte ”sygdomstrajektorier” hvor systematikken i multimorbiditet følges longitudinelt, enten som udvikling i diagnoseforløb eller i andre datatyper, som for eksempel tidslig udvikling i laboratoriesvar eller i ordineret medicin. Man arbejder med dataanalyse som kan bidrage til at give det kliniske personale bedre muligheder for at træffe informerede behandlingsvalg i en kompleks klinisk hverdag.

Et af elementerne er et nyt koncept indenfor integration af mange typer longitudinelle data fra tidsskalaer der repræsenterer sundhedshistorien mange år forud for den aktuelle indlæggelse. Et af vores godkendte projekter går i den forbindelse ud på at sammenligne sygdomstrajektorier i familier og trio’er for hele befolkningen. I arbejdet indgår også harmonisering af terminologier og vokabularier fra forskellige perioder, som fx en komplet interface mellem ICD-8 og ICD-10. Helt afgørende for denne type arbejde er naturligvis kvaliteten af de underliggende data der beskriver familierelationerne for alle danskere. Et udvidet multigenerationsregister, både tidsligt, og kvalitetsmæssigt, vil derfor være meget værdifuldt for denne type arbejde og gøre dets internationale betydning endnu større. Tiltag indenfor personlig medicin vil skabe data der genetisk set er relevante, men den begrænsende faktor er naturligvis kvaliteten af populationsdata på familierelationer, som vil placere Danmark unikt indenfor denne type forskning.