Analyser på nationale HPC-anlæg: En ny mulighed for brugere af Danmarks Statistiks mikrodataordninger
Fra i går den 3. december 2025, udvidede Danmarks Statistik (DST) mulighederne for at brugerne af DST’s Mikrodataordninger, kan koble egne data med registerdata på en række nationale HPC-anlæg, uden at sikkerheden udfordres.
4. december 2025 kl. 13:24
Løsningen sker gennem et nyt såkaldt API (Application Programming Interface), som forbinder Danmarks Datavindue (DDV) med landets HPC-anlæg (High Performance Computing). Løsningen er udviklet og lanceret af Danmarks Statistik i samarbejde med DeiC, og universiteternes HPC-miljøer, i første omgang Computerome og GenomeDK, for at sikre brugerne af DST’s Mikrodataordninger fleksibel og sikker adgang til avanceret databehandling.
Ny teknisk bro mellem DST og universiteterne
Den nye API-løsning gør det muligt at flytte selve analysen til universiteternes supercomputere. Du får som bruger mulighed for at arbejde med projekter, som indeholder store datamængder, hvor du kan koble egne data med registerdata, uden sikkerheden kompromitteres.
GenomeDK og DTU Computerome er de første aktører, som har indgået aftale med DST om denne løsning og det er nu muligt at oprette projekter via disse HPC-anlæg.
Sikker pseudonymisering og kontrolleret dataflow
Med det nye API kan pseudonymiserede data behandles hos et godkendt HPC-anlæg, hvor brugeren har fået bevilget eller indkøbt regnetid. Overførslen sker gennem det nye API, som er baseret på en såkaldt ”pull-arkitektur”, hvor HPC-centrene selv henter de nødvendige data og instruktioner, når de er klar til at modtage dem. Det betyder, at DST ikke behøver at oprette tekniske forbindelser til hvert enkelt anlæg, hvilket både øger sikkerheden og gør løsningen lettere at vedligeholde og udbygge.
Behandlingen af data foregår herefter på HPC-anlægget, hvor brugeren får adgang til højt specialiseret hardware, komplekse softwareløsninger og teknisk support. Når analysen er færdig, skal resultaterne igen returneres til DST, hvor de godkendes, inden brugeren kan hente dem ud til videre brug.
Michael Specht, Projektleder i DST, understreger:
"Det handler om at flytte beregningerne derhen, hvor kompetencerne og ressourcerne er – uden at gå på kompromis med sikkerhed og kontrol. Vores vigtigste princip er, at data aldrig må komme ud af vores kontrol. Derfor har hele løsningen været bygget op omkring, at alle dataoverførsler sker via Danmarks Datavindue og at vi bevarer overblikket over hver eneste bevægelse.”
Én løsning til bred anvendelse
Løsningen er resultatet af et tæt samarbejde mellem DST, Danish e-infrastructure Consortium (DeiC) og universiteternes HPC-centre og er udviklet på opfordring fra Koordinerende Organ for Registerforskning (KOR). Målet har fra starten været at udvikle én standardiseret løsning, som alle danske HPC-centre og andre forskningsorganisationer kan tilslutte sig – og dermed undgå at skulle udvikle særskilte integrationer for hvert center.
Rune Gamborg Ørum, Projektleder fra DeiC ser flere andre brugsperspektiver i løsningen:
“Vi glæder os til løsningen kommer i drift, og løsningen danner potentielt grundlag for, at andre typer organisationer end HPC-anlæg, som fx sektorforskningsinstitutioner, potentielt kan få værdi af løsningen”.
Kirsten Ohm Kyvik, Forperson for KOR og Institutleder og professor ved Syddansk Universitet, glæder sig ligeledes over, at løsningen nu er en realitet:
“Jeg sætter stor pris på, at det er lykkedes for DEIC og Danmarks Statistik at få gennemført dette projekt. Det åbner flere muligheder for forskerne for at kunne analysere store og komplekse datasæt”.
Om projektet
Udviklingen af det nye API startede i 2023. DST har haft ansvaret for projektledelse og udvikling af den sikre adgang til data, mens DeiC har spillet en central rolle i det tekniske samarbejde med HPC-centrene og i udviklingen af forbindelsen mellem API’et og HPC-anlæggene. DeiC har desuden udviklet og testet en proof-of-concept-kode, som HPC-centrene har kunnet tilpasse deres lokale systemer.
HPC-centrene har i et stort omfang og løbende bidraget med teknisk feedback og test og deres medvirken har været afgørende for at sikre, at løsningen fungerer i praksis på tværs af forskellige platforme. Resultatet er en skalerbar og robust arkitektur.
Den tekniske implementering af API’et og integrationen med Danmarks Datavindue er leveret af Copenhagen data.
Ønsker du at koble dit projekt på denne HPC-løsning kan du kontakte forskningsservice samt læse mere på Danmarks Statistiks hjemmmeside her. Du kan også læse mere om brugervejledning til HPC-løsningen ved Computerome.