Statistisk behandling
Nøgleoplysninger om andelsboligforeninger og andelsboliger indberettes løbende via andelsboliginfo.dk. Disse oplysninger sendes hvert kvartal til Danmarks Statistik. De indsamlede data valideres af Danmarks Statistik og sammenkøres med oplysninger fra BBR-registret, som også valideres. Til sidst beregnes prisindeks og fordeling af vurderingsprincip.
Kilder
Oplysninger om salg af individuelle andelsboliger stammer fra kvartalsvise indberetninger. For perioden 2015K1 - 2021K2 er salgsdata indsamlet via en frivillig stikprøveindsamling med hjælp fra andelsboligbranchen, mens salgsdata fra og med 2021K3 er indsamlet via andelsboliginfo.dk, hvor oplysningerne blev lovpligtige at indberette.
Oplysninger om andelsboligforeningen som helhed stammer fra årlige indberetninger via andelsboliginfo.dk, som har været lovpligtigt at indberette siden 2014.
Indsamlingshyppighed
Kvartalsvist.
Indsamlingsmetode
Data til denne statistik indhentes elektronisk fra administrative registre på andelsboliginfo.dk og BBR-registret.
Datavalidering
Indberetningerne via andelsboliginfo.dk kan være mangelfulde, da der i andelsboliginfo.dk kun foregår en meget begrænset datavalidering. Formålet med andelsboliginfo.dk er at understøtte andelsboligforeningers forpligtelser ved overdragelse af andelsboliger. Det er andelsboligforeningernes ansvar at nøgleoplysningerne er korrekt beregnet og indtastet. Data i nøgleoplysningsskemaerne tilhører andelsboligforeningerne, og det er dem, som har ansvaret for kvaliteten af data. Der er dog indsat visse kontroller på nogle af felterne hos andelsboliginfo.dk, for at sikre, at der indtastes oplysninger, som giver mening (fx kan der ikke indtastes tekst i numeriske felter). I andelsboliginfo.dk tjekkes det desuden om den indtastede regnskabsperiode overlapper en tidligere periode (det må den ikke).
Når Danmarks Statistik modtager data fra andelsboliginfo.dk, foretages der en omfattende kontrol af de oplysninger som bruges i andelsboligsalgsstatistikken. Der er udpeget 11 variable som essentielle for beregningsgrundlaget, de fire til beregning af prisbegrebet og 7 variable, som har været signifikante i regressionsanalyserne i mindst 2/3 af kørslerne. Det er de essentielle variable sammen med få andre variable, der er fokus på og som skal have bestemte værdier som betingelse for medtagelse i prisindekset. Ca.12% af observationerne er uegnede til at indgå i prisindekset, som beregnes som et hedonisk prisindeks.
For at undgå udelukkelse af samtlige ca. 12% af salg, hvor der er problemer i de essentielle variable, forsøges så mange som muligt reddet via imputering af manglende værdier og fejlretning af problematiske værdier. Denne indsats er koncentreret omkring de tre essentielle variable, hvor hver enkelte reparerede værdi har den største positive effekt på andelen af inkluderede salg, uden reparationerne indfører et bias i værdierne. Metoderne, der benyttes til at fejlrette og imputere, varierer fra variabel til variabel. Overordnet set benyttes der fem forskellige metoder: 1. Indsættelse af værdi fra et andet register 2. Udregning af værdien med hjælp fra andre variable, der udgør en teoretisk identitetsrelation (f.eks. boligareal = andelsværdi / foreningens andelsværdi pr. m2) 3. Rettelse af 10-, 100- og 1000-talsfejl via sammenligning med variable, der normalt korrelerer stærkt med den fejlagtige variabel 4. Indsættelse af værdi fra en næsten perfekt korreleret variabel 5. Adoption af den mest hyppige værdi fra foreningens andre regnskab
Når fejlretningen er overstået, køres alle fejlsøgningstjek igen for alle de variable, der enten er blevet rettet/imputeret på, eller hvor en rettet/imputeret variabel indgår i et konsistenstjek. Fordelingstallet genbestemmes også. Derefter beregnes prisbegrebet med formlen PRISBEGREB=F2*FORDELINGSTAL+Z18-Z3 hvor F2 er foreningens ejendomsværdi ved anvendte vurderingsprincip, Z18 er boligens salgspris, og Z3 er boligens andelsværdi. Prisbegrebet får også opstillet grænseværdier, som det skal ligge indenfor.
Fejlsøgningen for perioden 2015K1 - 2021K2 er mere begrænset for at bibeholde så mange observationer som muligt, data datagrundlaget for denne periode er baseret på en mindre stikprøve. Fejlsøgningen for perioden 2021K3 og frem er mere grundig, da datagrundlaget stammer fra obligatoriske indberetninger via andelsboliginfo.dk og dermed er større.
Databehandling
Knytning af salgsdata med foreningsdata: Som det første knyttes oplysningerne om salg af individuelle andelsboliger med information om andelsboligforeningen som helhed. Der findes ikke nogen entydig korrekt måde at foretage knytningen på, så der er lavet en pragmatisk løsning, hvor der er prioriteret at få så mange salg med som muligt. Desuden er det prioriteret at benytte de nyeste oplysninger om andelsboligforeningen. Følgende regler anvendes: - Knytningen foregår ud fra regnskabsperioden, som kobles på salget - Regnskabsperioden ligger mellem 0 og 24 måneder før salgsdatoen - Hvis der ligger flere regnskabsperioder inden for 0-24 måneder før salgsdatoen vælges de nyeste oplysninger
Knytning af låneoplysninger (for at kunne medtage en forklarende variabel om renteswap): Efter reglerne skal kreditinstitutterne indberette oplysningerne i januar måned samtidig med udsendelse af årsopgørelsen for det pågældende lån eller den finansielle aftale. Dvs. at i januar 2023 indberettes lån for 31/12 2022. Når der er nye lån i andelsboligsystemet (i løbet af januar) bliver de automatisk knyttet til oplysningerne om andelsboligforeningen som helhed. Følgende regler anvendes: - De salg der har været i fx 2022 hæftes på de lån som er indberettet pr. 31/12 2021. Dvs. salg i løbet af 2022 kobles sammen med lån opgjort pr. 31/12 2021.
Identificering af dubletsalg for perioden 2021K3 og frem (via andelsboliginfo.dk): Hvis et salg matcher adressen på et eller flere andre salg, hvor salgsdatoerne ligger inden for 30 dage af hinanden, køres disse tjek i følgende prioritering for at bestemme, hvilket salg der skal beholdes. Hvis der er uafgjort i første tjek, går afgørelsen videre til næste prioritet osv. Det første tjek, hvor der er en "vinder", afgør hvilket salg beholdes: 1. Salget hvor flest essentielle variable overordnet set består konsistenstjekkene 2. Salget hvor der er flest individuelt beståede konsistenstjek 3. Salget hvor flest variablers værdier ligger inden for grænseværdierne 4. Salget med flest udfyldte variable i alt 5. Salget med den nyeste salgsdato
Identificering af dubletsalg for perioden 2015K1 - 2021K2 (stikprøveindsamling): Salgsdata for perioden 2015K1 - 2021K2 er blevet indhentet fra flere forskellige kilder og det samme salg kan derfor være blevet indberettet flere gange til Danmarks Statistik. Hvis adressen og salgsdatoen er ens, men salgsprisen er forskellig er salgene blevet frasorteret, da det ikke vides med sikkerhed hvilke oplysninger, der er korrekte.
Hedonisk prisindeks: Danmarks Statistik har til brug for andelsboligernes prisindeks valgt at tage udgangspunkt i hedonisk regression. Hedonisk regression anvendes ofte til boligprisindeks. Når Danmarks Statistik ikke bruger hedonisk prisindeks for ejerboliger, er det fordi man kan bruge ejendomsvurderingerne til at kvalitetskorrigere boligprisen, men den mulighed foreligger ikke for andelsboliger. Udviklingen af et hedonisk baseret prisindeks involverer både regressionsteknik og konstruktion af kvalitetskorrigerede prisindeks. Tilgangen er velegnet, når de anvendte priser skal kvalitetskorrigeres for flere forskellige ting, som det netop er tilfældet for priserne på andelsboliger. Den valgte hedoniske metode hedder på engelsk ”Rolling time dummy (RTD) method” og er nærmere beskrevet i afsnit 6.2.2 i Technical manual on Owner-Occupied Housing and House Price Indices.
Korrektion
Når man beregner en prisudvikling vil man helst sammenligne prisen for præcis den samme vare på to forskellige tidspunkter. Udfordringen med andelsboliger er, at de er meget forskellige og det derfor ikke er helt ligetil at beregne prisudviklingen. For at gøre det, anvendes hedonisk regression. Med denne metode kan man relatere en observérbar pris som ejendomsprisen til en række foreliggende variable og estimere deres prispåvirkning. Man kan fx bruge en 0/1-dummy for, om der ”kun er andelsboliger i foreningen”, og en variabel med ”andelen af foreningens kvadratmeter, der udlejes”. Ved at give disse variable den gennemsnitlige værdi i alle observationer kan man lave et prisindeks, som er korrigeret for effekten af, at der er uforholdsmæssig stor eller lille andel af andelsboliger i et kvartals omsætning. Herved kommer man tættere på at måle prisen på en andelsbolig i stedet for prisen på en andelsbolig plus en andel i ejendommens udlejningsboliger.
Der foretages ikke sæsonkorrektion i statistikken.