TestLab: Kvadratdata
Hvis du skal visualisere mange oplysninger på en gang eller personfølsomme oplysninger, så er kvadratdata en metode som kan bruges. Her er eksempler med indkomst i Danmark.
Herover er det husstandsindkomst i 2007 i Hovedstadsområdet, som er vist. De højeste indkomster er markeret med rødt. Nok ikke så overraskende er de største husstandsindkomster i dette her tilfælde uden for Københavns kommune.
Oplysningerne i kortet er vist i felter på 100 X 100 meter. Derfor navnet kvadratdata.
Værdien i hvert kvadrat er beregnet på baggrund af Danmarks Statistiks oplysninger, om hver husstand i hele landet.
Du kan herunder også se eksempler på husstandsindkomst i områderne ved Århus, Svendborg og på Lolland.
Især Lolland skiller sig tydeligt ud som et område uden høje indkomster.
Bemærk at du kan få billederne vist på hele skærmen - klik på kvadratet med de fire pile - brug ESC når du skal tilbage.
Kvadratdata kan give det store overblik. Men du kan også komme helt tæt på.
På kortet kan du i princippet aflæse oplysningerne i så lille et område, at man med lokalkendskab, godt kan regne ud hvem, der er hvem.
Derfor kræver Danmarks Statistik, at der sker en anonymisering inden du offentliggøre data. Der er flere metoder. Du kan vælge at bruge større kvadrater - f.eks. 1 X 1 km eller 10 X 10 km. Det vil løseproblemet mange steder.
Men i dette her tilfælde er brugt en metode, som bevarer de små kvadrater, og hvor du alligevel ikke kommer tættere på end 150 husstande, som den mindste enhed. Du laver et slag hyperlokalt gennemsnit.
Metoden er, at hvis der ikke er 150 husstande i et enkelt kvadrat på 100 X 100 meter, så lægges kvadratet sammen med andre kvadrater i området indtil de tilsammen dækker mindst 150 husstande. Det kaldes en klynge.
I kortet ovenover kan du se en klynge, som er sat sammen af otte kvadrater. I det område er der altså mindst 150 husstande.
Her kan du se hvordan kvadraterne her kan være samlet i en klynge.
Kvadraterne i tyndt befolkende områder kan altså godt være i klynge sammen, selv om de ikke lægger lige op og ned af hinanden.
I dette her tilfælde er det Informi GIS, som på baggrund af data fra Danmarks Statistik har anonymiseret oplysningerne med et program, der automatisk inddeler oplysningerne i klynger. Informi bruger bl.a. kvadratdata til BAO, en kommerciel analyse-service til erhvervslivet.
I et kommende indlæg vil jeg give eksempler på, hvordan hvordan kvadratdata kan bruges i en journalistisk analyse.
Du kan se et andet eksempel på brug af kvadratdata hos Geomatic, der også leverer baggrundsoplysninger om forbrugere under navnet Conzoom.
Der er mere infomation om kvadratnet hos Danmarks Statistik.
Tak til Danmarks Statistik og Informi GIS for at stille data til rådighed for eksempler på GeoJournalistik.dk.
Eksemplet er bearbejdet i ArcMap.






























GeoJournalistik » TestLab: Se hvor de rige bor skriver
am januar 13 2009 @ 20:58
[...] af gangen. Det er et krav fra Danmarks Statistik, hvis du skal offentliggøre oplysningerne. Se tidligere post om metoden og [...]
Hans Ravnkjær Larsen skriver
am maj 12 2009 @ 20:43
Det er en rigtig god introduktion til det dér med demografika på kort. Der er blot flere nuancer i det, end det som artiklen antyder - at ‘150 husstande er minimum’ som bærer af informationer … Det har vi for så vidt brugt snart 7 år på at forfine og løbende videreudvikle.
Men altså: Vi skal kravle før vi kan gå, og der er raison i hvad du skriver. (Som altid!)