SlideShare a Scribd company logo
1 of 22
KAN BOLIGERS RISIKO FOR AT
STÅ TOMME KORTLÆGGES ?
2015-11-17
MORTEN FUGLSANG, PH.D. GEOINFORMATIK, KONSULENT SWECO
OG
MORTEN FRIIS STENHOLT, TEAMKOORDINATOR, IKAST-BRANDE KOMMUNE
1
Foto : google street view
Introduktion
• I mange kommuner er der stor bevågenhed omkring boliger, der står tomme - I
Ikast-Brande Kommune er der afsat en pulje til landsbyfornyelse
• Kortkontoret har dertil skabt en oversigt over de boliger der aktuelt står tomme
• Deraf opstod ideen om hvorvidt det er muligt i et eller andet omfang at forudsige
hvilke boliger, der har størst risiko for at komme til at stå tomme – for så er det
måske muligt at forebygge den udvikling
• Her er en god mulighed for rigtigt at bringe data i spil og skabe ny interessant
viden
2015-11-17
MORTEN FUGLSANG, SWECO, KORTDAGE 2015 2
Hvor og hvordan findes tomme boliger ?
• Tomme boliger kortlægges via LOIS-data (BBR, DPR)
- BBR_ENHED aggregeres på bygningsniveau, så det
totale antal enheder beregnes
• BBR_ENHED filtreres på anvendelseskode, så
enheder til beboelse udvælges. Der aggregeres på
bygningsniveau og det totale antal beboelsesenheder
beregnes
• DPR_DTTOTAL joines på, så enheder uden beboere
udvælges. Der aggregeres på bygningsniveau og det
totale antal tomme beboelsesenheder beregnes
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
3
Samkøring af data i Ikast Brande
• Data med de tomme boliger sammenkøres med andre data
til forskellige formål:
– Visning i kortet
– adresser og FOTbygninger bruges til at markere de tomme boliger i kortet
– Boligkarakteristik
– diverse BBRid’er tilføjes for at kunne joine yderligere data fra OIS, SVUR
mv.
– Beboelseshistorik
– via DPR-data kortlægges, hvor lang tid boligen har stået tom (seneste
fraflytning) og hvem der boede der sidst (antal og gennemsnitsalder for
personer over/under 18 år)
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
4
Resultatet af udpegningen
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
5
Data-sammenkøring
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
6
Input fra Ikast
Brande
OIS
SVUR
Energi
Spatiale
analyser
Matrikelkort
Variabel
datasæt
Variabel typer
• De klassificerede variable
– Opvarmningskode og lignende
• De graduerede variable
– Ejendomsvurdering og lignende
• De geografiske variable
–Afstand til by
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
7
opfoerelse_aar bebo_arl ejd_vaerdi_2012
Middelværdi 1944,05 Middelværdi 130,33 Middelværdi 1876992,59
Standardfejl 2,11 Standardfejl 4,01 Standardfejl 160463,55
Median 1950,00 Median 113,50 Median 945000,00
Tilstand 1900,00 Tilstand 90,00 Tilstand 1050000,00
Standardafvigelse 34,59 Standardafvigelse 65,96 Standardafvigelse 2636685,16
Stikprøvevarians 1196,38 Stikprøvevarians 4350,94 Stikprøvevarians 6952108631915,19
Kurtosis 2,30 Kurtosis 8,06 Kurtosis 11,29
Skævhed -1,03 Skævhed 2,08 Skævhed 3,25
Område 234,00 Område 554,00 Område 17230000,00
Minimum 1780,00 Minimum 1,00 Minimum 170000,00
Maksimum 2014,00 Maksimum 555,00 Maksimum 17400000,00
Sum 524893,00 Sum 35190,00 Sum 506788000,00
Konfidensniveau(95,0%) 4,14 Konfidensniveau(95,0%) 7,90 Konfidensniveau(95,0%) 315924,16
De klassificerede variable
• Familiestørrelse
• Gennemsnitsalder
• Tagkode
• Ydervæg
• Antal værelser
• Postnumre
• Opvarmningskoder
• Forsyningstyper
• Supplerende varme
• Afløbskode
• …
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
8
De graduerede variable • Matrikelareal
• Beboelsesareal
• Antal værelser
• Antal
badeværelser
• Opførelses år
• Ejendomsværdi
(2012/2014)
• Ændring (12/14)
• Sidste antal
beboere
• Sidste beboere
gennemsnitsalder
• Sidste beboere
antal børn
• …
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
9
De geografiske variable
• Afstand til større byer
• Afstand til bymæssig bebyggelse
• Gennemsnitlig afstand til 5 ‘naboer’ i
datasættet
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
10
Maup og korrelation i data?
• Er det repræsentativt at tage Ikast
Brande kommune ud som en helhed
og se på data, eller skulle analysen
have været forfinet derunder ?
• Mange variable har også indbyrdes
korrelation
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
11
opfoerelse_aar tag_kode varmeinstal_kode bebo_arl vaerelse_ant antbadevaerelser ejd_vaerdi_2012
opfoerelse_aar 0,058 -0,148 0,068 0,014 0,215 -0,014
tag_kode 0,058 0,176 -0,019 0,001 -0,029 0,119
varmeinstal_kode -0,148 0,176 -0,081 -0,134 -0,157 0,159
bebo_arl 0,068 -0,019 -0,081 0,817 0,608 0,069
vaerelse_ant 0,014 0,001 -0,134 0,817 0,491 0,059
antbadevaerelser 0,215 -0,029 -0,157 0,608 0,491 0,021
ejd_vaerdi_2012 -0,014 0,119 0,159 0,069 0,059 0,021
Metoden
• Til at behandle data benyttes en
metode der hedder ‘ Agglomerative
hierarchical clustering’ (AHC)
• Metoden søger at finde adskilte
grupper (clusters) i data plottet i n-
dimensioner
• Metoden estimerer selv det
nødvendige antal clusters der skal
til for at beskrive data.
• Til beregningerne benyttes R og
XLstat
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
12
Multivariat clustering analyse på data
• Vi udvælger til analysen kun parcelhuse…
• Analysen blev kørt mange mange gange, med forskellige variabel
konfigurationer for at analysere følsomheden i output.
• To hovedtype af modelkørslen blev sammenstillet :
– På bebyggelsesvariable alene
– På bebyggelsesvariable, geografi og ejerforhold
• Data blev standardiseret før kørslen i modellen
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
13
Bebyggelsesvariable alene
• AHC metoden foreslår 9 clusters i data.
• Cluster 1+2 dækker 68 % af observationerne – de er karakteriseret ved :
– Opførelses år 1935 – 1965
– Varmeinstallation 1-2
– Beboelsesareal 85 – 135 m2
– Antal værelser 3-5
– Antal badeværelser 1
– Ejendomsværdi under 1. mio
• (Baseret på cluster centroider og spredning)
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
14
Class 1 2 3 4 5 6 7 8 9
Objects 118 67 13 8 5 24 1 31 3
Sum of weights 118 67 13 8 5 24 1 31 3
Within-class variance 28101090028,963 14184195809,461 360576934740,372 600312507279,589 235000005986,500 251503639576,368 0,000 45478497754,346 103333337871,667
Minimum distance to centroid 2203,951 1671,703 115384,617 293750,005 100000,007 70833,354 0,000 24193,554 133333,351
Average distance to centroid 145420,879 95577,671 508875,749 629687,507 360000,007 450000,028 0,000 183142,569 244444,453
Maximum distance to centroid 317796,673 328328,366 934615,432 1356250,003 700000,010 820833,341 0,000 424193,554 366666,671
Bebyggelsesvariable, geografi og ejerforhold
• Her kommer noget flere clusters – 21 i alt i den beregning der præsenteres her
• Der er mange historier heri – har taget et udpluk:
– Cluster 1 (23%) : Yngre med og uden børn, i byområder, areal under 100m2 …
– Cluster 16 (11%): Ældre i byområder, areal omkring 130m2, opførelses år omkring 1970
– Cluster 6 (9,6%) : Ældre, langt fra by (4km), areal omkring 180m2…
– Cluster 2 (6,2%): Yngre, afstand til by 2 km, areal under 80m2, opførelse 1930…
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
15
Class 1 16 9 6 17 2 … 20
Objects 64 31 26 26 21 17 … 1
Hvor findes de ?
• Kørsel 1 Kørsel 2
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
16
Opskalering
• Der kan defineres flere forskellige modeller:
–Samlet risiko vurdering, alle variable sammen
–Enkelte risiko faktorer, variable hver for sig
• Derefter skal de genererede data på befolkning, goegrafi
m.m. selvfølgelig beregnes for hele kommunen (og
nabokommuner) – derefter kan man sammensætte en
opskallering…
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
17
Anvendelighed
• Forsøger ikke at forklare hvorfor en bolig står tom - Søger at isolere
faktorer der er statistisk overrepræsenterede i de observerede data
• Målsætningen var at afdække om der ud fra vores mange data, var
mulighed for sige noget generelt om fællestræk for tomme boliger ud fra
det vi ved om dem
• Der er selvfølgelig en lang række vigtige faktorer når man skal evaluere
resultatet:
– Hvilke data blev anvendt
– Hvordan blev de kombineret
– Hvordan tolkes resultatet.
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
18
Konklusion
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
19
• Det er muligt at identificere grupper af faktorer der er
statistisk overrepræsenterede på denne måde.
• Uden at forsøge at forklare hvorfor, er en række statistiske
fællestræk fundet .
• Målet var at forsøge at afdække information om de
bagvedliggende faktorer, og skabe ny viden, der kan
benyttes til at træffe bedre beslutninger - dette synes jeg i
høj grad er blevet bevist faktisk er muligt.
Perspektivering
• Det analytiske data-arbejde kan altid udbygges
• Modellen kan teoretisk forfines med flere data
–Socioøkonomi
–Ydereligere brug af CPR
–FLIS m.m.
• Dog skal gældende krav om diskretionering m.m.
selvfølgelig overholdes – vi kan komme tæt på…
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
20
Tak for opmærksomheden…
• Email : mortenwinther.fuglsang@sweco.dk
2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015
21
Kan boligers risiko for at stå tomme kortlægges ?

More Related Content

Featured

Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 

Featured (20)

Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 

Kan boligers risiko for at stå tomme kortlægges ?

  • 1. KAN BOLIGERS RISIKO FOR AT STÅ TOMME KORTLÆGGES ? 2015-11-17 MORTEN FUGLSANG, PH.D. GEOINFORMATIK, KONSULENT SWECO OG MORTEN FRIIS STENHOLT, TEAMKOORDINATOR, IKAST-BRANDE KOMMUNE 1 Foto : google street view
  • 2. Introduktion • I mange kommuner er der stor bevågenhed omkring boliger, der står tomme - I Ikast-Brande Kommune er der afsat en pulje til landsbyfornyelse • Kortkontoret har dertil skabt en oversigt over de boliger der aktuelt står tomme • Deraf opstod ideen om hvorvidt det er muligt i et eller andet omfang at forudsige hvilke boliger, der har størst risiko for at komme til at stå tomme – for så er det måske muligt at forebygge den udvikling • Her er en god mulighed for rigtigt at bringe data i spil og skabe ny interessant viden 2015-11-17 MORTEN FUGLSANG, SWECO, KORTDAGE 2015 2
  • 3. Hvor og hvordan findes tomme boliger ? • Tomme boliger kortlægges via LOIS-data (BBR, DPR) - BBR_ENHED aggregeres på bygningsniveau, så det totale antal enheder beregnes • BBR_ENHED filtreres på anvendelseskode, så enheder til beboelse udvælges. Der aggregeres på bygningsniveau og det totale antal beboelsesenheder beregnes • DPR_DTTOTAL joines på, så enheder uden beboere udvælges. Der aggregeres på bygningsniveau og det totale antal tomme beboelsesenheder beregnes 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 3
  • 4. Samkøring af data i Ikast Brande • Data med de tomme boliger sammenkøres med andre data til forskellige formål: – Visning i kortet – adresser og FOTbygninger bruges til at markere de tomme boliger i kortet – Boligkarakteristik – diverse BBRid’er tilføjes for at kunne joine yderligere data fra OIS, SVUR mv. – Beboelseshistorik – via DPR-data kortlægges, hvor lang tid boligen har stået tom (seneste fraflytning) og hvem der boede der sidst (antal og gennemsnitsalder for personer over/under 18 år) 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 4
  • 5. Resultatet af udpegningen 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 5
  • 6. Data-sammenkøring 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 6 Input fra Ikast Brande OIS SVUR Energi Spatiale analyser Matrikelkort Variabel datasæt
  • 7. Variabel typer • De klassificerede variable – Opvarmningskode og lignende • De graduerede variable – Ejendomsvurdering og lignende • De geografiske variable –Afstand til by 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 7 opfoerelse_aar bebo_arl ejd_vaerdi_2012 Middelværdi 1944,05 Middelværdi 130,33 Middelværdi 1876992,59 Standardfejl 2,11 Standardfejl 4,01 Standardfejl 160463,55 Median 1950,00 Median 113,50 Median 945000,00 Tilstand 1900,00 Tilstand 90,00 Tilstand 1050000,00 Standardafvigelse 34,59 Standardafvigelse 65,96 Standardafvigelse 2636685,16 Stikprøvevarians 1196,38 Stikprøvevarians 4350,94 Stikprøvevarians 6952108631915,19 Kurtosis 2,30 Kurtosis 8,06 Kurtosis 11,29 Skævhed -1,03 Skævhed 2,08 Skævhed 3,25 Område 234,00 Område 554,00 Område 17230000,00 Minimum 1780,00 Minimum 1,00 Minimum 170000,00 Maksimum 2014,00 Maksimum 555,00 Maksimum 17400000,00 Sum 524893,00 Sum 35190,00 Sum 506788000,00 Konfidensniveau(95,0%) 4,14 Konfidensniveau(95,0%) 7,90 Konfidensniveau(95,0%) 315924,16
  • 8. De klassificerede variable • Familiestørrelse • Gennemsnitsalder • Tagkode • Ydervæg • Antal værelser • Postnumre • Opvarmningskoder • Forsyningstyper • Supplerende varme • Afløbskode • … 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 8
  • 9. De graduerede variable • Matrikelareal • Beboelsesareal • Antal værelser • Antal badeværelser • Opførelses år • Ejendomsværdi (2012/2014) • Ændring (12/14) • Sidste antal beboere • Sidste beboere gennemsnitsalder • Sidste beboere antal børn • … 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 9
  • 10. De geografiske variable • Afstand til større byer • Afstand til bymæssig bebyggelse • Gennemsnitlig afstand til 5 ‘naboer’ i datasættet 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 10
  • 11. Maup og korrelation i data? • Er det repræsentativt at tage Ikast Brande kommune ud som en helhed og se på data, eller skulle analysen have været forfinet derunder ? • Mange variable har også indbyrdes korrelation 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 11 opfoerelse_aar tag_kode varmeinstal_kode bebo_arl vaerelse_ant antbadevaerelser ejd_vaerdi_2012 opfoerelse_aar 0,058 -0,148 0,068 0,014 0,215 -0,014 tag_kode 0,058 0,176 -0,019 0,001 -0,029 0,119 varmeinstal_kode -0,148 0,176 -0,081 -0,134 -0,157 0,159 bebo_arl 0,068 -0,019 -0,081 0,817 0,608 0,069 vaerelse_ant 0,014 0,001 -0,134 0,817 0,491 0,059 antbadevaerelser 0,215 -0,029 -0,157 0,608 0,491 0,021 ejd_vaerdi_2012 -0,014 0,119 0,159 0,069 0,059 0,021
  • 12. Metoden • Til at behandle data benyttes en metode der hedder ‘ Agglomerative hierarchical clustering’ (AHC) • Metoden søger at finde adskilte grupper (clusters) i data plottet i n- dimensioner • Metoden estimerer selv det nødvendige antal clusters der skal til for at beskrive data. • Til beregningerne benyttes R og XLstat 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 12
  • 13. Multivariat clustering analyse på data • Vi udvælger til analysen kun parcelhuse… • Analysen blev kørt mange mange gange, med forskellige variabel konfigurationer for at analysere følsomheden i output. • To hovedtype af modelkørslen blev sammenstillet : – På bebyggelsesvariable alene – På bebyggelsesvariable, geografi og ejerforhold • Data blev standardiseret før kørslen i modellen 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 13
  • 14. Bebyggelsesvariable alene • AHC metoden foreslår 9 clusters i data. • Cluster 1+2 dækker 68 % af observationerne – de er karakteriseret ved : – Opførelses år 1935 – 1965 – Varmeinstallation 1-2 – Beboelsesareal 85 – 135 m2 – Antal værelser 3-5 – Antal badeværelser 1 – Ejendomsværdi under 1. mio • (Baseret på cluster centroider og spredning) 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 14 Class 1 2 3 4 5 6 7 8 9 Objects 118 67 13 8 5 24 1 31 3 Sum of weights 118 67 13 8 5 24 1 31 3 Within-class variance 28101090028,963 14184195809,461 360576934740,372 600312507279,589 235000005986,500 251503639576,368 0,000 45478497754,346 103333337871,667 Minimum distance to centroid 2203,951 1671,703 115384,617 293750,005 100000,007 70833,354 0,000 24193,554 133333,351 Average distance to centroid 145420,879 95577,671 508875,749 629687,507 360000,007 450000,028 0,000 183142,569 244444,453 Maximum distance to centroid 317796,673 328328,366 934615,432 1356250,003 700000,010 820833,341 0,000 424193,554 366666,671
  • 15. Bebyggelsesvariable, geografi og ejerforhold • Her kommer noget flere clusters – 21 i alt i den beregning der præsenteres her • Der er mange historier heri – har taget et udpluk: – Cluster 1 (23%) : Yngre med og uden børn, i byområder, areal under 100m2 … – Cluster 16 (11%): Ældre i byområder, areal omkring 130m2, opførelses år omkring 1970 – Cluster 6 (9,6%) : Ældre, langt fra by (4km), areal omkring 180m2… – Cluster 2 (6,2%): Yngre, afstand til by 2 km, areal under 80m2, opførelse 1930… 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 15 Class 1 16 9 6 17 2 … 20 Objects 64 31 26 26 21 17 … 1
  • 16. Hvor findes de ? • Kørsel 1 Kørsel 2 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 16
  • 17. Opskalering • Der kan defineres flere forskellige modeller: –Samlet risiko vurdering, alle variable sammen –Enkelte risiko faktorer, variable hver for sig • Derefter skal de genererede data på befolkning, goegrafi m.m. selvfølgelig beregnes for hele kommunen (og nabokommuner) – derefter kan man sammensætte en opskallering… 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 17
  • 18. Anvendelighed • Forsøger ikke at forklare hvorfor en bolig står tom - Søger at isolere faktorer der er statistisk overrepræsenterede i de observerede data • Målsætningen var at afdække om der ud fra vores mange data, var mulighed for sige noget generelt om fællestræk for tomme boliger ud fra det vi ved om dem • Der er selvfølgelig en lang række vigtige faktorer når man skal evaluere resultatet: – Hvilke data blev anvendt – Hvordan blev de kombineret – Hvordan tolkes resultatet. 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 18
  • 19. Konklusion 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 19 • Det er muligt at identificere grupper af faktorer der er statistisk overrepræsenterede på denne måde. • Uden at forsøge at forklare hvorfor, er en række statistiske fællestræk fundet . • Målet var at forsøge at afdække information om de bagvedliggende faktorer, og skabe ny viden, der kan benyttes til at træffe bedre beslutninger - dette synes jeg i høj grad er blevet bevist faktisk er muligt.
  • 20. Perspektivering • Det analytiske data-arbejde kan altid udbygges • Modellen kan teoretisk forfines med flere data –Socioøkonomi –Ydereligere brug af CPR –FLIS m.m. • Dog skal gældende krav om diskretionering m.m. selvfølgelig overholdes – vi kan komme tæt på… 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 20
  • 21. Tak for opmærksomheden… • Email : mortenwinther.fuglsang@sweco.dk 2015-11-17MORTEN FUGLSANG, SWECO, KORTDAGE 2015 21