OSSConf 2024
Analýzy regionálnych údajov o demografii a
nezamestnanosti krajín Vyšehradskej
skupiny v R a PostGIS
Michal Páleník
Michal Páleník • www.palenik.sk
Potulky slnečnou
sústavou
● www.sustava.sk
● v mierke 1:464 mil
Mapa ničoho
● palenik.sk/ mapa-
nicoho
• www.palenik.sk/st
ar-trek
LAU1 dataset
● https://www.iz.sk/okresy
● administratívne údaje
– o nezamestnanosti
– o obyvateľstve
– prepojené na OpenStreetMap
– wikidata, skratky, ...
● 733 regiónov, 134543 pozorovaní
Ako použiť?
● stiahnem dáta
– doi:10.5281/zenodo.6165135
– CSV, SQL, (topo|geo|NULL)json, SHP, ods
● zorientujem sa v dátach
● spracujem
● vykreslím
stiahnem
● wget
https://zenodo.org/records/11520556/files/lau1-
current-iz.sql.bz2
zorientujem sa
● pozriem si opis stĺpcov
● chcem časový rad alebo aktuálny stav?
● ktoré dáta nás zaujímajú?
– miera nezamestnanosti
– registered_unemployed / Y15-64
spracujem
● dám do PostGIS a prehodím do R
● bzcat lau1-current-iz.sql.bz2
| psql mapnik
● prečo PostGIS?
– som zvyknutý na SQL syntax
– dlhodobý storage keď vypnem počítač
– má indexy a vie group by, st_union, ...
načítaj do R
● require('RpostgreSQL');
● drv <- dbDriver('PostgreSQL');
● conm<-dbConnect(drv, dbname='mapnik');
● okresy=pgGetGeom(conm, geom='way',
query='select * from lau1_dataset_current');
● okresy$podiel = okresy$registered_unemployed
/okresy$"Y15-64" * 100
vykreslím mapu
● plot(okresy)
vykreslím šedú mapu
● mmax=boxplot(okresy$podiel)$stats[5];
● col=grey(1-pmin(mmax,
ifelse(is.na(okresy$podiel),0,
okresy$podiel))/mmax))
● plot(okresy, border="black", col=col)
vykreslím farebnú mapu
● col=ifelse(okresy$podiel>8,'red', 'green');
● plot(okresy, col=col, border='black');
● legend('bottomleft', col=c('red', 'green'),
legend=c('viac ako 8%', 'menej ako 8%'), lwd=4)
● legend('bottomright', cex=1.5, bty="n",
legend="data: www.iz.sk/LAU1
● doi:10.5281/zenodo.6165135");
výstup…
● png('out.png',
width=800,
height=1000);
● …
● dev.off();
Michal Páleník
● používajte tento dataset
– nielen na školské účely
– nezabudnite na attribution
● vyskúšajte PostGIS a R
– sú fakt ľahké a užitočné

Analýzy regionálnych údajov o demografii a nezamestnanosti krajín Vyšehradskej skupiny v  R a PostGIS