1. Dados de mobilidade urbana com R
EXPLORANDO DADOS DE
MOBILIDADE URBANA COM R
26/nov/2017
13h30 - 15h00
FAAP - Sala 4 108
<Haydée Svab>
2. Dados de mobilidade urbana com R
Fonte: http://mediamatters.org/research/2012/10/01/a-history-of-dishonest-fox-charts/190225
3. Dados de mobilidade urbana com R
Fonte: http://mediamatters.org/research/2012/10/01/a-history-of-dishonest-fox-charts/190225
4. Dados de mobilidade urbana com R
Fonte:
http://www1.folha.uol.com.br/poder/2016/04/1759342-lula-e-marina-lideram-corrida-para-2018-tucanos-despencam.shtml
5. Dados de mobilidade urbana com R
Fonte:
https://www.facebook.com/photo.php?fbid=1053446014720706&set=pb.100001659537166.-2207520000.1485369941.&type=3&theater
6. Dados de mobilidade urbana com R
Dado
coletado /
levantado /
medido
Dado
processado
Resultados
computacionais Interpretação Texto
Final
AUTOR(A)
7. Dados de mobilidade urbana com R
Dado
coletado /
levantado /
medido
Dado
processado
Resultados
computacionais Interpretação Texto
Final
AUTOR(A)
LEITOR(A)
8. Dados de mobilidade urbana com R
Fontes: http://g1.globo.com/sao-paulo/noticia/2015/11/prefeitura-diz-que-mortes-no-transito-de-sp-cairam-em-comparacao-2014.html
https://catracalivre.com.br/geral/cidadania/indicacao/folha-mostra-que-russomano-manipula-dados-sobre-morte-no-transito/
9. Dados de mobilidade urbana com R
pacotes instalados e habilitados?
setting working directory feito?
base a ser trabalhada no local certo?
.:
Ler base de dados:
READ!
read.table()
read.csv()
read.csv2()
...
10. Dados de mobilidade urbana com R
#dica: HELP é seu amigo!
nome_do_data_frame$nome_da_variavel[linha]
data_frame$variavel = NULL para apagar variável
<- para atribuir
rm() para apagar objeto
+ para somar
- para subtrair
* para multiplicar
/ para dividir
# para comentar
12. Dados de mobilidade urbana com R
Mais um pouco de sintaxe… no ggplot
aes: define as principais variáveis para compor o gráfico
labs: define rótulos de eixos, título, subtítulo
scale: define parâmetros de escala
x_lim e y_lim: define limites dos eixos
geom_point: indica que o tipo de gráfico desejado é de pontos
geom_line: indica que o tipo de gráfico desejado é de linhas
Conector: +
13. Dados de mobilidade urbana com R
Ler, totalizar e plotar o total
mortes_transito <- read.csv("mortes-transito-2005-2015.csv", header =
TRUE, sep = ",", dec = ".", quote = '"')
mortes_transito <- mortes_transito %>% mutate (TOTAL =
AC_PEDESTRE + AC_CICLISTA + AC_MOTOCICLISTA +
AC_MOTOR_PASSAG)
plot1 <- ggplot(mortes_transito) +
scale_x_discrete(limits = c(2005:2015)) +
scale_y_continuous(breaks = seq(0, 1600, 200)) +
geom_point(aes(x=ANO, y=TOTAL), color = 'black') +
geom_line(aes(x=ANO, y=TOTAL), color = 'black') +
labs(x = "ano", y = "Número de mortes", title = "Quantidade de
mortes no trânsito entre 2005 e 2015"))
Resumindo...
14. Dados de mobilidade urbana com R
Tendência estimada em 2014
mortes_transito2014 <- mortes_transito %>% filter(ANO<2015) %>%
select(ANO, TOTAL)
modelo_2005a2014 <- lm(mortes_transito2014$TOTAL ~
mortes_transito2014$ANO)
b <- coefficients(modelo_2005a2014)[1]
a <- coefficients(modelo_2005a2014)[2]
plot2 <- ggplot(mortes_transito) + ylim(0,max(1600)) +
scale_x_discrete(limits = c(2005:2015)) +
geom_point(aes(x=ANO, y=TOTAL), color = 'black')+
geom_line(aes(x=ANO, y=TOTAL), color = 'black') +
labs(x = "ano", y = "Número de mortes", title = "Quantidade de
mortes no trânsito entre 2005 e 2015") +
geom_abline(aes(intercept = b, slope = a), color = 'purple'))
Resumindo...
15. Dados de mobilidade urbana com R
Avaliando 2015
mortes_transito <- mortes_transito %>%
mutate(VAR_ANO_ANTERIOR = (TOTAL/lag(TOTAL))-1)
no_mortes_previsao_2015 <- (a*(2015)+b)
queda_percent_esperada <- (no_mortes_previsao_2015 /
mortes_transito$TOTAL[mortes_transito$ANO==2014])-1
queda_percent_ocorrida <-
mortes_transito$VAR_ANO_ANTERIOR[mortes_transito$ANO==20
15]
diferenca = queda_percent_ocorrida - queda_percent_esperada
Resumindo...
16. Dados de mobilidade urbana com R
MORTES NO TRÂNSITO NO MUNICÍPIO DE SÃO PAULO
Ano Total
Nº
acidentes
pedestres
Nº
acidentes
ciclistas
Nº
acidentes
motociclist
as
Nº
acidentes
mot. e
passag.
Razão do Total
(Anox
/ Ano(x-1)
)
Variação em
relação ao
ano anterior
(Razão - 1)
2005 1505 748 93 345 319
2006 1487 734 84 380 289 98,8% -1,20%
2007 1566 736 83 466 281 105,3% 5,31%
2008 1463 670 69 478 246 93,4% -6,58%
2009 1382 671 61 428 222 94,5% -5,54%
2010 1357 630 49 478 200 98,2% -1,81%
2011 1365 617 49 512 187 100,6% 0,59%
2012 1231 540 52 438 201 90,2% -9,82%
2013 1152 514 35 403 200 93,6% -6,42%
2014 1249 555 47 440 207 108,4% 8,42%
2015 992 419 31 370 172 79,4% -20,58%
Obs.: Os dados entre 2000 e 2004 não são mais considerados em relatórios oficiais, por não serem comparáveis em razão de divergências nas medições
Fonte: http://www.cetsp.com.br/media/468500/acidentesdetransitofataisanual2015.pdf
17. Dados de mobilidade urbana com R
MORTES NO TRÂNSITO NO MUNICÍPIO DE SÃO PAULO
Ano Total Razão do Total (Anox
/ Ano(x-1)
) Possível efeito da redução
de velocidades
2005 1505
2006 1487 98,8%
2007 1566 105,3%
2008 1463 93,4%
2009 1382 94,5%
2010 1357 98,2%
2011 1365 100,6%
2012 1231 90,2%
2013 1152 93,6%
2014 1249 108,4%
2015* 1155 92,5% -7,53%
2015 (real) 992 79,4% (20,58% - 7,53%) = 13,05%
Obs.: Os dados entre 2000 e 2004 não são mais considerados em relatórios oficiais, por não serem comparáveis em razão de divergências nas medições
18. Dados de mobilidade urbana com R
MORTES NO TRÂNSITO NO MUNICÍPIO DE SÃO PAULO
Ano Total Razão do Total (Anox
/ Ano(x-1)
) Possível efeito da redução
de velocidades
2005 1505
2006 1487 98,8%
2007 1566 105,3%
2008 1463 93,4%
2009 1382 94,5%
2010 1357 98,2%
2011 1365 100,6%
2012 1231 90,2%
2013 1152 93,6%
2014 1249 108,4%
2015* 1155 92,5% -7,53%
2015 (real) 992 79,4% (992-1155)/1249 = -13,05%
Obs.: Os dados entre 2000 e 2004 não são mais considerados em relatórios oficiais, por não serem comparáveis em razão de divergências nas medições
19. Dados de mobilidade urbana com R
MORTES NO TRÂNSITO NO MUNICÍPIO DE SÃO PAULO
Ano
Nº
Acidentes
Marginal
Tietê
Razão
do Total
(Anox
/
Ano(x-1)
)
Possível
efeito da
redução de
velocidades
Nº
Acidentes
Marginal
Pinheiros
Razão
do Total
(Anox
/
Ano(x-1)
)
Possível
efeito da
redução de
velocidades
2007 49 34
2008 63 30
2009 52 30
2010 59 23
2011 56 27
2012 49 24
2013 39 24
2014 40 33
2015* 43 107,5%
2015 30 75% (-25% - 7,5%)
= -32,5%
19 57,6% -56,6%
20. Dados de mobilidade urbana com R
Estrutura de uma análise de dados
1) Definição da pergunta
2) Definição do banco de dados ideal
3) Determinação / descoberta dos dados a que você consegue
ter acesso
4) Obtenção dos dados
5) Limpeza do banco de dados
6) Análises exploratórias (estatísticas descritivas)
7) Modelagem (estatística preditiva)
8) Interpretação de resultados
9) Questionamento dos resultados
10) Síntese dos resultados (relatórios, artigos, etc.)
21. Dados de mobilidade urbana com R
● Transparência: da(s) base(s) de dados, dos cálculos feitos, dos
resultados obtidos e das premissas que basearam a interpretação
● Reprodutibilidade: escreva o código de tudo o que fizer e
comente para que outras pessoas (ou você, mais tarde)
entendam o que foi feito
● Créditos: dê créditos a autores(as) e cite as fontes consultadas
Resultados
Maior chance de impacto
Credibilidade do seu trabalho
#dica <3 Use licenças livres
Recomendações
22. Dados de mobilidade urbana com R
Quer olhar alguma via em específico?
Que tal as Marginais?
read.csv("mortes-transito-2007-2015_vias.csv")
Agora é com vocês!!!
Indo além...
23. Dados de mobilidade urbana com R
Muito obrigada!!!
Uma boa notícia:
estamos fundando o Rladies São Paulo!!!
Haydée Svab
CEO ASK-AR
co-fundadora PoliGNU
membro da Transparência Hacker
@hsvab
hsvab@hsvab.eng.br