SlideShare a Scribd company logo
1 of 23
Download to read offline
TRANSFORMAÇÃO DE DADOS 
Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
TRANSFORMAÇÃO DE 
DADOS 
• Quando tiramos uma foto muitas vezes o resultado não é o esperado 
• As cores podem estar muito escuras ou muito claras 
• O foco pode estar errado 
• Objetos podem estar muito pequenos 
• Nestes casos, utilizamos ferramentas para aplicar filtros e transformar 
a foto em algo mais próximo do que desejamos 
• Muitas vezes o mesmo ocorrer com os dados
TRANSFORMAÇÃO DE 
DADOS 
• Muitas vezes obtemos um conjunto de dados que quando 
visualizado apresenta imperfeições ou objetivos difíceis de ver 
• Além disso, se você pretende analisar estatisticamente seus 
dados provavelmente precisar considerar a forma como os 
dados estão distribuídos 
• Transformações são utilizadas para tratar destes dois 
problemas
TRANSFORMAÇÃO DE 
DADOS 
• Transformações são conjuntos de procedimentos 
de manipulação que podem revelar fatos não 
observáveis em sua forma original. 
• Podemos, por exemplo, ajustar a distribuição dos 
dados para torná-los mais fáceis de exibir e 
adequadas para certos testes estatísticos
ALERTA 
• Jamais realize operações de transformação em 
seus dados originais! 
• Você deve criar uma nova coluna para armazenar 
os novos valores para as variáveis sendo 
transformadas ou criar uma cópia inteira do seu 
conjunto de dados!
DISTRIBUIÇÃO NORMAL 
• Uma das suposições mais frequentemente utilizadas nos testes 
estatísticos é que os dados são normalmente distribuídos 
• Os dados se distribuem de foram simétrica ao redor de um 
valor central 
• “Curva do sino” 
• Alguns dados que são geralmente geralmente distribuídos de 
forma normal são medições humanas como altura, peso, 
expectativa de vida e resultados em testes de QI
DISTRIBUIÇÃO NORMAL
DISTRIBUIÇÃO NORMAL
OBLIQUIDADE 
• Dados oblíquos, diferentemente de dados normais, não se 
distribuem de forma simétrica em relação a um valor central. 
• Estes conjuntos tendem a ter mais observações à direita ou 
à esquerda deste valor 
• Se você observar que seus dados apresentam esta 
característica talvez seja necessário realizar algum tipo de 
transformação
OBLIQUIDADE À ESQUERDA
OBLIQUIDADE À DIREITA
EXEMPLO
DISTRIBUIÇÃO DA POPULAÇÃO 
POR ESTADO BRASILEIRO 
Frequência 
16 
12 
8 
4 
0 
Até 5 6 a 10 11 a 15 16 a 20 21 a 25 26 a 30 31 a 35 36 a 40 41 a 45 
População (milhões de habitantes)
POPULAÇÃO POR ÁREA 
URBANIZADA 
População (milhões de habitantes) 
50 
37.5 
25 
12.5 
0 
0 12.5 25 37.5 50 
Área urbanizada (centenas de Km2)
TRANSFORMAÇÃO 
LOGARÍTMICA
DISTRIBUIÇÃO DA POPULAÇÃO 
POR ESTADO BRASILEIRO 
Frequência 
14 
10.5 
7 
3.5 
0 
Até 6.0 De 6.1 a 6.5 De 6.6 a 7.0 De 7.1 a 7.5 De 7.6 a 8 
Log da população (milhões de habitantes)
POPULAÇÃO POR ÁREA 
URBANIZADA 
Log da População (milhões de habitantes) 
8 
6.25 
4.5 
2.75 
1 
1 1.75 2.5 3.25 4 
Log da Área urbanizada (Km2)
TRANSFORMAÇÃO PELA RAÍZ 
QUADRADA
DISTRIBUIÇÃO DA POPULAÇÃO 
POR ESTADO BRASILEIRO 
Frequência 
12 
9 
6 
3 
0 
Até 1000 1001 a 2000 2001 a 3000 3001 a 4000 4001 a 5000 Acima de 5000 
Raiz quadrada da população (milhões de habitantes)
POPULAÇÃO POR ÁREA 
URBANIZADA 
Raiz Quadrada da População (milhões de 
habitantes) 
7000 
5250.25 
3500.5 
1750.75 
1 
1 20.75 40.5 60.25 80 
Raiz Quadrada da Área urbanizada (Km2)
ESCOLHENDO A 
TRANSFORMAÇÃO CORRETA 
• A medida que você começa a entender melhor os efeitos de 
diferentes transformações começará a se perguntar como 
escolher a transformação adequada 
• Não é simples responder esta pergunta! 
• Apesar de existirem métodos estatísticos para essa escolha, a 
resposta geralmente envolve tentativa e erro 
• Uma estratégia geral é aplicar algumas das transformações mais 
utilizadas, observar os resultados e escolher a mais adequada
TRANSFORMAÇÕES COMUNS 
Método Operação 
Matemática 
Indicações Contra-indicações 
Log ln(x) 
log(x) 
Obliquidade à 
direita 
Valores nulos 
Valores negativos 
Raiz Quadrada x Obliquidade à 
direita Valores negativos 
Quadrado x Obliquidade à 
esquerda Valores negativos 
Raíz Cúbica x 
Obliquidade à 
direita 
Valores Negativos 
Menos efetiva que 
o log na 
normalização 
Recíproco 1/x 
Diminuir valores 
grandes e 
aumentar valores 
pequenos 
Valores nulos 
Valores negativos
ARMADILHAS 
• Uma vez que os métodos de transformação envolvem a 
aplicação de uma função matemática aos dados, você precisa 
tomar cuidado na hora de interpretar e apresentar os 
resultados por conta da mudança na unidade 
• Por exemplo, ao apresentar a transformação logarítmica nos 
exemplos passamos a tratar do log da população e não mais 
da população. 
• Isso precisa ficar bem claro nos gráficos

More Related Content

What's hot

Princípios da estatística experimental
Princípios da estatística experimental   Princípios da estatística experimental
Princípios da estatística experimental UERGS
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoAntonio Mankumbani Chora
 
Absorção de nutrientes pelas plantas.pptx
Absorção de nutrientes pelas plantas.pptxAbsorção de nutrientes pelas plantas.pptx
Absorção de nutrientes pelas plantas.pptxAlexandraDamasceno2
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritivaRodrigo Rodrigues
 
FIXAÇÃO BIOLÓGICA NA CULTURA DA SOJA
FIXAÇÃO BIOLÓGICA NA CULTURA DA SOJAFIXAÇÃO BIOLÓGICA NA CULTURA DA SOJA
FIXAÇÃO BIOLÓGICA NA CULTURA DA SOJAGeagra UFG
 
Influência de fatores climáticos na agricultura
Influência de fatores climáticos na agriculturaInfluência de fatores climáticos na agricultura
Influência de fatores climáticos na agriculturaGeagra UFG
 
Producao e comercializacao de frutas
Producao e comercializacao de frutasProducao e comercializacao de frutas
Producao e comercializacao de frutasgustavo_ruffeil
 
Sistemas geodésicos de referênci acrea
Sistemas geodésicos de referênci acreaSistemas geodésicos de referênci acrea
Sistemas geodésicos de referênci acreaNome Sobrenome
 
Manejo do solo e plantio de soja
Manejo do solo e plantio de sojaManejo do solo e plantio de soja
Manejo do solo e plantio de sojaGeagra UFG
 
Revisao av2 pesquisa de mercado
Revisao av2   pesquisa de mercadoRevisao av2   pesquisa de mercado
Revisao av2 pesquisa de mercadokatiagomide
 

What's hot (20)

Adm. rural 3
Adm. rural 3Adm. rural 3
Adm. rural 3
 
Aula 04 séries estatísticas
Aula 04   séries estatísticasAula 04   séries estatísticas
Aula 04 séries estatísticas
 
Escalas
EscalasEscalas
Escalas
 
Fertilidade do Solo
Fertilidade do SoloFertilidade do Solo
Fertilidade do Solo
 
Princípios da estatística experimental
Princípios da estatística experimental   Princípios da estatística experimental
Princípios da estatística experimental
 
Estatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formandoEstatistica aplicada exercicios resolvidos manual tecnico formando
Estatistica aplicada exercicios resolvidos manual tecnico formando
 
Absorção de nutrientes pelas plantas.pptx
Absorção de nutrientes pelas plantas.pptxAbsorção de nutrientes pelas plantas.pptx
Absorção de nutrientes pelas plantas.pptx
 
Aula 1 introdução e estatística descritiva
Aula 1   introdução e  estatística descritivaAula 1   introdução e  estatística descritiva
Aula 1 introdução e estatística descritiva
 
FIXAÇÃO BIOLÓGICA NA CULTURA DA SOJA
FIXAÇÃO BIOLÓGICA NA CULTURA DA SOJAFIXAÇÃO BIOLÓGICA NA CULTURA DA SOJA
FIXAÇÃO BIOLÓGICA NA CULTURA DA SOJA
 
Germinação
GerminaçãoGerminação
Germinação
 
Geometria espacial
Geometria espacialGeometria espacial
Geometria espacial
 
Manejo e Conservação do Solo
Manejo e Conservação do SoloManejo e Conservação do Solo
Manejo e Conservação do Solo
 
Topografia aula01
Topografia aula01Topografia aula01
Topografia aula01
 
Aula 01 introdução a estatística
Aula 01   introdução a estatísticaAula 01   introdução a estatística
Aula 01 introdução a estatística
 
Influência de fatores climáticos na agricultura
Influência de fatores climáticos na agriculturaInfluência de fatores climáticos na agricultura
Influência de fatores climáticos na agricultura
 
Producao e comercializacao de frutas
Producao e comercializacao de frutasProducao e comercializacao de frutas
Producao e comercializacao de frutas
 
Sistemas geodésicos de referênci acrea
Sistemas geodésicos de referênci acreaSistemas geodésicos de referênci acrea
Sistemas geodésicos de referênci acrea
 
Manejo do solo e plantio de soja
Manejo do solo e plantio de sojaManejo do solo e plantio de soja
Manejo do solo e plantio de soja
 
1 paisagismo - introdução
1 paisagismo - introdução1 paisagismo - introdução
1 paisagismo - introdução
 
Revisao av2 pesquisa de mercado
Revisao av2   pesquisa de mercadoRevisao av2   pesquisa de mercado
Revisao av2 pesquisa de mercado
 

Viewers also liked

Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e ClassificaçãoAlexandre Duarte
 
Desvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrõesDesvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrõesGabriel Passeri
 
Preparação e Limpeza de Dados
Preparação e Limpeza de DadosPreparação e Limpeza de Dados
Preparação e Limpeza de DadosAlexandre Duarte
 
Analise de agrupamentos uem
Analise de agrupamentos uemAnalise de agrupamentos uem
Analise de agrupamentos uemfalmeida856
 
Análises agrupamento e dissimilaridade no Genes
Análises agrupamento e dissimilaridade no GenesAnálises agrupamento e dissimilaridade no Genes
Análises agrupamento e dissimilaridade no GenesCristiano Lemes da Silva
 
Introdução à Teoria dos Grafos
Introdução à Teoria dos GrafosIntrodução à Teoria dos Grafos
Introdução à Teoria dos GrafosBianca Dantas
 
Análise de correlação
Análise de correlaçãoAnálise de correlação
Análise de correlaçãoEconomia Silva
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normaljoseagrosa
 
Fundamentos do desenho técnico
Fundamentos do desenho técnicoFundamentos do desenho técnico
Fundamentos do desenho técnicoleobispo28
 
Testes parametricos e nao parametricos
Testes parametricos e nao parametricosTestes parametricos e nao parametricos
Testes parametricos e nao parametricosRosario Cação
 
Cap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição NormalCap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição NormalRegis Andrade
 

Viewers also liked (16)

Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e Classificação
 
Desvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrõesDesvios médios, variância e desvios padrões
Desvios médios, variância e desvios padrões
 
Preparação e Limpeza de Dados
Preparação e Limpeza de DadosPreparação e Limpeza de Dados
Preparação e Limpeza de Dados
 
Analise de agrupamentos uem
Analise de agrupamentos uemAnalise de agrupamentos uem
Analise de agrupamentos uem
 
Modelo de Componentes de IHC
Modelo de Componentes de IHCModelo de Componentes de IHC
Modelo de Componentes de IHC
 
Análises agrupamento e dissimilaridade no Genes
Análises agrupamento e dissimilaridade no GenesAnálises agrupamento e dissimilaridade no Genes
Análises agrupamento e dissimilaridade no Genes
 
Aula programa Genes
Aula programa GenesAula programa Genes
Aula programa Genes
 
Introdução à Teoria dos Grafos
Introdução à Teoria dos GrafosIntrodução à Teoria dos Grafos
Introdução à Teoria dos Grafos
 
Grafos e Árvores
Grafos e ÁrvoresGrafos e Árvores
Grafos e Árvores
 
Análise de correlação
Análise de correlaçãoAnálise de correlação
Análise de correlação
 
Distribuição normal
Distribuição normalDistribuição normal
Distribuição normal
 
Fundamentos do desenho técnico
Fundamentos do desenho técnicoFundamentos do desenho técnico
Fundamentos do desenho técnico
 
Coleta de dados
Coleta de dadosColeta de dados
Coleta de dados
 
Teste t student
Teste t studentTeste t student
Teste t student
 
Testes parametricos e nao parametricos
Testes parametricos e nao parametricosTestes parametricos e nao parametricos
Testes parametricos e nao parametricos
 
Cap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição NormalCap4 - Parte 7 - Distribuição Normal
Cap4 - Parte 7 - Distribuição Normal
 

Similar to Transformação de Dados

Aula 1 - Bioestatística
Aula 1 - BioestatísticaAula 1 - Bioestatística
Aula 1 - BioestatísticaCaroline Godoy
 
Cap3 - Apresentação De Dados
Cap3 - Apresentação De DadosCap3 - Apresentação De Dados
Cap3 - Apresentação De DadosRegis Andrade
 
Aula 04 - Tópicos em Gestão da Informação Medidas de posição relativa
Aula 04 - Tópicos em Gestão da Informação Medidas de posição relativaAula 04 - Tópicos em Gestão da Informação Medidas de posição relativa
Aula 04 - Tópicos em Gestão da Informação Medidas de posição relativaDalton Martins
 
Estátística 1
Estátística 1Estátística 1
Estátística 1Danielvs74
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptssuser2b53fe
 

Similar to Transformação de Dados (7)

Aula 1 - Bioestatística
Aula 1 - BioestatísticaAula 1 - Bioestatística
Aula 1 - Bioestatística
 
Análise exploratória de dados no SPSS
Análise exploratória de dados no SPSSAnálise exploratória de dados no SPSS
Análise exploratória de dados no SPSS
 
Conceitos Básicos de Estatística I
Conceitos Básicos de Estatística IConceitos Básicos de Estatística I
Conceitos Básicos de Estatística I
 
Cap3 - Apresentação De Dados
Cap3 - Apresentação De DadosCap3 - Apresentação De Dados
Cap3 - Apresentação De Dados
 
Aula 04 - Tópicos em Gestão da Informação Medidas de posição relativa
Aula 04 - Tópicos em Gestão da Informação Medidas de posição relativaAula 04 - Tópicos em Gestão da Informação Medidas de posição relativa
Aula 04 - Tópicos em Gestão da Informação Medidas de posição relativa
 
Estátística 1
Estátística 1Estátística 1
Estátística 1
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 

More from Alexandre Duarte

Táticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosTáticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosAlexandre Duarte
 
Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Alexandre Duarte
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaAlexandre Duarte
 
Ciência da Computação como Ciência
Ciência da Computação como CiênciaCiência da Computação como Ciência
Ciência da Computação como CiênciaAlexandre Duarte
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: IntroduçãoAlexandre Duarte
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerAlexandre Duarte
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBAlexandre Duarte
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisAlexandre Duarte
 
Sumarização Estatística 2D
Sumarização Estatística 2DSumarização Estatística 2D
Sumarização Estatística 2DAlexandre Duarte
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1DAlexandre Duarte
 
Introdução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosIntrodução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosAlexandre Duarte
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de SurveysAlexandre Duarte
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Alexandre Duarte
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosAlexandre Duarte
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Alexandre Duarte
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Alexandre Duarte
 

More from Alexandre Duarte (20)

Projeto de Experimentos
Projeto de ExperimentosProjeto de Experimentos
Projeto de Experimentos
 
Táticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosTáticas para Projeto de Experimentos
Táticas para Projeto de Experimentos
 
Causalidade e Abdução
Causalidade e AbduçãoCausalidade e Abdução
Causalidade e Abdução
 
Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!
 
Atividades Científica
Atividades CientíficaAtividades Científica
Atividades Científica
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de Pesquisa
 
Ciência da Computação como Ciência
Ciência da Computação como CiênciaCiência da Computação como Ciência
Ciência da Computação como Ciência
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: Introdução
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPB
 
Agrupamento com K-Means
Agrupamento com K-MeansAgrupamento com K-Means
Agrupamento com K-Means
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis Nominais
 
Sumarização Estatística 2D
Sumarização Estatística 2DSumarização Estatística 2D
Sumarização Estatística 2D
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1D
 
Introdução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosIntrodução ao Projeto de Experimentos
Introdução ao Projeto de Experimentos
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de Surveys
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de Dados
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
 

Recently uploaded

Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptxSlides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptxLuizHenriquedeAlmeid6
 
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...azulassessoria9
 
Aspectos históricos da educação dos surdos.pptx
Aspectos históricos da educação dos surdos.pptxAspectos históricos da educação dos surdos.pptx
Aspectos históricos da educação dos surdos.pptxprofbrunogeo95
 
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...azulassessoria9
 
Power Point sobre as etapas do Desenvolvimento infantil
Power Point sobre as etapas do Desenvolvimento infantilPower Point sobre as etapas do Desenvolvimento infantil
Power Point sobre as etapas do Desenvolvimento infantilMariaHelena293800
 
Sopa de letras | Dia da Europa 2024 (nível 1)
Sopa de letras | Dia da Europa 2024 (nível 1)Sopa de letras | Dia da Europa 2024 (nível 1)
Sopa de letras | Dia da Europa 2024 (nível 1)Centro Jacques Delors
 
Histogramas.pptx...............................
Histogramas.pptx...............................Histogramas.pptx...............................
Histogramas.pptx...............................mariagrave
 
APRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
APRENDA COMO USAR CONJUNÇÕES COORDENATIVASAPRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
APRENDA COMO USAR CONJUNÇÕES COORDENATIVASricardo644666
 
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024azulassessoria9
 
Gramática - Texto - análise e construção de sentido - Moderna.pdf
Gramática - Texto - análise e construção de sentido - Moderna.pdfGramática - Texto - análise e construção de sentido - Moderna.pdf
Gramática - Texto - análise e construção de sentido - Moderna.pdfKelly Mendes
 
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na ÁfricaPeriodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na Áfricajuekfuek
 
13_mch9_hormonal.pptx............................
13_mch9_hormonal.pptx............................13_mch9_hormonal.pptx............................
13_mch9_hormonal.pptx............................mariagrave
 
Sopa de letras | Dia da Europa 2024 (nível 2)
Sopa de letras | Dia da Europa 2024 (nível 2)Sopa de letras | Dia da Europa 2024 (nível 2)
Sopa de letras | Dia da Europa 2024 (nível 2)Centro Jacques Delors
 
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdfUFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdfManuais Formação
 
Teatro como estrategias de ensino secundario
Teatro como estrategias de ensino secundarioTeatro como estrategias de ensino secundario
Teatro como estrategias de ensino secundarioWyngDaFelyzitahLamba
 
UFCD_10659_Ficheiros de recursos educativos_índice .pdf
UFCD_10659_Ficheiros de recursos educativos_índice .pdfUFCD_10659_Ficheiros de recursos educativos_índice .pdf
UFCD_10659_Ficheiros de recursos educativos_índice .pdfManuais Formação
 
Modelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autoresModelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autoresAna Isabel Correia
 
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdfCarinaSofiaDiasBoteq
 
SQL Parte 1 - Criação de Banco de Dados.pdf
SQL Parte 1 - Criação de Banco de Dados.pdfSQL Parte 1 - Criação de Banco de Dados.pdf
SQL Parte 1 - Criação de Banco de Dados.pdfAndersonW5
 

Recently uploaded (20)

662938.pdf aula digital de educação básica
662938.pdf aula digital de educação básica662938.pdf aula digital de educação básica
662938.pdf aula digital de educação básica
 
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptxSlides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
Slides Lição 7, CPAD, O Perigo Da Murmuração, 2Tr24.pptx
 
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...
 
Aspectos históricos da educação dos surdos.pptx
Aspectos históricos da educação dos surdos.pptxAspectos históricos da educação dos surdos.pptx
Aspectos históricos da educação dos surdos.pptx
 
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...QUESTÃO 4   Os estudos das competências pessoais é de extrema importância, pr...
QUESTÃO 4 Os estudos das competências pessoais é de extrema importância, pr...
 
Power Point sobre as etapas do Desenvolvimento infantil
Power Point sobre as etapas do Desenvolvimento infantilPower Point sobre as etapas do Desenvolvimento infantil
Power Point sobre as etapas do Desenvolvimento infantil
 
Sopa de letras | Dia da Europa 2024 (nível 1)
Sopa de letras | Dia da Europa 2024 (nível 1)Sopa de letras | Dia da Europa 2024 (nível 1)
Sopa de letras | Dia da Europa 2024 (nível 1)
 
Histogramas.pptx...............................
Histogramas.pptx...............................Histogramas.pptx...............................
Histogramas.pptx...............................
 
APRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
APRENDA COMO USAR CONJUNÇÕES COORDENATIVASAPRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
APRENDA COMO USAR CONJUNÇÕES COORDENATIVAS
 
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
ATIVIDADE 1 - ENF - ENFERMAGEM BASEADA EM EVIDÊNCIAS - 52_2024
 
Gramática - Texto - análise e construção de sentido - Moderna.pdf
Gramática - Texto - análise e construção de sentido - Moderna.pdfGramática - Texto - análise e construção de sentido - Moderna.pdf
Gramática - Texto - análise e construção de sentido - Moderna.pdf
 
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na ÁfricaPeriodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
Periodo da escravidAo O Brasil tem seu corpo na América e sua alma na África
 
13_mch9_hormonal.pptx............................
13_mch9_hormonal.pptx............................13_mch9_hormonal.pptx............................
13_mch9_hormonal.pptx............................
 
Sopa de letras | Dia da Europa 2024 (nível 2)
Sopa de letras | Dia da Europa 2024 (nível 2)Sopa de letras | Dia da Europa 2024 (nível 2)
Sopa de letras | Dia da Europa 2024 (nível 2)
 
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdfUFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
UFCD_8291_Preparação e confeção de peixes e mariscos_índice.pdf
 
Teatro como estrategias de ensino secundario
Teatro como estrategias de ensino secundarioTeatro como estrategias de ensino secundario
Teatro como estrategias de ensino secundario
 
UFCD_10659_Ficheiros de recursos educativos_índice .pdf
UFCD_10659_Ficheiros de recursos educativos_índice .pdfUFCD_10659_Ficheiros de recursos educativos_índice .pdf
UFCD_10659_Ficheiros de recursos educativos_índice .pdf
 
Modelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autoresModelos de Inteligencia Emocional segundo diversos autores
Modelos de Inteligencia Emocional segundo diversos autores
 
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
425416820-Testes-7º-Ano-Leandro-Rei-Da-Heliria-Com-Solucoes.pdf
 
SQL Parte 1 - Criação de Banco de Dados.pdf
SQL Parte 1 - Criação de Banco de Dados.pdfSQL Parte 1 - Criação de Banco de Dados.pdf
SQL Parte 1 - Criação de Banco de Dados.pdf
 

Transformação de Dados

  • 1. TRANSFORMAÇÃO DE DADOS Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
  • 2. TRANSFORMAÇÃO DE DADOS • Quando tiramos uma foto muitas vezes o resultado não é o esperado • As cores podem estar muito escuras ou muito claras • O foco pode estar errado • Objetos podem estar muito pequenos • Nestes casos, utilizamos ferramentas para aplicar filtros e transformar a foto em algo mais próximo do que desejamos • Muitas vezes o mesmo ocorrer com os dados
  • 3. TRANSFORMAÇÃO DE DADOS • Muitas vezes obtemos um conjunto de dados que quando visualizado apresenta imperfeições ou objetivos difíceis de ver • Além disso, se você pretende analisar estatisticamente seus dados provavelmente precisar considerar a forma como os dados estão distribuídos • Transformações são utilizadas para tratar destes dois problemas
  • 4. TRANSFORMAÇÃO DE DADOS • Transformações são conjuntos de procedimentos de manipulação que podem revelar fatos não observáveis em sua forma original. • Podemos, por exemplo, ajustar a distribuição dos dados para torná-los mais fáceis de exibir e adequadas para certos testes estatísticos
  • 5. ALERTA • Jamais realize operações de transformação em seus dados originais! • Você deve criar uma nova coluna para armazenar os novos valores para as variáveis sendo transformadas ou criar uma cópia inteira do seu conjunto de dados!
  • 6. DISTRIBUIÇÃO NORMAL • Uma das suposições mais frequentemente utilizadas nos testes estatísticos é que os dados são normalmente distribuídos • Os dados se distribuem de foram simétrica ao redor de um valor central • “Curva do sino” • Alguns dados que são geralmente geralmente distribuídos de forma normal são medições humanas como altura, peso, expectativa de vida e resultados em testes de QI
  • 9. OBLIQUIDADE • Dados oblíquos, diferentemente de dados normais, não se distribuem de forma simétrica em relação a um valor central. • Estes conjuntos tendem a ter mais observações à direita ou à esquerda deste valor • Se você observar que seus dados apresentam esta característica talvez seja necessário realizar algum tipo de transformação
  • 13. DISTRIBUIÇÃO DA POPULAÇÃO POR ESTADO BRASILEIRO Frequência 16 12 8 4 0 Até 5 6 a 10 11 a 15 16 a 20 21 a 25 26 a 30 31 a 35 36 a 40 41 a 45 População (milhões de habitantes)
  • 14. POPULAÇÃO POR ÁREA URBANIZADA População (milhões de habitantes) 50 37.5 25 12.5 0 0 12.5 25 37.5 50 Área urbanizada (centenas de Km2)
  • 16. DISTRIBUIÇÃO DA POPULAÇÃO POR ESTADO BRASILEIRO Frequência 14 10.5 7 3.5 0 Até 6.0 De 6.1 a 6.5 De 6.6 a 7.0 De 7.1 a 7.5 De 7.6 a 8 Log da população (milhões de habitantes)
  • 17. POPULAÇÃO POR ÁREA URBANIZADA Log da População (milhões de habitantes) 8 6.25 4.5 2.75 1 1 1.75 2.5 3.25 4 Log da Área urbanizada (Km2)
  • 19. DISTRIBUIÇÃO DA POPULAÇÃO POR ESTADO BRASILEIRO Frequência 12 9 6 3 0 Até 1000 1001 a 2000 2001 a 3000 3001 a 4000 4001 a 5000 Acima de 5000 Raiz quadrada da população (milhões de habitantes)
  • 20. POPULAÇÃO POR ÁREA URBANIZADA Raiz Quadrada da População (milhões de habitantes) 7000 5250.25 3500.5 1750.75 1 1 20.75 40.5 60.25 80 Raiz Quadrada da Área urbanizada (Km2)
  • 21. ESCOLHENDO A TRANSFORMAÇÃO CORRETA • A medida que você começa a entender melhor os efeitos de diferentes transformações começará a se perguntar como escolher a transformação adequada • Não é simples responder esta pergunta! • Apesar de existirem métodos estatísticos para essa escolha, a resposta geralmente envolve tentativa e erro • Uma estratégia geral é aplicar algumas das transformações mais utilizadas, observar os resultados e escolher a mais adequada
  • 22. TRANSFORMAÇÕES COMUNS Método Operação Matemática Indicações Contra-indicações Log ln(x) log(x) Obliquidade à direita Valores nulos Valores negativos Raiz Quadrada x Obliquidade à direita Valores negativos Quadrado x Obliquidade à esquerda Valores negativos Raíz Cúbica x Obliquidade à direita Valores Negativos Menos efetiva que o log na normalização Recíproco 1/x Diminuir valores grandes e aumentar valores pequenos Valores nulos Valores negativos
  • 23. ARMADILHAS • Uma vez que os métodos de transformação envolvem a aplicação de uma função matemática aos dados, você precisa tomar cuidado na hora de interpretar e apresentar os resultados por conta da mudança na unidade • Por exemplo, ao apresentar a transformação logarítmica nos exemplos passamos a tratar do log da população e não mais da população. • Isso precisa ficar bem claro nos gráficos