Your SlideShare is downloading. ×
  • Like
Estatística Parte 1
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Now you can save presentations on your phone or tablet

Available for both IPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Estatística Parte 1

  • 2,479 views
Published

A apresentação faz parte de um conjunto de aulas ministradas nos cursos de pós graduação da Fundação Universa,´módulo Métodos Quatitativos - estatística.

A apresentação faz parte de um conjunto de aulas ministradas nos cursos de pós graduação da Fundação Universa,´módulo Métodos Quatitativos - estatística.

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
2,479
On SlideShare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
168
Comments
0
Likes
2

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide
  • Este slide tem que estar linkado com os próximos 5 slides.
  • Este slide tem que estar linkado com os próximos 5 slides.
  • Este slide tem que estar linkado com os próximos 5 slides.
  • Problema – não começa do zero.
  • 11 EMPREGADOS; TOTAL DE SALÁRIOS: $770,000. MODA: $20,000 ; MEDIANA: $30,000 ; MÉDIA: $700,00 (ARGUMENTO DO PRESIDENTE).
  • Acho que deve trocar n. de obs. Por n???????
  • 11 EMPREGADOS; TOTAL DE SALÁRIOS: $770,000. MODA: $20,000 ; MEDIANA: $30,000 ; MÉDIA: $700,00 (ARGUMENTO DO PRESIDENTE).

Transcript

  • 1. Métodos Quantitativos –Parte I Análise de Dados Maurício T. Damasceno [email_address]
  • 2. Como analisar dados? ESTATÍSTICA Maurício T. Damasceno
  • 3. Maurício T. Damasceno Estatística Estatística Descritiva Estatística Inferencial
  • 4. Mas o que é Estatística?
    • ciência dos dados
    • coleta, classificação e organização
    • análise e interpretação de dados
    Maurício T. Damasceno
  • 5.
    • Qual o objetivo da Estatística?
    Extrair informações dos dados brutos que permitam processo posterior de tomada de decisão. Maurício T. Damasceno
  • 6. Informação Decisão Dados Brutos Estatística Maurício T. Damasceno
  • 7.
    • Conjunto de dados podem ser:
    Dados Brutos!! 1.Demonstrativos mensais de balanços; 2. Valores diários de taxas de juros; 3. Preços de fechamento de ações. Maurício T. Damasceno
  • 8. Estatística Descritiva
    • Técnicas que permitem REPRESENTAR, RESUMIR e ANALISAR um conjunto de dados.
    Maurício T. Damasceno
  • 9. Estatística Inferencial
      • Técnicas que permitem utilizar dados de uma amostra para generalizações sobre a população.
    Maurício T. Damasceno
  • 10. Definições e Conceitos Básicos Conjunto de todos os dados que contém a característica que temos interesse.
    • População
    • Amostra
    É um subconjunto da população. Maurício T. Damasceno
  • 11. Definições e Conceitos Básicos
    • Dados
    Conjunto de medições/identificações da variável de interesse. UE VARIÁVEIS DADOS Maurício T. Damasceno
  • 12. Definições e Conceitos Básicos
    • Unidade elementar (UE)
    A portadora da característica ou propriedade que se deseja investigar Ex: Funcionários de uma empresa. Característica, propriedade ou atributo que se deseja investigar. Ex: Idade
    • Variável
    Maurício T. Damasceno
  • 13. Tipos de Variáveis Maurício T. Damasceno TIPOS DE VARIÁVEIS QUALITATIVAS QUANTITATIVAS NOMINAL ORDINAL DISCRETOS CONTÍNUOS
  • 14. Variáveis Qualitativas (não numéricas)
    • Dados Nominais (sem hierarquia)
      • Ex: Estado civil, Gênero
    • Dados Ordinais (com hierarquia)
      • Ex: Nível de instrução
      • Nível salarial
    Maurício T. Damasceno
  • 15. Variáveis Quantitativas (numéricas)
    • Dados Discretos (contagem)
      • Ex: Quantidade de vendas diárias;
      • Quantidade de transações financeiras
    • Dados Contínuos (números reais)
      • Ex: Valor das vendas diárias
      • Valor das transações financeiras do mês
    Maurício T. Damasceno
  • 16. Relembrando... Maurício T. Damasceno TIPOS DE VARIÁVEIS QUALITATIVAS QUANTITATIVAS NOMINAL ORDINAL DISCRETOS CONTÍNUOS
  • 17. Analisando Dados Maurício T. Damasceno
  • 18.
    • Não faz sentido operações algébricas
    • Contagem => Tabulação
    • Tabelas de Freqüência
    • Gráficos
    Dados Qualitativos Maurício T. Damasceno
  • 19. Ex: Dados de uma amostra de 24 compras de refrigerantes Dados Qualitativos Tabela 1 – Distribuição de freqüências das compras de refrigerante Fonte – Dados fictícios Maurício T. Damasceno
  • 20.
    • Gráfico de Barras
    Dados Qualitativos Maurício T. Damasceno
  • 21. Dados Qualitativos
    • Gráfico de Colunas
    Maurício T. Damasceno
  • 22. Dados Qualitativos
    • Gráfico de Setores
    Maurício T. Damasceno
  • 23. Como NÃO fazer gráfico ! Maurício T. Damasceno
  • 24. Forma Correta de Representação Gráfica Maurício T. Damasceno
  • 25. Analisando Dados Quantitativos Maurício T. Damasceno
  • 26.
    • Ex: Seja uma série de dados de opções de ações negociadas por dia na bolsa de valores.
    17 negócios realizados nesse dia!! Dados Quantitativos Discretos Maurício T. Damasceno
  • 27. Tabela de Freqüências Observações mais freqüentes!! Maurício T. Damasceno
  • 28.
    • Gráfico de Linha
    Dados Quantitativos Discretos Maurício T. Damasceno
  • 29. Dados Quantitativos Contínuos Maurício T. Damasceno
  • 30. Dados Quantitativos Contínuos
    • Como representar graficamente dados quantitativos contínuos?
    • Gráfico de Histograma
    Maurício T. Damasceno
  • 31.
    • Condensa dados agrupando valores em classes
    • Alturas das barras refletem freqüências absolutas ou relativas (percentuais)
    • Representa uma tabela de Distribuição de Freqüências
    Histograma Maurício T. Damasceno
  • 32. Histograma Maurício T. Damasceno
  • 33. 0 0 Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 34. 0 Absoluta ou Relativa 0 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 35. 0 1 2 3 4 5 Absoluta ou Relativa 0 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 36. 0 1 2 3 4 5 Absoluta ou Relativa 0 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 37. 0 1 2 3 4 5 0 15 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 38. 0 1 2 3 4 5 0 15 25 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 39. 0 1 2 3 4 5 0 15 25 35 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 40. 0 1 2 3 4 5 0 15 25 35 45 55 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 41. 0 1 2 3 4 5 0 15 25 35 45 55 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 42. 0 1 2 3 4 5 0 15 25 35 45 55 Barras justapostas Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 43. 0 1 2 3 4 5 0 15 25 35 45 55 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
  • 44. Medidas Estatísticas Maurício T. Damasceno
  • 45. Medidas Estatísticas Maurício T. Damasceno Médias Mediana Moda Posição Amplitude Variância Desvio Padrão Variação Assimetria Forma Medidas Estatísticas Coeficiente de variação Desvio médio Outras Desvio Inter-Quartílico
  • 46. Caso Motivacional Maurício T. Damasceno ... Empregados reclamam que, na maioria, recebem apenas $200,00 por mês. $4.000,00 $700,00 $500,00 $300,00 $200,00 ... Presidente diz que, em média, eles recebem $700,00!
  • 47. Medidas de Posição (Tendência Central) - Média - Moda - Mediana Maurício T. Damasceno
  • 48. Média
    • Uma das medidas mais utilizadas para representar os dados mais típicos
    • Reflete um ponto de equilíbrio
    • Influenciada por valores extremos
    • Só deve ser utilizada em distribuições:
      • Não heterogêneas
      • Simétricas ou levemente assimétricas
    Maurício T. Damasceno
  • 49. Exemplo Dados: 10 4 8 11 6 9 Maurício T. Damasceno
  • 50. Média para Tabelas de Freqüências X X  i i m    1 X i i M   1 Amostra  = População f i f i f i  f i M   de classes na população m   de classes na amostra Maurício T. Damasceno
  • 51. Média Ponderada X  i i m   1 X i i M   1 Pesos Freqüências f i p i f i  p i Maurício T. Damasceno
  • 52. Média Ponderada Exemplo: Distribuição de Freqüências Maurício T. Damasceno
  • 53. Média Ponderada Exemplo 1: Média Aritmética Média Ponderada Maurício T. Damasceno
  • 54. Média Geométrica Exemplo 1: A Taxa Média de crescimento dos preços dos produtos foi de 13,26%. Maurício T. Damasceno
  • 55. Média Geométrica Duas observações importantes: 2. Menos afetada pelos extremos. 1. Medida de tendência central mais adequada quando as observações apresentam taxa constante de crescimento em função do tempo. Maurício T. Damasceno
  • 56. Maurício T. Damasceno Médias Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  • 57. Mediana
    • Valor que divide a distribuição em duas partes iguais
      • Se n for ímpar, a mediana será a obs. que ocupa a posição central
      • Se n for par, a mediana será a média dos dois valores centrais
    • Não é influenciada por valores extremos, mas sim pelas freqüências
    Maurício T. Damasceno
  • 58. Mediana: Método de Cálculo 1. Ordenar a série de valores 2. Encontrar o Elemento mediano (Emd) 2.1 Se n é par: 2.2 Se n é ímpar: Maurício T. Damasceno
  • 59. Mediana – Exemplo 1 Dados: 24 22 21 23 22 Dados Ordenados: 21 22 22 23 24 n é ímpar: Maurício T. Damasceno
  • 60. Mediana – Exemplo 2 Dados: 10 4 8 11 6 7 Dados Ordenados: 4 6 7 8 10 11 n é par: Maurício T. Damasceno
  • 61. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  • 62. Moda
    • Valor mais freqüente
    • Não é afetada por valores extremos
    • Pode haver mais de uma moda
    • Pode ser utilizada para dados qualitativos e quantitativos
    Maurício T. Damasceno
  • 63. Moda – Exemplo 1 Dados: 24 22 21 23 22 Moda = 22 Maurício T. Damasceno
  • 64. Exemplo: Uso do Cinto de Segurança Categoria de maior freqüência, portanto, é a Moda. Maurício T. Damasceno
  • 65. Medidas de Variação Maurício T. Damasceno
  • 66. Caso Motivacional Maurício T. Damasceno
  • 67. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  • 68. Amplitude
    • Diferença entre a maior e a menor observação
    • Ignora como os dados estão distribuídos
    • Considera apenas dois valores da distribuição
    Maurício T. Damasceno Amplitude   X x 7 8 9 10 7 8 9 10
  • 69. Amplitude – Exemplo 1 Dados: 10 4 8 11 6 7 Dados Ordenados: 4 6 7 8 10 11 Maurício T. Damasceno
  • 70. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  • 71. Desvio Médio Indica a distância das observações em relação à média da distribuição Maurício T. Damasceno i |  X   i   | DM X n n
  • 72. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
  • 73. Variância e Desvio Padrão Dados 1: 4 6 7 8 10 11 Maurício T. Damasceno
  • 74. Variância e Desvio Padrão Dados 1: 4 6 7 8 15 11 Maurício T. Damasceno
  • 75. Variância e Desvio Padrão Dados 1: 4 6 7 8 100 11 Maurício T. Damasceno
  • 76. Desvio Padrão
    • Medidas de variação absoluta.
    • É a distância média dos dados em relação à média.
    • Mostra como os dados estão dispersos em relação a média.
    Maurício T. Damasceno
  • 77. Desvio Padrão Maurício T. Damasceno
  • 78. Desvio padrão da amostra Maurício T. Damasceno
  • 79. Exercício Para a série de dados abaixo calcule a média e desvio padrão. No Excel: = media(A1:A6) = desvpad(A1:A6) Maurício T. Damasceno
  • 80. Medida de Forma Maurício T. Damasceno
  • 81. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Quartis
  • 82. Forma
    • Descreve a forma da distribuição
    • Medida pelo coeficiente de assimetria
    Assimetria positiva Assimetria negativa Simétrica Média = Mediana = Moda Média Mediana Moda Moda Mediana Média Preferência: Mediana Preferência: Mediana Preferência: Media Maurício T. Damasceno
  • 83. Exemplo: Maurício T. Damasceno ... Empregados reclamam que, na maioria, recebem apenas $200,00 por mês. $4.000,00 $700,00 $500,00 $300,00 $200,00 ... Presidente diz que, em média, eles recebem $700,00!
  • 84. Outras Medidas Maurício T. Damasceno
  • 85. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Quartis
  • 86. Relembrando.....
    • O desvio padrão visa medir o grau de dispersão de um conjunto de dados;
    • Quanto maior o desvio padrão menor a representatividade da média;
    • O desvio padrão é uma medida de risco.
    • Pergunta : Como comparar a dispersão entre dois conjuntos de dados?
    Maurício T. Damasceno
  • 87. Coeficiente de Variação (CV)
    • Situação problema: Qual o melhor investimento?
    • Para decidir qual o melhor investimento, considerando investidor avesso ao risco, deve-se utilizar uma medida apropriada para fazer comparação entre diferentes conjuntos de dados.
    • O coeficiente de variação é essa medida.
    Maurício T. Damasceno
  • 88. Coeficiente de Variação
    • Medida relativa de variação.
    • Indica se a distribuição é homogênea ou não.
    • Mede a dispersão dos dados em relação à média.
    Maurício T. Damasceno
  • 89. Exercício
    • Calcule a média, desvio padrão e CV
    Maurício T. Damasceno
  • 90. Exercício
    • Respostas.
    CV < 20%: Séries homogêneas!!! Maurício T. Damasceno
  • 91. Problema!!
    • Como é o relacionamento entre as ações A e B?
    Maurício T. Damasceno
  • 92. Interpretando o exercício
    • O gráfico de dispersão das ações A e B indica tendências opostas entre as ações A e B.
    • Como medir essas tendências ?
    • COVARIÂNCIA !!
    Maurício T. Damasceno
  • 93. Covariância
    • Fórmula:
    • Em amostras utilizar as médias amostrais e o tamanho da amostra (n).
    Maurício T. Damasceno
  • 94. Covariância
    • Cálculo da covariância para as ações A e B.
    O sinal é negativo !!!! Maurício T. Damasceno
  • 95. Covariância
    • É uma medida de tendência entre duas séries.
    • Objetiva identificar como os valores se inter-relacionam.
    • Avalia como duas variáveis movimentam-se ao mesmo tempo em relação à suas médias (covariam).
    Maurício T. Damasceno
  • 96. Covariância
    • COV > 0 – Indica comportamento de mesma tendência entre duas séries.
    • COV = 0 – Indica que não existe associação linear entre as séries.
    • COV < 0 – Indica comportamento de tendência contrária entre duas séries.
    Maurício T. Damasceno
  • 97. Covariância
    • Exercício : Para as séries de retornos das ações X e Y abaixo, verificar se existe associação entre elas. Interprete o resultado.
    Maurício T. Damasceno
  • 98. Covariância
    • Interpretando o resultado do exercício:
    O sinal é negativo !!!! Maurício T. Damasceno
  • 99. Covariância < 0
    • COV(X,Y) < 0 indica associação inversa entre as ações;
    • A COV(X,Y) < 0 indica que a tendência esperada é: o retorno de uma das ações valoriza-se acima do seu retorno médio quando o retorno da outra ficar abaixo.
    • A COV(X,Y) < 0 indica que as ações estão contrabalançadas, reduzindo o risco (variância) da carteira.
    • A COV(X,Y) < 0 é o que se chama de Heding .
    Maurício T. Damasceno
  • 100. Covariância < 0 Maurício T. Damasceno
  • 101. Covariância > 0
    • COV(X,Y) > 0 indica expectativa de retorno das ações no mesmo sentido;
    • A COV(X,Y) > 0 indica valorizações ou desvalorizações conjuntas;
    • A COV(X,Y) > 0 indica que as ações NÃO estão contrabalançadas, aumentando o risco (variância) da carteira.
    Maurício T. Damasceno
  • 102. Covariância > 0 Maurício T. Damasceno
  • 103. Problema
    • A covariância mede se existe e como é o relacionamento (tendência) entre duas séries de dados.
    • Mas, existindo o relacionamento, como saber o grau desse relacionamento?
    • Como saber se o grau desse relacionamento é Baixo, Médio ou Alto?
    COEFICIENTE DE CORRELAÇÃO = Maurício T. Damasceno
  • 104. Coeficiente de Correlação
    • Calculando o coeficiente de correlação:
    Maurício T. Damasceno
  • 105. Coeficiente de Correlação
    • Interpretando o resultado:
    • Indica que possuem tendências opostas;
    • Indica que as tendências são fortemente opostas.
    Maurício T. Damasceno
  • 106. Coeficiente de Correlação
    • Mede o grau de associação linear entre duas variáveis;
    • O coeficiente de correlação varia entre –1 e +1;
    • Indica a força de associação entre duas variáveis;
    • Quanto mais próxima de –1 mais inversa a associação;
    • Quanto mais próxima de +1 mais direta a associação;
    • Quanto mais próxima de 0 a associação indica que as variáveis são linearmente independentes.
    Maurício T. Damasceno
  • 107. Coeficiente de Correlação
    • Exercício 1: Para as séries abaixo verifique o grau de associação das variáveis. Interprete graficamente.
    Maurício T. Damasceno
  • 108. Coeficiente de Correlação
    • Exercício 1:Gráfico de Dispersão
    Maurício T. Damasceno
  • 109. Coeficiente de Correlação
    • Exercício 1:Gráfico de Linha das variáveis X e Y.
    Maurício T. Damasceno
  • 110. Coeficiente de Correlação
    • Exercício 1:Interpretação.
    • Forte correlação positiva : a maioria dos pares das observações estão sob a reta com declividade positiva.
    • Os acréscimos e decréscimos são iguais e na mesma direção.
    • As duas séries de observações são paralelas.
    Maurício T. Damasceno
  • 111. Coeficiente de Correlação
    • Exercício 2:Para as séries abaixo verifique o grau de associação das variáveis. Interprete graficamente.
    Maurício T. Damasceno
  • 112. Coeficiente de Correlação
    • Exercício 2:Gráfico de Dispersão
    Maurício T. Damasceno
  • 113. Coeficiente de Correlação
    • Exercício 2:Gráfico de Linha das variáveis X e Y.
    Maurício T. Damasceno
  • 114. Coeficiente de Correlação
    • Exercício 2:Interpretação.
    • Forte correlação negativa : a maioria dos pares das observações estão sob a reta com declividade negativa.
    • Os acréscimos e decréscimos são iguais mas em direções opostas.
    • As duas séries de observações não são paralelas.
    Maurício T. Damasceno
  • 115. Coeficiente de Correlação
    • Cuidado com as correlações espúrias!!!
    • Existência de correlações não implica necessariamente em causalidade!
    • Podem existir correlações sem relação de causa e efeito.
    • Exemplo: Taxa de retorno e Índice Pluviométrico.
    • Terceiro Fator: Aumento de vendas do produto em estações de chuva.
    Maurício T. Damasceno
  • 116. Aplicação prática de Análise de Dados Maurício T. Damasceno
  • 117.  
  • 118.  
  • 119. Maurício T. Damasceno
  • 120.  
  • 121. Analisando os dados Maurício T. Damasceno
  • 122.  
  • 123. Gráfico de Setores Maurício T. Damasceno
  • 124.  
  • 125. Gráfico de Colunas Maurício T. Damasceno
  • 126.  
  • 127. 1º) Selecionar F41 a F 47 2º) Digitar a fórmula em F41 * selecionar os dados * selecionar as classes D41 a D46 3º) Pressionar ao mesmo tempo: CTRL+SHIFT+ENTER
  • 128.  
  • 129. Qual gráfico usamos para representar a distribuição de frequências de dados contínuos? Gráfico Histograma Maurício T. Damasceno Analisando os dados
  • 130.  
  • 131. Gráfico Histograma Maurício T. Damasceno
  • 132. Gráfico Histograma Maurício T. Damasceno
  • 133. Medidas Estatísticas Maurício T. Damasceno Analisando os dados
  • 134. Maurício T. Damasceno
  • 135.  
  • 136.  
  • 137. Gráfico Histograma
  • 138. Analisando os dados O que é cruzamento de dados?
  • 139.  
  • 140. Gráfico de Dispersão e Correlação Maurício T. Damasceno
  • 141.  
  • 142. Análise de Dados - II Maurício T. Damasceno
  • 143. Relembrando...
    • Variáveis Quantitativas – Apresentam valores numéricos que fazem algum sentido.
      • Variáveis Quantitativas Discretas – valores inteiros que fazem sentido; normalmente proveniente de contagens. Ex: nº de perdas, nº de fraudes, nº de erros.
      • Variáveis Quantitativas Contínuas – valores fracionados que fazem sentido. Ex: Fluxo de caixa, índice de rentabilidade.
    Maurício T. Damasceno
  • 144. Distribuição Contínua
    • Exemplo:
    • A área sob a curva, entre dois pontos, informa a probabilidade.
    Média Alta frequência Baixa Freqüência Distribuição Normal. Maurício T. Damasceno Freqüência Variável X
  • 145. Distribuição Normal Maurício T. Damasceno A área total abaixo da curva é considerada como 100%. Isto é, a área total abaixo da curva é 1.
  • 146. Distribuição Normal Maurício T. Damasceno
  • 147. Distribuição Normal
    • Parâmetros da Distribuição Normal
    Maurício T. Damasceno
  • 148. Distribuição Normal
    • Conhecendo-se a média e o desvio-padrão é possível calcular qualquer valor de probabilidade.
    • Exemplo: A média das taxas de retorno mensais de uma carteira é de 40% e o seu desvio padrão 10%.
    Maurício T. Damasceno Pergunta : Qual a probabilidade de se observar uma taxa de retorno menor ou igual a 50%?
  • 149. Distribuição Normal
    • Qual a probabilidade de se observar um retorno menor ou igual a 50%?
    Área Maurício T. Damasceno
  • 150. Distribuição Normal
    • Como calcular a área sob a curva abaixo do ponto 50?
    • A área desejada é obtida pelo cálculo da integral da função f(x).
    Maurício T. Damasceno
  • 151. Distribuição Normal
    • Área sob a curva abaixo do ponto 50:
    Maurício T. Damasceno No Excel: = DIST.NORM(50;40;10;VERDADEIRO)
  • 152. Distribuição Normal
    • Exemplo: A média das taxas de retorno mensais de uma carteira é de 12% e o seu desvio padrão 4%.
    Maurício T. Damasceno Pergunta : Qual a probabilidade de se observar uma taxa de retorno maior que a média e menor ou igual a 14,56%?
  • 153. Distribuição Normal Padronizada 14,56 Maurício T. Damasceno Probabilidade Média = 12 desvio padrão  = 4
  • 154. Distribuição Normal Padronizada
    • Existem várias famílias de distribuições normais diferentes.
    • Essa distribuição é chamada de Distribuição Normal Padronizada. O operador de transformação é:
    • Pode-se utilizar uma única distribuição normal para calcular as probabilidades.
    Número de desvios de afastamento em relação à média. Maurício T. Damasceno
  • 155. Distribuição Normal Padronizada Probabilidade em tabela Z Z Z = +0,64 0,64 0 Maurício T. Damasceno Probabilidade 12  = 4 14,56
  • 156. Para Z =0,64 0,2389 Maurício T. Damasceno Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,00 0 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
  • 157.
    • A média tem Distribuição Normal
    Maurício T. Damasceno Distribuição amostral da média
  • 158. Inferência Estatística Maurício T. Damasceno
    • Quando não é possível coletar todos os dados (população) para realizar análises, pode-se retirar amostras de uma população.
    • Análises realizadas a partir de amostras para se obter conclusões para uma população são chamadas de Inferências Estatísticas.
    • De modo geral , os métodos de inferência estatística são:
      • Intervalos de Confiança
      • Testes de Hipótese
  • 159. Inferência Estatística Maurício T. Damasceno
    • Intervalos de Confiança
    • É uma estimativa de um parâmetro desconhecido da população (ex: média) sob a forma de intervalo.
    • O intervalo apresenta uma valor mínimo e uma valor máximo.
    • Ao intervalo está associado um grau de confiança.
  • 160. Relembrando: Distribuição Normal Maurício T. Damasceno
  • 161. Inferência Estatística Maurício T. Damasceno
    • Exemplos de Intervalos de Confiança
    • O faturamento médio mensal das micro empresas prestadoras de serviço, em Brasília, no ano de 2009, foi de R$30.000,00, com intervalo de confiança ao nível de 95% entre R$ 25.000,00 a R$35.000,00.
    • A quantidade média mensal de horas extras realizadas na empresa X, no ano de 2009, por funcionário, foi de 22 horas, com intervalo de confiança ao nível de 95% entre 18 a 32.
  • 162. Inferência Estatística Maurício T. Damasceno
    • Construido Intervalos de Confiança para a média com variância populacional conhecida
    • Retirar a amostra e calcular a Média
    • Escolher o Grau de confiança: Exemplo, 95% gera aproximadamente dois desvios padrão (1,96).
    • Limite Superior: =
    • Limite Inferior: =
  • 163. Inferência Estatística Maurício T. Damasceno
    • Exemplos de Intervalos de Confiança
    • O faturamento médio mensal de 60 micro empresas prestadoras de serviço, em Brasília, no ano de 2009, foi de R$30.000,00. O desvio padrão foi de R$19.362,92
    • Limite Inferior(95%):
    • Limite Superior (95%):
    • IC 95% [30.000,00;35.000,00]
  • 164. Maurício T. Damasceno Inferência Estatística
    • INTERPRETAÇÃO DO IC:
    • Para o resultado anterior, IC 95% [30.000,00;35.000,00], significa que 95% das vezes em que se extrair amostras de tamanho 60 da mesma população, espera-se que a média se encontre entre R$30.000,00 e R$35.000,00.
  • 165. Maurício T. Damasceno Inferência Estatística
    • Regra prática:
    * Número de desvios aproximados de uma distribuição Normal. Grau de Confiança Número de desvios (z)* 68% 1 95% 2 99% 3
  • 166. Maurício T. Damasceno Inferência Estatística
    • Exercício 1: Para uma amostra de 60 empresas, determine o Intervalo de confiança, ao nível de 95%, considerando que a média é a mesma, mas o desvio padrão é de R$10.000,00, menos dispersão.
    • Limite Inferior(95%):
    • Limite Superior (95%):
    • IC 95% [27.418,01;32.581,99]
    => Menor desvio=> Menor IC!!!
  • 167. Maurício T. Damasceno Inferência Estatística
    • INTERPRETAÇÃO DO IC:
    • Para o IC 95% [27.418,01;32.581,99], significa que 95% das vezes em que se extrair amostras de tamanho 60 da mesma população, espera-se que a média se encontre entre R$27.418,01 e R$32.581,99.
  • 168. Maurício T. Damasceno Inferência Estatística
    • Limite Inferior(95%):
    • Limite Superior (95%):
    • IC 95% [21,52 ; 22,47]
    • Exercício 2: Retirada uma amostra de 40 funcionários, verificou-se que a quantidade média mensal de horas extras realizadas na empresa X, no ano de 2009, por funcionário, foi de 22 horas, e desvio padrão de 1,5 horas. Construa um intervalo de confiança ao nível de 95%.
  • 169. Maurício T. Damasceno Inferência Estatística
    • INTERPRETAÇÃO DO IC:
    • Para o resultado anterior, IC 95% [21,52 ; 22,47], significa que 95% das vezes em que se extrair amostras de tamanho 40 da mesma população, espera-se que a média de horas extras se encontre entre 21,52 e 22,47 horas.
    • Nesse caso o limite inferior do IC está muito próximo do limite superior indicando que há pouca variação, ou seja, para os funcionários que realizam horas extras, essa quantidade é praticamente igual entre eles.
  • 170. Maurício T. Damasceno Inferência Estatística
    • Considerações a respeito do IC:
    • Quando a variância da população é conhecida, utiliza-se a distribuição Normal.
    • Quando a variância da população não é conhecida, utiliza-se a distribuição de Student.
    • Quando a variância da população não é conhecida, mas a distribuição não é pequena (n > 30), pode-se utilizar a distribuição Normal, pois os resultados são muito próximos à utilização da distribuição de Student.
  • 171. Inferência Estatística Maurício T. Damasceno
    • Hipótese estatística
    • Qualquer afirmativa formulada sobre um valor de um parâmetro da população, por exemplo, média.
    • A hipótese não necessariamente é verdadeira; pode ser verdadeira ou falsa.
  • 172. Inferência Estatística Maurício T. Damasceno
    • Testes de Hipótese
    • Conhecido também como Teste de Significância
    • Permite avaliar suposições feitas sobre uma característica da população.
    • Auxilia nas tomadas de decisões.
  • 173. Inferência Estatística Maurício T. Damasceno
    • Exemplo de Teste de Hipótese
    • Contexto: Em uma empresa verificou-se a necessidade de um treinamento para reduzir o tempo realização de certo trabalho.
    • Antes do treinamento o tempo médio, por funcionário, para a realização do trabalho era de 3 horas.
    • Realizado o treinamento, como comprovar que o tempo médio diminuiu?
  • 174. Inferência Estatística Maurício T. Damasceno
    • Exemplo de Teste de Hipótese
    • Hipótese Nula (H0): o tempo médio é de 3 horas.
    • Hipótese Alternativa (H1): o tempo médio é menor que 3 horas.
    • Retirar uma amostra
    • Construir o Intervalo de Confiança
    • Verificar se a afirmação feita em H0 está contida no IC
    • Aceitar OU Rejeitar H0
  • 175. Inferência Estatística Maurício T. Damasceno
    • Exemplo de Teste de Hipótese
    • Para o exemplo em questão, retirou-se uma amostra de 30 funcionários, calculou-se o tempo médio, 2,5 horas, e o desvio padrão 0,9 horas. Para um IC de 95% para o tempo médio, obteve-se:
    • Limite Inferior(95%):
    • Limite Superior (95%):
  • 176. Inferência Estatística Maurício T. Damasceno
    • Exemplo de Teste de Hipótese
    • Qual a decisão? Aceitar a hipótese H0 (o treinamento não surtiu efeito) ou rejeitar H0 (o treinamento surtiu efeito)?
    • Pelo IC calculado, percebe-se que o tempo médio de 3 horas não faz parte do intervalo, logo rejeita-se a Hipótese Nula (H0) e conclui-se que o treinamento surtiu efeito.
    • IC 95% [2,17 ; 2,82]
  • 177. Inferência Estatística Maurício T. Damasceno
    • Exercício de Teste de Hipótese
    • Contexto: Em uma empresa observou-se um elevado tempo médio de dias de afastamentos do trabalho, por semana, relacionados a doenças por Lesões por Esforço Repetitivo.
    • O departamento de gestão de pessoas decidiu trocar a empresa responsável pelo exercício laboral e após seis meses verificou o tempo médio de afastamentos.
    • Será que a nova empresa é mais eficiente? O tempo médio de afastamentos diminuiu estatisticamente?
  • 178. Inferência Estatística Maurício T. Damasceno
    • Exemplo de Teste de Hipótese
    • Para uma amostra de 40 funcionários, observou-se um número de afastamentos nos últimos seis meses de 197 dias. O desvio padrão da amostra é de 2,8 dias. Se o tempo médio anterior era de 7,4 dias, construa um IC de 95% para o tempo médio e verifique se houve uma redução.
    • Limite Inferior(95%):
    • Limite Superior (95%):
  • 179. Inferência Estatística Maurício T. Damasceno
    • Exemplo de Teste de Hipótese
    • Qual a decisão? Aceitar a hipótese H0 (a nova empresa não conseguiu reduzir o tempo médio de afastamentos) ou rejeitar H0 (o tempo médio de afastamentos diminuiu)?
    • Pelo IC calculado, percebe-se que o tempo médio de 7,4 dias não faz parte do intervalo, logo rejeita-se a Hipótese Nula (H0) e conclui-se que o tempo médio de afastamentos diminuiu.
    • IC 95% [4,53 ; 5,32]
  • 180. Inferência Estatística Maurício T. Damasceno
    • Exercício de Teste de Hipótese