Estatística Parte 1

3,017 views

Published on

A apresentação faz parte de um conjunto de aulas ministradas nos cursos de pós graduação da Fundação Universa,´módulo Métodos Quatitativos - estatística.

0 Comments
5 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
3,017
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
267
Comments
0
Likes
5
Embeds 0
No embeds

No notes for slide
  • Este slide tem que estar linkado com os próximos 5 slides.
  • Este slide tem que estar linkado com os próximos 5 slides.
  • Este slide tem que estar linkado com os próximos 5 slides.
  • Problema – não começa do zero.
  • 11 EMPREGADOS; TOTAL DE SALÁRIOS: $770,000. MODA: $20,000 ; MEDIANA: $30,000 ; MÉDIA: $700,00 (ARGUMENTO DO PRESIDENTE).
  • Acho que deve trocar n. de obs. Por n???????
  • 11 EMPREGADOS; TOTAL DE SALÁRIOS: $770,000. MODA: $20,000 ; MEDIANA: $30,000 ; MÉDIA: $700,00 (ARGUMENTO DO PRESIDENTE).
  • Estatística Parte 1

    1. 1. Métodos Quantitativos –Parte I Análise de Dados Maurício T. Damasceno [email_address]
    2. 2. Como analisar dados? ESTATÍSTICA Maurício T. Damasceno
    3. 3. Maurício T. Damasceno Estatística Estatística Descritiva Estatística Inferencial
    4. 4. Mas o que é Estatística? <ul><li>ciência dos dados </li></ul><ul><li>coleta, classificação e organização </li></ul><ul><li>análise e interpretação de dados </li></ul>Maurício T. Damasceno
    5. 5. <ul><li>Qual o objetivo da Estatística? </li></ul>Extrair informações dos dados brutos que permitam processo posterior de tomada de decisão. Maurício T. Damasceno
    6. 6. Informação Decisão Dados Brutos Estatística Maurício T. Damasceno
    7. 7. <ul><li>Conjunto de dados podem ser: </li></ul>Dados Brutos!! 1.Demonstrativos mensais de balanços; 2. Valores diários de taxas de juros; 3. Preços de fechamento de ações. Maurício T. Damasceno
    8. 8. Estatística Descritiva <ul><li>Técnicas que permitem REPRESENTAR, RESUMIR e ANALISAR um conjunto de dados. </li></ul>Maurício T. Damasceno
    9. 9. Estatística Inferencial <ul><ul><li>Técnicas que permitem utilizar dados de uma amostra para generalizações sobre a população. </li></ul></ul>Maurício T. Damasceno
    10. 10. Definições e Conceitos Básicos Conjunto de todos os dados que contém a característica que temos interesse. <ul><li>População </li></ul><ul><li>Amostra </li></ul>É um subconjunto da população. Maurício T. Damasceno
    11. 11. Definições e Conceitos Básicos <ul><li>Dados </li></ul>Conjunto de medições/identificações da variável de interesse. UE VARIÁVEIS DADOS Maurício T. Damasceno
    12. 12. Definições e Conceitos Básicos <ul><li>Unidade elementar (UE) </li></ul>A portadora da característica ou propriedade que se deseja investigar Ex: Funcionários de uma empresa. Característica, propriedade ou atributo que se deseja investigar. Ex: Idade <ul><li>Variável </li></ul>Maurício T. Damasceno
    13. 13. Tipos de Variáveis Maurício T. Damasceno TIPOS DE VARIÁVEIS QUALITATIVAS QUANTITATIVAS NOMINAL ORDINAL DISCRETOS CONTÍNUOS
    14. 14. Variáveis Qualitativas (não numéricas) <ul><li>Dados Nominais (sem hierarquia) </li></ul><ul><ul><li>Ex: Estado civil, Gênero </li></ul></ul><ul><li>Dados Ordinais (com hierarquia) </li></ul><ul><ul><li>Ex: Nível de instrução </li></ul></ul><ul><ul><li> Nível salarial </li></ul></ul>Maurício T. Damasceno
    15. 15. Variáveis Quantitativas (numéricas) <ul><li>Dados Discretos (contagem) </li></ul><ul><ul><li>Ex: Quantidade de vendas diárias; </li></ul></ul><ul><ul><li> Quantidade de transações financeiras </li></ul></ul><ul><li>Dados Contínuos (números reais) </li></ul><ul><ul><li>Ex: Valor das vendas diárias </li></ul></ul><ul><ul><li> Valor das transações financeiras do mês </li></ul></ul>Maurício T. Damasceno
    16. 16. Relembrando... Maurício T. Damasceno TIPOS DE VARIÁVEIS QUALITATIVAS QUANTITATIVAS NOMINAL ORDINAL DISCRETOS CONTÍNUOS
    17. 17. Analisando Dados Maurício T. Damasceno
    18. 18. <ul><li>Não faz sentido operações algébricas </li></ul><ul><li>Contagem => Tabulação </li></ul><ul><li>Tabelas de Freqüência </li></ul><ul><li>Gráficos </li></ul>Dados Qualitativos Maurício T. Damasceno
    19. 19. Ex: Dados de uma amostra de 24 compras de refrigerantes Dados Qualitativos Tabela 1 – Distribuição de freqüências das compras de refrigerante Fonte – Dados fictícios Maurício T. Damasceno
    20. 20. <ul><li>Gráfico de Barras </li></ul>Dados Qualitativos Maurício T. Damasceno
    21. 21. Dados Qualitativos <ul><li>Gráfico de Colunas </li></ul>Maurício T. Damasceno
    22. 22. Dados Qualitativos <ul><li>Gráfico de Setores </li></ul>Maurício T. Damasceno
    23. 23. Como NÃO fazer gráfico ! Maurício T. Damasceno
    24. 24. Forma Correta de Representação Gráfica Maurício T. Damasceno
    25. 25. Analisando Dados Quantitativos Maurício T. Damasceno
    26. 26. <ul><li>Ex: Seja uma série de dados de opções de ações negociadas por dia na bolsa de valores. </li></ul>17 negócios realizados nesse dia!! Dados Quantitativos Discretos Maurício T. Damasceno
    27. 27. Tabela de Freqüências Observações mais freqüentes!! Maurício T. Damasceno
    28. 28. <ul><li>Gráfico de Linha </li></ul>Dados Quantitativos Discretos Maurício T. Damasceno
    29. 29. Dados Quantitativos Contínuos Maurício T. Damasceno
    30. 30. Dados Quantitativos Contínuos <ul><li>Como representar graficamente dados quantitativos contínuos? </li></ul><ul><li>Gráfico de Histograma </li></ul>Maurício T. Damasceno
    31. 31. <ul><li>Condensa dados agrupando valores em classes </li></ul><ul><li>Alturas das barras refletem freqüências absolutas ou relativas (percentuais) </li></ul><ul><li>Representa uma tabela de Distribuição de Freqüências </li></ul>Histograma Maurício T. Damasceno
    32. 32. Histograma Maurício T. Damasceno
    33. 33. 0 0 Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    34. 34. 0 Absoluta ou Relativa 0 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    35. 35. 0 1 2 3 4 5 Absoluta ou Relativa 0 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    36. 36. 0 1 2 3 4 5 Absoluta ou Relativa 0 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    37. 37. 0 1 2 3 4 5 0 15 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    38. 38. 0 1 2 3 4 5 0 15 25 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    39. 39. 0 1 2 3 4 5 0 15 25 35 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    40. 40. 0 1 2 3 4 5 0 15 25 35 45 55 lim inferior Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    41. 41. 0 1 2 3 4 5 0 15 25 35 45 55 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    42. 42. 0 1 2 3 4 5 0 15 25 35 45 55 Barras justapostas Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    43. 43. 0 1 2 3 4 5 0 15 25 35 45 55 Freq Histograma Maurício T. Damasceno Classes Freq. 15  X < 25 3 25  X < 35 5 35  X < 45 2
    44. 44. Medidas Estatísticas Maurício T. Damasceno
    45. 45. Medidas Estatísticas Maurício T. Damasceno Médias Mediana Moda Posição Amplitude Variância Desvio Padrão Variação Assimetria Forma Medidas Estatísticas Coeficiente de variação Desvio médio Outras Desvio Inter-Quartílico
    46. 46. Caso Motivacional Maurício T. Damasceno ... Empregados reclamam que, na maioria, recebem apenas $200,00 por mês. $4.000,00 $700,00 $500,00 $300,00 $200,00 ... Presidente diz que, em média, eles recebem $700,00!
    47. 47. Medidas de Posição (Tendência Central) - Média - Moda - Mediana Maurício T. Damasceno
    48. 48. Média <ul><li>Uma das medidas mais utilizadas para representar os dados mais típicos </li></ul><ul><li>Reflete um ponto de equilíbrio </li></ul><ul><li>Influenciada por valores extremos </li></ul><ul><li>Só deve ser utilizada em distribuições: </li></ul><ul><ul><li>Não heterogêneas </li></ul></ul><ul><ul><li>Simétricas ou levemente assimétricas </li></ul></ul>Maurício T. Damasceno
    49. 49. Exemplo Dados: 10 4 8 11 6 9 Maurício T. Damasceno
    50. 50. Média para Tabelas de Freqüências X X  i i m    1 X i i M   1 Amostra  = População f i f i f i  f i M   de classes na população m   de classes na amostra Maurício T. Damasceno
    51. 51. Média Ponderada X  i i m   1 X i i M   1 Pesos Freqüências f i p i f i  p i Maurício T. Damasceno
    52. 52. Média Ponderada Exemplo: Distribuição de Freqüências Maurício T. Damasceno
    53. 53. Média Ponderada Exemplo 1: Média Aritmética Média Ponderada Maurício T. Damasceno
    54. 54. Média Geométrica Exemplo 1: A Taxa Média de crescimento dos preços dos produtos foi de 13,26%. Maurício T. Damasceno
    55. 55. Média Geométrica Duas observações importantes: 2. Menos afetada pelos extremos. 1. Medida de tendência central mais adequada quando as observações apresentam taxa constante de crescimento em função do tempo. Maurício T. Damasceno
    56. 56. Maurício T. Damasceno Médias Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
    57. 57. Mediana <ul><li>Valor que divide a distribuição em duas partes iguais </li></ul><ul><ul><li>Se n for ímpar, a mediana será a obs. que ocupa a posição central </li></ul></ul><ul><ul><li>Se n for par, a mediana será a média dos dois valores centrais </li></ul></ul><ul><li>Não é influenciada por valores extremos, mas sim pelas freqüências </li></ul>Maurício T. Damasceno
    58. 58. Mediana: Método de Cálculo 1. Ordenar a série de valores 2. Encontrar o Elemento mediano (Emd) 2.1 Se n é par: 2.2 Se n é ímpar: Maurício T. Damasceno
    59. 59. Mediana – Exemplo 1 Dados: 24 22 21 23 22 Dados Ordenados: 21 22 22 23 24 n é ímpar: Maurício T. Damasceno
    60. 60. Mediana – Exemplo 2 Dados: 10 4 8 11 6 7 Dados Ordenados: 4 6 7 8 10 11 n é par: Maurício T. Damasceno
    61. 61. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
    62. 62. Moda <ul><li>Valor mais freqüente </li></ul><ul><li>Não é afetada por valores extremos </li></ul><ul><li>Pode haver mais de uma moda </li></ul><ul><li>Pode ser utilizada para dados qualitativos e quantitativos </li></ul>Maurício T. Damasceno
    63. 63. Moda – Exemplo 1 Dados: 24 22 21 23 22 Moda = 22 Maurício T. Damasceno
    64. 64. Exemplo: Uso do Cinto de Segurança Categoria de maior freqüência, portanto, é a Moda. Maurício T. Damasceno
    65. 65. Medidas de Variação Maurício T. Damasceno
    66. 66. Caso Motivacional Maurício T. Damasceno
    67. 67. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
    68. 68. Amplitude <ul><li>Diferença entre a maior e a menor observação </li></ul><ul><li>Ignora como os dados estão distribuídos </li></ul><ul><li>Considera apenas dois valores da distribuição </li></ul>Maurício T. Damasceno Amplitude   X x 7 8 9 10 7 8 9 10
    69. 69. Amplitude – Exemplo 1 Dados: 10 4 8 11 6 7 Dados Ordenados: 4 6 7 8 10 11 Maurício T. Damasceno
    70. 70. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
    71. 71. Desvio Médio Indica a distância das observações em relação à média da distribuição Maurício T. Damasceno i |  X   i   | DM X n n
    72. 72. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Desvio Inter-Quartílico
    73. 73. Variância e Desvio Padrão Dados 1: 4 6 7 8 10 11 Maurício T. Damasceno
    74. 74. Variância e Desvio Padrão Dados 1: 4 6 7 8 15 11 Maurício T. Damasceno
    75. 75. Variância e Desvio Padrão Dados 1: 4 6 7 8 100 11 Maurício T. Damasceno
    76. 76. Desvio Padrão <ul><li>Medidas de variação absoluta. </li></ul><ul><li>É a distância média dos dados em relação à média. </li></ul><ul><li>Mostra como os dados estão dispersos em relação a média. </li></ul>Maurício T. Damasceno
    77. 77. Desvio Padrão Maurício T. Damasceno
    78. 78. Desvio padrão da amostra Maurício T. Damasceno
    79. 79. Exercício Para a série de dados abaixo calcule a média e desvio padrão. No Excel: = media(A1:A6) = desvpad(A1:A6) Maurício T. Damasceno
    80. 80. Medida de Forma Maurício T. Damasceno
    81. 81. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Quartis
    82. 82. Forma <ul><li>Descreve a forma da distribuição </li></ul><ul><li>Medida pelo coeficiente de assimetria </li></ul>Assimetria positiva Assimetria negativa Simétrica Média = Mediana = Moda Média Mediana Moda Moda Mediana Média Preferência: Mediana Preferência: Mediana Preferência: Media Maurício T. Damasceno
    83. 83. Exemplo: Maurício T. Damasceno ... Empregados reclamam que, na maioria, recebem apenas $200,00 por mês. $4.000,00 $700,00 $500,00 $300,00 $200,00 ... Presidente diz que, em média, eles recebem $700,00!
    84. 84. Outras Medidas Maurício T. Damasceno
    85. 85. Maurício T. Damasceno Média Mediana Moda Posição Assimetria Forma Medidas Estatísticas Amplitude Variância Desvio Padrão Variação Desvio médio Coeficiente de variação Outras Quartis
    86. 86. Relembrando..... <ul><li>O desvio padrão visa medir o grau de dispersão de um conjunto de dados; </li></ul><ul><li>Quanto maior o desvio padrão menor a representatividade da média; </li></ul><ul><li>O desvio padrão é uma medida de risco. </li></ul><ul><li>Pergunta : Como comparar a dispersão entre dois conjuntos de dados? </li></ul>Maurício T. Damasceno
    87. 87. Coeficiente de Variação (CV) <ul><li>Situação problema: Qual o melhor investimento? </li></ul><ul><li>Para decidir qual o melhor investimento, considerando investidor avesso ao risco, deve-se utilizar uma medida apropriada para fazer comparação entre diferentes conjuntos de dados. </li></ul><ul><li>O coeficiente de variação é essa medida. </li></ul>Maurício T. Damasceno
    88. 88. Coeficiente de Variação <ul><li>Medida relativa de variação. </li></ul><ul><li>Indica se a distribuição é homogênea ou não. </li></ul><ul><li>Mede a dispersão dos dados em relação à média. </li></ul>Maurício T. Damasceno
    89. 89. Exercício <ul><li>Calcule a média, desvio padrão e CV </li></ul>Maurício T. Damasceno
    90. 90. Exercício <ul><li>Respostas. </li></ul>CV < 20%: Séries homogêneas!!! Maurício T. Damasceno
    91. 91. Problema!! <ul><li>Como é o relacionamento entre as ações A e B? </li></ul>Maurício T. Damasceno
    92. 92. Interpretando o exercício <ul><li>O gráfico de dispersão das ações A e B indica tendências opostas entre as ações A e B. </li></ul><ul><li>Como medir essas tendências ? </li></ul><ul><li>COVARIÂNCIA !! </li></ul>Maurício T. Damasceno
    93. 93. Covariância <ul><li>Fórmula: </li></ul><ul><li>Em amostras utilizar as médias amostrais e o tamanho da amostra (n). </li></ul>Maurício T. Damasceno
    94. 94. Covariância <ul><li>Cálculo da covariância para as ações A e B. </li></ul>O sinal é negativo !!!! Maurício T. Damasceno
    95. 95. Covariância <ul><li>É uma medida de tendência entre duas séries. </li></ul><ul><li>Objetiva identificar como os valores se inter-relacionam. </li></ul><ul><li>Avalia como duas variáveis movimentam-se ao mesmo tempo em relação à suas médias (covariam). </li></ul>Maurício T. Damasceno
    96. 96. Covariância <ul><li>COV > 0 – Indica comportamento de mesma tendência entre duas séries. </li></ul><ul><li>COV = 0 – Indica que não existe associação linear entre as séries. </li></ul><ul><li>COV < 0 – Indica comportamento de tendência contrária entre duas séries. </li></ul>Maurício T. Damasceno
    97. 97. Covariância <ul><li>Exercício : Para as séries de retornos das ações X e Y abaixo, verificar se existe associação entre elas. Interprete o resultado. </li></ul>Maurício T. Damasceno
    98. 98. Covariância <ul><li>Interpretando o resultado do exercício: </li></ul>O sinal é negativo !!!! Maurício T. Damasceno
    99. 99. Covariância < 0 <ul><li>COV(X,Y) < 0 indica associação inversa entre as ações; </li></ul><ul><li>A COV(X,Y) < 0 indica que a tendência esperada é: o retorno de uma das ações valoriza-se acima do seu retorno médio quando o retorno da outra ficar abaixo. </li></ul><ul><li>A COV(X,Y) < 0 indica que as ações estão contrabalançadas, reduzindo o risco (variância) da carteira. </li></ul><ul><li>A COV(X,Y) < 0 é o que se chama de Heding . </li></ul>Maurício T. Damasceno
    100. 100. Covariância < 0 Maurício T. Damasceno
    101. 101. Covariância > 0 <ul><li>COV(X,Y) > 0 indica expectativa de retorno das ações no mesmo sentido; </li></ul><ul><li>A COV(X,Y) > 0 indica valorizações ou desvalorizações conjuntas; </li></ul><ul><li>A COV(X,Y) > 0 indica que as ações NÃO estão contrabalançadas, aumentando o risco (variância) da carteira. </li></ul>Maurício T. Damasceno
    102. 102. Covariância > 0 Maurício T. Damasceno
    103. 103. Problema <ul><li>A covariância mede se existe e como é o relacionamento (tendência) entre duas séries de dados. </li></ul><ul><li>Mas, existindo o relacionamento, como saber o grau desse relacionamento? </li></ul><ul><li>Como saber se o grau desse relacionamento é Baixo, Médio ou Alto? </li></ul>COEFICIENTE DE CORRELAÇÃO = Maurício T. Damasceno
    104. 104. Coeficiente de Correlação <ul><li>Calculando o coeficiente de correlação: </li></ul>Maurício T. Damasceno
    105. 105. Coeficiente de Correlação <ul><li>Interpretando o resultado: </li></ul><ul><li>Indica que possuem tendências opostas; </li></ul><ul><li>Indica que as tendências são fortemente opostas. </li></ul>Maurício T. Damasceno
    106. 106. Coeficiente de Correlação <ul><li>Mede o grau de associação linear entre duas variáveis; </li></ul><ul><li>O coeficiente de correlação varia entre –1 e +1; </li></ul><ul><li>Indica a força de associação entre duas variáveis; </li></ul><ul><li>Quanto mais próxima de –1 mais inversa a associação; </li></ul><ul><li>Quanto mais próxima de +1 mais direta a associação; </li></ul><ul><li>Quanto mais próxima de 0 a associação indica que as variáveis são linearmente independentes. </li></ul>Maurício T. Damasceno
    107. 107. Coeficiente de Correlação <ul><li>Exercício 1: Para as séries abaixo verifique o grau de associação das variáveis. Interprete graficamente. </li></ul>Maurício T. Damasceno
    108. 108. Coeficiente de Correlação <ul><li>Exercício 1:Gráfico de Dispersão </li></ul>Maurício T. Damasceno
    109. 109. Coeficiente de Correlação <ul><li>Exercício 1:Gráfico de Linha das variáveis X e Y. </li></ul>Maurício T. Damasceno
    110. 110. Coeficiente de Correlação <ul><li>Exercício 1:Interpretação. </li></ul><ul><li>Forte correlação positiva : a maioria dos pares das observações estão sob a reta com declividade positiva. </li></ul><ul><li>Os acréscimos e decréscimos são iguais e na mesma direção. </li></ul><ul><li>As duas séries de observações são paralelas. </li></ul>Maurício T. Damasceno
    111. 111. Coeficiente de Correlação <ul><li>Exercício 2:Para as séries abaixo verifique o grau de associação das variáveis. Interprete graficamente. </li></ul>Maurício T. Damasceno
    112. 112. Coeficiente de Correlação <ul><li>Exercício 2:Gráfico de Dispersão </li></ul>Maurício T. Damasceno
    113. 113. Coeficiente de Correlação <ul><li>Exercício 2:Gráfico de Linha das variáveis X e Y. </li></ul>Maurício T. Damasceno
    114. 114. Coeficiente de Correlação <ul><li>Exercício 2:Interpretação. </li></ul><ul><li>Forte correlação negativa : a maioria dos pares das observações estão sob a reta com declividade negativa. </li></ul><ul><li>Os acréscimos e decréscimos são iguais mas em direções opostas. </li></ul><ul><li>As duas séries de observações não são paralelas. </li></ul>Maurício T. Damasceno
    115. 115. Coeficiente de Correlação <ul><li>Cuidado com as correlações espúrias!!! </li></ul><ul><li>Existência de correlações não implica necessariamente em causalidade! </li></ul><ul><li>Podem existir correlações sem relação de causa e efeito. </li></ul><ul><li>Exemplo: Taxa de retorno e Índice Pluviométrico. </li></ul><ul><li>Terceiro Fator: Aumento de vendas do produto em estações de chuva. </li></ul>Maurício T. Damasceno
    116. 116. Aplicação prática de Análise de Dados Maurício T. Damasceno
    117. 119. Maurício T. Damasceno
    118. 121. Analisando os dados Maurício T. Damasceno
    119. 123. Gráfico de Setores Maurício T. Damasceno
    120. 125. Gráfico de Colunas Maurício T. Damasceno
    121. 127. 1º) Selecionar F41 a F 47 2º) Digitar a fórmula em F41 * selecionar os dados * selecionar as classes D41 a D46 3º) Pressionar ao mesmo tempo: CTRL+SHIFT+ENTER
    122. 129. Qual gráfico usamos para representar a distribuição de frequências de dados contínuos? Gráfico Histograma Maurício T. Damasceno Analisando os dados
    123. 131. Gráfico Histograma Maurício T. Damasceno
    124. 132. Gráfico Histograma Maurício T. Damasceno
    125. 133. Medidas Estatísticas Maurício T. Damasceno Analisando os dados
    126. 134. Maurício T. Damasceno
    127. 137. Gráfico Histograma
    128. 138. Analisando os dados O que é cruzamento de dados?
    129. 140. Gráfico de Dispersão e Correlação Maurício T. Damasceno
    130. 142. Análise de Dados - II Maurício T. Damasceno
    131. 143. Relembrando... <ul><li>Variáveis Quantitativas – Apresentam valores numéricos que fazem algum sentido. </li></ul><ul><ul><li>Variáveis Quantitativas Discretas – valores inteiros que fazem sentido; normalmente proveniente de contagens. Ex: nº de perdas, nº de fraudes, nº de erros. </li></ul></ul><ul><ul><li>Variáveis Quantitativas Contínuas – valores fracionados que fazem sentido. Ex: Fluxo de caixa, índice de rentabilidade. </li></ul></ul>Maurício T. Damasceno
    132. 144. Distribuição Contínua <ul><li>Exemplo: </li></ul><ul><li>A área sob a curva, entre dois pontos, informa a probabilidade. </li></ul>Média Alta frequência Baixa Freqüência Distribuição Normal. Maurício T. Damasceno Freqüência Variável X
    133. 145. Distribuição Normal Maurício T. Damasceno A área total abaixo da curva é considerada como 100%. Isto é, a área total abaixo da curva é 1.
    134. 146. Distribuição Normal Maurício T. Damasceno
    135. 147. Distribuição Normal <ul><li>Parâmetros da Distribuição Normal </li></ul>Maurício T. Damasceno
    136. 148. Distribuição Normal <ul><li>Conhecendo-se a média e o desvio-padrão é possível calcular qualquer valor de probabilidade. </li></ul><ul><li>Exemplo: A média das taxas de retorno mensais de uma carteira é de 40% e o seu desvio padrão 10%. </li></ul>Maurício T. Damasceno Pergunta : Qual a probabilidade de se observar uma taxa de retorno menor ou igual a 50%?
    137. 149. Distribuição Normal <ul><li>Qual a probabilidade de se observar um retorno menor ou igual a 50%? </li></ul>Área Maurício T. Damasceno
    138. 150. Distribuição Normal <ul><li>Como calcular a área sob a curva abaixo do ponto 50? </li></ul><ul><li>A área desejada é obtida pelo cálculo da integral da função f(x). </li></ul>Maurício T. Damasceno
    139. 151. Distribuição Normal <ul><li>Área sob a curva abaixo do ponto 50: </li></ul>Maurício T. Damasceno No Excel: = DIST.NORM(50;40;10;VERDADEIRO)
    140. 152. Distribuição Normal <ul><li>Exemplo: A média das taxas de retorno mensais de uma carteira é de 12% e o seu desvio padrão 4%. </li></ul>Maurício T. Damasceno Pergunta : Qual a probabilidade de se observar uma taxa de retorno maior que a média e menor ou igual a 14,56%?
    141. 153. Distribuição Normal Padronizada 14,56 Maurício T. Damasceno Probabilidade Média = 12 desvio padrão  = 4
    142. 154. Distribuição Normal Padronizada <ul><li>Existem várias famílias de distribuições normais diferentes. </li></ul><ul><li>Essa distribuição é chamada de Distribuição Normal Padronizada. O operador de transformação é: </li></ul><ul><li>Pode-se utilizar uma única distribuição normal para calcular as probabilidades. </li></ul>Número de desvios de afastamento em relação à média. Maurício T. Damasceno
    143. 155. Distribuição Normal Padronizada Probabilidade em tabela Z Z Z = +0,64 0,64 0 Maurício T. Damasceno Probabilidade 12  = 4 14,56
    144. 156. Para Z =0,64 0,2389 Maurício T. Damasceno Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,00 0 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
    145. 157. <ul><li>A média tem Distribuição Normal </li></ul>Maurício T. Damasceno Distribuição amostral da média
    146. 158. Inferência Estatística Maurício T. Damasceno <ul><li>Quando não é possível coletar todos os dados (população) para realizar análises, pode-se retirar amostras de uma população. </li></ul><ul><li>Análises realizadas a partir de amostras para se obter conclusões para uma população são chamadas de Inferências Estatísticas. </li></ul><ul><li>De modo geral , os métodos de inferência estatística são: </li></ul><ul><ul><li>Intervalos de Confiança </li></ul></ul><ul><ul><li>Testes de Hipótese </li></ul></ul>
    147. 159. Inferência Estatística Maurício T. Damasceno <ul><li>Intervalos de Confiança </li></ul><ul><li>É uma estimativa de um parâmetro desconhecido da população (ex: média) sob a forma de intervalo. </li></ul><ul><li>O intervalo apresenta uma valor mínimo e uma valor máximo. </li></ul><ul><li>Ao intervalo está associado um grau de confiança. </li></ul>
    148. 160. Relembrando: Distribuição Normal Maurício T. Damasceno
    149. 161. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplos de Intervalos de Confiança </li></ul><ul><li>O faturamento médio mensal das micro empresas prestadoras de serviço, em Brasília, no ano de 2009, foi de R$30.000,00, com intervalo de confiança ao nível de 95% entre R$ 25.000,00 a R$35.000,00. </li></ul><ul><li>A quantidade média mensal de horas extras realizadas na empresa X, no ano de 2009, por funcionário, foi de 22 horas, com intervalo de confiança ao nível de 95% entre 18 a 32. </li></ul>
    150. 162. Inferência Estatística Maurício T. Damasceno <ul><li>Construido Intervalos de Confiança para a média com variância populacional conhecida </li></ul><ul><li>Retirar a amostra e calcular a Média </li></ul><ul><li>Escolher o Grau de confiança: Exemplo, 95% gera aproximadamente dois desvios padrão (1,96). </li></ul><ul><li>Limite Superior: = </li></ul><ul><li>Limite Inferior: = </li></ul>
    151. 163. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplos de Intervalos de Confiança </li></ul><ul><li>O faturamento médio mensal de 60 micro empresas prestadoras de serviço, em Brasília, no ano de 2009, foi de R$30.000,00. O desvio padrão foi de R$19.362,92 </li></ul><ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul><ul><li>IC 95% [30.000,00;35.000,00] </li></ul>
    152. 164. Maurício T. Damasceno Inferência Estatística <ul><li>INTERPRETAÇÃO DO IC: </li></ul><ul><li>Para o resultado anterior, IC 95% [30.000,00;35.000,00], significa que 95% das vezes em que se extrair amostras de tamanho 60 da mesma população, espera-se que a média se encontre entre R$30.000,00 e R$35.000,00. </li></ul>
    153. 165. Maurício T. Damasceno Inferência Estatística <ul><li>Regra prática: </li></ul>* Número de desvios aproximados de uma distribuição Normal. Grau de Confiança Número de desvios (z)* 68% 1 95% 2 99% 3
    154. 166. Maurício T. Damasceno Inferência Estatística <ul><li>Exercício 1: Para uma amostra de 60 empresas, determine o Intervalo de confiança, ao nível de 95%, considerando que a média é a mesma, mas o desvio padrão é de R$10.000,00, menos dispersão. </li></ul><ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul><ul><li>IC 95% [27.418,01;32.581,99] </li></ul>=> Menor desvio=> Menor IC!!!
    155. 167. Maurício T. Damasceno Inferência Estatística <ul><li>INTERPRETAÇÃO DO IC: </li></ul><ul><li>Para o IC 95% [27.418,01;32.581,99], significa que 95% das vezes em que se extrair amostras de tamanho 60 da mesma população, espera-se que a média se encontre entre R$27.418,01 e R$32.581,99. </li></ul>
    156. 168. Maurício T. Damasceno Inferência Estatística <ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul><ul><li>IC 95% [21,52 ; 22,47] </li></ul><ul><li>Exercício 2: Retirada uma amostra de 40 funcionários, verificou-se que a quantidade média mensal de horas extras realizadas na empresa X, no ano de 2009, por funcionário, foi de 22 horas, e desvio padrão de 1,5 horas. Construa um intervalo de confiança ao nível de 95%. </li></ul>
    157. 169. Maurício T. Damasceno Inferência Estatística <ul><li>INTERPRETAÇÃO DO IC: </li></ul><ul><li>Para o resultado anterior, IC 95% [21,52 ; 22,47], significa que 95% das vezes em que se extrair amostras de tamanho 40 da mesma população, espera-se que a média de horas extras se encontre entre 21,52 e 22,47 horas. </li></ul><ul><li>Nesse caso o limite inferior do IC está muito próximo do limite superior indicando que há pouca variação, ou seja, para os funcionários que realizam horas extras, essa quantidade é praticamente igual entre eles. </li></ul>
    158. 170. Maurício T. Damasceno Inferência Estatística <ul><li>Considerações a respeito do IC: </li></ul><ul><li>Quando a variância da população é conhecida, utiliza-se a distribuição Normal. </li></ul><ul><li>Quando a variância da população não é conhecida, utiliza-se a distribuição de Student. </li></ul><ul><li>Quando a variância da população não é conhecida, mas a distribuição não é pequena (n > 30), pode-se utilizar a distribuição Normal, pois os resultados são muito próximos à utilização da distribuição de Student. </li></ul>
    159. 171. Inferência Estatística Maurício T. Damasceno <ul><li>Hipótese estatística </li></ul><ul><li>Qualquer afirmativa formulada sobre um valor de um parâmetro da população, por exemplo, média. </li></ul><ul><li>A hipótese não necessariamente é verdadeira; pode ser verdadeira ou falsa. </li></ul>
    160. 172. Inferência Estatística Maurício T. Damasceno <ul><li>Testes de Hipótese </li></ul><ul><li>Conhecido também como Teste de Significância </li></ul><ul><li>Permite avaliar suposições feitas sobre uma característica da população. </li></ul><ul><li>Auxilia nas tomadas de decisões. </li></ul>
    161. 173. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Contexto: Em uma empresa verificou-se a necessidade de um treinamento para reduzir o tempo realização de certo trabalho. </li></ul><ul><li>Antes do treinamento o tempo médio, por funcionário, para a realização do trabalho era de 3 horas. </li></ul><ul><li>Realizado o treinamento, como comprovar que o tempo médio diminuiu? </li></ul>
    162. 174. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Hipótese Nula (H0): o tempo médio é de 3 horas. </li></ul><ul><li>Hipótese Alternativa (H1): o tempo médio é menor que 3 horas. </li></ul><ul><li>Retirar uma amostra </li></ul><ul><li>Construir o Intervalo de Confiança </li></ul><ul><li>Verificar se a afirmação feita em H0 está contida no IC </li></ul><ul><li>Aceitar OU Rejeitar H0 </li></ul>
    163. 175. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Para o exemplo em questão, retirou-se uma amostra de 30 funcionários, calculou-se o tempo médio, 2,5 horas, e o desvio padrão 0,9 horas. Para um IC de 95% para o tempo médio, obteve-se: </li></ul><ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul>
    164. 176. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Qual a decisão? Aceitar a hipótese H0 (o treinamento não surtiu efeito) ou rejeitar H0 (o treinamento surtiu efeito)? </li></ul><ul><li>Pelo IC calculado, percebe-se que o tempo médio de 3 horas não faz parte do intervalo, logo rejeita-se a Hipótese Nula (H0) e conclui-se que o treinamento surtiu efeito. </li></ul><ul><li>IC 95% [2,17 ; 2,82] </li></ul>
    165. 177. Inferência Estatística Maurício T. Damasceno <ul><li>Exercício de Teste de Hipótese </li></ul><ul><li>Contexto: Em uma empresa observou-se um elevado tempo médio de dias de afastamentos do trabalho, por semana, relacionados a doenças por Lesões por Esforço Repetitivo. </li></ul><ul><li>O departamento de gestão de pessoas decidiu trocar a empresa responsável pelo exercício laboral e após seis meses verificou o tempo médio de afastamentos. </li></ul><ul><li>Será que a nova empresa é mais eficiente? O tempo médio de afastamentos diminuiu estatisticamente? </li></ul>
    166. 178. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Para uma amostra de 40 funcionários, observou-se um número de afastamentos nos últimos seis meses de 197 dias. O desvio padrão da amostra é de 2,8 dias. Se o tempo médio anterior era de 7,4 dias, construa um IC de 95% para o tempo médio e verifique se houve uma redução. </li></ul><ul><li>Limite Inferior(95%): </li></ul><ul><li>Limite Superior (95%): </li></ul>
    167. 179. Inferência Estatística Maurício T. Damasceno <ul><li>Exemplo de Teste de Hipótese </li></ul><ul><li>Qual a decisão? Aceitar a hipótese H0 (a nova empresa não conseguiu reduzir o tempo médio de afastamentos) ou rejeitar H0 (o tempo médio de afastamentos diminuiu)? </li></ul><ul><li>Pelo IC calculado, percebe-se que o tempo médio de 7,4 dias não faz parte do intervalo, logo rejeita-se a Hipótese Nula (H0) e conclui-se que o tempo médio de afastamentos diminuiu. </li></ul><ul><li>IC 95% [4,53 ; 5,32] </li></ul>
    168. 180. Inferência Estatística Maurício T. Damasceno <ul><li>Exercício de Teste de Hipótese </li></ul>

    ×