Estatística Descritiva
Upcoming SlideShare
Loading in...5
×
 

Estatística Descritiva

on

  • 1,693 views

Estatística Descritiva com linguagem fácil.

Estatística Descritiva com linguagem fácil.
Estes slides completam hoje 2 anos.

Statistics

Views

Total Views
1,693
Views on SlideShare
1,693
Embed Views
0

Actions

Likes
0
Downloads
75
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Estatística Descritiva Estatística Descritiva Presentation Transcript

  • ESTATÍSTICA Organizando dados para uma visão melhor Por: Marden Rodrigues Aluno de Administração – Segundo Período
  • CONCEITOS GERAIS DE ANÁLISE DE DADOS Por: Marden Rodrigues
  • DEFINIÇÃO E TIPOS DE VARIÁVEIS Por: Marden Rodrigues
  • VARIÁVEIS QUALITATIVAS Quando o resultado da observação é apresentado na forma de qualidade ou atributo, dividem-se em:  Variáveis nominais: quando podem ser separadas por categorias chamadas de não mensuráveis  Variáveis ordinais: quando os números podem agir como categorias ou ordenações. Por: Marden Rodrigues
  • EXEMPLOS DE VARIÁVEIS QUALITATIVAS  Variáveis nominais: a cor dos olhos, tipo de acomodação, marcas de carro, sexo, etc.  Variáveis ordinais: como sugere o nome, elas envolvem variáveis que representam algum elemento em ordem. Uma classificação em anos pode ser um exemplo clássico Por: Marden Rodrigues
  • VARIÁVEIS QUANTITATIVAS Quando o resultado da observação é um número, decorrente de um processo de mensuração ou contagem.  Variáveis contínuas: são aquelas que podem assumir qualquer valor num certo intervalo da reta real.  Variáveis discretas: são aquelas que podem assumir apenas valores inteiros em pontos da reta real. Por: Marden Rodrigues
  • EXEMPLOS DE VARIÁVEIS QUANTITATIVAS Variáveis contínuas: não é possível enumerar todos os possíveis valores, essas variáveis geralmente provém de medições, como de altura, peso, etc.  Variáveis discretas: é possível enumerar todos os possíveis valores da variável, como o número de alunos em uma escola ou o número de mensagens de uma secretária eletrônica.  Por: Marden Rodrigues
  • DISTRIBUIÇÃO DE FREQÜÊNCIAS Por: Marden Rodrigues
  • Um conjunto de observações de certo fenômeno, não estando adequadamente organizado, fornece pouca informação de interesse ao pesquisador e ao leitor. Para uma visão rápida e global do fenômeno deve-se fazer a organização dos dados coletados em uma pesquisa através Por: Marden das distribuições de freqüência. Rodrigues
  • REPRESENTAÇÃO DOS DADOS  Dados brutos: são aqueles que não foram numericamente organizados, ou seja, estão na forma com que foram coletados.  Rol: é a organização dos dados brutos em ORDEM de grandeza crescente ou decrescente Por: Marden Rodrigues
  •   Distribuição da freqüência sem intervalos de classe: é a simples condensação dos dados conforme as repetições de seus valores. Para um rol de tamanho razoável, esta distribuição de freqüência é inconveniente, já que exige muito espaço. Distribuição de freqüência com intervalos de classe: quando o tamanho da amostra é elevada e o número de variáveis é muito grande, é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. REPRESENTAÇÃO DE DADOS Por: Marden Rodrigues As imagens respectivas às classificações estão nas páginas 39 e 40 da apostila
  • CLASSE Por: Marden Rodrigues
  • DEFINIÇÃO São intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1,2,3... (ou seja, i = 1ª classe, 2ª classe...) Por: Marden Rodrigues
  • LIMITES DE CLASSE São os extremos de cada classe. O menor número é o limite inferior da classe (li) e o maior número é o limite superior da classe (ls). Por exemplo: se em uma classe temos que : 26|--- 36 (onde “ |--- “ indica: fechado em 26 e aberto em 36), dizemos que li = 26 e ls = 36 Por: Marden Rodrigues
  • AMPLITUDE DE UM INTERVALO DE CLASSE É a medida de intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior. A nomeando de “h”, temos que: h = ls – li Por exemplo, no exemplo anterior, podemos afirmar que a amplitude é de 10. (36-26) Por: Marden Rodrigues
  • AMPLITUDE TOTAL (H) É a diferença entre o valor máximo e o valor mínimo da amostra: H = Li – Ls Se no total de uma amostra, temos que o maior valor é de 96 e o menor é de 6, temos que H= 96 – 6 = 90 Por: Marden Rodrigues
  • PONTO MÉDIO DE UMA CLASSE O ponto médio de uma classe (xi) é o ponto que divide o intervalo de classe em duas partes iguais. xi = (li + ls)/2 No exemplo anterior do intervalo 26|--- 36, temos que: xi = (36+26)/2 = 62/2 = 31 Por: Marden Rodrigues
  • EM SÍNTESE... Dados brutos são aqueles que não foram organizados. Rol é a organização dos dados brutos em ordem de grandeza crescente ou decrescente. Distribuição de freqüências pode ser com ou sem intervalos de classe. Os elementos da distribuição de frequencias são:  Classe: são intervalos de variação da variável.  Limites de classe: são extremos de cada classe.  Amplitude de classe e total: é a diferença entre o maior e o menor limite.  Ponto médio: é a média aritmética dos limites de Por: Marden classe. Rodrigues
  • -DISTRIBUIÇÃO DE FREQÜÊNCIAS -NÚMERO DE CLASSE -TIPOS DE FREQÜÊNCIA Por: Marden Rodrigues
  • DETERMINAÇÃO DO NÚMERO DE CLASSES (K) É importante que a distribuição conte com um número adequado de classes. Se o número de classes for excessivamente pequeno acarretará perda de detalhe e pouca informação se poderá extrair da tabela. Por outro lado, se for utilizado um número excessivo de classes, haverá alguma classe com freqüência nula ou muito pequena, não atingindo o objetivo de classificação que é tornar o conjunto de Por: Marden dados supervisionáveis. Rodrigues
  • TRÊS SOLUÇÕES PARA DETERMINAR “K” 1) Para n ≤ 25 , K = 5. E para n > 25, K = √n Por exemplo: se a amostra tiver 23 elementos analisados, o número de classes é 5, pois n< 25. Por outro lado, supondo que a amostra tenha 83 elementos analisados (n>25), o número de classes é dado por √83 = 9,1104335, que aproximando-se = 9 Por: Marden classes. Rodrigues
  • TRÊS SOLUÇÕES PARA DETERMINAR “K” 2) Pode-se utilizar a regra de Sturges, que fornece o número de classes em função do total de observações: K = 1 + 3,3 x log n Por: Marden Rodrigues
  • TRÊS SOLUÇÕES PARA DETERMINAR “K” 3) Truman L. Kelley, sugere os seguintes números de classes, com base no número total de observações, para efeito de representação gráfica: n 5 10 25 50 100 200 500 K 2 4 6 8 10 12 15 Por: Marden Rodrigues
  • RELEMBRANDO... Qualquer regra para determinação do número de classes da tabela não nos leva a uma decisão final, esta vai DEPENDER, na realidade, de um julgamento pessoal, que deve estar ligado á natureza dos dados. Por: Marden Rodrigues
  • AMPLITUDE DO INTERVALO DE CLASSE  Amplitude do intervalo de classe nada mais é que o comprimento da mesma, dado por: Ai = H/K Onde H = Limite superior – Limite inferior K = número de classes Por: Marden Rodrigues
  • TIPOS DE FREQÜÊNCIA Por: Marden Rodrigues
  • FREQÜÊNCIA SIMPLES OU ABSOLUTA Representada por “fi”, é o número de repetições de um valor individual ou de uma classe de valores da variável. A soma das freqüências simples é igual ao número total dos dados da distribuição. ∑fi = n Por: Marden Rodrigues
  • FREQÜÊNCIAS RELATIVAS Representadas por “fri”, são os valores das razões (divisões) entre as freqüências absolutas de cada classe e a freqüência total da distribuição. A soma das freqüências relativas é igual a 1 ou 100%. Fri = (fi/n) x 100 Por: Marden Rodrigues
  • FREQUENCIA SIMPLES ACUMULADA Representadas por “faci”, é o total das freqüências de todos os valores inferiores do limite superior do intervalo de uma determinada classe. Bilhete meu: se você não entendeu aqui, no exemplo entenderá.  Por: Marden Rodrigues
  • FREQÜÊNCIA RELATIVA ACUMULADA Representada por “fraci”, é a freqüência acumulada da classe, dividida pela freqüência total da distribuição. fraci = faci/n Por: Marden Rodrigues
  • Classe Fi Fri Fri (%) Faci Fraci xi 280|-- 305 2 8% 8 2 8% 293 305|-- 330 3 12% 12 5 20% 318 330|-- 355 4 16% 16 9 40% 343 355|-- 380 9 36% 36 18 76% 368 380|-- 405 5 20% 20 23 92% 393 405|--|430 2 8% 8 25 100% 418 ∑ 25 100% 100 - - -
  • EM SÍNTESE... Para determinar o número de classes, temos três casos: 1º caso: Para n ≤ 25  número de classes é K = 5 Para n > 25  número de classes é K = √n 2º caso: Pela regra de Sturges  K = 1 + 3,3 x log n 3º caso: Por: Marden Pela regra de Truman. Conforme a tabela Rodrigues
  • EM SÍNTESE...  Amplitude do intervalo de classe: é o comprimento da classe, calculado por Ai = H/K.  Freqüência simples ou absoluta (fi) é o número de repetições de um valor individual.  Freqüências relativas (fri) são os valores das divisões entre “fi” e “n”  Freqüência simples acumulada (faci) é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.  Freqüência relativa acumulada (fraci) é a freqüência acumulada da classe (faci) dividida pela Por: Marden freqüência total da distribuição. Rodrigues
  • MEDIDAS DESCRITIVAS Por: Marden Rodrigues
  • MÉDIAS Por: Marden Rodrigues
  • MÉDIA ARITMÉTICA SIMPLES Para se obter a média aritmética simples de um conjunto de dados, devemos dividir a soma dos valores de todos os dados do conjunto pela quantidade deles. Coisa que todos nós já sabíamos. ∂ = ∑xi/n Onde: ∑ indica “soma de” xi = valores que a variável x assume n = número de valores ∂ = a média aritmética da amostra/população Por: Marden Rodrigues
  • MÉDIA ARITMÉTICA PONDERADA Média ponderada é uma média arítmética na qual será atribuído um peso a cada valor da série. ∂p = (xi . Pi)/∑Pi onde o acréscimo da letra “i” na variável, indica o fator de “todos os valores de”, por exemplo: Pi = todos os valores de P Por: Marden Rodrigues
  • MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS SEM INTERVALOS DE CLASSES As frequencias são as quantidades de vezes que a variável ocorre na oleta de dados, elas funcionam como fatores de ponderação, o que nos leva a calcular uma média ponderada. ∂ = (xi . fi)/n Por: Marden Rodrigues
  • MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSES Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com seu ponto médio, e determinamos a média aritmética ponderada por meio da seguinte fórmula: ∂ = (xi . fi)/n Onde : xi = (li + ls)/2 = ponto médio
  • EXEMPLOS...  Sem intervalo de classes: Após ter sido realizado trabalho bimestral numa turma de Estatística, o professor efetuou levantamento das notas obtidas pelos alunos, observou a seguinte distribuição e calculou a média de sua turma: Notas dos alunos Números de alunos - xifi fi 1 2 3 4 Total ∑ 1 3 5 1 Por: N = 10 Marden Rodrigues 1 6 15 4 26 ∂ =(∑xi . fi)/n ∂ = 26/10 ∂ = 2,6
  • EXEMPLOS...  Com intervalo de classes: Determine a renda familiar, de acordo com os dados da tabela: Classes – Renda familiar Xi Fi – numero de famílias xifi 2 |--- 4 3 5 15 4 |--- 6 5 10 50 6 |--- 8 7 14 98 8 |--- 10 9 8 72 10 |--- 12 11 3 33 N = 40 268 Total ∑ ∂ =(∑xi . fi)/n ∂ = 268/40 ∂ = 6,7
  • MODA (MO) Por: Marden Rodrigues
  • DEFINIÇÃO E LEMBRETE Define-se a moda como o valor que ocorre com maior freqüência em um conjunto de dados.   Primeiramente os dados devem ser ordenados para, em seguida, observar o valor que tem maior freqüência. É possível que haja mais de uma moda dentro de uma mesma amostra/população, dependendo da freqüência de determinado Por: Marden dado. Rodrigues
  • EXEMPLOS... Calcular a moda nos seguintes conjuntos de dados: X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) Mo = 6 (o valor mais freqüente) Y = (1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 6) Mo = 2 e Mo = 4 (valores mais freqüentes) Conjunto BImodal Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) Mo = 2, Mo = 3 e Mo = 4 (valores mais freqüentes) Conjunto POLImodal, ou seja, tem mais de 2 modas Por: Marden Rodrigues
  • MEDIANA (MD) Por: Marden Rodrigues
  • DEFINIÇÃO E OBTENÇÃO É uma medida de posição cujo número divide um conjunto de dados em duas partes iguais. Portanto, a mediana se localiza no centro de um conjunto de números ordenados segundo uma ordem de grandeza.  Para se obter o elemento mediano de uma série deveremos seguir os seguintes passos: - Se N for ímpar, a mediana é o termo de ordem: P = (N+1)/2 - Se N for par, a mediana é a média aritmética dos termos de ordem: P1 = N/2 e P2 = N/2 + 1 Por: Marden Rodrigues
  • EXEMPLOS... 1) Determine o valor da mediana da série que é composta dos seguintes elementos: 56, 58, 62, 65 e 90. N = 5 (ímpar)  P = (N + 1)/2 = 6/2 = 3 3  indica o 3º elemento  Md = 62 2) Em um pesquisa realizada a respeito de erros por folha, cometidos por digitadores, revelaram-se as seguintes quantidades: 12, 12, 13, 13, 15, 16, 18 e 20. Determinar a quantidade mediana de falhas. N = 8 (par)  P1 = N/2 = 8/2 = 4  4º elemento  Md = 13 P2 = N/2 + 1 = 8/2 + 1 = 5  5º elemento  Md = 15 Logo, a mediana será (13 + 15)/2 = 28/2 = 14 Por: Marden
  • DICA IMPORTANTE Para analisar a fundo a diferença entre Média, Mediana e Moda, estude a tabela da página 60 da apostila. Por: Marden Rodrigues
  • POSIÇÃO – QUARTIS, DECIS E PERCENTIS Por: Marden Rodrigues
  • DEFINIÇÃO E DIFERENCIAÇÃO As medidas de posição denominadas quartis, decis e percentis têm o mesmo princípio da mediana. Enquanto a mediana separa a distribuição em duas partes iguais, a característica principal de cada uma dessas medidas é que: Quartis: dividem a distribuição em quatro partes. Decis: dividem em dez partes iguais. Percentis: dividem em cem partem iguais. Por: Marden Rodrigues
  • QUARTIS PARA DADOS NÃO AGRUPADOS 0% 25% Q1 50% Q2 Para o cálculo das posições usaremos: Q1  P1 = (n+1)/4 Q2  P2 = 2(n+1)/4 Q3  P3 = 3(n+1)/4 Onde n  número de dados (valores). Por: Marden Rodrigues 75% Q3 100%
  • DECIS PARA DADOS NÃO AGRUPADOS Para o cálculo das posições usaremos: D1  P1 = (n+1)/10 D2  P2 = 2(n+1)10 D5  P5 = 5(n+1)/10 D9  P9 = 9(n+1)/10 Onde n  número de dados (valores). Por: Marden Rodrigues
  • PERCENTIS PARA DADOS NÃO AGRUPADOS Para o cálculo das posições usaremos: P1  P1 = (n+1)/100 P2  P2 = 2(n+1)/100 P50  P50 = 50(n+1)/100 P99  P99 = 99(n+1)/100 Onde  número de dados (valores). Por: Marden Rodrigues
  • LEMBRANDO QUE... Utilizando medianas quartis, decis ou percentis, se calcula uma POSIÇÃO, ou seja, o valor obtido do cálculo não será necessariamente o dado em si, e sim sua posição dentro do rol. Por: Marden Rodrigues
  • MEDIDAS DE DISPERSÃO (VARIABILIDADE) Por: Marden Rodrigues
  • DEFINIÇÃO São medidas utilizadas para medir o grau de variabilidade ou dispersão dos valores observados em torno da média aritmética. Servem para medir a representatividade da média e proporcionam o conhecimento do nível de homogeneidade ou heterogeneidade dentro de cada grupo analisado. Para compreender esse conceito, considere o exemplo a seguir. Por: Marden Rodrigues
  • EXEMPLO (HOMO/HETEROGENEIDADE) Um empresário deseja comparar a performance de dois empregados, com base na produção diária de determinada peça, durante cinco dias: Empregado A: 70, 71, 69, 70, 70  ∆ = 70 Empregado B: 60, 80, 70, 62, 83  ∆ = 71 A performance média do empregado A é de 70 peças produzidas diariamente enquanto que a do empregado B é de 71 peças. Com base na média aritmética, verifica-se que a performance B é melhor do que a de A. Porém, observando-se bem os dados, percebe-se que a produção de A varia apenas de 69 a 71 peças, ao passo que a de B varia de 60 a 83 peças, o que revela que a performance de A é bem mais uniforme do que a de B.
  • TIPOS DE MEDIDAS DE DISPERSÃO ABSOLUTA Amplitude total (Ai): é a diferença entre o maior e o menor valor observado. Exemplo: Pela situação sugerida na introdução, temos para a amplitude total os seguintes cálculos para os empregados: Empregado A  Ai = 71 – 69 = 2 Empregado B  Ai = 83 – 60 = 23 Por: Marden Rodrigues
  • LEMBRANDO QUE... Utilizando como medida de dispersão a amplitude total de um grupo, se obtém algumas desvantagens, que são: - - - Leva em conta apenas os valores mínimo e máximo do conjunto. Se ocorrer qualquer variação no interior do conjunto de dados, a amplitude total não nos dá qualquer indicação dessa mudança. - A amplitude total também sofre a influencia de um valor “atípico” (extremo) na distribuição, ( um valor muito elevado ou muito baixo em relação ao Por: Marden conjunto) Rodrigues
  • VARIÂNCIA E DESVIO PADRÃO Por: Marden Rodrigues
  • DEFINIÇÃO São as medidas de dispersão mais empregadas, pois levam em consideração a totalidade dos valores da variável em estudo. Ambos estão ligados como meios de se analisar a dispersão dos dados dentro de uma amostra.  Vocês vão ver.  Definiremos como: a variância é dada através da média aritmética dos quadrados dos desvios. Analisaremos na prática a seguir. Por: Marden Rodrigues
  • FÓRMULAS: AMOSTRA X POPULAÇÃO Ficará assim: Dados não agrupados S² = ∑(xi- ) População --------N Amostra S² = ∑ (xi- ) --------n-1 Dados agrupados S² = ∑(xi- ) . fi -----------N S² = ∑(xi- ) . fi -----------n-1 A legenda das fórmulas está no slide
  • LEGENDA DAS FÓRMULAS E DESVIO PADRÃO S = Desvio padrão, no entanto, o calcularemos elevado ao quadrado, sendo assim:  Desvio Padrão = √variância = √S² = S  = média (homenagem ao falecido Steve Jobs) rs Xi = no caso não agrupado, são todos os valores que os dados podem assumir e no caso agrupado, é o ponto médio de determinado intervalo de classe. Sobre a legenda de ∑ e “n”(ou N), vocês já conhecem, que é, respectivamente: somatório e total de valores. Por: Marden Rodrigues
  • CONTINUAÇÃO DO EXEMPLO Retomando-se o exemplo de homo/heterogeneidade para fins de aplicar as fórmulas dadas anteriormente, efetuaremos os seguintes cálculos: Empregado A (média = 70) S² = ∑(xi- )/N = = (70-70)²+(71-70)²+(69-70)²+(70-70)²+(70-70)²/5 = 2/5 = 0,4 portanto, temos que Desvio Padrão = √S² = √0,4 = aproximadamente 0,64 Empregado B (média = 71) S² = ∑(xi- )/N = = (60-71)²+(80-71)²+(70-71)²+(62-71)²+(83-71)²/5 = 428/5 = 85,6 .:. Desvio Padrão = √85.6 = aproximadamente 9,25
  • LEMBRANDO QUE... O enunciado da questão deverá informar se os dados estão sendo demonstrados através de uma amostra ou de uma população, para que assim possa haver a mudança necessária nas fórmulas (e sua interpretação). Por: Marden Rodrigues
  • COEFICIENTE DE VARIAÇÃO DE PEARSON Por: Marden Rodrigues
  • USO E CÁLCULO O Coeficiente de variação de Pearson (CV) é calculado através da divisão entre o desvio padrão e a média multiplicado por cem. No caso, é expressado em porcentagem e facilita a visualização do quão dispersos estão os valores da amostra ou da população. Por: (S x 100)/ CV = Marden Rodrigues
  • COMO QUALIFICAR A DISPERSÃO  Se CV ≤ 15% , está sendo indicada uma baixa dispersão.  Se 15% < CV < 30%, há uma média dispersão.  E por fim, se CV ≥ 30%, está sendo representada uma alta dispersão entre os valores. Por: Marden Rodrigues
  • Para finalizar... MEDIDAS DE ASSIMETRIA Por: Marden Rodrigues
  • DEFINIÇÃO Modo de analisar a distribuição de freqüência em uma amostra/população através da organização de seus dados em forma de gráfico.  Simples? Por: Marden Rodrigues
  • CASOS Caso 1: quando MÉDIA = MEDIANA = MODA, temos uma distribuição de freqüências: SIMÉTRICA MODA MEDIANA E MÉDIA
  • CASOS Caso 2: quando MÉDIA < MEDIANA < MODA, temos uma distribuição de freqüências: ASSIMÉTRICA À ESQUERDA OU NEGATIVA MEDIANA MÉDIA MODA
  • CASOS Caso 3: quando MÉDIA > MEDIANA > MODA, temos uma distribuição de freqüências: ASSIMÉTRICA À DIREITA OU POSITIVA MODA MEDIANA MÉDIA
  • LEMBRANDO QUE...  A média é afetada pelos EXTREMOS, e por isso, em gráficos assimétricos, é apresentada sempre tendendo ao lado onde se encontram os mesmos.  Outro fator por simples observação é que representei a média dos gráficos assimétricos através de uma linha circular pois nos casos não estamos aplicando valores, portanto não podemos dar com exatidão a média de cada um. Por: Marden Rodrigues
  • BONS ESTUDOS! Por: Marden Rodrigues