• Like
  • Save
Estatística Descritiva - parte 1 (ISMT)
Upcoming SlideShare
Loading in...5
×
 

Estatística Descritiva - parte 1 (ISMT)

on

  • 11,463 views

 

Statistics

Views

Total Views
11,463
Views on SlideShare
11,394
Embed Views
69

Actions

Likes
3
Downloads
187
Comments
1

3 Embeds 69

http://www.slideshare.net 42
http://www.joaoleal.net 26
http://moodle.ada-net.org 1

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

11 of 1

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Estatística Descritiva - parte 1 (ISMT) Estatística Descritiva - parte 1 (ISMT) Presentation Transcript

    • Ano Lectivo 2009/2010 CET – Curso de Especialização Tecnológica Métodos Computacionais e Estatísticos Professor: João Leal
    • 1. Estatística Descritiva www.joaoleal.net Professor: João José Leal 2
    • Estatística: É um ramo da Matemática que nos ajuda a recolher, a organizar e a interpretar dados que através da utilização de métodos e técnicas permitem-nos classificar os dados recolhidos e reunir informações de modo a destacar o que é mais importante. www.joaoleal.net Professor: João José Leal 3
    • A Estatística, enquanto conjunto de métodos e técnicas próprios para recolher, classificar (tratar), apresentar e interpretar os dados, organiza-se em dois sub-conjuntos: a Estatística Descritiva e a Estatística Analítica. A Estatística Descritiva é o sub-conjunto da estatística que se ocupa indistintamente de um universo ou de uma amostra, com o intuito de os descrever, ou seja, dedica-se apenas à classificação (tratamento), representação e redução de dados, podendo compreender a análise dos mesmos, sempre que as conclusões não respeitem a um conjunto maior do que o observado. www.joaoleal.net Professor: João José Leal 4
    • Portanto, quando se torna necessário manusear e organizar dados para os transformar em informação, é na Estatística Descritiva que buscamos os métodos e as técnicas para realizar essas actividades. www.joaoleal.net Professor: João José Leal 5
    • Rotina de Abordagem da Fase Descritiva 1. Determinar a natureza da informação desejada para os fins que se têm em vista; 2. Indagar se os dados já publicados - pelos serviços oficiais de estatística ou outras entidades – contêm elementos de interesse: Conhecer as principais fontes de dados estatísticos; 3. Citar as fontes a que se recorreu. Procurar as fontes originais, tentando saber como foram apurados os dados e que fim presidiu à sua recolha; www.joaoleal.net Professor: João José Leal 6
    • 4. Se os dados pretendidos não estiverem disponíveis, há que proceder à sua recolha, que terá um objectivo e um âmbito. Há ainda a considerar a definição do: – PLANO DE RECOLHA DOS DADOS: dados necessários e suficientes e meios para os obter – PROCESSO DE RECOLHA DOS DADOS • Inquéritos exaustivos ou censos • Inquéritos ou indagações parciais • Sondagens ou inquéritos por amostragem – MODO DE RECOLHA DOS DADOS • Contínuo • Periódico • Ocasional www.joaoleal.net Professor: João José Leal 7
    • 5. Obtidas as respostas, há que fazer a análise crítica dos dados, verificando a verosimilhança das respostas e as suas falhas (censura das respostas), eliminando as contraditórias ou inexactas 6. Finalmente, há que tratar os dados (classificação) com vista à sua representação: Quadros, Gráficos, Redução de Dados www.joaoleal.net Professor: João José Leal 8
    • População/ Universo: Conjunto de todos os elementos que vão ser objecto de estudo ou análise, que têm pelo menos uma característica em comum. Exemplo: Os alunos da Escola X. www.joaoleal.net Professor: João José Leal 9
    • Amostra: É um subconjunto finito da população que se supõe representativo desta. Ou seja, na impossibilidade de se estudar todos os elementos da população efectua- se um subconjunto finito da população. Exemplo: Os alunos de uma determinada turma da Escola X. Unidade Estatística: É cada elemento da população ou da amostra. www.joaoleal.net Professor: João José Leal 10
    • Exercícios: 1. Para estimar a audiência de cada um dos quatro canais de televisão, realizou-se um estudo a partir de 1000 famílias portuguesas. Relativamente ao estudo indique: a) a população; b) a amostra; c) a unidade estatística. www.joaoleal.net Professor: João José Leal 11
    • 2. De entre os 3000 alunos de uma escola seleccionaram-se 60 e inquiriram-se sobre o programa de televisão preferido. Os resultados obtidos de dados, indique: a) a população; b) a amostra; c) a unidade estatística. www.joaoleal.net Professor: João José Leal 12
    • Censos ou Recenseamento: Num censo ou recenseamento são observados todos os indivíduos da população relativamente aos diferentes atributos que estão a ser objecto do estudo estatístico. Sondagens: Numa sondagem, o estudo estatístico baseia-se numa parte da população, isto é, numa amostra que deve ser representativa dessa população. Caracter (ou atributos ou variável): É um modo pelo qual eu vou estudar a minha população, isto é, segundo uma determinada característica. Exemplo: Relativamente aos elementos de uma família, podemos observar: a altura; a cor dos olhos; o sexo; a idade (em anos); etc. www.joaoleal.net Professor: João José Leal 13
    • Atributos ou características de uma população É o que se pretende conhecer quando se estuda uma população. população. Podem ser: ser: •Qualitativos: Qualitativos: São aquelas que estão relacionadas com uma qualidade e se apresentam com várias modalidades. Ou seja, não é possível a sua mensuração, não é possível traduzi-los em números. Exemplo: O sexo (masculino, feminino); Cor dos olhos (castanhos, verdes, azuis). •Quantitativos: Quantitativos: São aquelas a que é possível atribuir uma medida e apresentam-se com diferentes intensidades ou valores. Isto é, são mensuráveis e podem ser traduzidos por números. Exemplo: A altura; a idade (em anos). www.joaoleal.net Professor: João José Leal 14
    • Dados Os dados quantitativos de um atributo ou característica podem ser discretos ou contínuos. • Discretos se tomam um número finito ou infinito numerável de valores. • Contínuos se tomam um número infinito não- não- numerável de valores. www.joaoleal.net Professor: João José Leal 15
    • Variável É um símbolo que representa determinado atributo ou característica de uma população. Pode ser: - discreta - contínua www.joaoleal.net Professor: João José Leal 16
    • Proporção Permite avaliar o peso relativo de uma parte em relação a um todo, e obtém-se através do quociente da parte pelo todo. Ex: Relação entre desempregados e população activa; proporção de activa; observações com um determinado valor da característica analisada e o total de observações realizadas. realizadas www.joaoleal.net Professor: João José Leal 17
    • Percentagem Proporção, multiplicada por 100. Ex: A percentagem de desempregados é de 6,4%, ou seja, em 100 pessoas activas há 6,4 no desemprego. www.joaoleal.net Professor: João José Leal 18
    • Taxa Percentagem Ex: Ex: Taxa de desemprego é de 6,4%. Traduz o peso da população desempregada sobre o total da população activa; taxa de activa; abstenção foi de 21,3 %. 21, Taxa de variação Compara dois valores da mesma variável. Traduz o acréscimo variável. ou o decréscimo verificado relativamente a uma variável. variável. Ex: A Taxa de variação mensal compara o nível de variação da variável entre dois meses consecutivos. www.joaoleal.net Professor: João José Leal 19
    • Em resultado da observação (em sentido amplo, seja por visualização, medição, inquirição, etc.) das etc. unidades estatísticas que constituem os conjuntos alvos da nossa atenção/interesse, os correspondentes dados que se obtêm vêm “a granel”: rol de dados. ” dados. www.joaoleal.net Professor: João José Leal 20
    • Exemplo 1: Relativamente a 50 motoristas que trabalham numa empresa de transportes, observou-se a quantidade de acidentes sofridos em serviço, donde se obtiveram os seguintes dados: Estes dados apenas foram inscritos e listados pela ordem em que foram sendo recolhidos, não tendo havido ainda qualquer preocupação de representação, visando a facilitação da apreensão das características do conjunto a que os dados se referem. www.joaoleal.net Professor: João José Leal 21
    • Todavia, se tomarmos os dados anteriores e os tratarmos, poderemos apresentá-los de uma forma muito mais “apelativa” e susceptível de permitir a quem os aprecie uma percepção mais fácil das características do conjunto a que respeitam Atributo alvo da observação realizada sobre o conjunto dos motoristas Frequências Relativas Acumuladas Modalidades numéricas (valores) assumidas pelo atributo Qtd. de repetições Proporção de Variável DISCRETA de cada repetições de cada modalidade do Frequências modalidade do Absolutas atributo: atributo: atributo: frequências frequências Acumuladas relativas simples absolutas simples www.joaoleal.net Professor: João José Leal 22
    • A um conjunto de elementos como os que se identificaram no quadro anterior, chama-se Distribuição de Frequências. chama- Frequências. Ou seja, uma Distribuição de Frequências é uma associação de 1 atributo (ou mais), e o respectivo campo de variação, com as suas frequências e os respectivos campos de frequências. Se estamos a trabalhar apenas com 1 atributo, a distribuição diz-se unidimensional. Se forem 2 atributos, será bidimensional; se forem N, será N-dimensional. www.joaoleal.net Professor: João José Leal 23
    • Distribuição de Frequências de acidentes sofridos por 50 motoristas Neste caso estamos a trabalhar apenas com 1 atributo, a distribuição diz-se unidimensional. www.joaoleal.net Professor: João José Leal 24
    • O quadro estatístico é uma forma possível de representação da distribuição de frequências, mas não é a única! Freq. 20 Freq. Absoluta Absoluta 50 15 46 11 35 4 20 0 1 2 3 Quant. Acid. 0 1 2 3 Quant. Acid. Sofridos Sofridos Temos assim os gráficos de frequências absolutas simples e absolutas acumuladas. www.joaoleal.net Professor: João José Leal 25
    • As frequências relativas são representadas com os mesmos tipos de gráficos mas utilizando uma escala de valores relativos no eixo das ordenadas Na representação de dados que acabámos de apreciar, o quadro e os gráficos estatísticos são típicos do tratamento de uma variável discreta. www.joaoleal.net Professor: João José Leal 26
    • Exemplo 2: Uma fábrica de parafusos pretende analisar a qualidade da produção de uma determinada máquina e seleccionou uma amostra de 100 parafusos produzidos por essa máquina, tendo procedido à medição dos respectivos comprimentos, em milímetros, donde obteve o seguinte rol de dados: www.joaoleal.net Professor: João José Leal 27
    • Atributo Analisado: Comprimento (em mm) Tipo de Variável: Variável Contínua Modo de Representação: Em Classes de Valores www.joaoleal.net Professor: João José Leal 28
    • Distribuição de Frequências dos comprimentos (em mm) de 100 parafusos produzidos por uma determinada máquina Frequências Absolutas Simples Frequências Relativas Acumuladas 120 1,20 Freq. / Ampl.Classe 100 1,00 0,80 Frequências 0,60 50 0,40 0,20 8 7 9 9 19 23 9 8 4 4 0,00 0 00 00 20 40 60 80 Comprimentos 0 0 0 0 0 0 0 0 0 ,0 ,0 ,2 ,4 ,6 ,8 ,0 ,2 ,4 0, 9, 9, 9, 9, 9, 10 10 10 10 10 11 11 11 -1 10,00 10,20 10,40 10,60 10,80 11,00 (em mm) 09,00 09,20 09,40 09,60 09,80 Comprimentos (em mm) www.joaoleal.net Professor: João José Leal 29
    • As medidas de estatística descritiva permitem:  representar um conjunto de dados de forma resumida (Redução de Dados);  a comparação de diferentes distribuições. As medidas descritivas designam-se por:  parâmetros (população)  estatísticas (amostra) www.joaoleal.net Professor: João José Leal 30
    • As medidas descritivas dividem-se em:  Medidas de localização  Medidas de dispersão  Medidas de assimetria  Medidas de achatamento  Medidas de concentração www.joaoleal.net Professor: João José Leal 31
    • Medidas de tendência central Médias:aritmética geométrica harmónica Mediana Moda Medidas de tendência não central Quantis:Quartis Quintis … Decis … Centis … Milis www.joaoleal.net Professor: João José Leal 32
    • A média aritmética ( x ) é a soma de todos os valores observados, dividida pela quantidade de observações. Sendo, xk : Dados observados (k = 1, 2, 3, …, N) N : Quantidade de observações m : Quantidade de diferentes valores observados ni : Frequência absoluta de cada valor observado xi fi : Frequência relativa de cada valor observado xi N Fórmulas de cálculo: x + x + ... + x x k Dados Não Classificados : x = 1 2 N = k =1 N N m n 1 x1 + n 2 x2 + … + n m xm nx i i Dados Classificados : x = = i =1 = N N m = fx i =1 i i www.joaoleal.net Professor: João José Leal 33
    • Exemplo 3: Relativamente a 50 motoristas que trabalham numa empresa de transportes, observou-se a quantidade de acidentes sofridos em serviço… www.joaoleal.net Professor: João José Leal 34
    • O valor da média aritmética não tem, necessariamente, que ser algum dos valores observados, mas tem de estar compreendido no intervalo dos valores observados! A média aritmética, corresponde ao valor que, para o mesmo total do valor de todas as observações, cada uma teria, se todas tivessem igual valor. www.joaoleal.net Professor: João José Leal 35
    • Exemplo 4: Uma fábrica de parafusos seleccionou uma amostra de 100 parafusos produzidos por uma máquina, tendo procedido à medição dos respectivos comprimentos, em milímetros … www.joaoleal.net Professor: João José Leal 36
    • Se já não tivermos acesso ao rol de dados, e estes estiverem agrupados em classes, não podemos saber com rigor quais os valores observados em cada classe. Nestas circunstâncias, a média aritmética calcula-se por aproximação, estabelecendo a hipótese de o valor de cada observação dentro da mesma classe ter valor igual ao ponto central dessa classe (hipótese de tabulagem). À diferença entre o verdadeiro valor da média aritmética (apurado a partir dos dados das observações) e o valor da média aritmética que é apurado desta forma, chama-se erro de tabulagem. www.joaoleal.net Professor: João José Leal 37
    • A média geométrica (Mg) de N números positivos é a raiz de índice N do produto desses números. Sendo, xk : Dados observados (k = 1, 2, 3, …, N) N : Quantidade de observações m : Quantidade de diferentes valores observados ni : Frequência absoluta de cada valor observado xi fi : Frequência relativa de cada valor observado xi Fórmulas de cálculo N Dados Não Classificados : Mg = N x1 . x2 … xN = N x k k=1 m nk Dados Classificados : Mg = N x1 n1 2 …2 xmnm .x n = N  xk k=1 www.joaoleal.net Professor: João José Leal 38
    • Exemplo 5: Num determinado momento um indivíduo investiu 10.000 € numa aplicação financeira e manteve esse investimento durante 3 anos, ao longo dos quais obteve diferentes taxas de rentabilidade anuais, conforme exposto no quadro seguinte: www.joaoleal.net Professor: João José Leal 39
    • Pretende calcular-se qual foi a taxa média anual de rentabilidade que o indivíduo obteve, durante os 3 anos, com este investimento. www.joaoleal.net Professor: João José Leal 40
    • A média harmónica ( Mh ) é o inverso da média aritmética dos inversos dos valores observados. Sendo, xk : Dados observados (k = 1, 2, 3, …, N) N : Quantidade de observações m : Quantidade de diferentes valores observados ni : Frequência absoluta de cada valor observado xi fi : Frequência relativa de cada valor observado xi Fórmulas de cálculo 1 Dados Não Classificados : Mh = 1 N 1 N  xk . k=1 1 1 Dados Classificados : Mh = 1 m = m ni .  fi N xi xi i =1 i =1 www.joaoleal.net Professor: João José Leal 41
    • Exemplo 6: Em cada um de 3 anos, um indivíduo gastou 1000 € na compra de um certo produto, nas condições descritas no quadro seguinte: Pretende calcular-se as médias por ano de cada uma das grandezas envolvidas nesta questão: Gasto, Quantidade comprada e Preço. www.joaoleal.net Professor: João José Leal 42
    • www.joaoleal.net Professor: João José Leal 43
    • A mediana (Me) é o valor da variável que ocupa a posição central na sucessão de observações ou na distribuição de frequências depois de se colocar os dados por ordem. Para observações de variável discreta, temos de verificar previamente se a quantidade de observações é par ou ímpar: * Se N for ímpar, então: Me será o elemento central de ordem [(N+1) / 2] * Se N for par, então: Me será a média aritmética entre os elementos centrais (de ordem N/2 e de [(N+2)/2] ) www.joaoleal.net Professor: João José Leal 44
    • Porém, dado que já aprendemos a representar distribuições de frequências de variável discreta, também podemos apurar o valor da mediana com recurso às respectivas funções cumulativas de frequências acumuladas. No caso de variável discreta, o valor da mediana será o valor da variável que satisfaça simultaneamente as seguintes desigualdades: F(Me – ε ) ≤ 0,5 F(Me) ≥ 0,5 www.joaoleal.net Professor: João José Leal 45
    • Exemplo 7: Cálculo da Mediana (variável discreta) Freq. Relativa Distribuição de Frequências de acidentes Acum. sofridos por 50 motoristas 1 0,92 0,70 0,40 0 1 2 3 Quant. Acid. Sofridos Temos uma quantidade par de observações: 50 Para x = 1, vem: Ordenando as 50 observações, verifica-se que a 25ª. e a 26ª. observações têm o F(1 – ε ) = 0,4 e F(1) = 0,7 valor 1, pelo que Me = 1 Pelo que Me = 1 www.joaoleal.net Professor: João José Leal 46
    • Para valores de variável contínua, agrupados em classes, o cálculo da mediana faz-se do seguinte modo: 1.º - Calcula-se a ordem N/2. 2.º- Pelas frequências acumuladas identifica-se a classe que contém a mediana e que será a classe mediana. 3.º - Calcula-se o valor exacto através de uma das seguintes fórmulas: www.joaoleal.net Professor: João José Leal 47
    • Frequências absolutas Frequências relativas Com www.joaoleal.net Professor: João José Leal 48
    • Porém, dado que já aprendemos a representar distribuições de frequências de variável contínua, também podemos apurar o valor da mediana com recurso às respectivas funções cumulativas de frequências acumuladas. No caso de variável contínua, o valor da mediana será o valor da variável que satisfaça a seguinte igualdade da função cumulativa de frequências relativas: F(Me) = 0,5 www.joaoleal.net Professor: João José Leal 49
    • Exemplo 8: Distribuição de Frequências dos comprimentos (em mm) de 100 parafusos produzidos por uma determinada máquina Frequências Relativas Acumuladas 1,20 1,00 0,80 Frequências 0,60 C 0,40 B D A E 0,20 0,00 00 00 20 40 60 80 0 0 0 0 0 0 0 0 0 ,0 ,2 ,4 ,6 ,8 ,0 ,2 ,4 ,0 0, 9, 9, 9, 9, 9, 10 10 10 10 10 11 11 11 -1 Comprimentos (em mm) www.joaoleal.net Professor: João José Leal 50
    • Exemplo 9: Cálculo da Mediana (variável contínua) C 0,50 B D A E 1.º N/2 = 25 2.º A classe mediana é a de [55 – 65[ 3.º Fórmula 1: Fórmula 2: www.joaoleal.net Professor: João José Leal 51
    • A moda (Mo) é a modalidade ou o valor do atributo mais frequente na distribuição, isto é, o que mais observações apresenta. Para distribuições de frequências de atributo qualitativo, ou de atributo quantitativo de variável discreta, a moda encontra-se por observação directa ! Para variáveis contínuas, é necessário identificar a classe modal e depois aplicar alguma fórmula, como por exemplo, a fórmula de King: www.joaoleal.net Professor: João José Leal 52
    • Frequências absolutas Frequências relativas Com www.joaoleal.net Professor: João José Leal 53
    • Outra fórmula empírica de localizar a moda (Mo) a partir da identificação da classe modal, baseia-se na relação de proporcionalidade de dois triângulos, conforme exemplificado na imagem seguinte: nMo D F AB DE = BC FG A B C nMo-1 E com AB = Mo - liMo nMo+1 G BC = LiMo - Mo DE = nMo – nMo-1 FG = nMo – nMo+1 Mo liMo LiMo Classe Modal www.joaoleal.net Professor: João José Leal 54
    • O apuramento do valor da moda pela fórmula de King ou pela proporcionalidade dos triângulos desenhados no interior da classe modal não tem que dar exactamente o mesmo resultado, mas dá resultados aproximados! www.joaoleal.net Professor: João José Leal 55
    • Exemplo 10: Classes ni Ni fi Fi 35 - 45 5 5 0,10 0,10 45 - 55 10 15 0,20 0,30 55 - 65 16 31 0,32 0,62 65 - 75 12 43 0,24 0,86 75 - 85 4 47 0,08 0,94 85 - 95 3 50 0,06 1,00 Cálculo da Moda 50 1 Fórmula de King: Proporcionalidade dos triângulos: 0,6 Mo - 55 1.º Classe modal é a de [55 – 65[ = 0,4 65 - Mo 2.ºFórmula 1: Fórmula 2: Mo = 61 www.joaoleal.net Professor: João José Leal 56