• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
35302050 apostila-de-estatistica-basica (1)
 

35302050 apostila-de-estatistica-basica (1)

on

  • 16,997 views

 

Statistics

Views

Total Views
16,997
Views on SlideShare
16,938
Embed Views
59

Actions

Likes
13
Downloads
0
Comments
1

1 Embed 59

http://avabrasil.com.br 59

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

11 of 1 previous next

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    35302050 apostila-de-estatistica-basica (1) 35302050 apostila-de-estatistica-basica (1) Document Transcript

    • Ana Lúcia Guimarães Carvalho ESTATÍSTICA BÁSICA resultado final, que influências cabem a cada uma delas. A Estatística é a parte da Fases do Método EstatísticoMatemática Aplicada que trata dosmétodos científicos para coleta, Podemos distinguir no método estatísticoorganização, resumo, apresentação e as seguintes fases:análise de dados. 1. Planejamento Podemos dividi-la em duas: Estatísticadescritiva, que apenas descreve e analisa um Consiste em determinar quais são os dadosconjunto de dados, sem tirar conclusões; e a serem levantados e como estes serãoEstatística indutiva ou Inferência Estatística, levantados, fazendo uma análise de material eque trata das inferências e conclusões, isto é, custos necessários durante a pesquisa.a partir da análise de dados são tiradasconclusões. 2. Coleta de dadosMÉTODO CIENTÍFICO Após cuidadoso planejamento, damos início à coleta de dados. Método científico é um conjunto de A coleta pode ser direta e indireta.meios dispostos convenientemente para se A coleta é direta quando os dados sãochegar a um fim que se deseja. coletados diretamente na fonte. A coleta direta de dados pode ser classificada relativamente ao Dos métodos científicos, vamos destacar o fator tempo em;método experimental e o estatístico. a. contínua (registro) – quando feita continuamente, tal como a deMétodo Experimental nascimentos e óbitos e a de freqüência dos alunos às aulas; O Método experimental consiste em b. periódica - quando feita em intervalosmanter constante todas as causas (fatores), constantes de tempo, como os censos (demenos uma, e variar esta causa de modo que o 10 em 10 anos) e as avaliações mensaispesquisador possa descobrir seus efeitos, caso dos alunos;existam. É o método preferido no estudo da c. ocasional – quando feitaFísica, da Química etc. extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência,Método Estatístico como no caso de epidemias que assolam ou dizimam rebanhos inteiros. Muitas vezes temos necessidade dedescobrir fatos em um campo em que o A coleta pode ser indireta quando osmétodo experimental não se aplica (nas dados são levantados em órgãos que já tenhamciências sociais), já que os vários fatores que efetuado a pesquisa de campo. Como exemplo,afetam o fenômeno em estudo não podem podemos citar a pesquisa sobre a mortalidadepermanecer constantes enquanto fazemos infantil, que é feita através de dados colhidosvariar a causa que, naquele momento, nos por uma coleta direta.interessa. Nesses casos, lançamos mão do método 3. Crítica dos dadosestatístico. O método estatístico, diante da Obtidos os dados, eles devem serimpossibilidade de manter as causas cuidadosamente criticados, à procura deconstantes, admite todas essas causas possíveis falhas e imperfeições, a fim de nãopresentes variando-as, registrando essas incorrermos em erros grosseiros ou de certovariações e procurando determinar, noESTATÍSTICA 1
    • Ana Lúcia Guimarães Carvalhovulto, que possam influir sensivelmente nos - para o fenômeno “número de filhos”há umresultados. número de resultados possíveis expresso através dos números naturais: 0, 1, 2, 3,4. Apuração dos dados ...,n; - para o fenômeno “estatura”temos uma É a soma e o processamento dos dados situação diferente, pois os resultadosobtidos e a disposição mediante critérios de podem tomar um número infinito declassificação. valores numéricos dentro de um determinado intervalo.5. Exposição ou apresentação dos dados Por mais diversa que seja a finalidade que Variável é, convencionalmente, o conjuntose tenha em vista, os dados devem ser de resultados possíveis de um fenômeno.apresentados sob forma adequada (tabelas ougráficos), tornando mais fácil o exame Os exemplos nos dizem que uma variáveldaquilo que está sendo objeto de tratamento pode ser:estatístico. a. qualitativa – quando seus valores são6. Análise dos resultados expressos por atributos: sexo (masculino- feminino), cor da pele (branca, preta, É o objetivo último da Estatística que amarela, vermelha, parda) etc.;consiste em tirar conclusões sobre o todo b. quantitativa – quando seus valores são(população) a partir de informações expressos em números (salários dosfornecidas por parte representativa do todo operários, idade dos alunos de uma escola(amostra).Assim, fazemos uma análise dos etc.). Uma variável quantitativa que poderesultados obtidos e tiramos desses resultados assumir, teoricamente, qualquer valorconclusões e previsões. entre dois limites recebe o nome de variável contínua (exemplos: peso dos7. Conclusão alunos de uma escola) ; uma variável que só pode assumir valores pertencentes a um Significado matemático da pesquisa, conjunto enumerável recebe o nome depodendo apresentar comentários e críticas aos variável discreta ( exemplos: número deresultados. alunos de uma escola). De modo geral, as medições dão origem aExercícios: variáveis contínuas e as contagens ou enumerações, a variáveis discretas.1) Defina Estatística e exemplifique a sua utilização. Exercícios:2) Defina método científico. 1) Classifique as variáveis em qualitativas ou quantitativas (contínuas ou descontínuas):3) Cite e explique detalhadamente as fases do método estatístico. a) Universo: alunos de uma escola. Variável: cor dos cabelos –POPULAÇÃO E AMOSTRA b) Universo: casais residentes em uma cidade. Variável: número de filhos –Variáveis c) Universo: as jogadas de um dado. Variável: o ponto obtido em cada jogada – A cada fenômeno corresponde um número d)Universo: peças produzidas por certade resultados possíveis. Assim, por exemplo: máquina.- para o fenômeno “sexo”são dois os Variável: número de peças produzidas por resultados possíveis: sexo masculino e hora sexo feminino;ESTATÍSTICA 2
    • Ana Lúcia Guimarães Carvalhoe) Universo: peças produzidas por certa fenômeno que desejamos pesquisar. É preciso, máquina pois, que a amostra ou as amostras que vão ser Variável: diâmetro externo – usadas sejam obtidas por processos adequados.2) Diga quais das variáveis abaixo são Amostragem discretas e quais são contínuas: Consiste em uma técnica especial paraa) População: alunos de uma cidade. recolher amostras, que garante, tanto quanto Variável: cor dos olhos. possível, o acaso na escolha.b) P.: estação meteorológica de uma cidade. Dessa forma, cada elemento da população V.: precipitação pluviométrica, durante um passa a ter a mesma chance de ser escolhido, o ano. que garante à amostra o caráter dec) P.: Bolsa de Valores de São Paulo. representatividade, e isto é muito importante, V.: número de ações negociadas. pois nossas conclusões relativas à populaçãod) P.: pregos produzidos por uma máquina. vão estar baseadas nos resultados obtidos nas V.: comprimento. amostras dessa população.e) P.: casais residentes em uma cidade. Principais técnicas de amostragem: V.: sexo dos filhos.f) P.: bibliotecas da cidade de São Paulo. 1- Amostragem casual ou aleatória simples V.: número de volumes. Este tipo de amostragem é equivalente a3) Como se separa as variáveis em discretas e um sorteio lotérico. contínuas? Dê pelo menos, três exemplos Na prática, a amostragem casual ou de cada tipo de variáveis. aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de umPopulação dispositivo aleatório qualquer, k números dessa seqüência, os quais corresponderão aos Ao conjunto de entes portadores de, pelo elementos pertencentes à amostra.menos, uma característica comum Exemplo:denominamos população estatística ou Vamos obter uma amostra representativauniverso estatístico. para a pesquisa da estatura de noventa alunos Assim, os estudantes, por exemplo, de uma escola:constituem uma população, pois apresentam a. Numeramos os alunos de 01 a 90.pelo menos uma característica comum: são os b. Escrevemos os números, de 01 a 90, emque estudam. pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa.Amostra Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, Na maioria das vezes, por impossibilidade um a um, nove números que formarão aou inviabilidade econômica ou temporal, amostra. Neste caso, 10% dalimitamos as observações referentes a uma população.determinada pesquisa a apenas uma parte da Quando o número de elementos da amostrapopulação. A essa parte proveniente da é grande, esse tipo de sorteio torna-se muitopopulação em estudo denominamos amostra. trabalhoso. A fim de facilita-lo, foi elaborada Uma amostra é um subconjunto finito de uma tabela – Tabela de Números Aleatórios -uma população. , construída de modo que os dez algarismos (0 Para as inferências serem corretas, é a 9) são distribuídos ao acaso nas linhas enecessário garantir que a amostra seja colunas (Anexo I)representativa da população, isto é, a amostra Para obtermos os elementos da amostradeve possuir as mesmas características usando a tabela, sorteamos um algarismobásicas da população, no que diz respeito ao qualquer da mesma, a partir do qual iremosESTATÍSTICA 3
    • Ana Lúcia Guimarães Carvalhoconsiderar números de dois, três ou mais 55 a 90, meninas. Usando a tabela de númerosalgarismos, conforme nossa necessidade. Os aleatórios retiramos os elementos danúmeros assim obtidos irão indicar os população.elementos da amostra. A leitura da tabela pode ser feita 3 – Amostragem sistemáticahorizontalmente (da direita para a esquerdaou vice-versa), verticalmente ( de cima para Quando os elementos da população já sebaixo ou vice-versa), diagonalmente (no acham ordenados, não há necessidade desentido ascendente ou descendente) ou construir o sistema de referência. Sãoformando desenhos de uma letra qualquer. A exemplos os prédios de uma rua, as linhas deopção, porém, deve ser feita antes de iniciado produção etc. Nestes casos, a seleção doso processo. elementos que constituirão a amostra pode ser feita por um sistema imposto pelo2 – Amostragem proporcional estratificada pesquisador. A esse tipo de amostragem denominamos sistemática. Muitas vezes a população se divide em Exemplo:subpopulações – estratos. No caso de uma linha de produção, Como é provável que a variável em estudo podemos, a cada dez itens produzidos, retirarapresente, de estratos em estratos, um um para pertencer a uma amostra dacomportamento heterogêneo e, dentro de população diária. Neste caso, estaríamoscada estrato, um comportamento homogêneo, fixando o tamanho da amostra em 10% daconvém que o sorteio dos elementos da população.amostra leve em consideração tais estratos. É exatamente isso que fazemos quando Exercícios:empregamos a amostragem proporcionalestratificada, que, além de considerar a 1) Descreva as técnicas de amostragens.existência dos estratos, obtém os elementos Quando se utiliza cada uma delas?da amostra proporcional ao número deelementos dos mesmos.Exemplo: Supondo, no exemplo anterior, que, dos 2) O que é população estatística?noventa alunos, 54 sejam meninos e 36 sejammeninas, vamos obter a amostra proporcionalestratificada. São, portanto, dois estratos (sexo 3) O que é amostra?masculino e sexo feminino) e queremos umaamostra de 10% da população. Logo, temos:SEXO POPUL. 10% AMOSTRA 4) O que é amostragem? 10 × 54 M 54 = 5, 4 5 100 F 36 10 × 36 4 5) O diretor de uma escola, na qual estão = 3,6 matriculados 280 meninos e 320 meninas, 100 desejoso de conhecer as condições de vida extra-escolar de seus alunos e nãoTOTAL 90 9 dispondo de tempo para entrevistar todas 10 × 90 = 9 ,0 as famílias, resolveu fazer um 100 levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, Numeramos os alunos de 01 a 90, sendo os elementos componentes da amostra.que de 01 a 54 correspondem meninos e deESTATÍSTICA 4
    • Ana Lúcia Guimarães Carvalho Tabela é um quadro que resume um6) Uma cidade X apresenta o seguinte conjunto de observações. quadro relativo às suas escolas de 1º grau: Uma tabela compõe-se de: a. corpo – conjunto de linhas e colunas ESCOLAS Nº DE ESTUDANTES que contêm informações sobre a MASCULINO FEMININO variável em estudo; A 80 95 b. cabeçalho – parte superior da tabela B 102 120 C 110 92 que especifica o conteúdo das colunas; D 134 228 c. coluna indicadora – parte da tabela E 150 130 que especifica o conteúdo das linhas; F 300 290 d. linhas – retas imaginárias que facilitam Total 876 955 a leitura, no sentido horizontal, de dados que se inscrevem nos seus Obtenha uma amostra proporcional cruzamentos com as colunas;estratificada de 120 estudantes. e. casa ou célula – espaço destinado a um só número;7) Em uma escola existem 250 alunos, sendo f. título – conjunto de informações, as 35 na 1ª série, 32 na 2ª, 30 na 3ª, 28 na 4ª, mais completas possíveis, localizado no 35 na 5ª, 32 na 6ª, 31 na 7ª e 27 na 8ª. topo da tabela; Obtenha uma amostra de 40 alunos e g. rodapé – são os elementos preencha o quadro seguinte. complementares da tabela, tais como fonte, as notas e as chamadas, Série População Cálculo Amostra Proporcional colocados, de preferência, no fecho da 1ª tabela. 2ª Exemplo: 3ª Título 4ª Cabeçalho PRODUÇÃO DE CAFÉ 5ª BRASIL – 1996-2000 Cabeçalho Coluna ANOS PRODUÇÃO Coluna 6ª Indicadora (1.000 t) Numérica 7ª 8ª 1996 2.535 Casa ou Célula Total 250 40 1997 2.666 Corpo 1998 2.122 Linhas 1999 3.750SÉRIES ESTATÍSTICAS 2000 2.007 Um dos objetivos da Estatística é Rodapé FONTE: Dados Hipotéticossintetizar os valores que uma ou maisvariáveis podem assumir, para que tenhamos Séries Estatísticasuma visão global da variação dessa ou dessasvariáveis. E isto ela consegue, inicialmente, Denominamos série estatística toda tabelaapresentando esses valores em tabelas e que apresenta a distribuição de um conjunto degráficos, que irão nos fornecer rápidas e dados estatísticos em função da época, do localseguras informações a respeito das variáveis ou da série.em estudo, permitindo-nos determinações Daí podemos concluir que numa sérieadministrativas e pedagógicas mais coerentes estatística observamos a existência de trêse científicas. elementos ou fatores: o tempo, o espaço e a espécie.TabelaESTATÍSTICA 5
    • Ana Lúcia Guimarães Carvalho Conforme varie um dos elementos da REBANHOS BRASILEIROSsérie, podemos classifica-la em histórica, 2000geográfica e específica. ESPÉCIE QUANTIDADE (1.000 cabeças) Bovinos 139.599Séries históricas Eqüinos 5.855 Suínos 32.121 Descrevem os valores da variável, em Ovinos 20.085determinado local, descriminados segundo Caprinos 11.313intervalos de tempo variáveis. Coelhos 909 Fonte: Dados hipotéticosExemplo: PRODUÇÃO DE FERTILIZANTES Séries Conjugadas – Tabela de Dupla FOSFATADOS – BRASIL Entrada 1995 – 1999 ANOS QUANTIDADE Muitas vezes temos necessidade de (t) apresentar, em uma única tabela, a variação de 1995 3.570.115 valores de mais de uma variável, isto é, fazer 1996 4.504.201 uma conjugação de duas ou mais séries. 1997 5.448.835 1998 4.373.226 Conjugando duas séries em uma única 1999 4.024.813 tabela, obtemos uma tabela de dupla entrada. Fonte: Dados Hipotéticos Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha)Séries Geográficas e uma vertical (coluna). Descrevem os valores da variável, em Exemplo:determinado instante, discriminados segundo TELEFONES INSTALADOS – 1997-99regiões. REGIÃO 1997 1998 1999 Norte 373.312 403.712 457.741Exemplo: Nordeste 1.440.531 1.567.006 1.700.467 PRODUÇÃO DE OVOS DE Sudeste 8.435.308 8.892.409 8.673.660 GALINHA NO BRASIL – 2000 Sul 2.106.145 2.192.762 2.283.581 REGIÃO QUANTIDADE (1.000 dúzias) Centro-Oeste 803.013 849.401 944.075 Norte 66.092 Nordeste 356.810 Sudeste 937.463 Total 13.158.309 13.905.290 14.059.524 Sul 485.098 Fonte: Dados Hipotéticos Centro-Oeste 118.468 Fonte: Dados hipotéticos A conjugação, no exemplo dado, foi série geográfico-histórica.Séries Específicas Exercícios Descrevem os valores da variável, em 1) Classifique as sériesdeterminado tempo e local, discriminados a) PRODUÇÃO BRASILEIRA DEsegundo especificações ou categorias. CARVÃO MINERAL BRUTO 1998-00 ANO QUANTIDADE PRODUZIDA (1.000 t)Exemplo: 1998 22.700 1999 18.115 2000 20.984 Fonte: Dados HipotéticosESTATÍSTICA 6
    • Ana Lúcia Guimarães Carvalhob) AVICULTURA BRASILEIRA - 1999 porcentagem de famílias de baixa renda ESPÉCIE NÚMERO com crianças menores de 6 anos e às taxas (1.000 cabeças) de analfabetismo das diferentes regiões Galinhas 511.834 brasileiras e do Brasil como um todo. Patos, marrecos e gansos 5.888 Perus 3.823 Regiões Mortalidade Famílias de Taxa de do infantil* baixa renda analfabetismo Fonte: Dados Hipotéticos Brasil com em maiores crianças de 15 anos menores de (em %) 6 anos (emc) CRIANÇAS NÃO-VACINADAS %) CONTRA A PÓLIO - 1999 Norte 35,6 34,5 12,7 REGIÕES QUANTIDADE Nordeste 59,0 54,9 29,4 Nordeste 512.900 Sul 22,5 22,4 8,3 Sudeste 299.585 Sudeste 25,2 18,9 8,6 Norte 148.818 Centro- 25,4 25,5 12,4 Centro-Oeste 124.791 Oeste Sul 105.371 Brasil 36,7 31,8 14,7 Total 1.191.465 Fonte: Folha de S. Paulo, 11/3/99 Dados fictícios * A mortalidade infantil indica o número de crianças que morrem antes de completar um ano de idade para cada grupo de 1.000 crianças que nasceram vivas.d) AQUECIMENTO DE UM MOTOR Suponha que um grupo de alunos recebeu a DE AVIÃO DE MARCA X MINUTOS TEMPERATURA tarefa de pesquisar fatores que interferem na (º C) manutenção da saúde ou no desenvolvimento 0 20 de doenças. O primeiro grupo deveria colher 1 27 dados que apoiasses a idéia de que, se 2 34 combatendo agentes biológicos e químicos, 3 41 4 49 garante-se a saúde. Já o segundo grupo deveria 5 56 coletar informações que reforçassem a idéia de 6 63 que a saúde de um indivíduo está diretamente Dados Fictícios relacionada à sua condição socioeconômica. Os dados da tabela podem ser utilizados apropriadamente para:e) PRODUÇÃO DE LAMINADOS a) apoiar apenas a argumentação do primeiro NÃO-PLANOS - BRASIL - 1998-2000 grupo. TIPOS QUANTIDADE (1.000 t) b) apoiar apenas a argumentação do segundo 1998 1999 2000 grupo. Barras 1.414 1.272 1.139 c) refutar apenas a posição a ser defendida Vergalhões 2.203 2.140 2.209 Perfilados 526 538 425 pelo segundo grupo. Tubos 390 344 330 d) apoiar a argumentação dos dois grupos. Dados Fictícios e) refutar as posições a serem defendidas pelos dois grupos.f) PESSOAL DOCENTE DO ESTADO 3)(Enem)Lâmpadas incandescentes são DE SÃO PAULO - 1999 normalmente projetadas para trabalhar com REDES 1º GRAU 2º GRAU a tensão da rede elétrica em que serão Estadual 171.910 38.281 ligadas. Em 1997, contudo, lâmpadas Municipal 18.429 1.304 projetadas para funcionar com 127 V Particular 31.514 19.902 foram retiradas do mercado e, em seu Total 221.853 59.487 lugar, colocaram-se lâmpadas concebidas Dados hipotéticos para uma tensão de 120 V. Segundo dados recentes, essa substituição representou uma2)(Enem)A tabela abaixo apresenta dados mudança significativa no consumo de referentes à mortalidade infantil, àESTATÍSTICA 7
    • Ana Lúcia Guimarães Carvalho energia elétrica para cerca de 80 milhões secundária, assim como de traços de brasileiros que residem nas regiões em desnecessários que possam levar o que a tensão da rede é de 127 V. observador a uma análise morosa ou A tabela abaixo apresenta algumas com erros.características de duas lâmpadas de 60 W, b) Clareza – o gráfico deve possibilitarprojetadas respectivamente para 127 V uma correta interpretação dos valores(antiga) e 120 V (nova), quando ambas se representativos do fenômeno emencontram ligadas numa rede de 127 V. estudo. c) Veracidade – o gráfico deve expressar Lâmpada Tensão Potência Lumino Vida a verdade sobre o fenômeno em estudo. (projeto da rede medida sidade útil original) elétrica (watt) medida média (lúmens) (horas) Os principais tipos de gráficos são os 60 W – 127 V 127 V 60 750 1.000 diagramas, os cartogramas e os 60 W – 120 V 127 V 65 920 452 pictogramas. DIAGRAMAS Acender uma lâmpada de 60 W e 120 Vem um local onde a tensão na tomada é de Os diagramas são gráficos geométricos de,127 V, comparativamente a uma lâmpada de no máximo, duas dimensões; para sua60 W e 127 V no mesmo local, tem como construção, em geral, fazemos uso do sistemaresultado: cartesiano.a) mesma potência, maior intensidade de luz e Dentre os principais diagramas, maior durabilidade. destacamos: Gráfico em linha ou em curva;b) mesma potência, maior intensidade de luz e Gráfico em coluna ou em barras; Gráfico menor durabilidade. em colunas ou em barras múltiplas; Gráficoc) maior potência, maior intensidade deluz e em setores. maior durabilidade.d) maior potência, maior intensidade de luz e Gráfico em linha ou em curva menor durabilidade.e) menor potência, menor intensidade de luz e Os dados, geralmente de uma série (tabela), menor durabilidade. são colocados num sistema cartesiano ortogonal. Graficamente, temos pontos ligados por segmentos de reta.GRÁFICOS ESTATÍSTICOS Exemplos: O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo a) objetivo é o de produzir, no investigador ou VENDA DE TRATORES DE UMA no público em geral, uma impressão mais FÁBRICA - 2000 rápida e viva do fenômeno em estudo, já que Mês Unidades vendidas os gráficos falam mais rápido à compreensão que as séries. Janeiro 20 Para tornarmos possível uma Fevereiro 12representação gráfica, estabelecemos uma Março 16correspondência entre os termos da série e Abril 24determinada figura geométrica, de tal modoque cada elemento da série seja representado Maio 8por uma figura proporcional. Junho 18 A representação gráfica de um fenômeno Dados fictíciosdeve obedecer a certos requisitosfundamentais, para ser realmente útil: a) Simplicidade – o gráfico deve ser destituído de detalhes de importânciaESTATÍSTICA 8
    • Ana Lúcia Guimarães Carvalho 24 b) 20 PRONTO SOCORRO – CASOS Dias da semana Atendimento 16 vendas Segunda 12 12 8 Terça 20 4 Quarta 18 0 Quinta 24 J F M A M J Sexta 16 mês Sábado 8b) DESEMPENHO DOS CANDIDATOS 1º SEMESTRE - 2001 Dados fictícios Desempenho (%) c) DISCOS VENDIDOS Candidatos (em milhões) Mês A B C Anos Vendas Janeiro 12 30 40 1992 76,6 Fevereiro 16 25 36 1993 44,8 Março 20 20 40 1994 44,3 Abril 24 18 32 1995 34,5 Maio 30 20 35 1996 44 Dados fictícios 1997 60 Dados hipotéticos 45 40 d) COMÉRCIO EXTERIOR Desempenho (%) 35 30 C BRASIL – 1989-98 25 A Anos Quantidade (1.000 t) 20 Exportação Importação B 15 10 1989 98.010 75.328 5 1990 109.100 71.855 0 J F M A M 1991 123.994 64.066 Mês 1992 119.990 60.718Exercícios 1993 178.790 55.056Construa o gráfico de linhas para as tabelas a 1994 141.737 53.988seguir: 1995 146.351 48.870a) VENDA DE AUTOMÓVEIS 1996 133.832 60.605 1º SEMESTRE 2001 Mês Unidades vendidas 1997 142.382 61.975 Janeiro 12 1998 169.396 58.085 Fevereiro 20 Fonte: Dados hipotéticos Março 18 Abril 24 Gráfico em colunas ou em barras Maio 16 Junho 8 É a representação de uma série por meio de retângulos, dispostos verticalmente Dados hipotéticos (em colunas) ou horizontalmente (em barras).ESTATÍSTICA 9
    • Ana Lúcia Guimarães Carvalho Quando em colunas, os retângulos têm PRODUÇÃO DE ALHOa mesma base e as alturas são proporcionais BRASIL – 2000aos respectivos dados. Estados Quantidade Quando em barras, os retângulos têm a (t)mesma altura e os comprimentos são Santa Catarina 13.973proporcionais aos respectivos dados. Assim estamos assegurando a Minas Gerais 13.389proporcionalidade entre as áreas dos Rio Grande do Sul 6.892retângulos e os dados estatísticos. Goiás 6.130 São Paulo 4.179Exemplos: Fonte fictícia Produção de Alhoa) Gráfico em colunas Brasil – 2000 CONSTRUÇÃO DE AERONAVES Santa Catarina BRASIL - 1994-99 ANOS UNIDADES Minas Gerais 1994 184 Rio Grande do Sul 1995 171 Goiás 1996 167 São Paulo 1997 203 1998 199 0 2 4 6 8 10 12 14 toneladas 1999 197 Fonte: Dados Hipotético c) Gráfico em colunas ou em barras múltiplas Este tipo de gráfico é geralmente empregado quando queremos representar, Construção de Aeronaves simultaneamente, dois ou mais fenômenos Brasil – 1994-99 estudados com o propósito de comparação. 250 Exemplo: 200 PÚBLICO NO BRASIL QUE Unidades 150 FREQÜENTA CINEMA - 1994-2000 100 Ano Filmes nacionais Filmes 50 % estrangeiros % 1994 16 84 0 1994 95 96 97 98 99 1995 18 82 Anos 1996 21 79 1997 25 75 1998 30 70 1999 29 71 2000 31 69b) Gráfico em barras Fonte hipotéticaESTATÍSTICA 10
    • Ana Lúcia Guimarães Carvalho a) Público no Brasil que Freqüenta Cinema PRODUÇÃO DE OVOS DE GALINHA BRASIL - 1999 100 Filmes nacionais Filmes estrangeiros REGIÃO QUANTIDADE 90 80 (1.000 dúzias) 70 Norte 66.092 Percentual 60 50 Nordeste 356.810 40 Sudeste 937.463 30 20 Sul 485.098 10 Centro-Oeste 118.468 0 94 95 96 97 98 99 00 Fonte: Hipotética Ano Fonte hipotética b)Exercícios MORADORES DO BAIRRO A, SEGUNDO O HÁBITO DE ASSISTIR A NOVELAS1) Represente as tabelas usando o gráfico em HÁBITO PERCENTUALcolunas: Sim 82% Não 18%a) Total 100% CHEGADA DE VISITANTES Fonte: fictícia BRASIL - 1997-2000 ANOS NÚMERO (milhares) 1997 1.450 3) Represente as tabelas por meio de um gráfico de colunas múltiplas. 1998 1.550 1999 1.700 a) 2000 1.900 NATALIDADE SEGUNDO AS REGIÕES DO PAÍS Fonte: hipotéticab) (em %) ENTREGA DE GASOLINA PARA 1940 1960 1980 CONSUMO - BRASIL – 1997-00 Norte 54,4 57,4 43,6 ANOS QUANTIDADE Nordeste 53,5 52,6 41,5 (1.000 m3) Sudeste 43,7 42,5 28,9 1997 9.700 Sul 39,2 41,7 29,4 1998 11.100 Centro-Oeste 46,8 47,0 35,9 1999 9.727 Fonte: jornal Folha de S. Paulo, 21/7/88 2000 9.347 Dados hipotéticos2) Usando o gráfico em barras, represente as Gráfico em Setorestabelas: Este gráfico é construído com base em um círculo, e é empregado sempre queESTATÍSTICA 11
    • Ana Lúcia Guimarães Carvalhodesejamos ressaltar a participação do dado no Exercícios:total. O total é representado pelo círculo, 1) Represente as tabelas por meio deque fica dividido em tantos setores quantas gráficos em setores.são as partes. a) Os setores são tais que suas áreas são QUEM DOMINA O SETORrespectivamente proporcionais aos dados da FARMACÊUTICOsérie. % de participação Número de Obtemos cada setor por meio de uma no mercado companhiasregra de três simples e direta, lembrando que Americana 22o total da série corresponde a 360º. Italiana 4 Inglesa 6Exemplo: Francesa 5 Alemã 10 REBANHOS BRASILEIROS Austríaca/Holandesa 2 1988 Suíça 6 ESPÉCIE QUANTIDADE Subtotal 280 (milhões de cabeças) Origem nacional 55 Bovinos 140 Total 335 Suínos 32 Fonte: Jornal Folha de S, Paulo, 23/7/88 Ovinos 20 c) Caprinos 11 A OCUPAÇÃO DE CADA UM Total 203 Fonte: IBGETemos: 203 __ 360º x1= 248,2 x1 = 248º 140 __ x1 Executivos, x2 = 56,7 x2 = 57º Fazendeiros e profissionais liberais e empresários outros x3 = 35,4 x3 = 35º Total no Operários Congresso 37% 62% 1% x4 = 19,5 x4 = 20º PMDB 39% 60% 0,3%Com esses dados (valores em graus), PFL 37% 62% 0,0%marcamos num círculo de raio arbitrário, comum transferidor, os arcos correspondentes, PDS 50% 50% 0,0%obtendo o gráfico: PDT 19% 76% 4% PT 0% 80% 19% REBANHOS BRASILEIROS – 1988 Fonte: Revista Veja, jun/87 c) ÁREA TERRESTRE BRASIL Bovino REGIÕES RELATIVA Suíno (%) Norte 45,25 Ovino Nordeste 18,28 Caprino Sudeste 10,85 Sul 6,76 Centro-Oeste 18,86 Fonte: IBGE Total 100,00 Fonte: IBGEESTATÍSTICA 12
    • Ana Lúcia Guimarães Carvalho Cartograma DENSIDADE POPULACIONAL O cartograma é a representação sobre PROJETADA DA REGIÃO SUL DO uma carta geográfica. BRASIL - 1990 Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Distinguimos duas aplicações: a) Representar dados absolutos (população) – neste caso, lançamos mão, em geral, dos pontos, em número proporcional aos dados. b) Representar dados relativos (densidade) – neste caso, lançamos mão, em geral, de hachuras. Exemplo: Menos de 33,0 hab/Km2 POPULAÇÃO PROJETADA DA REGIÃO Menos de 46,0 hab/Km2 SUL DO BRASIL - 1990ESTADO POPULAÇÃO ÁREA DENSIDADE Menos de 47,0 hab/Km2 (hab.) (Km2) Paraná 9.137.700 199.324 45,8 Santa 4.461.400 95.318 46,8 Catarina Rio 9.163.200 280.674 32,6Grande do Pictograma Sul Fonte: IBGE O pictograma constitui um dos processos que melhor fala ao público, pela sua POPULAÇÃO PROJETADA DA REGIÃO forma ao mesmo tempo atraente e sugestiva. A SUL DO BRASIL - 1990 representação gráfica consta de figuras. Exemplos: AUMENTA CONSUMO DE GÁS (Consumo mensal de gás de nafta na região metropolitana de São Paulo em milhões me m3) 30,15 29,03 MAI./ 28,71 ABR./ 28,00 MAR./ 27,39 FEV./ JAN./88 • 400.000 habitantes Fonte: Jornal Folha de S. Paulo, jul./88 ESTATÍSTICA 13
    • Ana Lúcia Guimarães Carvalho CRESCE O NÚMERO DE d) No período 1985-1996, a taxa de PASSAGEIROS NOS ÔNIBUS desemprego esteve entre 8% e 16%. URBANOS DE CAMPINAS (SP) e) A taxa de desemprego foi crescente no (em milhões) 166,2 período compreendido entre 1988 e 162,1 1997 1991. 158,8 1996 1995 152,4 MÉDIAS ANUAIS DA TAXA DE 1994 DESEMPREGO TOTAL 140,1 GRANDE SÃO PAULO 1993 1985-1996 16% 14% 12% 10% 8%Fonte: Jornal Folha de São Paulo, jul./98 6% 4% 2% 0% APURAÇÃO DOS VOTOS PARA 85 86 87 88 89 90 91 92 93 94 95 96 PRESIDENTE Até 22h34, em % Fonte: SEP, Convênio SEADE-DIEESE 2)(Enem) Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de alguns canais de televisão, entre 20h e 21h, 54,0 24,2 durante uma determinada noite. Os resultados 6,7 5,8 obtidos estão representados no gráfico de 5,6 2,9 barras a seguir: FHC Lula Enéas Quércia Amim Brizola 100 (PSDB) (PT) (Prona) (PMDB) (PPR) (PDT) 80 Nº de residencia 60 Fonte: jornal Folha de S. Paulo, 5 out. 1994 40 20Exercícios 0 TvA TvB TvC TvD Nenhum canal1)(Enem) Um estudo sobre o problema do desemprego na Grande São Paulo, no I. O número de residências atingidas nessa período 1985-1996, realizado pelo SEADE- pesquisa foi, aproximadamente , de: DIEESE, apresentou o seguinte gráfico a) 100 c) 150 e) 220 sobre taxa de desemprego. b) 135 d) 200Pela análise do gráfico, é correto afirmar que, II. A percentagem de entrevistados queno período considerado: declararam estar assistindo à TvB é a) a maior taxa de desemprego foi de aproximadamente igual a: 14%. a) 15% c) 22% e) 30% b) A taxa de desemprego no ano de 1995 b) 20% d) 27% foi a menor do período. c) A partir de 1992, a taxa de desemprego foi decrescente.ESTATÍSTICA 14
    • Ana Lúcia Guimarães Carvalho3)(Univali) O gráfico mostra as vendas de GRÁFICO II televisores em uma loja: 2.200 Nº total de linhas telefônicas 60 2.150 50 Unidades vendidas 2.100 40 30 2.050 20 2.000 Jan. Abr. Ago. Dez. 10 0 Jan. Fev. Mar. Abr. Maio Jun. Mês Analisando os gráficos, pode-se concluir que: a) o gráfico II representa um crescimentoPode-se afirmar que: real maior do que o do gráfico I. a) as vendas aumentaram mês a mês. b) o gráfico I apresenta o crescimento real. b) foram vendidos 100 televisores até Sendo o II incorreto. junho. c) o gráfico II apresenta o crescimento c) as vendas do mês de maio foram real, sendo o gráfico I incorreto. inferiores à soma das vendas de d) a aparente diferença de crescimento nos janeiro e fevereiro. dois gráficos decorre da escolha das d) foram vendidos 90 televisores até diferentes escalas. abril. e) os dois gráficos são incomparáveis, e) Se cada televisor é vendido por pois usam escalas diferentes. R$240,00, em maio a loja faturou, com as vendas desse produto, 5) Analisando o gráfico responda: R$7.200,00. sesem4)(Enem) Para convencer a população local NAJ VEF RAM RBA IAM NUJda ineficiência da Companhia Telefônica 0 01Vilatel na expansão da oferta de linhas, um 02 A otudorP lim me( adnevpolítico publicou no jornal local o gráfico I, 03 04abaixo representado. A companhia Vilatel 05 06 B otudorPrespondeu publicando dias depois o gráfico II, 07 08onde pretende justificar um grande aumento 09na oferta de linhas. O fato é que, no períodoconsiderado, foram instaladas, efetivamente,200 novas linhas telefônicas. a) Quantas unidades do produto A foram vendidas em janeiro? E em fevereiro? Gráfico I b) Em que mês o produto B atingiu a venda de 70.000 unidades? 2.200 c) Em que mês os dois produtos tiveram o Nº total de linhas telefônicas 2.180 2.160 mesmo número de unidades vendidas? 2.140 d) Em que meses o produto B foi mais vendido 2.120 2.100 que o produto A? 2.080 2.060 2.040 6) O gráfico nos mostra o número de chamadas 2.020 telefônicas ocorridas numa determinada 2.000 cidade de 1995 a 1999. Construa uma Jan. Abr. Ago. Dez. tabela que represente esse gráfico.ESTATÍSTICA 15
    • Ana Lúcia Guimarães Carvalho 5000 milhões de dólares 450 4500número de chamadas 400 4000 350 3500 300 3000 250 2500 200 2000 Importação 150 1500 Exportação 100 1000 50 500 0 0 1995 1996 1997 1998 1999 1995 1996 1997 1998 1999 anos anos7) O gráfico a seguir fornece a evolução dopreço médio de um videocassete brasileiro, de 9) O gráfico abaixo nos mostra a participação1994 a 1999. Construa a tabela referente ao em 47 vôos semanais para o exterior degráfico e responda: algumas empresas brasileiras (dados de outubro de 1991). Construa a tabela 1200 referente ao gráfico apresentado. preços (US$) 1000 800 9% 600 400 200 23% Varig 0 1994 1995 1996 1997 1998 1999 Transbrasil anos Vasp Fonte: revista Veja 68% Fonte: revista Isto Éa) Que nome se dá a esse tipo de gráfico?b) Qual era o preço médio do TÉCNICA DE SOMATÓRIO videocassete brasileiro em 1987? Para indicarmos a soma dos x i (x índicec) Qual a variação do preço médio do i) valores de uma variável x, isto é, a soma de videocassete brasileiro entre 1986 e x1 + x2 + x3 + ... + xn, utilizamos o símbolo 1991? grego sigma (Σ), denominado, em Matemática, SOMATÓRIO.8) O gráfico nos mostra o movimento de Assim, a soma x1 + x2 + x3 + ... + xn n importações e das exportações de um país, de 1995 a 1999. Faça uma tabela que pode ser representado por ∑x i=1 i (somatório de represente esse gráfico. xi, onde x varia de 1 a n). TÉCNICAS DE SOMATÓRIO são as técnicas que auxiliam na soma dos x i valores de uma variável x. VARIÁVEL é o conjunto de valores possíveis que representam um fenômeno.ESTATÍSTICA 16
    • Ana Lúcia Guimarães Carvalho Ex.: Sendo o conjunto x = {1, 3, 5, 6, 8, 9}Ex.: x = {0, 1, 2, 3, ..., 10} determine: x = variável 6 i = índice ou ordem que o elemento ∑3x i = 3x2 + 3x3 + 3x4 + 3x5 + 3x6 = 3·3 +ocupa na seqüência i=2x1 = 0 x3 = 2 3·5 + 3·6 + 3·8 + 3·9 = 93x2 = 1 x4 = 3 , e assim por diante. Aplicando a propriedade temos, SEQÜÊNCIA é uma função cujo 6 6domínio é o conjunto de números positivos ∑3x i = 3· ∑x i = 3(x2 + x3 + x4 + x5 + x6) =que indicam a posição. i =2 i =2 3(3 + 5 + 6 + 8 + 9) = 3·31 = 93 Ex.: X = {x1, x2, x3, ... , x n} ⇒ {1, 2,3, .. , n} é o conjunto das posições d) ∑∑x i j ij = x11 + x12 + ... + xijPROPRIEDADES: n Seja por exemplo a tabelaa) ∑x = x + x + x + ... + x i=1 i 1 2 3 n i J Níveis Níveis fator 2 fator 1 1 2 3Ex.: Sendo o conjunto X = {1, 3, 5, 6, 8, 9} 1 X11 X12 X13 Σx1jfaça: 2 X21 X22 X23 Σx2j 6 Σxi1 Σxi2 Σxi3 Σxij• ∑x = x + x + x + x + x + x = 1 + 3 i=1 i 1 2 3 4 5 6 P + 5 + 6 + 8 + 9 = 32 N 1 2 3 5 1 28 35 46 109• ∑x = x i=3 i 3 + x4 + x5 = 5 + 6 + 8 =19 2 36 48 62 146 64 83 108 255 n xij ⇒ i → linhab) ∑k i =1 = 1 k4k +...+ k = n·k, onde k é k + +2 4 4 4 3 nvezes j → colunauma constante real. como fica a notação de somatório: 7 2Ex.: Determine ∑ 8=8+8+8+8+8+8 i =1 da 1ª coluna → x11 + x21 = ∑x i1 = 28 + 36 = i =1+ 8 = 7·8 = 56 64 3 n da 1ª linha → x11 + x12 + x13 = ∑x = 28 + ∑ 1jc) kx i = kx1 + kx2 + kx3 + kx4 + ...+ kxn = j=1 i =1 35 + 46 = 109 nk· ∑x i=1 i , onde k é uma constante real.ESTATÍSTICA 17
    • Ana Lúcia Guimarães Carvalho 4 6Ex. Seja a matriz M =    determine  EXERCÍCIOS 8 9 2 1) Desenvolva os seguintes somatórios:∑∑x ij = x21 + x22 = 8 + 9 = 17 7 7 ∑i=2 j=1 a) i =1 xi c) ∑x i= 3 i ne) ∑x yi=1 i i = x1·y1 + x2·y2 + ... + xn·yn b) ∑y 3 i d) 10 ∑y i i =1 i =4Ex.: Sejam os conjuntos X={0,1,2,3,4,5,6} eY = {5,6,7,8,9}, determine: 2) Sendo X = {2, 5, 6, 7} calcule: 4 2 5 ∑x y = 2·7 + 3·8 + 4·9 = 14 + 24 + 36 = i i a) ∑x i =1 i b) ∑x i=1 i i=3 3 474 c) ∑ (x i =1 i + 1) d) ∑(x i =2 i + 3)2 nf) ∑(x +y ) = (x + y )+(x + y )+...+(x + y ) i i 1 1 2 2 n n i=1 3) Sendo X = {1, 2, 3, 6}, calcule: n n 4 4= ∑x + ∑y i=1 i i =1 i a) ∑10⋅ x i=1 i b) ∑(2 +10⋅ x ) i =1 iEx.: Sejam os conjuntos X = {0,1,2,3, 4,5,6} 4) Calcule os seguintes somatórios, sendoe Y = {5,6,7,8,9}, determine: Y = {0, 4, 3, 7} 5 5 3 4 4 5∑(x + y ) = ∑x + ∑yi = 2 + 3 + 4 + 5 + i i i a) ∑i =1 yi b) ∑i =1 8 c) ∑4y ii=2 i=2 i=2 i=16 + 7 + 8 + 9 = 44 3 3 n d) ∑y ⋅10 i e) ∑(5+12y ) ig) ∑(x +a) = (x + a) + (x + a) + (x + a) i=1 i t 1 t 2 t 3 t i=1 3 i=1 4+ ... + (xn + a)t , onde a é uma constante real f) ∑(3 − y ) i =1 i g) ∑(4y + 3y −10) i=1 i iEx.: Seja X = {2, 3, 4, 5, 6}, determine: 4 4 h) ∑(3− y + 2y ) i i∑i=1 ( x i + 1) 2 2 = ( 2 + 1) + (3 + 1) + (4 + 1) 2 2 i=1 5) Sendo X = {3, 7, 2, 1} e Y = {0, 3, 1, 2},+ (5 + 1)2 = 32 + 42 + 52 + 62 = 9 + 16 + 25 + calcule:36 = 86 4 4 a) ∑(x + y ) i=1 i i b) ∑(x − y ) i=1 i i 2 4 c) ∑i=1 (2 + x i ) 2 d) ∑(x i=1 i + yi ) 2ESTATÍSTICA 18
    • Ana Lúcia Guimarães Carvalho 4 4 166 160 161 150 162 160e) ∑x y i =1 i i f) ∑(x i=1 i + 1) 165 168 167 163 164 156 160 173 162 160 161 155 164 168 155 152 163 160 155 155 169 151 170 164 4 4 4 154 161 156 172 153 157f) ∑x + ∑ y i=1 i i =1 i g) ∑(x +2+y ) i=1 i i 156 158 158 161 Rol 4 4 46) Sendo ∑x i =10 , ∑y =20 e ∑ x i 2 i =30, Estatura de 40 alunos do Colégio A i =1 i =1 i =1 150 151 152 153 154 155calcule: 155 155 155 156 156 156 4 4 157 158 158 160 160 160a) ∑(x i=1 i + yi ) b) ∑(x + 3) i=1 i 2 160 162 160 162 161 161 163 163 161 164 161 164 4 164 165 166 167 168 168c) ∑(4x i=1 i + yi ) 169 170 172 173 No exemplo dado, a variável em  2 − 6 3 − 3 questão, estatura, será observada e estudada   muito mais facilmente quando dispusermos7) Sendo M =  1 2 4 5  , determine:  − 3 5 2 − 1 valores ordenados em uma coluna e   colocarmos, ao lado de cada valor, o número 3 4 de vezes que aparece repetido.]a) ∑x i2 b) ∑xj=1 3j Denominamos freqüência o número de alunos que fica relacionado a um determinado i =1 3 3 3 4 valor da variável. Obtemos, assim, uma tabelac) ∑∑x i = 1 j= 2 ij d) ∑∑ x i =1 j=1 ij que recebe o nome de distribuição de freqüência: Tabela I ESTATURA DE 40 ALUNOS DO COLÉGIODISTRIBUIÇÃO DE FREQÜÊNCIA A ESTAT. FREQ. ESTAT. FREQ. Freqüência – repetição de determinado (cm) (cm) dado. 150 1 163 2 151 1 164 3 Tabela Primitiva – tabela cujos 152 1 165 1 elementos não foram numericamente 153 1 166 1 organizados 154 1 167 1 155 4 168 2 Rol – tabela obtida após a ordenação 156 3 169 1 dos dados . 157 1 170 1 158 2 172 1Exemplo: 160 5 173 1 161 4Tabela primitiva 162 2 TOTAL 40 Estatura de 40 alunos do Colégio AESTATÍSTICA 19
    • Ana Lúcia Guimarães Carvalho O processo dado exige muito espaço, total descrição, até porque a Estatística tem pormesmo quando o número de valores da finalidade analisar o conjunto de valores,variável (n) é de tamanho razoável. A desinteressando-se por casos isolados.solução mais aceitável, pela própria naturezada variável contínua, é o agrupamento dos Exercício:valores em vários intervalos. Deste modo, estaremos agrupando os 1) Observe a tabela seguinte.valores da variável em intervalos, sendo que,em estatística, preferimos chamar os Algumas informações sociais sobre os 30intervalos de classes. funcionários da Indústria Santo Afonso. Chamando de freqüência de umaclasse o número de valores da variável Nº Estado Nº de Grau de Saláriopertencentes à classe, os dados da tabela Civil depen instrução (x mínimo)anterior podem ser dispostos em uma tabela dentesdenominada distribuição de freqüência com 1 casado 2 1º grau 3intervalos de classe. 2 casado 2 1º grau 3 solteiro 0 2º grau 6Tabela II 4 divorc. 2 2º grau 6 5 casado 2 superior 15 ESTATURA DE 40 ALUNOS DO 6 solteiro 0 1º grau 3 COLÉGIO A 7 casado 2 2º grau 6 ESTATURAS FREQÜÊNCIA 8 casado 3 1º grau 3 (cm) 9 solteiro 0 1º grau 3 150├ 154 4 10 casado 2 1º grau 3 154 ├ 158 9 11 divorc. 3 1º grau 3 158 ├ 162 11 12 casado 2 1º grau 3 162 ├ 166 8 13 casado 2 1º grau 3 166 ├ 170 5 14 casado 2 2º grau 15 170 ├ 174 3 15 solteiro 0 1º grau 4 Total 40 16 solteiro 0 2º grau 8 17 solteiro 1 1º grau 4 OBS: Os intervalos de classe devem 18 casado 2 1º grau 4ser escritos, de acordo com a Resolução 19 casado 2 2º grau 8886/66 do IBGE, em termos de desta 20 divorc. 2 1º grau 4quantidade até menos aquela, empregando, 21 solteiro 1 superior 15para isso o símbolo ├ (inclusão de li e 22 casado 3 1º grau 4exclusão de L i). 23 casado 2 2º grau 8 24 solteiro 0 1º grau 4 Ao agruparmos os valores da variável 25 casado 2 2º grau 8em classes, ganhamos em simplicidade mas 26 solteiro 1 1º grau 4perdemos em pormenores. Assim, na tabela I, 27 solteiro 0 2º grau 8podemos verificar, facilmente, que quatro 28 casado 2 1º grau 4alunos têm 161 cm de altura e que não existe 29 solteiro 0 2º grau 8nenhum aluno com 171 cm de altura. Já na 30 solteiro 0 1º grau 4tabela II não podemos ver se algum aluno tem Fonte: dados hipotéticosa estatura de 159 cm. No entanto, sabemos,com segurança, que onze alunos têm estatura Elabore uma tabela de freqüência (absoluta ecompreendida entre 158 e 162 cm. relativa) considerando como variável: O que se pretende com a construçãodessa nova tabela é realçar o que há de a) o estado civil.essencial nos dados e, também, tornarpossível o uso de técnicas analíticas para sua b) o número de dependentes.ESTATÍSTICA 20
    • Ana Lúcia Guimarães Carvalho c) O grau de instrução. Ela é obtida pela diferença entre os limites superior e inferior dessa classe e d) O salário. indicada por hi. Assim: hi = L i - l i2) As notas de Estatística de uma turma de 50 alunos estão anotadas na tabela a seguir. Faça uma tabela de freqüência (absoluta e 4 – Amplitude total da distribuição relativa) para essas notas. Amplitude total da distribuição NOTAS DE ESTATÍSTICA ( AT ) é a diferença da última classe ( limite superior máximo) e o limite4 6 8 5 8 5 7 inferior da primeira classe ( limite4 10 6 7 5 6 4 inferior mínimo).6 7 10 10 5 10 57 5 8 7 4 5 67 6 7 9 9 6 5 AT = L (máx.) – l(mín.)9 6 5 9 8 10 85 6 7 5 6 8 54 5 – Amplitude amostralELEMENTOS DE UMA DISTRIBUIÇÃODE FREQÜÊNCIA Amplitude amostral ( AA ) é a diferença entre o valor máximo e o valor1 – Classe mínimo da amostra. Classes de freqüência ou, simplesmente, classes são intervalos de AA = x(max.) – x(min.) variação da variável. As classes são representadas 6 – Ponto médio de uma classesimbolicamente por i, sendo i = 1,2,3, ... ,K(onde K é o número total de classes dadistribuição). Ponto médio de uma classe ( xi ) é, como o próprio nome indica, o ponto2 – Limites de classe que divide o intervalo de classe em duas partes iguais. Determinamos limites de classe os extremos de cada classe. Para obtermos o ponto médio de uma classe, calculamos a semi-soma dos limites da O menor número é o limite inferior classe ( média aritmética):da classe ( li ) e o maior número, o limitesuperior da classe ( L i ) . li + L i xi =3 – Amplitude de um intervalo de classe 2 Amplitude de um intervalo 7 – Freqüência simples ou absoluta de classe ou, simplesmente, intervalo de classe é a medida do intervalo que Freqüência simples ou freqüência define a classe. absoluta ou, simplesmente freqüência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor.ESTATÍSTICA 21
    • Ana Lúcia Guimarães Carvalho A freqüência simples é simbolizada i Notas xi fipor fi ( lemos: f índice i ou freqüência da 1 0├2classe i ). 2 2├4 A soma de todas as freqüências é 3 4├6representada pelo símbolo de somatório: 4 6├8 5 8 ├10 k ∑f = ∑ fi i i =1 b) Agora, responda: 1) Qual a amplitude amostral?NÚMERO DE CLASSES 2) Qual a amplitude da distribuição?INTERVALO DE CLASSE 3) Qual o número de classes da Para a determinação do número de distribuição?classes de uma distribuição podemos lançar 4) Qual o limite inferior da quarta classe?mão da regra de Sturger, que nos dá o 5) Qual o limite superior da classe de ordem 2?número de classes em função do número devalores da variável: 6) Qual a amplitude do segundo intervalo de classe? i ≅ 1 + 3,3 . log n c) Complete:onde: i é o número de classe; 1) h3 = _____ 2) l1 = _____ 3) x2 = ___ n é o número total de dados. 4) n = _____ 5) L 3 = ____ 6) f5 = ____ Decidido o número de classes quedeve ter a distribuição, resta-nos resolver o TIPOS DE FREQÜÊNCIAproblema da determinação da amplitude dointervalo de classe, o que conseguimos Freqüências simples oudividindo a amplitude total pelo número de absolutas (fi) são os valores queclasses: realmente representam o número de dados de cada classe. AT h ≅ i A soma das freqüências simples é igual Quando o resultado não é exato, ao número total dos dados:devemos arredonda-lo para mais. ∑f i =nExercício:1) As notas obtidas por 50 alunos de uma Freqüência relativa (fri) são classe foram: 1 2 3 4 5 6 6 7 7 8 os valores das razões entre as 2 3 3 4 5 6 6 7 8 8 freqüências simples e a freqüência 2 3 4 4 5 6 6 7 8 9 total 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9 fia) Complete a distribuição de freqüência : fri = ∑f iESTATÍSTICA 22
    • Ana Lúcia Guimarães Carvalho O propósito das freqüências relativas é i xi fio de permitir a análise ou facilitar as 1 2 4comparações. 2 3 7 3 4 5 Freqüência acumulada (Fi) é o 4 5 2 somatório de todas as classes anteriores 5 6 1 da referida classe. 6 7 1 ∑ = 20 Fk = f1 + f2 + ... + fk Exercícios: Freqüência acumulada 1) Considerando as notas de um teste de relativa (Fri) de uma classe é a inteligência aplicado a 100 alunos: freqüência acumulada da classe, dividida pela freqüência total da 64 78 66 82 74 103 78 86 103 87 distribuição. 73 95 82 89 73 92 85 80 81 90 78 86 78 85 98 75 73 90 86 101 86 84 86 76 76 83 86 84 85 103 76 80 92 73 87 70 85 79 93 102 Fi Fri = 82 90 83 81 85 72 81 96 81 85 ∑f i 68 71 96 73 86 63 70 74 72 74 98 78 84 78 99 81 89 83 96 105 95 94 88 62 91 83 98 93 83 76 94 75 67 95 708 98 71 92 72 73DISTRIBUIÇÃO DE FREQÜÊNCIA SEMINTERVALO DE CLASSE Forme uma distribuição de freqüência. Determine: Quando se trata de variável discreta a) ∑ fi b) fri c) Fi d) Fr ide variação relativamente pequena, cada valorpode ser tomado como um intervalo de classe 2) A distribuição abaixo indica o número dee, nesse caso, a distribuição é chamada acidentes ocorridos com 70 motoristas dedistribuição sem intervalo de classe, uma empresa de ônibus:tomando a seguinte forma: Nº acidentes 0 1 2 3 4 5 6 7 xi fi Nº motoristas 20 10 16 9 6 5 3 1 x1 f1 x2 f2 Determine: : : a) o número de motoristas que não sofreram xn fn nenhum acidente: ∑ fi = n b) o número de motoristas que sofreram pelo menos 4 acidentes; c) o número de motoristas que sofreram menos de 3 acidentes;Exemplo: d) o número de motoristas que sofreram no mínimo 3 e no máximo 2 acidentes; e) a percentagem dos motoristas que sofreram no máximo 2 acidentes.Seja X a variável “número de cômodos dascasas ocupadas por vinte famílias 3) Sejam as alturas (em centímetros) de 25 alunos de uma determinada classe:entrevistadas”:ESTATÍSTICA 23
    • Ana Lúcia Guimarães Carvalho 150 159 157 151 152 m) a percentagem dos lotes cuja área é de 500m2, no mínimo, mas inferior a 1.000m2; 156 153 163 159 175 n) a classe do 72º lote; o) até que classe estão incluídos 60% dos lotes. 162 162 164 158 159 5) Baseando que um amostra apresentou os 164 168 166 160 162 resultados abaixo, clacule a amplitude do intervalo de classe ( h ) e o número total dea) Calcule a amplitude do rol. classes ( i ).b) Calcule a amplitude para cada intervalo de classe. a) n=50 AA=150c) Ache a distribuição de freqüência com intervalos de classe, a freqüência relativa, a b) n=70 AA=10 freqüência acumulada e a freqüência acumulada relativa. 6) Complete os dados que faltam na distribuição de freqüência:4) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: a) I Xi fi fri fi ÁREAS Nº DE (m2) LOTES 1 0 1 0.05 300 ├ 400 14 2 1 0.15 4 3 2 4 400 ├ 500 46 4 3 0.25 13 500 ├ 600 58 5 4 3 6 5 18 600 ├ 700 76 7 6 19 700 ├ 800 68 8 7 800 ├ 900 62 ∑ = 20 ∑ = 1.00 900 ├ 1000 48 1000 ├ 1100 22 b) i Classes xi fi Fi fri 1100 ├ 1200 6 1 0├2 1 4 0,04 2 2├4 8Com referência a essa tabela, determine: 3 4├6 5 30 0,18a) a amplitude total; 4 7 27 0,27b) o limite superior da quinta classe; 5 15 72c) o limite inferior da oitava classe; 6 10 ├ 12 83d) o ponto médio da sétima classe; 7 13 10 93 0,10e) a amplitude do intervalo da segunda classe; 8 14 ├ 16 0,07f) a freqüência da quarta classe;g) a freqüência relativa da sexta classe; ∑= ∑=h) a freqüência acumulada da quinta classe;i) o número de lotes cuja área não atinge 700 m2; REPRESENTAÇÃO GRÁFICA DE UMAj) o número de lotes cuja área atinge e DISTRIBUIÇÃO ultrapassa 800 m2; Uma distribuição de freqüência podek) a percentagem dos lotes cuja área não ser representada graficamente pelo atinge 600 m2; histograma, pelo polígono de freqüência el) a percentagem dos lotes cuja área seja pelo polígono de freqüência acumulada maior ou igual a 900 m2; (ogiva de Galton).ESTATÍSTICA 24
    • Ana Lúcia Guimarães Carvalho Construímos qualquer um dos gráficos O histograma goza de uma propriedademencionados utilizando o primeiro quadrante da qual faremos considerável uso: a área dedo sistema de eixos coordenados cartesianos um histograma é proporcional à soma dasortogonais. Na linha horizontal (eixo das freqüências.abscissas) colocamos os valores da variável ena linha vertical ( eixo das ordenadas), as POLÍGONO DE FREQÜÊNCIAfreqüências. O polígono de freqüência é umHISTOGRAMA gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo O histograma é formado por um horizontal, levantadas pelos pontosconjunto de retângulos justapostos, cujas médios dos intervalos de classe.bases se localizam sobre o eixohorizontal, de tal modo que seus pontos Para realmente obtermos um polígonomédios coincidam com os pontos médios (linha fechada), devemos completar a figura,dos intervalos de classe. ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da As larguras dos retângulos são iguais posterior à última, da distribuição.às amplitudes dos intervalos de classe. As alturas dos retângulos devem ser Exemplo:proporcionais às freqüências das classes, ESTATURA DE 40 ALUNOS DO COLÉGIOsendo a amplitude dos intervalos iguais. Isso Anos permite tomar as alturas numericamente i ESTATURAS fiiguais às freqüências. (cm) 1 150├ 154 4Exemplo: À distribuição da tabela 2 154 ├ 158 9corresponde o seguinte histograma: 3 158 ├ 162 11 4 162 ├ 166 8 ESTATURA DE 40 ALUNOS DO 5 166 ├ 170 5 COLÉGIO A 6 170 ├ 174 3 i ESTATURAS (cm) fi Total ∑ f i = 40 1 150├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 12 4 162 ├ 166 8 10 frequência 5 166 ├ 170 5 8 6 170 ├ 174 3 6 Total ∑ f i = 40 4 2 0 148 152 156 160 164 168 172 176 12 Estatura 10 frequência 8 6 No caso de termos uma variável 4 essencialmente positiva, cuja distribuição se 2 inicie no valor zero, devemos considerar um 0 intervalo anterior localizado no semi-eixo 150 154 158 162 166 170 174 negativo. Porém consideraremos apenas a parte classes positiva do segmento que liga o ponto médioESTATÍSTICA 25
    • Ana Lúcia Guimarães Carvalhodesse intervalo com a freqüência do intervalo Exemplo:0├ ... . i xi fi FiPOLÍGONO DE FREQÜÊNCIA 1 2 4 4ACUMULADA 2 3 7 11 3 4 5 16 O polígono de freqüência 4 5 2 18 acumulada é traçado marcando-se as 5 6 1 19 freqüências acumuladas sobre 6 7 1 20 perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos ∑ = 20 limites superiores dos intervalos de classe. 8Exemplo: Freqüência 6 ESTATURA DE 40 ALUNOS DO COLÉGIO A 4 i ESTATURAS fi 2 (cm) 1 150├ 154 4 0 2 154 ├ 158 9 1 2 3 4 5 6 7 3 158 ├ 162 11 4 162 ├ 166 8 Também podemos representar a 5 166 ├ 170 5 distribuição pelo gráfico da freqüência 6 170 ├ 174 3 acumulada, o qual se apresentará com pontos Total ∑ f i = 40 de descontinuidade nos valores observados da variável: 40 30 Freqüencia 20 Exercícios: 10 1) Dada a distribuição abaixo, construa para os dados apresentados: 0 150 154 158 162 166 170 174 Estatura Áreas nº de (m2) lotesGRÁFICO DE UMA DISTRIBUIÇÃO DE 300 ├ 400 14FREQÜÊNCIA SEM INTERVALO DE 400 ├ 500 46CLASSE 500 ├ 600 58 600 ├ 700 76 Uma distribuição de freqüência sem 700 ├ 800 68intervalo de classe é representada 800 ├ 900 62graficamente por um diagrama onde cada 900 ├ 1000 48valor da variável é representado por um 1000 ├ 1100 22segmento de reta vertical e de comprimento 1100 ├ 1200 6proporcional à respectiva freqüência.ESTATÍSTICA 26
    • Ana Lúcia Guimarães Carvalhoa) O histograma; c) O polígono de freqüência.b) o polígono de freqüência; d) O polígono de freqüência acumuladac) o polígono de freqüência acumulada. correspondente.2) Dada a distribuição abaixo, construa para 5) Um grau de nebulosidade, registrado em os dados apresentados: décimos, ocorre de acordo com a distribuição abaixo: i Classes fi Nebulo 0 ├ 0,5├ ,5├ 2,5├ 3,5├ 4,5├ 5,5 ├ 6,5├ 7,5├ 8,5├ 9,5├ 10 1 4├8 2 sidade 2 8 ├ 12 5 fi 320 125 75 65 45 45 55 65 90 145 676 3 12 ├ 16 9 4 16 ├ 20 6 Pede-se: 5 20 ├ 24 2 a) A freqüência acumulada. 6 24 ├ 28 1 b) O histograma. Σ = 25 c) O polígono de freqüência. d) O polígono de freqüência acumulada. a) O histograma. b) O polígono de freqüência. 6) Dado o histograma abaixo, construa: c) O polígono de freqüência acumulada 123) Conhecidas as notas de 50 alunos: 10 frequência 8 68 85 33 52 66 77 84 65 74 57 6 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 4 41 55 78 48 69 85 67 39 60 76 2 94 88 66 66 73 42 65 94 88 89 0 8 10 12 14 16 18 20 22 classespede-se: a) Uma tabela de freqüência para os dadosa) A distribuição de freqüência começando apresentados. por 30 e adotando-se o intervalo de classe b) O polígono de freqüência. de amplitude igual a 10. c) O polígono de freqüência acumulada.b) A freqüência acumulada.c) O histograma.d) O polígono de freqüência. 7) Dado o polígono de freqüência abaixo,f) O polígono de freqüência acumulada. construa: 4) A tabela abaixo apresenta os coeficientes de liquidez obtidos da análise de balanço 16 em 50 indústrias 14 frequência 12 10 3,9 7,4 10,0 11,8 2,3 4,5 10,5 8,4 15,6 818,8 2,9 2,3 0,4 5,0 9,0 5,5 9,2 12,4 4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 6 7,1 3,2 2,7 16,2 2,7 9,5 13,1 3,8 6,3 4 4,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 2 7,5 8,7 4,4 7,9 16,0 0 10 14 18 22 26 30 34 36pede-se: Xa) Formar com esses dados uma distribuição a)Uma tabela de freqüência para os com intervalos de classe igual a 3, tais que dados apresentados. os limites inferiores sejam múltiplos de 3. b) O histograma.b) Confeccionar o histograma. c) O polígono de freqüência acumulada.ESTATÍSTICA 27
    • Ana Lúcia Guimarães Carvalho8) Examinando o histograma abaixo, que MEDIDAS DE POSIÇÃO corresponde às notas relativas à aplicação de um teste de inteligência a um grupo de As medidas de posição mais alunos, responda: importantes são as medidas de tendência central, que recebem tal denominação pelo a) Qual é o intervalo de classe que tem fato de os dados observados tenderem, em maior freqüência? geral, a se agrupar em torno dos valores b) Qual a amplitude total da distribuição? centrais. Dentre as medidas de tendência c) Qual o número total de alunos? central, destacamos a média aritmética, a d) Qual é a freqüência do intervalo de mediana e a moda. classe 110 ├ 120? e) Quais os dois intervalos de classe que _ têm a mesma freqüência? MÉDIA ARITMÉTICA ( X ) f) Quais são os dois intervalos de classe tais que a freqüência de um é o dobro Média aritmética é o quociente da da freqüência do outro? divisão da soma dos valores da variável g) Quantos alunos receberam notas de pelo número deles. teste entre 90 (inclusive) e 110? h) Quantos alunos receberam notas não- inferiores a 100? x= ∑ i _ x 30 n sendo: 25 frequência _ 20 x a média aritmética; x i os valores da variável; 15 n o número de valores. 10 Dados não-agrupados 5 Quando desejamos conhecer a média 0 40 60 80 100 120 140 160 dos dados não-agrupados, determinamos a classes média aritmética simples.9) O gráfico mostra a distribuição de uma Exemplo:amostra de garrafas de refrigerantes e seus Sabendo-se que a produção leiteirarespectivos volumes em mililitros: diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para 500 produção média da semana: 400 _ 10 + 14 + 13 + 15 + 16 + 18 + 12 98 (nº de garrafas x= = 14 Freqüência = 300 7 7 Logo: 200 _ 100 x =14 litros 0 280 300 320 Volume (ml) Dados agrupadosa) Quantas garrafas compõem essa amostra?b) Qual a freqüência relativa da classe “300 Sem intervalo de classe ml”?ESTATÍSTICA 28
    • Ana Lúcia Guimarães Carvalho Neste caso, como as freqüências sãonúmeros indicadores de cada valor da i ESTATURAS fi xi xifivariável, elas funcionam como fatores de (cm)ponderação, o que nos leva a calcular a média 1 150 ├ 154 4 152 608aritmética ponderada, dada pela fórmula: 2 154├ 158 9 156 1.404 3 158├ 162 11 160 1.760 4 162├ 166 8 164 1.312 _ x= ∑x f i i 5 166├ 170 5 168 840 6 170├ 174 3 172 516 ∑f i ∑ = 40 ∑ = 6.440Exemplo: _ x= ∑x f i i = 6.440 _ = 161 ⇒ x = 161 cm Considere a distribuição relativa a 34 ∑f i 40famílias de quatro filhos, tomando paravariável o número de filhos do sexo Exercícios:masculino: 1) As idades dos jogadores de um time deNº DE FILHOS fi xif i basquetebol são 18, 23, 19, 20 e 21 anos. Qual é a média de idade desses jogadores? 0 2 0 1 6 6 2) Entre sessenta números, vinte são iguais a 2 10 20 5, dez são iguais a 6, quinze são iguais a 8, 3 12 36 dez são iguais a 12, e cinco são iguais a 1. 4 4 16 Determine a média aritmética desses ∑ = 34 ∑ = 78 números.Temos, então: 3) Quatro funcionários A, B, C e D de uma_x= ∑x f i i ⇒x= _ 78 _ = 2,29 ⇒ x = 2,3 empresa têm respectivamente 8, 6, 10 e 16 anos de trabalho nessa empresa. O ∑f i 34 funcionário A recebeu um prêmio de R$ 500,00 por ano de casa; B recebeu umisto é: prêmio de R$ 600,00 por ano de casa; e C e _ D receberam, cada um, R$ 800,00 de x = 2,3 meninos prêmio por ano de casa. Qual foi o prêmio médio recebido por ano de casa por esses Com intervalo de classe funcionários? Neste caso, convencionamos que 4) As classes A, B e C da segunda série dotodos os valores incluídos em um ensino médio tiveram respectivamente asdeterminado intervalo de classe coincidem seguintes médias na prova de matemática:com o seu ponto médio, e determinamos a 6,5; 6,0 e 7,0. Sabendo que a classe A émédia aritmética ponderada por meio da formada por 28 alunos, B é formada por 25fórmula: alunos e C, por 22 alunos, calcule a nota média de todos os 75 alunos. _ x= ∑x f i i ∑f i 5) A tabela mostra a distribuição de freqüência da carga, em toneladas, dos caminhões que passaram por uma estrada num certoOnde xi é o ponto médio da classe. período. Calcule a carga média desses caminhões.Exemplo:Consideremos a distribuição:ESTATÍSTICA 29
    • Ana Lúcia Guimarães Carvalho Carga Número de Uma vez agrupados os dados, é (em toneladas) caminhões possível determinar imediatamente a moda: [ 9,5;14,5 [ 18 basta fixar o valor da variável de maior freqüência. [ 14,5;19,5 [ 33 [ 19,5;25,5 ] 9 Exemplo: Dada a distribuiçãoA MODA ( Mo ) Nº DE FILHOS fi 0 2 Denominamos moda o valor 1 6 que ocorre com maior freqüência em 2 10 uma série de valores. 3 12 4 4Dados não-agrupados ∑ = 34 Quando lidamos com valores não- A freqüência máxima ( 12 ) corresponde oagrupados, a moda é facilmente reconhecida: valor 3 da variável. Logo:basta, de acordo com a definição, procurar o Mo = 3valor que mais se repete. Com intervalo de classeExemplo: A classe que apresenta a maiorA série de dados: freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste7, 8, 9, 10, 10, 10, 11, 12, 13, 15 caso, é o valor dominante que está compreendido entre os limites da classe modal.tem moda igual a 10. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da Podemos, entretanto, encontrar séries classe modal.nas quais não exista valor modal, isto é, nas Damos a esse valor a denominação dequais nenhum valor apareça mais vezes que moda bruta.outros. É o caso da série: Temos, então:3, 5, 8, 10, 12, 13 l+Lque não apresenta moda ( amodal ). Mo = 2 Em outros casos, ao contrário, podehaver dois ou mais valores de concentração. onde:Dizemos, então, que a série tem dois ou maisvalores modais. Na série: l é o limite inferior da classe modal; L é o limite superior da classe modal.2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9temos duas modas: 4 e 7 ( bimodal ). Exemplo:Dados agrupados Para a distribuição: Sem intervalo de classe i Estaturas fiESTATÍSTICA 30
    • Ana Lúcia Guimarães Carvalho (cm) da série. Convencionou-se utilizar o ponto 1 150 ├ 154 4 médio. 2 154 ├ 158 9 Assim, a série de valores: 3 158 ├ 162 11 4 162 ├ 166 8 2, 6, 7, 10, 12, 13, 18, 21 5 166 ├ 170 5 6 170 ├ 174 3 tem para mediana a média aritmética entre 10 e 12 ∑ = 40 Logo: 10 = 12 22 l+L Md = = = 11Mo = 2 2 2 donde: 158 = 162 320 Md = 11Mo = = = 160 2 2Logo: Dados agrupadosMo = 160 cm Se os dados agrupam em uma distribuição de freqüência, o cálculo daA MEDIANA ( Md ) mediana se processa de modo muito semelhante àquele dos dados não-agrupados, A mediana é definida como o implicando, porém, a determinação prévia das número que se encontra no centro de um freqüências acumuladas. Ainda aqui, temos série de números, estando estes dispostos que determinar um valor tal que divida a segundo uma ordem.. É o valor situado de distribuição em dois grupos que contenham o tal forma no conjunto que o separa em dois mesmo número de elementos. subconjuntos de mesmo número de Para o caso de uma distribuição, porém, elementos. a ordem, a partir de qualquer um dos extremos, é dada por:Dados não-agrupados Dada uma série de valores: Pos = ∑f i 25, 13, 10, 2, 18, 15, 6, 16, 9, Sem intervalo de classeo primeiro passo é o da ordenação ( crescente Neste caso, basta identificar aou decrescente ) dos valores: freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana2, 5, 6, 9, 10, 13, 15, 16, 18 será aquele valor da variável que corresponde a tal freqüência acumulada.em seguida, tomamos aquele valor central queapresenta o mesmo número de elementos à Exemplo:direita e à esquerda. Em nosso exemplo, essevalor é o 10, já que, nessa série, há quatro Dada a distribuição de freqüência:elementos acima dele e quatro abaixo. Nº DE fi Fi Temos, então: MENINOS Md = 10 0 2 2 1 6 8 Se, porém, a série dada tiver um 2 10 18número par de termos, a mediana será, por 3 12 30definição, qualquer dos números 4 4 34compreendidos entre os dois valores centrais ∑ = 34ESTATÍSTICA 31
    • Ana Lúcia Guimarães CarvalhoSendo: Neste caso, o problema consiste em ∑f 34 i = 17 = determinar o ponto do intervalo em que está compreendida a mediana. 2 2 Para tanto, temos inicialmente quea menor freqüência acumulada que supera determinar a classe na qual se acha a medianaesse valor é 18, que corresponde ao valor 2 da – classe mediana. Tal classe será,variável, sendo este o valor mediano. Logo: evidentemente, aquela correspondente à freqüência acumulada imediatamente superiorMd = 2 meninos a ∑ fi . No caso de existir uma freqüência 2acumulada (F i), tal que: Seguimos os seguintes passos:Fi = ∑f, i 1º) Determinamos as freqüências acumuladas. 2a mediana será dada por: 2º) Calculamos ∑ fi 2 3º) Marcamos a classe correspondente à x i + x i +1 freqüência acumulada imediatamente superior Md = 2 à ∑ f i - classe mediana – e, em seguida, 2isto é, a mediana será a média aritmética entre empregamos a fórmula:o valor da variável correspondente a essafreqüência acumulada e o seguinte. ∑ fi   − F(ant ) hExemplo:  2    Md = l + fDada a distribuição de freqüência: na qual: xi fi Fi l é o limite inferior da classe mediana; 12 1 1 F(ant) é a freqüência acumulada da 14 2 3 classe anterior à classe mediana; 15 1 4 f é a freqüência simples da classe 16 2 6 mediana; 17 1 7 h é a amplitude do intervalo da classe 20 1 8 mediana. ∑= 8 Exemplo:Temos: Dada a distribuição de freqüência: Pos = ∑f i 8 = =4 2 2 i Estaturas fi FiLogo: (cm) 15 + 16 31 1 150 ├ 154 4 4 Md = = = 15,5 2 2 2 154 ├ 158 9 13 3 158 ├ 162 11 24 ClasseDonde: mediana Md = 15,5 4 162 ├ 166 8 32 5 166 ├ 170 5 37 6 170 ├ 174 3 40Com intervalo de classe ∑ = 40ESTATÍSTICA 32
    • Ana Lúcia Guimarães CarvalhoTemos: xi 3 4 5 6 7 8 ∑f 40 i = 20 = fi 4 8 11 10 8 3 2 2Logo, a classe mediana é a de ordem 3. Então: calcule: a) a média;l = 158, F(ant) = 13, f = 11 e h = 4 b) a mediana; c) a moda.substituindo na fórmula:Md = 158 + (20 − 13) 4 =158 + 28 5) Quando trabalhamos com variáveis 11 11 contínuas e em grande número, pode serMd = 158 + 2,54 = 160,54 interessante classificá-las em intervalos iguais, a fim de reduzir o tempo dasisto é: operações. Nestes casos, para os cálculos Md = 160,5 cm das medidas de posição costumamos considerar todos os valores de cadaExercícios intervalo iguais ao ponto médio do intervalo. Assim, se no intervalo de 10 a 151) Considerando os conjuntos de dados: tivermos 18 valores, consideraremos que todos os 18 são iguais a 12,5, que é o valor a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 médio entre 10 e 15. Esta medida não b) 51,6; 48,7; 50,3; 49,5; 48,9 costuma acarretar erro considerável. Com base no que afirmamos acima, c) 20, 9, 7, 2, 12, 7, 20, 15, 7 determine a média, a mediana e a moda das d) 15, 18, 20, 13, 10, 16, 14 seguintes distribuições de freqüências:calcule: INTERVALO FREQÜÊNCIA 2├8 4I - a média; 8 ├ 14 6II - a mediana; 8 14 ├ 20III - a moda. 20 ├ 26 62) Os salários-hora de cinco funcionários de uma companhia são: INTERVALO FREQÜÊNCIAR$ 75,00; R$ 90,00; R$ 83,00;R$ 142,00 e 1├2 1R$ 88,00. 2├3 4 3├4 6Determine: 4├5 3 a) a média dos salários-hora; 5├6 1 b) o salário-hora mediano; c) o salário modal. 6) Numa pesquisa feita dentre os alunos de3) As notas de um candidato, em seis provas uma escola para saber da existência de de um concurso, foram: 8,4; 9,1; 7,2; 6,8; irmãos mais novos, obtiveram-se os dados 8,7 e 7,2. Determine: mostrados na tabela abaixo: a) a nota média; Calcule: b) a nota mediana; c) a nota modal a) o número médio de irmãos mais novos; b) o número mediano de irmãos mais novos;4) Considerando as distribuições: c) a moda de irmãos mais novos.ESTATÍSTICA 33
    • Ana Lúcia Guimarães Carvalho nº de irmãos Freqüência b) É possível afirmar que a nota média, mais novos nessa questão, foi ≤ 2? Justifique sua 6 4 resposta. 5 6 c) Qual é a moda do conjunto das notas de 4 10 todos os alunos? 3 12 d) Qual é a mediana do conjunto das notas 2 22 de todos os alunos? 1 31 0 187) Determine a média, a mediana e a moda 1 (20% ) das seguintes distribuições de freqüências: 2 (32% ) 0 (10% ) INTERVALO FREQÜÊNCIA 1,60 ├ 1,65 4 5 (10% ) 1,65 ├ 1,70 7 3 (16% ) 1,70 ├ 1,75 9 4 (12% ) 1,75 ├ 1,80 12 1,80 ├ 1,85 6 10) (Vunesp) Suponhamos que nos 1,85 ├ 1,90 2 vestibulares desse ano uma universidade tivesse tido, para os seus diversos cursos,8) (UFRJ) O gráfico mostra a distribuição de uma média de 3,60 candidatos por vaga uma prova de matemática. oferecida. Se para os vestibulares do ano que vem o número de vagas for aumentado 10 de 20% e o número de candidatos aumentar em 10%, qual a média de candidatos por vaga que essa universidade terá no próximo Número de alunos 8 ano? 6 4 a) 3,24 b) 3,30 c) 3,36 d) 3,40 e) 3,46 2 MEDIDAS DE DISPERSÃO OU DE 0 1 2 3 4 5 6 7 8 9 10 VARIABILIDADE Notas A média aritmética, a mediana e a a) Quantos alunos fizeram a prova? moda, são valores que podem servir de b) Determine a média aritmética das comparação para dar a posição de qualquer notas dessa prova. elemento do conjunto. Entretanto, quando se trata de9) (Unicamp-SP) O gráfico, em forma de interpretar dados estatísticos, mesmo aqueles já pizza, representa as notas obtidas em uma convenientemente simplificados, é necessário questão pelos 32.000 candidatos presentes ter-se uma idéia retrospectiva de como se à primeira fase de uma prova de vestibular. apresentavam esses mesmos dados nas tabelas. Ele mostra, por exemplo, que 32% desses Assim, não é o bastante dar uma das candidatos tiveram nota 2 nessa questão. medidas de posição para caracterizar perfeitamente um conjunto de valores, pois,Pergunta-se: mesmo sabendo, por exemplo, que a temperatura média de duas cidades é a mesma, a) Quantos candidatos tiveram nota 3? e igual a 24º C, ainda assim somos levados aESTATÍSTICA 34
    • Ana Lúcia Guimarães Carvalhopensar a respeito do lima dessas cidades. Em Portanto, para qualificar os valores deuma delas poderá a temperatura variar entre uma variável, ressaltando a maior ou menorlimites de muito calor e de muito frio e haver, dispersão ou variabilidade entre esses valores eainda, uma temperatura média de 24º C. A a sua medida de posição, a Estatística recorre àsoutra poderá ter uma variação pequena de medidas de dispersão ou de variabilidade.temperatura e possuir, portanto, no que se Dessas medidas, estudaremos arefere à temperatura, um clima mais amplitude total, a variância, o desvio padrãofavorável. e o coeficiente de variação. As medidas de posição, ainda queconsiderada como um número que tem a AMPLITUDE TOTALfaculdade de representar uma série de valores,não pode, por si mesma, destacar o grau de A amplitude total é a diferençahomogeneidade ou heterogeneidade que entre o maior e o menor valorexiste entre os valores que compões o observado.conjunto. Consideremos os seguintes conjuntosde valores das variáveis x, y e z: Dados não-agrupados X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 AT = x(max.) – x(min.) Z: 5, 15, 50, 120, 160. Calculando a média aritmética de cada Para os valores:um desses conjuntos, obtemos: 40, 45, 48, 52, 54, 62 e 70 _ temos: x = 70 AT = 70 – 40 = 30 _ Logo: y = 70 AT = 30 _ z = 70 Quando dizemos que a amplitude total Vemos, então, que os três conjuntos dos valores é 30, estamos afirmando algumaapresentam a mesma média aritmética: 70. coisa do grau de sua concentração. É evidente Entretanto, é fácil notar que o que, quanto maior a amplitude total, maior é aconjunto X é mais homogêneo que os dispersão ou variabilidade dos valores daconjuntos Y e Z, já que todos os valores são variável.iguais à média. Considerando os conjuntos X, Y e Z O conjunto Y, por sua vez, é mais citados anteriormente, temos:homogêneo que o conjunto Z, pois há menordiversificação entre cada um de seus valores e AT x = 70 – 70 = 0 (dispersão nula)a média representativa. AT y = 72 – 68 = 4 Chamando de dispersão ou variabilidade a maior ou menor AT z = 160 – 5 = 155 diversificação dos valores de uma variável em torno de um valor de tendência central Dados agrupados tomado como ponto de comparação, podemos dizer que o conjunto X apresenta Sem intervalo de classe dispersÃo ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z . AT = x(max.) – x(min.) Considerando a tabela:ESTATÍSTICA 35
    • Ana Lúcia Guimarães Carvalho 1) Calcule a amplitude total dos conjuntos de xi 0 1 2 3 4 dados: fi 2 6 12 7 3 a) 1, 3, 5, 9 b) 20, 14, 15, 19, 21, 22, 20Temos: b) -10, -6, 2, 3, 7, 9, 10 AT = 4 – 0 = 4 c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2Logo: AT = 4 2)Calcule a amplitude total das distribuições: a) Com intervalo de classe xi 2 3 4 5 6 7 8 Neste caso a amplitude total é adiferença entre o limite superior da última fi 1 3 5 8 5 4 2classe e o limite inferior da primeira classe: b) CLASSES 1,5├1,6├1,7├1,8├1,9├2,0├ 2,1├ 2,2 AT = L(max.) – l(mín.) fi 4 8 12 15 12 8 4Considerando a distribuição: VARIÂNCIA i Estaturas fi Uma outra medida que indica o (cm) afastamento dos elementos de uma amostra, 1 150 ├ 154 4 em relação à média aritmética, é a variância, 2 154 ├ 158 9 que se representa por σ2. define-se essa medida 3 158 ├162 11 como a média aritmética entre os quadrados 4 162 ├ 166 8 dos desvios dos elementos da amostra, isto é: 5 166 ├ 170 5 6 170 ├ 174 3 2  − ∑ = 40 ∑  xi − x   2   σ =temos: ∑fi AT = 174 – 150 = 24Logo: AT = 24 cm Ou, lembrando que ∑ fi = n A amplitude total tem o inconveniente 2de só levar em conta os dois valores extremos  −da série, descuidando de valores ∑  xi − x   2  intermediários, o que quase sempre invalida a σ = nidoneidade do resultado. Ela é apenas umaindicação aproximada da dispersão ouvariabilidade. DESVIO PADRÃO Faz-se uso da amplitude total quandose quer determinar a amplitude da temperatura Na interpretação da variância podemem um dia ou no ano, no controle da surgir algumas dificuldades em relação àqualidade ou como uma medida de cálculo unidade de medida dos elementos da amostra.rápido, e quando a compreensão popular é Por exemplo, se os elementos da amostramais importante que a exatidão e a representam capacidades em litros ( l ), aestabilidade. variância representará um resultado em l2; como essa unidade não tem significado físico,Exercícios: não é conveniente utilizar a variância nesseESTATÍSTICA 36
    • Ana Lúcia Guimarães Carvalhocaso. Por causa de dificuldades como essa, foicriado o desvio padrão, representado por σ, edefinido como a raiz quadrada da variância. 2 Exemplo: σ= ∑x2 i  ∑ xi −   n  n  xi fi fix i fix i2   0 2 0 0 1 6 6 6Dados não-agrupados 2 12 24 48 3 7 21 63 Tomemos, como exemplo, o conjunto 4 3 12 48de valores da variável x: ∑ = 30 ∑ = 63 ∑ = 165 40, 45, 48, 52, 54, 62, 70 Logo: 2 O modo mais prático para se obter odesvio padrão é formar uma tabela com duas σ= ∑ fi x 2 i  ∑ fi x i  −  n  n colunas: Uma para xi e outra para xi2. Assim:   2 165  63  xi X i2 σ= −  = 5,5 − 4,41 = 40 1.600 30  30  45 2.025 1,09 = 1,044 48 2.304 52 2.704 Então: 54 2.916 σ = 1,04 62 3.844 70 4.900 Com intervalos de classe ∑ = 371 ∑ = 20.293 Começamos por abrir as colunas para x i que é oComo n = 7, temos: ponto médio do intervalo de classe. 2 σ= ∑x2 i  ∑ xi −   Exemplo: n  n    i Estaturas fi xi fixi fixi2 (cm) 2 20.293  371  2 1 150├154 4 152 608 92.416σ= −  = 2.899 − 53 = 7  7  2 154├158 9 156 1.404 219.024 = 2.899 − 2.809 = 90 = 9,486 3 158├162 11 160 1.760 281.600 4 162├166 8 164 1.312 215.168Logo: 5 166├170 5 168 840 141.120 σ = 9,49 6 170├174 3 172 516 88.752Dados agrupados ∑ = 40 ∑ = 6.440 ∑ = 1.038.080 Sem intervalo de classe Como, neste caso, temos a presença de Logo:freqüências, devemos leva-las emconsideração, resultando a fórmula: 2 σ=ESTATÍSTICA ∑ fi x 2 i  ∑ fi x i  −  37 n  n   
    • Ana Lúcia Guimarães Carvalho Logo, nesse grupo de indivíduos, os 2 pesos apresentam maior grau de dispersão que 1.038.080  6.440 σ= −  = 25.952 − 25.921 = as estaturas. 40  40  Exercícios= 31 = 5,567Então: 1)Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão, σ = 5,57 cm respectivamente, 18,3 e 14,7, calcule o coeficiente de variação.COEFICIENTE DE VARIAÇÃO 2) Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o O desvio padrão por si só não nos diz desvio padrão, 0,80. Em Estatística,muita coisa. Assim, um desvio padrão de duas entretanto, o grau médio final foi 7,3 e ounidades pode ser considerado pequeno para desvio padrão de 0,76. Em que disciplina foiuma série de valores cujo valor médio é 200; maior a dispersão?no entanto, se a média for igual a 20, o mesmonão pode ser dito. Além disso, o fato de o 3) Medidas as estaturas de 1.017 indivíduos,desvio padrão ser expresso na mesma unidadedos dados limita o seu emprego quando obtivemos x =162,2 cm e s=8,01 cm. O pesodesejamos comparar duas ou mais séries de médio desses mesmos indivíduos é 52 Kg,valores, relativamente à sua dispersão ou com um desvio padrão de 2,3 Kg. Essesvariabilidade, quando expressas em unidades indivíduos apresentam maior variabilidadediferentes. em estatura ou peso? Para contornar essas dificuldades elimitações, podemos caracterizar a dispersão 4) Um grupo de cem estudantes tem umaou variabilidade dos dados em termos estatura média de 163,8 cm, com umrelativos a seu valor médio, medida essa coeficiente de variação de 3,3%. Qual odenominada coeficiente de variação (CV): desvio padrão desse grupo? 5) Uma distribuição apresenta as seguintes σ CV = x 100 estatísticas: s=1,5 e CV=2,9%. Determine a _ x média da distribuição.Exemplo: 6) Mostre que os conjuntos 2, 4, 6, 8, 10 e 3, 5, 7, 9, 11 têm o mesmo desvio padrão. Tomemos os resultados das medidas Verifique, também, se há alguma relaçãodas estaturas e dos pesos de um mesmo grupo entre as médias.de indivíduos: 7) Num exame de História, duas classes obtiveram as seguintes médias e desvios: − σ x classe A: x = 5,4 s= 2,6 Estaturas 175 cm 5,0 cm classe B: x = 5,4 s= 3,1 Pesos 68 Kg 2,0 Kg Se for sorteado um aluno em cada classe, em qual delas é mais provável que a nota desseTemos: aluno esteja entre 3,0 e 7,0? Por quê? 5CVE = x100 = 0,0285 x 100 = 2,85% 8) (Fuvest-SP) Dois atiradores X e Y 175 2 obtiveram numa série de vinte tiros, numCVP= x 100 = 0,0294 x 100 = 2,94% alvo de forma indicada na figura, os 68 seguintes resultados:ESTATÍSTICA 38
    • Ana Lúcia Guimarães Carvalho 10)(Fuvest-SP, modificado) A distribuição dos salários de uma empresa é dada na seguinte tabela: Salário em R$ Número de funcionários 10 20 30 50 500,00 10 1.000,00 5 1.500,00 1 2.000,00 10 5.000,00 4 10.500,00 1 Total 31 Atirador Resultado 50 30 20 10 0 a) Qual é a média e qual é a mediana dos X 4 6 5 4 1 salários dessa empresa? Y 6 3 5 3 3 b) Suponha que sejam contratados dois novos funcionários com salários de Calcule e compare os desvios padrões R$2.000,00 cada. A variância da novade cada uma das séries de tiros e decida qual é distribuição de salários ficará menor,o atirador com desempenho mais regular. igual ou maior do que a anterior?9) Para preencher uma vaga de gerente de 11) O gráfico abaixo mostra a istribuição de produção, o departamento de recursos freqüência das notas obtidas pelos alunos da humanos de uma empresa realizou um segunda série do ensino médio numa prova teste com vários candidatos, selecionando de educação física. os dois melhores: Leonor e Felipe. A tabela mostra os desempenhos dos dois candidatos nas provas a que se 21 submeteram: Número de alunos 18 15 Candidato 12 Felipe Leonor 9 Assunto 6 Conhecimentos 8,5 9,5 3 de informática 0 1 2 3 4 5 6 7 8 9 10 Língua 9,5 9,0 Nota Portuguesa Determinar: Língua Inglesa 8,0 8,5 a) a nota média desses alunos; b) a mediana dessa distribuição; Matemática 7,0 8,0 c) a moda dessa distribuição. Conhecimentos 7,0 5,0 de Economia PROBABILIDADE Média = Média = 8,0 8,0 Em condições normais podemos prever a que temperatura o leite ferve. Esse tipo de Os dois candidatos obtiveram a experimento, cujo resultado é previsível, recebemesma média. Como proceder, o nome de determinístico. Mas, ao lançar umcientificamente, para determinar qual dos dado uma ou mais vezes, não podemos saberdois teve o melhor desempenho nessa com antecedência o número que se vai obter;avaliação? sabemos apenas que os possíveis resultados são 1, 2, 3, 4, 5 ou 6. Esse tipo de experimento,ESTATÍSTICA 39
    • Ana Lúcia Guimarães Carvalhocujo resultado não pode ser previsto, é EVENTOSchamado aleatório. Como exemplos de experimentos Chamamos de evento qualqueraleatórios temos: subconjunto do espaço amostral S de um • o sorteio de uma loteria de números; experimento aleatório. • a escolha de um número de 1 a 50; Assim, qualquer que seja E, se E ⊂ S (E • o sorteio do primeiro prêmio da loteria está contido em S), então E é um evento de S. federal; Se E=S, E é chamado evento certo; • o lançamento de uma moeda. Se E ⊂ S e E é um conjunto unitário, E é Na teoria das probabilidades, estudamos chamado evento elementar;os experimentos aleatórios equiprováveis, ou Se E = ∅, E é chamado eventoseja, aqueles em que qualquer resultado podeocorrer com a mesma chance. É o caso do impossível.lançamento de uma moeda: a possibilidade de Exemplo:ocorrer cara ou coroa é a mesma. No lançamento de um dado, onde S={1,2,3,4,5,6}, Experimentos ou fenômenos aleatórios são aqueles que, mesmo • obter um número par na face superior repetidos várias vezes sob condições A = {2,4,6} A ⊂ S; logo, A é um semelhantes, apresentam resultados evento de S. imprevisíveis. • obter um número menor ou igual a 6 na face superior B = {1,2,3,4,5,6} B ⊂ S; logo, B éESPAÇO AMOSTRAL um evento certo de S (B = S). A cada experimento correspondem, emgeral, vários resultados possíveis. Assim, ao • obter o número 4 na face superiorlançarmos uma moeda, há dois resultados C = {4} C ⊂ S; logo, C é um eventopossíveis: ocorrer cara ou ocorrer coroa. Já ao elementar de S.lançarmos um dado há seis resultadospossíveis: 1, 2, 3, 4, 5, ou 6. • obter um número maior que 6 na face Ao conjunto desses resultados superiorpossíveis damos o nome de espaço amostral D= ∅ logo, D é um eventoou conjunto universo, representado por S. impossível de S O número de elemento desse conjuntoé indicado por n(S). Exercícios Os dois experimentos citadosanteriormente têm os seguintes espaços 1) Determine o espaço amostral do experimentoamostrais: aleatório “lançamento simultâneo de duas moedas”.• lançamento de uma moeda S = { Ca, Ko}• lançamento de um dado S={1,2, 3, 4, 5, 6} 2) considerando o experimento aleatório• lançamento de duas moedas “nascimento de três filhos de um casal”, S = {(Ca,Ko); (Ca,Ca); (Ko,Ca); (Ko,Ko)} determine o espaço amostral e o subconjunto que representa o evento nascimento de Cada um dos elementos de S que exatamente dois meninos em três filhos docorresponde a um resultado recebe o nome de casal.ponto amostral. 3) No lançamento de um dado, determine o evento para obter: a) um número maior que 4.ESTATÍSTICA 40
    • Ana Lúcia Guimarães Carvalho b) Um número primo S = {1,2,3,4,5,6} E = {2,4,6}4) Considerando o experimento “sorteio de n(S) = 6 n(E) = 3 um número de 1 a 20”, determine o evento 3 1 para obter um número: P( B ) = = 6 2 a) múltipla de 3. b) múltiplo de 5. c) obter um número menor ou igual a 6 na face c) Primo superior5) No lançamento simultâneo de dois dados S = {1,2,3,4,5,6} E = {1,2,3,4,5,6} diferentes, determine os seguintes eventos: n(S) = 6 n(E) = 6 a) números iguais nos dois dados; 6 b) números cuja soma seja 2; P (C ) = = 1 6 c) números cuja soma seja 7; d) números cuja soma seja 13. d) obter um número maior que 6 na face superiorProbabilidade S = {1,2,3,4,5,6} E=∅ Dado um experimento aleatório, sendo n(S) = 6 n(E) = 0S o seu espaço amostral, vamos admitir quetodos os elementos de S tenham a mesma 0 P( D ) = = 0chance de acontecer, ou seja, que S é um 6conjunto equiprovável. Chamamos de probabilidade de um Propriedadesevento A (A ⊂ S) o número real P(A), tal que: 1ª) Se E = ∅, então n(E) = 0 e, portanto, P(E)=0 ( probabilidade do evento n( A ) P( A ) = impossível). n (S )onde: 2ª) Se E = S, então n(E) = n(S) e P(E) = 1 n(A) é o número de elementos de A (probabilidade do evento certo). n(S) é o número de elementos de S 3ª) Se E ⊂ S, então 0 ≤ n(E) ≤ n(S)Exemplos: 0 ≤ P(E) ≤ 11) Lançamento de uma moeda e o evento 4ª) Se A é conjunto unitário, então n(E) = 1 obter cara. 1 (evento elementar E qualquer) P( E ) = nS = {Ca, Ko} E = {Ca}n(S) = 2 n(E) = 1 Exercícios: n( A ) 1logo: P( A ) = = = 50% n (S ) 2 1) Na escolha de um número de 1 a 30, qual a probabilidade de que seja sorteado um2) Lançamento de um dado, calcular: múltiplo de 5?a) obter um número primo 2) Qual a probabilidade de, no lançamneto simultâneo de dois dados diferentes, obterS = {1,2,3,4,5,6} E = {2,3,5} soma igual a 7?n(S) = 6 n(E) = 3 3 1 3) Qual a probabilidade de sair o ás de ouroP( A ) = = quando retiramos uma carta de um baralho 6 2 de 52 cartas?b) obter um número par na face superiorESTATÍSTICA 41
    • Ana Lúcia Guimarães Carvalho Dizemos que dois eventos são4) Qual a probabilidade de sair um rei quando independentes quando a realização ou a não retiramos uma carta de um baralho de52 realização de um dos eventos não afeta a cartas? probabilidade do outro e vice-versa.5) Uma urna contém 10 bolas brancas, 8 Exemplo: vermelhas e 6 pretas, todas iguais e indistinguíveis ao tato. Retirando-se uma Quando lançamos dois dados, o bola ao acaso, qual a probabilidade de ela resultado obtido em um deles independe do não ser preta? resultado obtido no outro.6) a probabilidade de você ganhar uma Se dois eventos são independentes, a bicicleta numa rifa de 100 números da qual probabilidade de que eles se realizem você comprou quatro números é: simultaneamente é igual ao produto das probabilidade de realização dos dois eventos. 2 1 1 a) b) c) 5 10 25 1 1 Assim, sendo p1 a probabilidade de d) e) realização do primeiro evento e p2 a 30 50 probabilidade de realização do segundo evento, a probabilidade de que tais eventos se realizemEventos Complementares simultaneamente é dada por: Sabemos que um evento pode ocorrerou não. Sendo p a probabilidade de que ele p = p1 x p2ocorra (sucesso) e q a probabilidade de queele não ocorra (insucesso), para um evento Exemplo:existe sempre a relação: Lançamos dois dados. A probabilidade p+q=1 q=1-p 1 de obtermos 1 no primeiro dados é p1 = 6 A probabilidade de obtermos 5 no Assim, se a probabilidade de se 1 1 segundo dado é p2 =realizar um evento é p = , a probabilidade de 6 5 Logo, a probabilidade de obtermos,que ele não ocorra é: simultaneamente , 1 no primeiro e 5 no 1 4 1 1 1 q=1–p q=1– = segundo é p = x = 5 5 6 6 36Exemplo: Eventos Mutuamente Exclusivos Sabemos que a probabilidade de tirar 4 Dizemos que dois ou mais eventos são 1 mutuamente exclusivos quando a realização deno lançamento de um dado é p = . Logo, a um exclui a realização do(s) outro(s). 6probabilidade de não tirar o 4 no lançamento Assim, no lançamento de uma moeda, ode um dado é evento “tirar cara”e o evento “tirar coroa”são mutuamente exclusivos, já que, ao se realizar 1 5 um deles, o outro não se realiza. q=1- = Se dois eventos são mutuamente 6 6Eventos Independentes exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize.ESTATÍSTICA 42
    • Ana Lúcia Guimarães Carvalho c) Uma cara somente. p = p1 + p2 d) Nenhuma cara. e) Pelo menos uma cara.Exemplo: f) No máximo uma cara. Lançamos um dado. A probabilidadede se tirar o 3 ou o 5 é 8) Um dado é lançado duas vezes. Calcule a 1 1 2 1 probabilidade de: p= + = = a) sair um 6 no primeiro lançamento. 6 6 6 3pois como vimos, os dois eventos são b) Sair um 6 no segundo lançamento.mutuamente exclusivos. c) Não sair 6 em nenhum lançamento. d) Sair um 6 pelo menos.Exercícios: 9) Uma urna contém 50 bolas idênticas.1) No lançamento de dois dados, calcule a Sendo as bolas numeradas de 1 a 50, probabilidade de se obter soma igual a 5. determine a probabilidade de, em uma extração ao acaso:2) Determine a probabilidade de cada a) obtermos a bola de número 27. evento: b) Obtermos uma bola de número par. a) Um número par aparece no lançamento c) Obtermos uma bola de número maior de um dado. que 20. b) Uma só coroa aparece no lançamento d) Obtermos uma bola de número menor de três moedas. ou igual a 20.3) Dois dados são lançados 10) Um par de dados é atirado. Encontre a simultaneamente. Determine a probabilidade de que a soma seja 10 ou probabilidade de: maior que 10 se: a) A soma ser menor que 4. a) um 5 aparece no primeiro dado. b) A soma ser 9. b) um 5 aparece pelo menos em um dado. c) O primeiro resultado ser maior que o segundo. 11) Lança-se um par de dados. Aparecendo d) A soma ser menor ou igual a 5. dois números diferentes, encontre a probabilidade de que:4) Um inteiro entre 3 e 11 será escolhido ao a) a soma seja 6. acaso. b) O 1 apareça. a) Qual é a probabilidade de que este c) A soma seja 4 ou menor que 4. número seja ímpar? b) Qual é a probabilidade de que este 12) Um lote é formado por 10 peças boas, 4 número seja ímpar e divisível por 3? com defeitos e 2 com defeitos graves. Uma peça é escolhida ao acaso. Calcule a5) No lançamento de dois dados, qual é a probabilidade de que: probabilidade de se obter um par de a) ela não tenha defeitos graves. pontos iguais? b) Ela não tenha defeitos c) Ela seja boa ou tenha defeitos graves.6) Um casal planeja ter três filhos. Determine a probabilidade de nascerem: 13) Uma urna A contém: 3 bolas brancas, 4 a) Três homens. pretas, 2 verdes; uma urna B contém: 5 b) Dois homens e uma mulher. bolas brancas, 2 pretas, 1 verde; uma urna C contém:2 bolas brancas, 3 pretas, 47) Uma moeda é lançada três vezes. Calcule verdes. Uma bola é retirada de cada urna. a probabilidade de obtermos: Qual é a probabilidade de as três bolas a) três caras. retiradas da primeira, Segunda e terceira b) Duas caras e uma coroaESTATÍSTICA 43
    • Ana Lúcia Guimarães Carvalho urnas serem, respectivamente, branca, d) Nenhuma seja perfeita. preta e verde? 21) Você acabou de achar a raspadinha no14) No lançamento de um dado, qual a pacote de Doritos. Com base na figura probabilidade de se obter um número não- abaixo calcule a probabilidade de achar a inferior a 5? carinha.15) Dois dados são lançados conjuntamente. a) PERDEU Determine a probabilidade de a soma ser PERDEU 10 ou maior que 10. PERDEU16) Uma moeda é lançada duas vezes. Calcule PERDEU a probabilidade de: a) Não ocorrer cara nenhuma vez. PERDEU INÍCIO b) Obter-se cara na primeira ou na Segunda jogada.17) Em um lote de 12 peças, 4 são 22) Qual a probabilidade de um apostador defeituosas. Sendo retiradas acertar na sena do jogo mega sena, com aleatoriamente e sem reposição 2 peças, uma única aposta de 6 dezenas? Sabe-se calcule: que sorteiam 6 dezenas em 60. a) A probabilidade de ambas serem defeituosa. 23) Qual a probabilidade de um apostador b) A probabilidade de ambas não serem acertar na sena do jogo super sena, com 6 defeituosas. apostas de 6 dezenas? Sabe-se que sorteiam c) A probabilidade de ao menos uma ser 6 dezenas em 48. defeituosa.18) No lançamento de um dado, qual é a DISTRIBUIÇÃO DE PROBABILIDADE probabilidade de sair o número 6 ou um número ímpar? Consideremos a distribuição de19) Uma loja dispõe de 12 geladeiras do freqüência relativa ao número de acidentes mesmo tipo, das quais 4 apresentam diários em um estacionamento: defeitos. a) Se um freguês vai comprar uma Nº de Acidentes Freqüência geladeira, qual a probabilidade de levar 0 22 uma defeituosa? b) Se um freguês vai comprar duas 1 5 geladeiras, qual a probabilidade de levar duas defeituosas? 2 2 c) Se um freguês vai comprar duas 3 1 geladeiras, qual a probabilidade de levar pelo menos uma defeituosa? Σ = 3020) Um lote é formado por 10 peças boas, 4 Em um dia, a probabilidade de: com defeitos e duas com defeitos graves. Retiram-se duas peças ao acaso. Calcule a • não ocorrer acidentes é: probabilidade de que: 22 a) ambas sejam perfeitas. p = = 0,73 b) Pelo menos uma seja perfeita. 30 c) Nenhuma tenha defeitos graves. • ocorrer um acidente é:ESTATÍSTICA 44
    • Ana Lúcia Guimarães Carvalho 2 1 = 0,25 5 4p = = 0,17 1 2 = 0,5 30 4 0 1 = 0,25• ocorrerem dois acidentes é: 4 4 Σ=1 2 4p= = 0,07 30 Ao lançarmos um dado, sendo a variável aleatória x definida por “pontos de um• ocorrerem três acidentes é: dado”. Faça uma tabela de distribuição de probabilidade para cada um dos resultados do 1 dado. Assim, ao lançarmos um dado a variávelp= = 0,03 30 aleatória x, definida por “pontos de um dado”pode tomar os valores 1, 2, 3, 4, ,5, 6.Podemos, então, escrever: Como cada um desses valores está associado uma só probabilidade de realização e Σ P(xi) = Nº de acidentes Probabilidade 1, fica definida então uma função de 0 22 probabilidade da qual resulta a distribuição de = 0,73 probabilidade: 30 1 5 = 0,17 30 x P(x) 2 2 = 0,07 30 1 1 3 1 6 = 0,03 30 2 1 Σ = 1,00 6 3 1 6 Essa tabela é denominada 4 1distribuição de probabilidade. 6 5 1 6Exemplo: 6 1 6 Determine a distribuição de Σ=1probabilidade para o lançamento simultâneode duas moedas e a probabilidade de A função da probabilidade éobtermos número de caras. representada por:Ponto Amostral Nº de Caras Probabilidade f(x) = P(x=xi) (Ca, Ca) 2 1 ⋅ 1 = 1 2 2 4 A função P(x=xi), determina a (Ca, Ko) 1 1 ⋅ 1 = 1 distribuição de probabilidade da variável 2 2 4 aleatória x. (Ko,Ca) 1 1 ⋅ 1 = 1 2 2 4 Exercícios: (Ko,Ko) 0 1 ⋅ 1 = 1 2 2 4 1) Efetue a distribuição de probabilidade do Ca Ko lançamento de 2 dados e a probabilidade Ca Ca Ko Ca Ko Ko para a soma dos resultados Nº de Caras Probabilidade ( P(x) )ESTATÍSTICA 45
    • Ana Lúcia Guimarães Carvalho2) Construir o gráfico de pares para o n é o número de vezes que repete a lançamento de 3 moedas ( x i = nº de prova; coroas) k número de vezes que repete o evento. a) Qual a probabilidade de saírem 2 coroas? Exemplo: b) Qual a probabilidade de saírem 2 ou mais coroas? 1)Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabilidade deDISTRIBUIÇÃO BINOMIAL serem obtidas 3 caras nessas 5 provas.Termo Geral Temos: n = 5 e k = 31) O experimento deve ser repetido nas 5  5 mesmas condições, num número finito de P(X=3) =   p3q5-3 =   p3q2 3  3 vezes (n) .     Se a probabilidade de obtermos “cara”numa só2) As provas repetidas devem ser 1 prova (sucesso) é p= e a probabilidade deindependentes, ou seja, o resultado de uma 2não deve afetar os resultados das sucessivas. não obtermos “cara”numa só prova (insucesso) 1 1 é q=1 - = , então:3) Em cada prova deve aparecer um dos dois 2 2possíveis resultados: sucesso e insucesso. 3 2  5  1   1  5! 1 14) No decorrer do experimento a P( X = 3 ) =       =  3 2 x x =probabilidade p (sucesso) e a probabilidade q      2  3!2! 8 4(insucesso) somados tem que ser igual a 1 5x 4 x3x 2 x1 1 1 5(q=1- p) = x x = 3x 2 x1x 2 x1 8 4 16 Suponhamos, que realizemos a mesma Logo:prova n vezes sucessivas e independentes. A 5probabilidade de que um evento se realize k P(X=3) =vezes nas provas é dada pela função: 16 2) Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time n A ganhar 4 jogos. f ( X ) = P( X = k ) =   p k q n − k k   1 1 2 n = 6, k = 4, p = ,q=1- = 3 3 3na qual: 2 P(X = k) é a probabilidade de que o 6 1  4 2 1 4 20evento se realize k vezes em n provas; P( X = 4 ) =     4 3   = 15 x x = 3      81 9 243 p é a probabilidade de que o evento serealize em uma só prova – sucesso; Logo: q é a probabilidade de que o evento 20 P(X = 4) = = 0,08não se realize no decurso dessa prova – 243insucesso; Exercícios: n   é o coeficiente binomial de n k 1) Um atirados acerta o alvo 3 vezes em uma   bateria de 5 tiros. Se ele participar de 7 n! baterias, qual a probabilidade dele acertar osobre k, igual a k! (n − k )! alvo?ESTATÍSTICA 46
    • Ana Lúcia Guimarães Carvalho 12) Calcule a probabilidade de obter2) Jogando um dado 4 vezes, qual a exatamente 3 coroas e 2 caras em 5 lances probabilidade de sair o número 5 de uma moeda. exatamente 3 vezes? 13) Em um campeonato de tênis, o jogados A3) Uma prova consta de 6 questões com 4 tem 0,4 de probabilidade de ganhar uma opções cada uma, com uma única partida, o jogador B tem 0,3 e o jogador C alternativa correta. Qual a probabilidade de tem 0,3. Sabendo que o torneio consta de 3 acertar 2 das 6 questões? partidas, determine a probabilidade de:4) Uma urna contém 3 bolas azuis e 2 a) B ganhar as 3 partidas; brancas. Retira-se uma bola ao acaso, b) A ganhar as 3 partidas; observando-se sua cor e recoloca-se a bola c) A ganhar 2 partidas; na urna. Se esse experimento for realizado d) C ganhar 2 partidas. 5 vezes sucessivas, qual é a probabilidade de se obterem exatamente 3 bolas azuis? 14) (Cesgranrio-RJ) Três moedas são lançadas simultaneamente. A probabilidade de obter5) Por meio de estudos genéticos, um casal 2 caras e 1 coroa é de: descobre que a probabilidade de que eles 1 1 5 3 1 venham a ter um filho de olhos azuis é a) b) c) d) e) 8 4 16 8 2 igual a 1 . Se o casal pretende ter 6 4 15) A probabilidade de um atirados acertar um filhos, qual é a probabilidade de que alvo em um único tiro é 0,2. Dando 4 tiros exatamente 2 tenham olhos azuis? calcular a probabilidade de :6) Jogando-se um dado três vezes, determine a) acertar o alvo duas vezes; a probabilidade de se obterem um múltiplo b) não acertar o alvo. de 3 duas vezes. 16) Em cirurgias de miopia, sabe-se que 10%7) dois times de futebol, A e B, jogam entre si não obtêm sucesso. Qual é a probabilidade 6 vezes. Encontre a probabilidade de o de que, em 4 cirurgias, 3 obtenham time A ganhar dois ou três jogos. sucesso?8) A probabilidade de um atirados acertar o 17) Um casal quer ter 5 filhos. Qual é a alvo é 2 . Se ele atirar 5 vezes, qual a probabilidade de que: 3 probabilidade de acertar exatamente 2 tiros? a) todos sejam homens? b) Tenham 2 meninas?9) Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta 18) Qual é a maior probabilidade: 10% de peças defeituosas. Qual a A: de sair 50% de caras num lançamento de 8 probabilidade de serem defeituosos dois moedas, ou deles? B: de sair 50% de caras num lançamneto de 12 moedas?10) Jogando uma moeda 3 vezes, determine a probabilidade de obter: DISTRIBUIÇÃO NORMAL a) coroa nas 3 vezes; CURVA NORMAL b) coroa 2 vezes; Em nosso dia a dia podemos observar11) Determine a probabilidade de ocorrerem 3 que alguns fatos têm probabilidade de ocorrer números 4 em 5 lances de um dado. com maior freqüência que outros.ESTATÍSTICA 47
    • Ana Lúcia Guimarães Carvalho Uma pessoa muito alta, acima de2,10m, por exemplo, andando na rua, Quando temos em mãos uma variáveldesperta a nossa curiosidade, evidentemente aleatória com distribuição normal, nossoporque não é tão comum assim alguém com principal interesse é obter a probabilidade detanta altura. Entretanto, as pessoas adultas, essa variável aleatória assumir um valor em umna faixa de 1,60m a 1,80m, podem determinado intervalo.ultrapassar-nos às milhares pelas ruas, semque nos fixemos em alguma delas pela sua Exemplo:estatura. Logo, a altura das pessoas, assim Seja X a variável aleatória quecomo as suas idades ou a média bimestral representa os diâmetros dos parafusosdos alunos de uma escola, entre outras produzidos por certa máquina. Vamos supordistribuições encontradas na natureza, são que essa variável tenha distribuição normalexemplos de distribuição normal, onde cada com média x =2cm e desvio padrão s=0,04cm.evento possui freqüência diferente dentro do Pode haver interesse em conhecer auniverso, variáveis de acordo com a forma probabilidade de um parafuso ter um diâmetrográfica: com valor entre 2 e 2,05cm. Freqüência É fácil notar que essa probabilidade é indicada por: P( 2 < X < 2,05 ) que corresponde à área hachurada da figura: EventosPropriedades de uma Distribuição Normal 2 2,051º) A variável aleatória X pode assumir todoe qualquer valor real. Para o cálculo direto dessa probabilidade, podemos dizer que se X é uma2º) A representação gráfica da distribuição variável aleatória com distribuição normal denormal é uma curva em forma de sino, média x e desvio padrão s, então existe umasimétrica em torno da média ( x ), que recebe variável z que tem distribuição normalo nome de curva normal ou de Gauss. reduzida, isto é, tem distribuição normal de média 0 e desvio padrão 1, dada por:3º) A área total limitada pela curva e peloeixo das abscissas é igual a 1, já que essa área x−xcorresponde à probabilidade de a variável Z= saleatória X assumir qualquer valor real. Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, precisamos, em4º) A curva normal é assintótica em relação primeiro lugar, calcular o valor de z queao eixo das abscissas, isto é, aproxima-se corresponde a x1 = 2,05 e x2 = 2.indefinidamente do eixo das abscissas sem,contudo, alcança-lo. x −x 2−2 Z= Z= Z= 05º) Como a curva é simétrica em torno de x, a s 0,04probabilidade de ocorrer valor maior do que a x−x 2,05 − 2 0,05 Z= Z= Z= Z = 1,25média é igual à probabilidade de ocorrer valor s 0,04 0,04menor do que a média, isto é, ambas as então:probabilidades são iguais a 0,5. Escrevemos: P( 2 < X < 2,05 ) = P( 0 < Z < 1,25 )P( X > x ) = P( X < x ) = 0,5ESTATÍSTICA 48
    • Ana Lúcia Guimarães CarvalhoExercícios: b) maior que 80; c) entre 85 e 115;1) Uma variável x tem distribuição normal d) maior que 100. com média 200u e desvio padrão de 40u. Determine aos valores de Z para os 6) Os pesos de 600 estudantes são seguintes valores de x normalmente distribuídos com média 65,3 Kg e desvio padrão 5,5 Kg. Determine o a) (180 < X < 220) número de estudantes que pesam: b) (X ≥ 205) a) entre 60 e 70 Kg; c) (193 < X < 194) b) mais que 63,2 Kg; c) menos que 68 Kg. d) ( X ≤ 200) e) ( X < 210) 7) A duração de um certo componente eletrônico tem média de 850 dias e desvio padrão de 40 dias. Sabendo que a duração é2) Utilizando a tabela de Distribuição Normal normalmente distribuída, calcule a determine as probabilidades: probabilidade de esse componente durar: a) P(-1,25 < Z < 0) a) entre 700 e 1000 dias; b) P(-0,5 < Z < 1,48) b) mais de 800 dias; c) menos de 750 dias. c) P(0,8 < Z < 1,23) d) P(Z > 0,6) 8) Ao anotar a velocidade de uma série de motoristas que passavam por determinado e) P(Z < 0,92) ponto da estrada, a polícia chegou à3) Os salários dos operários industriais são conclusão de que a velocidade média distribuídos normalmente, em torno da naquele ponto era de 65 km/h, com um média de R$1.000,00, com desvio padrão desvio padrão de 9 km/h. Verificou-se de R$800,00. Calcule a probabilidade de também que a distribuição das velocidades um operário ter um salário situado entre podia ser considerada uma normal. Assim R$800,00 e R$1.400,00. sendo, pede-se:4) Sendo Z uma variável com distribuição a) Determinar a probabilidade de que o normal reduzida, calcule: próximo carro a passar pelo referido ponto da estrada tenha velocidade maior que 80 a) P(0 < Z < 1,44) km/h. b) b) P(-0,85 < Z < 0) b) Determinar a probabilidade de que o c) P(-1,48 < Z < 2,05) próximo carro a passar pelo mesmo ponto d) P(0,72 < Z < 1,89) tenha velocidade entre 70 e 75 km/h. e) P(Z > -2,03) c) Calcular a porcentagem dos carros que, f) f) P(Z > 1,08) num determinado dia, serão multados ou g) P(Z < -0,66) advertidos, sabendo-se que serão multados h) h) P(Z < 0,60) os carros com velocidades superiores a 85 km/h e serão advertidos os carros com5) Um teste padronizado de escolaridade tem velocidades entre 75 km/h e 85 km/h. distribuição normal com média 100 e desvio padrão 10. Determine a 9) A altura média dos rapazes que se inscrevem probabilidade de um indivíduo submetido para o serviço militar é 1,67 m, com desvio ao teste ter nota: padrão de 15 cm. Sabendo-se que o Exército somente aceita para o serviço militar a) maior que 120; rapazes com altura entre 1,55 m e 1,92 m,ESTATÍSTICA 49
    • Ana Lúcia Guimarães Carvalho qual a porcentagem de rapazes que não servirão o Exército? CORRELAÇÃO Relação Funcional e Relação Estatística CORRELAÇÃO E REGRESSÃO Como sabemos, o perímetro e o lado de Até agora analisamos os cálculos um quadrado estão relacionados. A relação queestatísticos associados a uma única variável; os liga é perfeitamente definida e pode sercomo o peso das pessoas, o diâmetro das expressa por meio de uma sentençaesferas ou o consumo de energia elétrica. matemática:Sabemos, entretanto, que muitas variáveis 2p = 4lmantêm dependências entre si, no sentido de onde 2p é o perímetro e l é o lado.que o crescimento de uma delas também pode Atribuindo-se, então, um valor qualquercausar o crescimento em outra. Vejamos a l, é possível determinar exatamente o valor dealguns casos: 2p. • O preço dos aluguéis dos imóveis e a Consideremos, agora, a relação que sua área. existe entre o peso e a altura de um grupo de • Os índices pluviométricos e a pessoas. É evidente que esta relação não é do fertilidade dos solos. mesmo tipo da anterior; ela é bem menos • A temperatura ambiente e o consumo precisa. Assim, pode acontecer que a estaturas de cerveja. diferentes correspondam pesos iguais ou que a Há, sem dúvida, um número muito estaturas iguais correspondam pesos diferentes.grande de pares de variável dependentes entre Porém, em média, quanto maior a estatura,si, sendo o nosso trabalho, no momento, maior o peso.encontrar uma maneira de dimensionar essainterdependência, principalmente quando nãoconhecemos os fatores que interferem em uma As relações do tipo perímetro–lado são conhecidasou em outra. Ao grau de dependência entreduas variáveis denominamos correlação, e, como relações funcionais e as dodeste modo, podemos esperar que certas tipo peso-estatura, como relaçõesvariáveis, como por exemplo, “quantidade de estatísticas.tinta”e “área da parede”, tenham uma altacorrelação, enquanto “área da parede”e “idade Quando duas variáveis estão ligadas pordo pintor”, por outro lado, apresentam quase uma relação estatística, dizemos que existenenhuma correlação. correlação entre elas. Assim, quando consideramos variáveiscomo peso e altura de um grupo de pessoas, Diagrama de Dispersãouso do cigarro e incidência do câncer,vocabulário e compreensão da leitura, Após dispormos de uma série deprocuramos verificar se existe alguma relação valores de duas variáveis que estamos querendoentre as variáveis de cada um dos pares e qual verificar se entre elas há ou não um certo grauo grau dessa relação. Para isso é necessário o de dependência, o primeiro passo será marca-conhecimento de novas medidas. las num gráfico cartesiano, cada uma das séries Sendo a relação entre as variáveis de num dos eixos, construindo, assim, o que senatureza quantitativa, a correlação é o conhece por diagrama de dispersão. Ainstrumento adequado para descobrir e medir observação do diagrama de dispersão dasessa relação. variáveis será o primeiro passo para avaliarmos Uma vez caracterizada a relação, a correlação. Suponhamos, por exemplo, oprocuramos descreve-la através de uma função gráfico de dispersão das variáveis mostradas namatemática. A regressão é o instrumento tabela abaixo:adequado para a determinação dos parâmetrosdessa função. X Y X YESTATÍSTICA 50
    • Ana Lúcia Guimarães Carvalho 25 12 36 9 A observação pura e simples dos 26 11 37 7 diagramas de dispersão pode nos fornecer uma 27 13 38 7 série de informações: 28 12 39 6 y 29 11 40 6 30 8 41 4 31 10 42 5 Correlação linear positiva 32 9 43 5 Aumenta x, aumenta y 33 7 44 5 34 8 45 5 35 8 x Imaginemos que os valores da variávelX sejam as idades das pessoas de determinada yclasse e os valores de Y, o tempo médio deduração do banho diário de todas as pessoasentrevistadas em cada idade. A marcação dos Correlação linear negativapares ordenados (X,Y) no plano cartesiano Aumenta x, diminui ylevará, por fim, ao diagrama de dispersãomostrado abaixo: x 14 12 10 8 y Tempo 6 Correlação não-linear 4 Distribuição dos pontos 2 em torno de uma curva 0 24 26 28 30 32 34 36 38 40 42 44 46 48 Idade A configuração mostrada no gráfico xnos faz supor que existe uma certa correlaçãoentre duas variáveis, ou seja, com a passagemdo tempo, as pessoas parecem demorar-se ymenos debaixo do chuveiro. Devemos, Correlação nulaentretanto, tomar o cuidado na análise de Aumenta x, varia ycorrelação, uma vez que as variáveis ao acasocorrelacionadas não necessariamente estão Não há correlaçãosujeitas a uma relação de causa e efeito. Nonosso exemplo, não podemos afirmar com xcerteza que as pessoas se banham maisrapidamente apenas porque são mais idosas, jáque o motivo da rapidez pode ser outro que Exercíciosnão a idade, como por exemplo o fato de aspessoas tornarem-se menos vaidosas ou mais 1) Consideremos uma amostra aleatória,ocupadas conforme o tempo vai passando. formada por dez dos 98 alunos de uma A correlação, portanto, apontará em classe da faculdade A e pelas notas obtidasmuitos casos unicamente a existência de por eles em Matemática e Estatística.variações semelhantes em duas variáveis, semque, entretanto, uma tenha muita coisa a ver Notascom a outra.ESTATÍSTICA 51
    • Ana Lúcia Guimarães Carvalho Nº Matemática Estatística e, ainda, o sentido dessa correlação (positivo ou (xi) (yi) negativo). 01 5.0 6.0 Faremos uso do coeficiente de 08 8.0 9.0 correlação de Pearson, que é dado por: 24 7.0 8.0 38 10.0 10.0 44 6.0 5.0 n∑ x iyi − (∑ x i )(∑ y i ) r= 58 7.0 7.0  n x 2 − ( x )2   n y 2 − ( y )2  59 9.0 8.0  ∑ i  ∑ i  ∑ i ∑ i    72 3.0 4.0 80 8.0 6.0 onde n é o número de observações. 92 2.0 2.0Construa o diagrama de dispersão. Os valores limites de r são –1 e +1. isto é, o valor de r pertence ao intervaloCorrelação Linear [-1,+1]. Observando o exercício anterior, Assim:podemos imaginar que, quanto mais fina for aelipse, mais ela se aproximará de uma reta. a) se a correlação entre duas variáveis éDizemos, então, que a correlação de forma perfeita e positiva, então r = +1`;elíptica tem como “imagem” uma reta, sendo, b) se a correlação é perfeita e negativa, entãopor isso, denominada correlação linear. r = -1; É possível verificar que a cada c) se não há correlação entre as variáveis,correlação está associada como “imagem” então r = 0.uma relação funcional. Por esse motivo, asrelações funcionais são chamadas relações Logicamente:perfeitas. Como a correlação em estudo tem a) se r = +1, há uma correlação perfeita ecomo “imagem” uma reta ascendente, ela é positiva entre as variáveis;chamada correlação linear positiva. b) se r = -1, há uma correlação perfeita e Assim, uma correlação é: negativa entre as variáveis;a) linear positiva se os pontos do diagrama c) se r = 0, ou não há correlação entre astêm como “imagem” uma reta ascendente; variáveis, ou a relação que porventurab) linear negativa se os pontos têm como exista não é linear.“imagem” uma reta descendente;c) não-linear se os pontos têm como OBS: Para podermos tirar algumas conclusões“imagem” uma curva. significativas sobre o comportamento Se os pontos apresentam-se dispersos, simultâneo das variáveis analisadas, énão oferecendo uma “imagem” definida, necessário que:concluímos que não há relação alguma entreas variáveis em estudo. 0,6 ≤ r ≤ 1 Se 0,3 ≤ r < 0,6 , há uma correlação Coeficiente de Correlação Linear relativamente fraca entre as variáveis. O instrumento empregado para a Se 0 < r < 0,3 , a correlação é muitomedida da correlação linear é o coeficiente decorrelação. fraca e, praticamente, nada podemos concluir Este coeficiente deve indicar o grau de sobre a relação entre as variáveis em estudo.intensidade da correlação entre duas variáveisESTATÍSTICA 52
    • Ana Lúcia Guimarães Carvalho Vamos então calcular o coeficiente de construindo também o diagrama decorrelação do exercício anterior. O modo mais dispersão.rápido para obtermos r é abrir, na tabela, a)colunas correspondentes aos valores de xiy i, x 2 3 9 8 6 10xi2 e y i2. y 1,6 1,2 1,0 1,2 1,4 1,0 Notas b)Nº Matem. Estat. xiyi xi2 yi2 x 0 1 2 3 4 5 6 (xi) (yi) y 3 18 21 40 34 61 6501 5.0 6.0 30 25 36 3) Numa indústria é feito um acompanhamento08 8.0 9.0 72 64 81 sistemático do percentual de elementos24 7.0 8.0 56 49 64 defeituosos produzidos a cada intervalo de meia hora. Após um mês de produção, os38 10.0 10.0 100 100 100 valores médios de percentuais de defeitos a44 6.0 5.0 30 36 25 cada horário foram marcados na tabela:58 7.0 7.0 49 49 4959 9.0 8.0 72 81 64 Horas % Horas % 7:00 0,12 10:00 0,1372 3.0 4.0 12 9 16 7:30 0,09 10:30 0,1880 8.0 6.0 48 64 36 8:00 0,14 11:00 0,1592 2.0 2.0 4 4 4 8:30 0,19 11:30 0,19 Σ xi=65 Σ yi=65 Σ xiyi=473 Σ xi2=481 Σ yi2=475 9:00 0,14 12:00 0,20 9:30 0,16 Verifique a existência de correlação n ∑ x i y i − (∑ x i )(∑ y i ) linear entre o horário e o percentual de defeitos.r=  n x 2 − ( x )2   n y 2 − ( y )2   ∑ i  ∑ i  ∑ i ∑ i    4) Calcule o coeficiente de correlação linear do conjunto de pontos apresentados no gráfico a seguir: 10.473 − (65)(65 ) .r= [10.(481) − (65) ][10.(475) − (65) ] 2 2 y 4,5 4 H K 505 3,5r= r = 0,91 3 G I J 585 . 525 2,5 2 B C F 1,5Resultado que indica uma correlação linear 1positiva altamente significativa entre as duas 0,5 A D Evariáveis. 0 0 1 2 3 4 5 6 7 8 9 10 xExercícios: REGRESSÃO1) Calcule o coeficiente de correlação para os valores das variáveis x i e y i. Sempre que desejamos estudar determinada variável em função de outra, fazemos uma xi 4 6 8 10 12 análise de regressão. yi 12 10 8 12 14 Podemos dizer que a análise de regressão tem por objetivo descrever, através2) determine o coeficiente de correlação linear de um modelo matemático, a relação entre duas para os dados dos conjuntos abaixo, variáveis, partindo de n observações das mesmas.ESTATÍSTICA 53
    • Ana Lúcia Guimarães Carvalho A variável sobre a qual desejamos 44 6.0 5.0 30 36fazer uma estimativa recebe o nome de 58 7.0 7.0 49 49variável dependente e a outra recebe o nome 59 9.0 8.0 72 81de variável independente. Assim, supondo X a variável 72 3.0 4.0 12 9independente e Y a dependente, vamos 80 8.0 6.0 48 64procurar determinar o ajustamento de uma reta 92 2.0 2.0 4 4à relação entre essas variáveis, ou seja, vamosobter uma função definida por: Σ xi=65 Σ yi=65 Σ xiyi=473 Σ xi2=481 Y = aX + b n = 10onde a e b são os parâmetros. n∑ x i y i − ∑ x i ∑ y i A correlação retilínea permiti o a= 2ajustamento de uma reta, imagem da função n ∑ x 2 − (∑ x i ) idefinida por Y = aX + b 10 x 473 − 65 x 65 Vamos, então, calcular os valores dos a= 2parâmetros a e b com a ajuda das fórmulas: 10 x 481 − (65) 4.730 − 4.225 505 a= = = 0,8632 n∑ x i y i − ∑ x i ∑ y i 4.810 − 4.225 585 a= 2 n ∑ x 2 − (∑ x i ) i como: 65 65e x= = 6,5 e y= = 6,5 10 10 b = y − ax b = 6,5 – 0,8632 x 6,5 = 6,5 – 5,6108 = 0,8892onde:n é o número de observações; a = 0,86 e b = 0,89x é a média dos valores x i ( x = ∑ xi ) Logo: n ˆ Y = 0,86X + 0,89y é a média dos valores y i ( y = ∑ yi ) n Para traçarmos a reta no gráfico, basta determinar dois de seus pontos:OBS: Como estamos fazendo uso de umaamostra para obtermos os valores dos X=0 ˆ Y = 0,89parâmetros, o resultado, é uma estimativa da X=5 ˆ Y = 0,86 x 5 + 0,89 = 5,19verdadeira equação de regressão. Sendo assim,escrevemos: Assim temos: ˆ Y = aX + b ˆonde Y é o Y estimado. yExemplo: 10 Y = 0,86X + 0,89 9 8Nº Matem. Estat. xiyi xi2 7 6 (xi) (yi) 5,19 5 401 5.0 6.0 30 25 3 208 8.0 9.0 72 64 0,89 1 024 7.0 8.0 56 49 5 0 2 4 6 8 10 x38 10.0 10.0 100 100ESTATÍSTICA 54
    • Ana Lúcia Guimarães CarvalhoExercícios: Determine:1) A partir da tabela: a) o coeficiente de correlação xi 1 2 3 4 5 6 b) a reta ajustada yi 70 50 40 30 20 10 c) o valor estimado do comprimento da barra para a temperatura de 18ºC a) Calcule o coeficiente de correlação d) o valor estimado do comprimento da b) Determine a reta ajustada barra para a temperatura de 35ºC. c) Estime o valor Y para X = 0 5) Considere os resultados de dois testes, X e2) Certa empresa, estudando a variação da Y, obtidos por um grupo de alunos da escola demanda de seu produto em relação à A: variação de preço de venda, obteve a tabela: xi yi xi yi Preço Demanda Preço Demanda 11 13 28 17 (xi) (yi) (xi) (yi) 14 14 30 24 38 350 63 246 19 18 31 22 42 325 70 238 19 15 34 24 50 297 80 223 22 22 37 25 56 270 95 215 59 256 110 208 Determine: a) Determine o coeficiente de correlação a) calcule o coeficiente de correlação; b) Estabeleça a equação da reta ajustada b) a equação de regressão; c) Estime Y para X=60 e X=120 c) estime x para y = 4.3) Pretendendo-se estudar a relação entre as 6) Considere os resultados de dois testes e variáveis”consumo de energia elétrica”(xi) e calcule o coeficiente de correlação , a “volume de produção nas empresas equação de regressão e construa o gráfico. industriais”(y i), fez-se uma amostragem que inclui vinte empresas, computando-se os X Y X Y seguintes valores: 2 1 4 4 2 2 5 3Σxi = 11,34 , Σyi = 20,72 , Σxi2 = 12,16 , 3 2 6 4 3 3 6 5Σyi2 = 84,96 , Σxiy i = 22,13 3 4 6 3 4 2 a) calcule o coeficiente de correlação b) equação de regressão c) estime o consumo de energia elétrica para um volume de produção de 3.4) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura:Temperatura 10 15 20 25 30 (º C)Comprimento 1.003 1.005 1.010 1.011 1.014 (mm)ESTATÍSTICA 55