Your SlideShare is downloading. ×
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Estatística ii   emerson josé jung
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Estatística ii emerson josé jung

3,973

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
3,973
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
23
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. C iências ontábeisCaderno de Estatística II Dom Alberto Prof: Emerson José Jung
  • 2. C122 JUNG, Emerson José Caderno de Estatística II Dom Alberto / Emerson José Jung. – Santa Cruz do Sul: Faculdade Dom Alberto, 2010. Inclui bibliografia. 1. Administração – Teoria 2. Ciências Contábeis – Teoria 3. Estatística II – Teoria I. JUNG, Emerson José II. Faculdade Dom Alberto III. Coordenação de Administração IV. Coordenação de Ciências Contábeis V. Título CDU 658:657(072)Catalogação na publicação: Roberto Carlos Cardoso – Bibliotecário CRB10 010/10 Página 2
  • 3. Apresentação O Curso de Administração da Faculdade Dom Alberto iniciou suatrajetória acadêmica em 2004, após a construção de um projeto pautado naimportância de possibilitar acesso ao ensino superior de qualidade que,combinado à seriedade na execução de projeto pedagógico, propiciasse umaformação sólida e relacionada às demandas regionais. Considerando esses valores, atividades e ações voltadas aoensino sólido viabilizaram a qualidade acadêmica e pedagógica das aulas, bemcomo o aprendizado efetivo dos alunos, o que permitiu o reconhecimento peloMEC do Curso de Administração em 2008. Passados seis anos, o curso mostra crescimento quantitativo equalitativo, fortalecimento de sua proposta e de consolidação de resultadospositivos, como a publicação deste Caderno Dom Alberto, que é o produto dotrabalho intelectual, pedagógico e instrutivo desenvolvido pelos professoresdurante esse período. Este material servirá de guia e de apoio para o estudoatento e sério, para a organização da pesquisa e para o contato inicial dequalidade com as disciplinas que estruturam o curso. A todos os professores que com competência fomentaram oCaderno Dom Alberto, veículo de publicação oficial da produção didático-pedagógica do corpo docente da Faculdade Dom Alberto, um agradecimentoespecial. Lucas Jost Diretor Geral Página 3
  • 4. PREFÁCIO A arte de ensinar e aprender pressupõe um diálogo entre aqueles queinteragem no processo, como alunos e professores. A eles cabe a tarefa deformação, de construção de valores, habilidades, competências necessárias àsuperação dos desafios. Entre estes se encontra a necessidade de umaformação profissional sólida, capaz de suprir as demandas de mercado, deestabelecer elos entre diversas áreas do saber, de atender às exigências legaisde cada área de atuação, etc. Nesse contexto, um dos fatores mais importantes na formação de umprofissional é saber discutir diversos temas aos quais se aplicamconhecimentos específicos de cada área, dispondo-se de uma variedade amplae desafiadora de questões e problemas proporcionada pelas atuaisconjunturas. Para que isso se torne possível, além da dedicação daquelesenvolvidos no processo de ensino-aprendizagem, é preciso haver suportepedagógico que dê subsídios ao aprender e ao ensinar. Um suporte quesupere a tradicional metodologia expositiva e atenda aos objetivos expressosna proposta pedagógica do curso. Considerando esses pressupostos, a produção desse Caderno DomAlberto é parte da proposta pedagógica do curso da Faculdade Dom Aberto.Com este veículo, elaborado por docentes da instituição, a faculdade buscaapresentar um instrumento de pesquisa, consulta e aprendizagem teórico-prática, reunindo materiais cuja diversidade de abordagens é atualizada enecessária para a formação profissional qualificada dos alunos do curso. Ser um canal de divulgação do material didático produzido porprofessores da instituição é motivação para continuar investindo da formaçãoqualificada e na produção e disseminação do que se discute, apresenta, reflete,propõe e analisa nas aulas do curso. Espera-se que os leitores apreciem oCaderno Dom Alberto com a mesma satisfação que a Faculdade tem emelaborar esta coletânea. Elvis Martins Diretor Acadêmico de Ensino Página 4
  • 5. SumárioApresentação 03Prefácio 04Plano de Ensino 06Aula 1Introdução 11Aula 2Inferência estatística 12Aula 3Probabilidade 13Aula 4Distribuição de probabilidades 14Aula 5Amostragem, estimativa e intervalos de confiança 21Aula 6Determinação do tamanho da amostra 29Aula 7Exercícios 34Aula 8Teste de hipóteses 39Aula 9Interpretando uma decisão 40Aula 10Correlação e Regressão 46Aula 11Diagrama de Dispersão 48Aula 12Exercícios 53 Página 5
  • 6. Centro de Ensino Superior Dom Alberto Plano de Ensino IdentificaçãoCurso: Administração/Ciências Contábeis Disciplina: Estatística IICarga Horária (horas): 60 Créditos: 4 Semestre: 3º EmentaInferência estatística. Testes de Hipóteses. Correlação e regressão. Números Índices e Análise de SériesTemporais. ObjetivosGeral: Oferecer condições para que o aluno possa utilizar esta ferramenta dando-lhe condições para quepossa coletar, interpretar e concluir sobre os resultados obtidos através da observação de dados coletados.Que o aluno possa ainda verificar as variações dos preços de produtos utilizados em sua empresa atravésda compreensão da Série de Números índices, podendo inclusive projetar estas variações, a fim deimplementar estratégias competentes para a empresa.Específicos: Apresentação de exemplos de distribuição de probabilidades, que sejam capazes de propiciarao aluno uma identidade com problemas específicos da empresa, possibilitando melhor preparo naidentificação de problemas podendo preveni-los no futuro. Através da compreensão da série de númerosíndices, a realização de uma pesquisa dentro da empresa em que o aluno está familiarizado, identificandoprodutos com preços e quantidades para que dessa forma possa calcular as variações de preços. Inter-relação da DisciplinaHorizontal: Matemática Aplicada I, Estatística Aplicada I.Vertical: Administração Estratégica, Elaboração e Análise de Projetos, Orçamento Empresarial e Mercadode Capitais. Competências GeraisRealizar tomada de decisão: coletar, interpretar e concluir sobre os resultados obtidos.Desenvolver raciocínio lógico, crítico e analítico: verificar variações (números índices), projetar as variaçõespara implementar estratégias competentes. Revelar-se um profissional adaptável. Competências EspecíficasIdentificar problemas específicos, compreender e ler dados coletados , produzir estratégias eficazes eeficientes. Habilidades GeraisReconhecer e definir problemas, pensar estrategicamente, transferir e generalizar conhecimentos etransferir conhecimentos de experiências cotidianas para o ambiente de trabalho. Habilidades EspecíficasEquacionar soluções, inferir, testar, correlacionar, calcular números índices e analisar séries temporais. Conteúdo ProgramáticoPROGRAMA: 1. Distribuição de Probabilidades; 2. Distribuição Binomial de Probabilidades; 3. Distribuição Normal de Probabilidades; 4. Inferência Estatística: - Amostragem; - Margem de erro; Página 6 Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
  • 7. - Intervalos de Confiança; - Tamanho da Amostra; 5. Testes de Hipóteses para médias e proporções; 6. Análise de Regressão e Correlação; 7. Análise de Séries Temporais; 8. Números índices; 9. Série de números índices. Estratégias de Ensino e Aprendizagem (metodologias de sala de aula)Aulas participativas, aulas expositivas, exercícios, trabalhos individuais. Avaliação do Processo de Ensino e AprendizagemA avaliação do processo de ensino e aprendizagem deve ser realizada de forma contínua, cumulativa esistemática com o objetivo de diagnosticar a situação da aprendizagem de cada aluno, em relação àprogramação curricular. Funções básicas: informar sobre o domínio da aprendizagem, indicar os efeitos dametodologia utilizada, revelar conseqüências da atuação docente, informar sobre a adequabilidade decurrículos e programas, realizar feedback dos objetivos e planejamentos elaborados, etc.A forma de avaliação será da seguinte maneira:1ª Avaliação – Peso 8,0 (oito): Prova; – Peso 2,0 (dois): Trabalho O Trabalho será definido no decorrer das aulas, sendo algumas questões dissertativas que os alunos terão que resolver e entregar.2ª Avaliação - Peso 8,0 (oito): Prova; - Peso 2,0 (dois): referente ao Sistema de Provas Eletrônicas – SPE (maior nota das duas provas do SPE) Avaliação SomativaA aferição do rendimento escolar de cada disciplina é feita através de notas inteiras de zero a dez,permitindo-se a fração de 5 décimos.O aproveitamento escolar é avaliado pelo acompanhamento contínuo do aluno e dos resultados por eleobtidos nas provas, trabalhos, exercícios escolares e outros, e caso necessário, nas provas substitutivas.Dentre os trabalhos escolares de aplicação, há pelo menos uma avaliação escrita em cada disciplina nobimestre.O professor pode submeter os alunos a diversas formas de avaliações, tais como: projetos, seminários,pesquisas bibliográficas e de campo, relatórios, cujos resultados podem culminar com atribuição de umanota representativa de cada avaliação bimestral.Em qualquer disciplina, os alunos que obtiverem média semestral de aprovação igual ou superior a sete(7,0) e freqüência igual ou superior a setenta e cinco por cento (75%) são considerados aprovados.Após cada semestre, e nos termos do calendário escolar, o aluno poderá requerer junto à Secretaria-Geral,no prazo fixado e a título de recuperação, a realização de uma prova substitutiva, por disciplina, a fim desubstituir uma das médias mensais anteriores, ou a que não tenha sido avaliado, e no qual obtiverem comomédia final de aprovação igual ou superior a cinco (5,0). Sistema de Acompanhamento para a Recuperação da AprendizagemSerão utilizados como Sistema de Acompanhamento e Nivelamento da turma os Plantões Tira-Dúvidas quesão realizados sempre antes de iniciar a disciplina, das 18h30min às 18h50min, na sala de aula. Recursos Necessários HumanosProfessor. FísicosLaboratórios, visitas técnicas, etc. MateriaisRecursos Multimídia. Página 7 Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
  • 8. Bibliografia BásicaCRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002.SILVA, Ermes Medeiros da. et al. Estatística: para cursos de economia, administração e ciênciascontábeis. São Paulo: Atlas, 1999. 1 e 2 v.MORETTIN, Pedro A; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva 2003.TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995.SPIEGEL, Murray R.. Estatística. 3. ed. São Paulo: Pearson Education, 1994. ComplementarBARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002.MOORE, David. A Estatística básica e a sua prática. Rio de Janeiro: LTC, 2005.BUNCHAFT G.; KELLNER S. R. O. Estatística sem mistério. Petrópolis: Vozes; 1999.FONSECA, Jairo Simon da; MARTINS, Gilberto. Curso de estatística. São Paulo: Atlas, 1996.MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990. PeriódicosJornais: Gazeta do Sul, Zero Hora.Revistas: Exame, Amanhã, Veja, Isto É. Sites para Consultahttp://www.ime.usp.brhttp://www.ibge.gov.br Outras InformaçõesEndereço eletrônico de acesso à página do PHL para consulta ao acervo da biblioteca:http://192.168.1.201/cgi-bin/wxis.exe?IsisScript=phl.xis&cipar=phl8.cip&lang=por Página 8 Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
  • 9. Cronograma de AtividadesAula Consolidação Avaliação Conteúdo Procedimentos Recursos Introdução da disciplina (apresentação, acordos e 1ª cronograma). Revisão de probabilidades. Distribuição de AE QG/DS/LB Probabilidade Binomial. Distribuição Probabilidade Binomial e Distribuição 2ª AE/TG QG/DS/LB Probabilidade Normal. 3ª Distribuição Probabilidade Normal. AE QG/DS 4ª Distribuição Probabilidade Normal. AE QG/DS Estimativas: Margem de erro e Intervalos de Confiança para 5ª AE QG grandes e pequenas amostras Para médias. 6ª Estimativas: Tamanho da Amostra AE QG Estimativas: Margem de erro e Intervalos de Confiança para 7ª AE QG proporções. Consolidação e Sistematização dos Conteúdos da 1ª 1 AE QG Avaliação. 1 Primeira Avaliação. 8ª Teste de Hipóteses para média. Interpretação. AE QG 9ª Teste de Hipóteses para média. Interpretação. AE QG Testes de Hipóteses para proporção. Teste de Hipóteses com10ª AE/TG QG duas médias e proporções. Interpretação. Introdução a Correlação e Regressão. Cálculos e11ª AE QG/DS /LB interpretação. Cálculos de Correlação e Regressão através das funções12ª AE QG/DS /LB estatísticas e Análise de Dados. Séries Temporais. Números Índices e seus métodos de13ª AE QG/DS cálculo. Séries de Números Índices. Consolidação e Sistematização dos Conteúdos da 2a 2 AE QG Avaliação. 2 Segunda Avaliação. 3 Avaliação Substitutiva LegendaCódigo Descrição Código Descrição Código DescriçãoAE Aula expositiva QG Quadro verde e giz LB Laboratório de informáticaTG Trabalho em grupo RE Retroprojetor PS Projetor de slidesTI Trabalho individual VI Videocassete AP ApostilaSE Seminário DS Data Show OU OutrosPA Palestra FC Flipchart Página 9 Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
  • 10. CENTRO DE ENSINO SUPERIOR DOM ALBERTOCursos de Administração e Ciências Contábeis ESTATÍSTICA II Professor: Emerson José Jung emerson.jung@domalberto.edu.br INTRODUÇÃO Página 10
  • 11. Por causa da enxurrada de dados coletados, referente a todas as particularidadesde negócios, o uso de técnicas estatísticas tornou-se uma ferramenta indispensável paraum gerenciamento bem sucedido. No âmbito de uma responsabilidade gerencial, o papelda estatística ajuda a determinar iniciativas e decisões em diferentes situações. Vejamalgumas:- No gerenciamento corporativo: examinar tendências e prever o comportamento futuro domercado. A estatística pode comparar desempenhos atuais, antecipar ciclos de vida deprodutos e planejar iniciativas futuras.- No gerenciamento de produtos para uma linha específica: você precisa estimar aatividade futura do produto com base em vendas atuais, identificar a sensibilidade doproduto para novos produtos e desenvolver novos produtos com base em informações deconsumidores.- No gerenciamento de relações com o consumidor: é necessário avaliar a satisfação dosconsumidores e informar o desempenho dos produtos à gerência de produtos. A estatísticaestaria presente para identificar problemas de aceitação dos produtos e determinar níveisde satisfação ou insatisfação dos consumidores.- No gerenciamento financeiro: é necessário avaliar o desempenho financeiro dos produtoscom base no desempenho histórico e quanto ao retorno do investimento. A estatística éusada para estimar a receita da empresa com base em desempenho histórico. A cada uma dessas situações gerenciais é preciso analisar dados quantitativos àluz dos objetivos e tomar decisões com base nesses dados. Daí a necessidade de seentender estatística e a capacidade de empregar as suas várias ferramentaseficientemente. A estatística é definida como o estudo da coleta e processamento de dados paraajudar na tomada de decisões informadas em uma área de incerteza. Ela emprega aanálise quantitativa e apresenta-se em três fases:1. Coleta de dados ou amostragem: esta fase requer a elaboração de uma pesquisa, oplanejamento de uma estratégia de amostragem e coleta de amostras.2. Análise descritiva: esta fase enfoca a descrição do comportamento da amostra – umafotografia, por assim dizer, dos níveis atuais ou históricos de desempenho dos negócios.3. Análise inferencial: esta fase prevê o comportamento da população com base nosresultados da amostra, isto é, como o desempenho se altera à proporção que as variáveisprincipais são modificadas. A finalidade desta disciplina é apresentar aos acadêmicos dos cursos deadministração e ciências contábeis os métodos mais usados de organização esumarização de dados estatísticos. Página 11
  • 12. INFERÊNCIA ESTATÍSTICA A Estatística I preparou o caminho para poder entrar nos problemas da inferênciaestatística. Foram apresentadas as diversas técnicas de análise exploratória de dados, astécnicas de amostragem e a teoria de probabilidades, cada uma dessas áreas constituem otripé da inferência estatística. Amostragem Estatística Cálculo de Descritiva Probabilidades INFERÊNCIA ESTATÍSTICA A Inferência Estatística é conhecida como a parte fundamental da estatística, que éa tomada de decisões em condições de incerteza. Ela se divide em duas grandes áreas: Estimação PontualInferência Estatística Intervalar Teste de Hipóteses Página 12
  • 13. Esta tabela é denomonada distribuição de probabilidade.Exemplos de distribuição binomial: 1) Qual a probabilidade de obtermos 2 caras em 6 lances de uma moeda? 2) Imaginando qual o sucesso de sair o ás de ouros quando retiramos uma carta de um baralho de 52 cartas. Logicamente diríamos que no exemplo 2 a resposta é 1/52, mas e o exemplo 1? Página 13
  • 14. CENTRO DE ENSINO SUPERIOR DOM ALBERTO I. DISTRIBUIÇÃO DE PROBABILIDADES 1.1 Distribuição Binomial – Variáveis Discretas Uma variável aleatória associa um valor numérico a cada resultado de um experimentoaleatório e uma distribuição de probabilidades associa uma probabilidade a cada valor de umavariável aleatória. Os experimentos binomiais têm a característica de apresentarem exatamentedois resultados complementares: em processos industriais as pessoas falham ou não falham. Namedicina um paciente sobrevive um ano, ou morre. Em propaganda, um consumidor reconheceum produto, ou não. Definição: Um experimento binomial é um experimento que satisfaz as seguintes condições: 1. O experimento deve comportar um numero fixo de provas; 2. As provas devem ser independentes (o resultado de qualquer prova não afeta as probabilidades das outras provas); 3. Cada prova deve ter todos os resultados classificados em duas categorias; 4. As probabilidades devem permanecer constantes para cada prova. Se fizermos um experimento binomial, a distribuição da variável aleatória x é chamadauma distribuição de probabilidade binomial (ou distribuição binomial). Usa-se a seguintedenominação: S e F (sucesso ou falha) denotam as duas categorias possíveis de todos osresultados: p e q denotam as possibilidades de S e F, respectivamente; assim: P( s) = p P ( F ) = − p =q 1 Sendo n = denota o numero fixo de provas; x = denota um número específico de sucesso em n provas, podendo ser qualquer inteiro entre 0 e n, inclusive; p = denota a probabilidade de sucesso em uma das n provas; q = denota a probabilidade de falha em uma das n provas; P(x) = denota a probabilidade de obter exatamente x sucessos em n provas; Fórmula utilizada para calcular a probabilidade binomial: n! = P( x) ⋅ p x ⋅ q n− x (n − x)! x ! Exemplo: Dado que 10% das pessoas são canhotas, suponha que queiramos achar aprobabilidade de obter exatamente 3 estudantes canhotos em uma turma de 15 estudantes.Questiona-se: a) Trata-se de um experimento binomial? b) Em caso afirmativo, identifique os valores de n, x, p e q. c) Aplicando a formula da probabilidade binomial, determine a probabilidade de obter 3 estudantes canhotos em uma turma de 15 estudantes. Página 14
  • 15. CENTRO DE ENSINO SUPERIOR DOM ALBERTO d) A probabilidade de ao menos 3 sucessos (alunos canhotos). EXERCÍCIOS1. Uma empresa produz 10% de peças defeituosas. As peças são embaladas em caixas que contêm 12peças. Calcule a probabilidade de um cliente comprar uma caixa contendo: (a) nenhuma peça defeituosa; (b) uma peça defeituosa.2. Um produtor de sementes vende pacotes com 20 sementes cada. Os pacotes que apresentaremmais de uma semente sem germinar são indenizados. A probabilidade de uma semente germinar é0,98. (a) Qual é a probabilidade de que um pacote não seja indenizado? (b) Se o produtor vende 1.000 pacotes, em quantos se espera indenização?3. Estatísticas de tráfego revelam que 25% dos veículos interceptados numa auto-estrada não passamno teste de segurança. De 10 veículos interceptados, determine a probabilidade de 2 ou mais nãopassarem.4. Numa criação de coelhos, 40% são machos. Qual a probabilidade de que nasçam pelo menos 2coelhos machos num dia em que nasceram 20 coelhos?5. O fabricante de drives de disco utilizados em uma das mais conhecidas marcas demicrocomputadores espera que 2% dos drives de disco apresentem defeitos durante o período degarantia do microcomputador. Numa amostra de 10 drives de disco, qual é a probabilidade de que: a) Nenhum irá apresentar defeito durante o período de garantia? b) Exatamente um irá apresentar defeito durante o período de garantia? c) Pelo menos dois irão apresentar defeito durante o período de garantia? d) Quais seriam as respostas para a letra (a) e (b) se fosse esperado que 1% dos drives de disco apresentasse defeito? 1.2 DISTRIBUIÇÃO NORMAL A distribuição normal desempenha papel importantíssimo na Teoria Estatística.Deduzida por De Moivre em 1753 como forma limite da Binominal, foi posteriormenteredescoberta em 1774 por Laplace, e em 1809 por Gauss. Por essa razão é conhecida ainda pelonome de Distribuição de Gauss, de Laplace, ou ainda Laplace-Gauss. A Distribuição Normal é a mais importante distribuição de variável aleatória contínua eé básica para o desenvolvimento da inferência estatística. Entre as distribuições teóricas devariável aleatória contínua, uma das mais empregadas é a distribuição normal. A distribuição normal é caracterizada por uma função, cujo gráfico descreve uma curvaem forma de sino. Esta distribuição depende de dois parâmetros: • µ (média) – este parâmetro especifica a posição central da distribuição de probabilidades. • σ (desvio padrão) – este parâmetro especifica a variabilidade da distribuição de probabilidades. Existem infinitas distribuições normais, cada uma com usa própria média e desviopadrão. A distribuição normal com media zero e desvio padrão de 1 é chamada de distribuiçãonormal padrão ou padronizada. A escala horizontal do gráfico da distribuição normal padrão Página 15
  • 16. CENTRO DE ENSINO SUPERIOR DOM ALBERTOcorresponde aos escores z (uma medida de posição que indica o numero de desvios-padrão deum valor a partir da media). Pode-se transformar um valor x em um escore z, usando a seguintefórmula: x−µ z= σonde: x = valores arbitrários (intervalos) µ = média da distribuição normal σ = desvio-padrão da distribuição normal - ∞ +∞ Após usar a fórmula dada acima para transformar um valor x num escore z, pode-se usar aTabela Normal Padrão. A tabela enumera a área acumulada sob a curva normal padrão à esquerda dez para escores z de –3,49 a 3,49. Área na tabela A distribuição normal possui as seguintes características:- Variável aleatória contínua.- Tem a forma de um sino.- É simétrica em relação a média.- Prolonga-se de - ∞ a + ∞.- A área sob a curva normal é considerada de tamanho 1 (100%).Exemplos. 1. Determina a área que corresponde ao escore z de 1,15. 2. Determina a área acumulada que corresponde ao escore z de 1,15. Página 16
  • 17. CENTRO DE ENSINO SUPERIOR DOM ALBERTO 3. Calcule a área acumulada que corresponde ao escore z de -0,24. 4. Esboce a curva normal padrão e sombreie a área apropriada sob a curva: a) para obter a área a esquerda de z = 1,23. b) para obter a área a direita de z = 1,23. c) para obter a área entre dois escores z, -0,75 e 1,23. 5. Determine a área sob a curva padrão à direita de z = 1,06. 6. Se um escore z for zero, qual das afirmações a seguir será verdadeira. Explique seu raciocínio. (a) a média é zero. (b) o valor x correspondente é igual a zero. (c) o valor x correspondente é igual à média. 7. Analise os gráficos e obtenha a probabilidade de z ocorrer na região indicada. 8. Determine a probabilidade indicada usando a distribuição normal padrão: a) P (z < 1,45) b) P (z > -1,95) c) P ( 0 < z < 2,05) d) P (z < -2,58 ou z > 2,58) e) P ( -0,95 < z < 1,44)Exemplos para transformar um escore z em um valor x.1. As velocidades de veículos ao longo de um trecho de uma via expressa tem uma media de 56km/he um desvio padrão de 8km/h. Obtenha as velocidades x correspondentes aos escores z = 1,96; -2,33e 0. Interprete os seus resultados.2. As notas dos candidatos ao concurso público do INSS estão normalmente distribuídas com umamédia de 75 pontos e um desvio padrão de 6,5. Para poder entrar no serviço público, o candidatoprecisa figurar entre os 5% melhores. Qual é a menor pontuação possível para a aprovação de umcandidato?3. Em uma amostra selecionada ao acaso de 1169 homens com idade entre 40 e 49 anos, foiconstatado um nível médio total de colesterol de 211 miligramas por decilitros, com desvio padrão de39,2 miligramas por decilitros. Suponha que os níveis totais de colesterol sejam normalmentedistribuídos. Obtenha o mais alto nível total de colesterol que um homem com idade entre 40 e 49anos pode ter e ainda assim ficar entre o 1% mais baixo. Página 17
  • 18. CENTRO DE ENSINO SUPERIOR DOM ALBERTO EXERCÍCIOS1. Um levantamento indica que pessoas usam seus computadores em media durante 2,4 anos antes de adquirir uma nova máquina. O desvio padrão é de 0,5 anos. Selecionando ao acaso alguém que tenha computador, obtenha a probabilidade de que ele o use por menos de dois anos antes de comprar outro.2. A taxa de hemoglobina no sangue de pessoas que possuem boa saúde segue uma distribuição normal com média 12 e desvio padrão 1. Qual a probabilidade de se encontrar uma pessoa normal com taxa de hemoglobina: (a) superior a 15? (b) Inferior a 10? (c) Entre 10 e 13 (d) Num grupo de 500 pessoas, em quantas devemos esperar as características acima?3. Os depósitos mensais na caderneta de poupança têm distribuição normal com média igual a $ 500 e desvio padrão $ 150. Se um depositante realizar um depósito, pede-se calcular a probabilidade de que esse depósito seja igual ou menor que $ 650.4. A análise estatística de um investimento mostrou que seu resultado líquido é uma variável aleatória X com valor esperado $ 10 000 e desvio padrão $ 4 000. Sabendo que a variável X tem distribuição normal, pede-se calcular a probabilidade de que o resultado X seja menor que $ 5000.5. As vendas mensais dos últimos 50 meses apresentam uma média igual a $ 500 mil com desvio padrão igual a $ 80 mil. Se a empresa estabeleceu uma meta de vendas para o próximo mês de $ 550 mil, pede-se calcular, considerando que os dados históricos se repetem no futuro próximo: a) A probabilidade de ficar abaixo da meta. b) A probabilidade de superar a meta. c) A probabilidade de que as vendas se situem entre 80 % e 110 % da média.6. Uma população X tem distribuição normal com média igual a 20 e desvio padrão igual a 5. Retirando aleatoriamente um elemento dessa população, pede-se calcular a probabilidade desse elemento ser igual ou menor que 22.7. A distribuição dos salários anuais dos auxiliares de escritório de uma grande empresa tem distribuição normal com média igual a R$12.500,00 e desvio padrão igual a R$2.800,00. Calcular: a) A proporção dos auxiliares de escritório que ganha mais que R$14.500,00. b) A proporção dos auxiliares de escritório que ganha menos que R$11.000,00 c) A proporção dos auxiliares de escritório que ganha entre R$10.000,00 e R$14.000,00.8. Suponha que um consultor esteja investigando o tempo que os trabalhadores de uma fábrica de automóveis levam para montar determinada peça depois de terem sido treinados para realizar a tarefa por um método de aprendizagem individual. O consultor determina que o tempo em segundos para montar a peça para os trabalhadores treinados por esse método é distribuído de maneira normal com média igual a 75 segundos e desvio padrão igual a 6. Pede-se: a) A probabilidade de um trabalhador montar uma peça em 81 segundos? b) Quantos segundos devem transcorrer antes que 10% dos trabalhadores da fabrica montam uma peça?9. Um conjunto de notas finais de provas da disciplina de Estatística II foi considerado como sendo normalmente distribuído com uma média aritmética de 73 e um desvio padrão de 8. Página 18
  • 19. CENTRO DE ENSINO SUPERIOR DOM ALBERTO a) Qual é a probabilidade de se obter no máximo uma nota 91 nesta prova? b) Que porcentagem de alunos tirou entre 65 e 89? c) Que porcentagem de alunos tirou entre 81 e 89? d) Qual é a nota final do exame se somente 5% dos alunos que fizeram a prova tiram nota mais alta? 10. Uma fabrica de carros sabe que os motores de sua fabricação têm duração normal com 150.000 km e desvio padrão de 5000 km. Se a fabrica substitui o motor que apresenta duração inferior a garantia, qual deve ser esta garantia para que a porcentagem de motores substituídos seja inferior a 0,2%? 11. As alturas dos alunos de uma determinada escola são normalmente distribuídas com média 1,60m e desvio padrão 0,30. Encontre a probabilidade de uma aluna escolhida ao acaso medir: a) Entre 1,50 e 1,80 m. b) Mais que 1,60 m. c) Menos que 1,48m. d) Entre 1,54 e 1,58m. e) Mais que 1,55m. f) Menos que 1,55m ou mais que 1,75m. 12. Suponha-se que a renda anual de uma determinada cidade tenha uma média de R$ 5.000,00 com desvio padrão de R$ 1.500,00. Admitindo-se uma distribuição normal, que podemos dizer de uma renda de R$ 7.000,00? EXEMPLO DE DISTRIBUIÇÃO NORMAL COMO APROXIMAÇÃO DA DISTRIBUIÇÃO BINOMIALSe n.p ≥ 5 e n.q ≥ 5, então a variável aleatória binomial x tem distribuição aproximadamentenormal, com média µ = np e desvio padrão σ = npq1. Uma maquina produz parafusos, dos quais 10% são defeituosos. Determinar a probabilidade de, em uma amostra tomada ao acaso de 400 parafusos produzidos por essa maquina, serem defeituosos: (a) no máximo 30; (b) entre 30 e 50 (c) 55 ou mais.2. Numa cidade haverá um plebiscito em que 1.250.000 eleitores decidirão entre aceitar (SIM) ou rejeitar (NÃO) certa política. Suponha que um partidário da aceitação dessa política afirme que 80% dos votos serão SIM. Admitindo essa previsão como verdadeira, qual é a probabilidade de, em uma amostra de 900 eleitores, menos de 684 serem partidários do SIM?3. Cerca de 4,4% dos acidentes fatais com automóveis são causados por pneus defeituosos (com base em dados do Conselho Nacional de Segurança). Se um estudo de segurança em uma rodovia começa com a escolha aleatória de 750 casos de acidentes fatais com veículos motorizados, estime a probabilidade de exatamente 35 deles terem sido causados por pneus defeituosos. Página 19
  • 20. CENTRO DE ENSINO SUPERIOR DOM ALBERTOTabela Z – Áreas sob a curval Normalz 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,03590,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,07530,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,11410,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,15170,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,18790,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,22240,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,25490,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,28520,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,31330,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,33891,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,36211,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,38301,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,40151,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,41771,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,43191,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,44411,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,45451,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,46331,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,47061,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,47672,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,48172,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,48572,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,48902,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,49162,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,49362,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,49522,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,49642,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,49742,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,49812,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,49863,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,49903,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,49933,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,49953,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,49973,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 Página 20
  • 21. CENTRO DE ENSINO SUPERIOR DOM ALBERTO II – AMOSTRAGEM, ESTIMATIVA E INTERVALOS DE CONFIANÇA 2.1 Amostragem 2.1.1 Introdução Nas pesquisas científicas, em que se querem conhecer algumascaracterísticas de uma população, é muito comum se observar apenas uma amostrade seus elementos e, a partir dos resultados dessa amostra, obter valoresaproximados, ou estimativos, para as características populacionais de interesse. Essetipo de pesquisa é usualmente chamado de levantamento por amostragem. Numlevantamento por amostragem, a seleção dos elementos que serão observados, deveser feita com uma metodologia adequada, de tal forma que os resultados da amostrasejam representativos de toda a população. 2.1.2 Importância da utilização da amostragem Quatro razões para o uso de amostragem em levantamento de grandespopulações: • Economia: Em geral, torna-se bem mais econômico o levantamento de somente uma parte da ação; • Tempo: Numa pesquisa eleitoral, a três dias de uma eleição presidencial, não haveria tempo para pesquisar toda a população de eleitores do país, mesmo que houvesse recursos financeiros em abundância; • Confiabilidade dos dados: Quando se pesquisa um número reduzido de elementos, pode-se dar mais aos casos individuais, evitando erros nas respostas; • Operacionalidade: É mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes censos é o controle dos entrevistadores. Situações em que pode não valer a pena a realização de uma amostragem: Página 21
  • 22. CENTRO DE ENSINO SUPERIOR DOM ALBERTO • População pequena: Sob o enfoque de amostragens aleatórias, se a população for pequena, para uma amostra ser capaz de gerar resultados precisos para os parâmetros da população, é necessário que ela seja relativamente grande (em torno de 80% da população); • Característica de mensuração: Talvez a população não seja tão pequena, mas variável que se quer observar é de tão fácil mensuração, que não compensaria investir num plano de amostragem; • Necessidade de alta precisão: A cada dez anos o IBGE realiza um censo demográfico para estudar diversas características da população brasileira. Dentre estas características tem-se o parâmetro número de habitantes residentes no país, que é fundamental para um bom planejamento. Desta forma, o parâmetro – número de habitantes – precisa ser avaliado com grande precisão e, por isso, se pesquisa toda a população. Para se fazer um plano de amostragem, deve-se ter bem definidos: os objetivos da pesquisa, a população a ser amostrada, bem como os parâmetros necessários a serem estimados para que os objetivos sejam alcançados. 2.2 Estimação de Parâmetros 2.2.1 Introdução A inferência estatística representa o processo de utilização de resultados deamostras, visando tirar conclusões sobre as características de uma população. Como as populações são caracterizadas por medidas numéricas descritivas,denominadas parâmetros, a inferência estatística diz respeito à realização deinferências sobre esses parâmetros populacionais. A estimação é o processo que consiste em utilizar dados amostrais paraestimar os valores de parâmetros populacionais desconhecidos. Qualquercaracterística de uma população pode ser estimada a partir de uma amostra. Entre asmais comuns, estão a média e o desvio padrão de uma população e a proporçãopopulacional. Página 22
  • 23. CENTRO DE ENSINO SUPERIOR DOM ALBERTO 2.2.2 Estimativas pontuais e intervalares As estatísticas amostrais são utilizadas como estimadores de parâmetrospopulacionais. Por exemplo, uma média aritmética da amostra é usada comoestimativa de ponto da média populacional. Existem dois tipos principais de estimativas: estimativas de ponto eestimativas de intervalo. A estimativa pontual é um valor (ou ponto) único usado para aproximar umparâmetro populacional. A média amostral x é a melhor estimativa pontual damédia populacional µ . Mas, a estatística de uma amostra, tal como x , varia deamostra para amostra, uma vez que depende dos itens selecionados na amostra, eesta variação deve ser levada em consideração ao se fornecer estimativas para apopulação. Pensando nessa variação é que foi desenvolvida a estimativa intervalar. A estimativa intervalar é um intervalo de valores que tem probabilidade deconter o verdadeiro valor da população. Ou seja, o intervalo que é construído teráuma confiança ou probabilidade especificada de estar estimando corretamente overdadeiro valor do parâmetro da população. 2.2.3 Intervalos de confiança Um intervalo de confiança está associado a um grau de confiança que é umamedida da nossa certeza de que o intervalo contém o parâmetro populacional. Adefinição grau de confiança utiliza α (alfa) para descrever uma probabilidade quecorresponde a uma área. São escolhas comuns para o grau de confiança (ou nível de confiança, oucoeficiente de confiança): 90%, 95% e 99%, veja a tabela. Grau de confiança α Valor Crítico z 90% 0,10 1,645 95% 0,05 1,96 99% 0,01 2,575 Página 23
  • 24. CENTRO DE ENSINO SUPERIOR DOM ALBERTO Um valor crítico é um número na fronteira que separa os valores dasestatísticas amostrais prováveis de ocorrerem, dos valores que têm pouca chance deocorrer. Região Região crítica crítica Valor crítico Valor crítico Para entender melhor, observe a figura abaixo a distribuição normal para umgrau de confiança de 90%. 90% 0,45 0,45 -z = -1,645 z = 1,645 Portanto, dado um grau de confiança, devemos usar a tabela da distribuiçãodos escores z para encontrar o valor critico z. Exemplo: Determine o valor critico z que corresponde ao grau de confiança98%. Página 24
  • 25. CENTRO DE ENSINO SUPERIOR DOM ALBERTO 2.2.4 Estimativas para a média populacional: grandes amostras Quando utilizamos dados amostrais para estimar uma média populacional µ , amargem de erro, denotada por E, é a diferença máxima provável, com certaprobabilidade, entre a média amostral e a verdadeira média populacional µ . A margem de erro E é chamada também de erro máximo de estimativa e podeser obtida por σ E = z. n Há três determinantes do tamanho ou quantidade de erro: 1. A confiança desejada (índice de confiança), representada por z; 2. Dispersão da população (representada pelo desvio padrão); 3. Tamanho da amostra. O cálculo da margem de erro E, tal como dado na fórmula, exige o conhecimento do desvio padrão populacional σ , mas, na realidade, é raro conhecermos σ quando a média populacional µ não é conhecida. Então devemos levar em conta o seguinte detalhe: Se n > 30 , podemos substituir σ na formula pelo desvio padrão amostral s. Se n ≤ 30 , a população deve ter a distribuição normal, e devemos conhecer σ para usarmos a formula. Com base na definição da margem de erro E, podemos agora identificar o intervalo de confiança para a média populacional µ . x-E< µ < x+E ou µ = ± E Fator de Correção para população finita: quando uma população for finita, aformula que determina o erro padrão da média precisa ser ajustada. Se N é o Página 25
  • 26. CENTRO DE ENSINO SUPERIOR DOM ALBERTOtamanho da população e n é o tamanho da amostra, onde n for maior ou igual a 5%do tamanho da população, o erro padrão da média é: σ N −n E = z. . n N −1 N −n Onde, é o fator de correção. N −1 Para calcular limites de confiabilidade, utilizamos a seguinte equação: x = µ ± Z(σ/√̅n) No nosso caso, inverte-se o x com µ, para se saber se é o que se espera.Exemplo: 1. Um fabricante de papel para impressora possui um processo de produção que opera de maneira contínua, através de um turno completo de produção. É esperado que o papel tenha um comprimento de 11 polegadas, e o desvio padrão conhecido sejam 0,02 polegadas. A intervalos periódicos, são selecionadas amostras para determinar se o comprimento médio do papel ainda se mantém igual a 11 polegadas ou se algo de errado aconteceu no processo de produção para que tenha modificado o comprimento do papel produzido. Uma amostra aleatória de 100 folhas foi selecionada e verificou-se que o comprimento médio do papel era de 10,998 polegadas. Caso seja desejada uma estimativa do intervalo de confiança de 95% do comprimento médio do papel na população, teremos: x= µ ± Z(σ/√̅n) = 10,998 ± (1,96)(0,02/√̅100) = 10,998 ± 0,00392 10,99408 ≤ µ ≤ 11,00192Como 11 está entre o intervalo encontrado, o fabricante não tem com o que sepreocupar. Página 26
  • 27. CENTRO DE ENSINO SUPERIOR DOM ALBERTOCaso se queira um intervalo de confiança maior, por exemplo 99%, aí o que teremos? 2. A variabilidade do tempo de atendimento em um caixa bancário é conhecida σ = 0,10min. e tem distribuição normal. Uma amostragem de 40 pessoas indicou tempo médio de atendimento de x = 1,5 min. Construir um intervalo de confiança de 95% para o tempo médio de atendimento. EXERCÍCIOS1. O gerente do controle aéreo do aeroporto de São Paulo está interessado em conhecero tempo que os aviões 737 necessitam para aterrissar, medindo este tempo entre oinstante que o piloto inicia a operação de descida e o instante que o avião abandona apista de aterrissagem. Se a média de uma amostra aleatória de 33 aviões é igual a 21minutos com desvio padrão igual a 4,5 minutos, pede-se estimar o valor da média dapopulação considerando dois valores de intervalo de confiança: 90% e 95%.2. Numa amostra aleatória de 32 notas de despesa numa semana em dezembro, umauditor constatou uma despesa média de R$220,00, com desvio padrão de R$20,00. a) Qual a estimativa pontual da quantia média? b) Construa um intervalo de 99% de confiança para a quantia média.3. De uma população com distribuição normal e desvio-padrão igual a 5 foi retirada umaamostra aleatória de tamanho 20 e sua média calculada foi 24. Estime o valor da médiada população com índice de confiança igual a 90%.4. Uma amostra consiste em 75 aparelhos de TV adquiridos há vários anos. Os temposde substituição destes aparelhos têm média de 8,2 anos e desvio-padrão de 1,1 ano.Construa um intervalo de 90% de confiança para o tempo médio de substituição de todosos aparelhos de TVs. Página 27
  • 28. CENTRO DE ENSINO SUPERIOR DOM ALBERTO5. Suponha que o proprietário de uma loja de materiais de construção érevendedor de tintas e queira calcular a verdadeira quantidade de tinta contida naslatas de um galão de 1 l, compradas de um fabricante nacionalmente conhecido.Sabe-se, pelas especificações contidas no galão, que o desvio padrão da quantidadede tinta é igual a 0,02 l. Uma amostra aleatória de 50 latas é selecionada, e aquantidade média de tinta por lata de 1 galão é igual a 0,995 l.a) Desenvolva uma estimativa do intervalo de confiança de 99% da verdadeira média da população da quantidade de tinta contida em uma lata de 1 galão.b) Com base nos seus resultados, você acha que o proprietário da loja tem o direito de reclamar ao fabricante? Por que?c) A população de quantidade de tinta por lata tem que ser distribuída normalmente neste caso? Explique.d) Explique por que um valor observado de 0,98 l para cada lata não seria incomum, apesar de estar fora do intervalo de confiança que você calculou?e) Suponha que você utilizasse uma estimativa do intervalo de confiança de 95%, quais seriam suas respostas para (a) e (b)?6. O gerente de controle de qualidade de um fábrica de lâmpadas de filamentoprecisa calcular a vida útil média de uma remessa de lâmpadas. Sabe-se que odesvio padrão do processo é de 100 horas. Uma amostra aleatória de 50 lâmpadasindicou uma vida útil média da amostra igual a 350 horas. a) Desenvolva uma estimativa do intervalo de confiança de 99% da verdadeira média útil das lâmpadas nesta remessa. b) Você, conhecendo estes resultados, compraria uma lâmpada deste fabricante? Explique. c) Suponha que o desvio padrão do processo mudasse para 80 horas. Qual seria sua resposta para (a)?7. Um comerciante ficou muito curioso para descobrir qual a real quantidade derefrigerante que é colocada em garrafas de 2 litros. Foi informado ao comerciante queo desvio padrão para garrafas de 2 litros é 0,05 litro. Uma amostra aleatória, de 100garrafas de 2 litros, indica uma média da amostra de 1,99 litro. a) Desenvolva a estimativa do intervalo de confiança de 95% da verdadeira média da quantidade de refrigerante de cada garrafa. Página 28
  • 29. CENTRO DE ENSINO SUPERIOR DOM ALBERTO b) A população de quantidade de refrigerante tem que ser distribuída normalmente neste caso? Explique. c) Explique por que um valor observado de 2,02 litros não seria incomum. d) Suponha que a média da amostra mudasse para 1,97 litro. Quais seriam suas respostas para (a) e (b)? 2.2.5 Determinação do tamanho da amostra A formula do erro pode ser resolvida em relação a n. Assim: σ σ  σ 2 E = z. ⇒ n = z. ⇒ n =  z.  n E  E Logo o tamanho da amostra dependerá de: 1. O grau de confiança desejado; 2. A quantidade de dispersão na população σ; 3. Certa quantidade de erro tolerável. Se o tamanho da população N for conhecido, calculamos n com a fórmula N .σ 2 .z 2 n= σ 2 .z 2 + (N − 1).E 2 OBS: o tamanho da amostra n encontrado sempre deverá ser arredondadopara o inteiro superior mais próximo.Atividades:1) Qual o tamanho da amostra necessário pra estimar a média populacional de umacaracterística dimensional de um processo com 95% de confiança cujo desvio-padrãopopulacional é σ = 2,45 cm e precisão de 0,5 cm? Página 29
  • 30. CENTRO DE ENSINO SUPERIOR DOM ALBERTO2) Você pretende fazer uma pesquisa para atualizar os dados sobre média salarial dosfuncionários de uma indústria de cigarros. Estudos anteriores sugerem um desvio-padrãode R$330,00. Sabendo que a empresa tem 3400 funcionários quantas pessoas vocêdeve pesquisar para estimar a média salarial de todos os funcionários, quando a) o erro máximo tolerável for 50 reais e o nível de confiança 99%? b) o erro máximo tolerável for 50 reais e o nível de confiança 95%? c) o erro máximo tolerável for 20 reais e o nível de confiança 95%?3) Para planejar o manuseio adequado do lixo doméstico, uma cidade deve estimar opeso médio do lixo descartado pelas residências em uma semana. Determine o tamanhoda amostra necessário para estimar essa média, para que tenhamos 96% de confiançaem que a média amostral esteja a menos de 0,9 kg da verdadeira média populacional.Para o desvio-padrão populacional use o valor 5,65 kg, que é o desvio padrão dumacidade vizinha de mesmo porte. 2.2.6 Estimativas para a média populacional: pequenas amostras Em muitas situações da vida real, o desvio padrão populacional édesconhecido. Além disso, em função de fatores como tempo e custo,frequentemente não é prático colher amostras de tamanho superior a 30. Assim,como construir intervalos de confiança para a média populacional nessas condições?Se a variável aleatória é normalmente distribuída (ou aproximadamente normalmentedistribuída), a distribuição amostral para x é uma distribuição t (Student). A distribuição t é uma família de curvas, cada uma delas determinada por umparâmetro chamado grau de liberdade. Os graus de liberdade são os números deescolhas livres deixados após uma amostra estatística, tal como a média de x ter sidocalculada. Quando se usa uma distribuição t para estimar uma média populacional, onúmero de graus de liberdade é igual ao tamanho da amostra menos um. Página 30
  • 31. CENTRO DE ENSINO SUPERIOR DOM ALBERTO Grau de Liberdades = n – 1 Quando o número de graus de liberdade cresce, a distribuição tende para adistribuição normal. Após 30 graus de liberdade distribuição t está muito próxima dadistribuição normal padrão z. Condições para utilização da Distribuição t de Student 1. O tamanho da amostra deve ser pequeno, n ≤ 30 ; 2. σ é desconhecido; 3. A população original tem distribuição essencialmente normal. Obtendo os valores críticos de t1. Determinar o valor crítico t para 95% de confiança quando o tamanho da amostrafor 15.2. Determinar o valor crítico de t para 90% de confiança quando o tamanho daamostra for 22. 2.2.8 Intervalos de confiança e a distribuição t O intervalo de confiança para uma média amostral quando se usa desvio padrãoamostral é muito semelhante ao intervalo quando se usa desvio padrão da população. x-E< µ < x+E ou µ = ± E Sendo que s E = t. n Página 31
  • 32. CENTRO DE ENSINO SUPERIOR DOM ALBERTO E para população finita σ N −n E = z. . n N −1Exemplos:1. Você seleciona ao acaso 16 restaurantes e mede a temperatura do café vendido emcada um. A temperatura média amostral é de 72ºC, com um desvio padrão amostral de12ºC. Obtenha o intervalo de confiança de 95% para a temperatura média. Suponha queas temperaturas estejam normalmente distribuídas.2. Você seleciona ao acaso 20 casas hipotecárias e determina a atual taxa de juro quecada uma cobra. A taxa média amostral é de 6,93% com desvio padrão de 0,42%Obtenha o intervalo de confiança de 99% para a população da taxa media de juro para ashipotecas. Suponha que as taxas de juros tenham distribuição aproximadamente normal. EXERCÍCIOS1. Nosso interesse é estimar a média de consumo em quilômetros por litro de um novo modelo de carro da montadora líder do mercado de carros populares. Sabendo que a população tem distribuição normal e o consumo em quilômetros por litros de uma amostra aleatória de 16 carros do novo modelo de carro é igual a 14,8 com desvio padrão igual a 2, pede-se estimar o valor da média da população com intervalo de confiança igual a 95%.2. Um analista de um departamento de pessoal seleciona aleatoriamente os registros de 16 empregados horistas e calcula a taxa média de salário, R$ 7,50. Supõe-se que os salários na firma sejam distribuídos normalmente. Se o desvio-padrão dos salários é conhecido, e igual a R$1,00, estimar a taxa média de salário na firma usando um intervalo de confiança de 90%.3. O diâmetro médio de uma amostra de 12 bastões cilíndricos incluídos em um carregamento é de 2,350 mm com um desvio padrão de 0,050 mm. A distribuição dos diâmetros de todos os bastões incluídos no carregamento é aproximadamente Página 32
  • 33. CENTRO DE ENSINO SUPERIOR DOM ALBERTOnormal. Determinar o intervalo de confiança de 99% para estimar o diâmetro médiode todos os bastões incluídos no carregamento. 2.2.9 Estimação da proporção numa população É semelhante à de médias populacionais. p = proporção populacional x p= proporção amostral de x sucessos em uma mostra de tamanho n. n Estimativa de intervalos p–E<p<p+E ou p= ±E Margem de erro da estimativa p p.(1 − p ) E = z. n Para população finita p.(1 − p ) N − n E = z. . n N −1 Determinação do tamanho da amostra z 2 . p.(1 − p ) n= E2 Quando o tamanho N da população for conhecido Página 33
  • 34. CENTRO DE ENSINO SUPERIOR DOM ALBERTO N .z 2 . p.(1 − p ) n= p.(1 − p ).z 2 + ( N − 1).E 2 Caso não se conheça informações sobre a proporção amostral p, devemossupor que p = 0,5.Exemplos:1. Determine um intervalo de confiança de 98% para a verdadeira proporçãopopulacional, se x = 50 e n = 200.2) Qual o tamanho da amostra necessário para estimar a verdadeira porcentagempopulacional a menos de 4% usando um intervalo de confiança de 90%. É razoávelsuspeitar que o verdadeiro valor seja 0,30 ou menos.3) Qual o tamanho da amostra necessário para obter um intervalo de 95% de confiançapara a proporção populacional, se o erro tolerável é 0,08? EXERCÍCIOS1. Em recente pesquisa levada a efeito junto a 200 habitantes de uma grande cidade, 30 se mostraram favoráveis ao restabelecimento da pena de morte. a) Construa um intervalo de 99% de confiança para a verdadeira proporção dos habitantes daquela cidade favoráveis à pena capital. b) Que se pode dizer quanto ao tamanho do erro máximo para esse intervalo de confiança?2. Uma biblioteca pública deseja estimar a percentagem de livros de seu acervo publicados até 2000. Qual deve ser o tamanho da amostra aleatória para se ter 90% de confiança de ficar a menos de 5 % da verdadeira proporção? Página 34
  • 35. CENTRO DE ENSINO SUPERIOR DOM ALBERTO3. Uma amostra aleatória de 40 homens trabalhando num grande projeto de construção revelou que 6 não estavam usando capacetes protetores. Construa um intervalo de 99% de confiança para a verdadeira proporção dos que estão usando capacetes neste projeto.4. Uma amostra de 50 bicicletas de um estoque de 400 bicicletas acusou 7 com pneus vazios. Construa um intervalo de 99% de confiança para a população das bicicletas com pneus vazios.5. Selecionado aleatoriamente e pesquisados 500 universitários, verificou-se que 135 deles têm computador pessoal. a) Determine a estimativa pontual da verdadeira proporção de todos os universitários que têm computador pessoal. b) Determine um intervalo de 95% de confiança para a verdadeira proporção de todos os universitários que têm computador pessoal.6. Se uma faculdade tem 1200 alunos, qual tamanho de amostra necessário para estimar a proporção de alunos que são a favor da pena de morte? Use um erro amostral de 2% e índice de confiança de 95%.7. Um estudo de saúde envolve 1000 mortes selecionadas aleatoriamente, dentre as quais 331 causadas por doenças cardíacas. a) Com os dados amostrais, construa um intervalo de confiança de 99% para a proporção de todas as mortes causadas por doenças cardíacas. b) Utilizando os dados amostrais como piloto, determine o tamanho da amostra necessário para estimar a proporção de todas as mortes causadas por doenças cardíacas. Admita um nível de confiança de 98%, em que o erro da estimativa não supere 1%.8. Uma papelaria gostaria de calcular o valor médio do preço dos cartões de cumprimentos existente em seu estoque. Uma amostra aleatória de 20 cartões indica um valor médio de $1,67 e um desvio padrão de $0,32. Se o número de cartões no estoque da loja fosse igual a 300: a) Desenvolva uma estimativa, com intervalo de confiança de 95%, do valor médio de todos os cartões no estoque da loja. Página 35
  • 36. CENTRO DE ENSINO SUPERIOR DOM ALBERTO b) Desenvolva uma estimativa, com intervalo de confiança de 95%, do valor médio da população de todos os cartões que estão no estoque. c) Compare os resultados obtidos em (a) e (b). d) Quais seriam a respostas para (b) e (c) se a loja tivesse 500 cartões no estoque?9. Uma concessionária de automóveis gostaria de calcular a proporção de consumidores que ainda possuem o carro que compraram 5 anos atrás. Uma amostra aleatória de 200 consumidores, selecionados a partir dos registros da concessionária de automóveis, indica que 82 consumidores ainda possuem os carros que compraram a 5 anos. Suponha que a população consiste em 4.000 proprietários: a) Desenvolva uma estimativa, com intervalo de confiança de 95%, da verdadeira proporção de clientes que ainda possuem os carros que adquiriram cinco anos atrás. b) E se a população fosse de 6.000 proprietários?10. O gerente de um banco em uma cidade pequena gostaria de determinar a proporção de seus correntistas que recebem salários semanais. Uma amostra aleatória de 100 correntistas é selecionada, e 30 afirmam que são pagas semanalmente. Se o banco possui 1.000 correntistas: a) Desenvolva uma estimativa, com intervalo de confiança de 90%, para a verdadeira proporção de correntistas que recebem salários semanais. b) Determine o tamanho da amostra necessário para se calcular a vida útil média, em uma margem de ± 0,05, com 90% de confiança. c) Quais seriam as respostas para (a) e (b), se o banco tivesse 2.000 depositantes?11. Observe os dados do problema do refrigerante (exercício 7 da 1ª lista de exercícios de Estimativas). Se a população consiste em 2.000 garrafas: a) Desenvolva uma estimativa, com intervalo de confiança de 95% da quantidade média de refrigerante em cada garrafa do total da população. b) Determine o tamanho da amostra necessário para se calcular a quantidade média da população, em uma margem de ±0,01, com 95% de confiança. c) Quais seriam suas respostas para (a) e (b) se a população consistisse em 1.000 garrafas? Página 36
  • 37. CENTRO DE ENSINO SUPERIOR DOM ALBERTO12. Uma pesquisa é planejada para determinar as despesas médicas anuais das famílias dos empregados de uma grande empresa. A gerência da empresa deseja ter 95% de confiança de que a média da amostra está correta, e de ± 0,05 da média real das despesas médias familiares. Um estudo-piloto indica que o desvio padrão pode ser calculado como sendo igual a $400. Que tamanho da amostra seria necessário se a companhia tivesse 3.000 empregados? Página 37
  • 38. CENTRO DE ENSINO SUPERIOR DOM ALBERTO Tabela de Distribuição t de Student 75% 80% 90% 95% 96% 98% 99% I.C. 15% 10% 5% 2,5% 2% 1% 0,5% BilateralGL 30% 20% 10% 5% 4% 2% 1% Unilateral 1 1,9626 3,0777 6,3137 12,7062 15,8945 31,8210 63,6559 2 1,3862 1,8856 2,9200 4,3027 4,8487 6,9645 9,9250 3 1,2498 1,6377 2,3534 3,1824 3,4819 4,5407 5,8408 4 1,1896 1,5332 2,1318 2,7765 2,9985 3,7469 4,6041 5 1,1558 1,4759 2,0150 2,5706 2,7565 3,3649 4,0321 6 1,1342 1,4398 1,9432 2,4469 2,6122 3,1427 3,7074 7 1,1192 1,4149 1,8946 2,3646 2,5168 2,9979 3,4995 8 1,1081 1,3968 1,8595 2,3060 2,4490 2,8965 3,3554 9 1,0997 1,3830 1,8331 2,2622 2,3984 2,8214 3,249810 1,0931 1,3722 1,8125 2,2281 2,3593 2,7638 3,169311 1,0877 1,3634 1,7959 2,2010 2,3281 2,7181 3,105812 1,0832 1,3562 1,7823 2,1788 2,3027 2,6810 3,054513 1,0795 1,3502 1,7709 2,1604 2,2816 2,6503 3,012314 1,0763 1,3450 1,7613 2,1448 2,2638 2,6245 2,976815 1,0735 1,3406 1,7531 2,1315 2,2485 2,6025 2,946716 1,0711 1,3368 1,7459 2,1199 2,2354 2,5835 2,920817 1,0690 1,3334 1,7396 2,1098 2,2238 2,5669 2,898218 1,0672 1,3304 1,7341 2,1009 2,2137 2,5524 2,878419 1,0655 1,3277 1,7291 2,0930 2,2047 2,5395 2,860920 1,0640 1,3253 1,7247 2,0860 2,1967 2,5280 2,845321 1,0627 1,3232 1,7207 2,0796 2,1894 2,5176 2,831422 1,0614 1,3212 1,7171 2,0739 2,1829 2,5083 2,818823 1,0603 1,3195 1,7139 2,0687 2,1770 2,4999 2,807324 1,0593 1,3178 1,7109 2,0639 2,1715 2,4922 2,797025 1,0584 1,3163 1,7081 2,0595 2,1666 2,4851 2,787426 1,0575 1,3150 1,7056 2,0555 2,1620 2,4786 2,778727 1,0567 1,3137 1,7033 2,0518 2,1578 2,4727 2,770728 1,0560 1,3125 1,7011 2,0484 2,1539 2,4671 2,763329 1,0553 1,3114 1,6991 2,0452 2,1503 2,4620 2,756430 1,0547 1,3104 1,6973 2,0423 2,1470 2,4573 2,7500 Página 38
  • 39. CENTRO DE ENSINO SUPERIOR DOM ALBERTO TESTE DE HIPÓTESES Muitas vezes o pesquisador tem alguma idéia ou conjectura, sobre o comportamento deuma variável. Neste caso, o planejamento de pesquisa deve ser de tal forma que permita, com osdados amostrais, testar a veracidade de suas idéias sobre a população em estudo. Considera-seque a população seja o mundo real e as idéias sejam hipóteses de pesquisa, que poderão sertestadas por técnicas estatísticas denominadas de testes de hipóteses ou testes de significância. Neste sentido, Teste de Hipótese consiste em analisar as diferenças entre os resultadosobtidos, e verificar se a hipótese levantada condiz com a realidade. Em outras palavras, o objetivo do teste estatístico de hipótese é fornecer ferramentasque nos permitam validar ou recusar uma hipótese através dos resultados da amostra. Na intenção de confirmar ou rejeitar uma hipótese, temos nominá-la (nula oualternativa). Para escrever as hipóteses nula e alternativa, transforme a formulação verbal daalegação sobre um parâmetro populacional em uma formulação matemática.Exemplos:1. Escreva a formulação matemática da alegação. Estabeleça as hipóteses nula e alternativa eidentifique qual delas representa a alegação. (a) Uma fabrica de bateria para automóveis alega que a vida média de um determinado modelo é de 74 meses. (b) Uma estação de rádio alega que sua proporção de audiência local é maior do que 39%. • Tipos de erros Não importando qual das hipóteses representa a alegação, você começará sempre umteste de hipótese assumindo que a condição de igualdade na hipótese nula é verdadeira. Assim,quando realizar um teste de hipótese, você deve tomar uma das duas decisões: rejeitar ahipótese nula ou não rejeitar a hipótese nula. Uma vez que sua decisão baseia-se em informação incompleta (uma amostra em vez detoda a população), há sempre a possibilidade de se tomar a decisão errada. Então, quando se realiza um teste de hipótese, podem-se cometer dois tipos de erro: Errotipo I ou Erro tipo II. Veja a Tabela. Realidade H 0 verdadeira H 0 falsa Aceitar H 0 Decisão correta Erro tipo II Decisão Rejeitar H 0 Erro tipo I Decisão Correta Observe que o erro tipo I só poderá acontecer se for rejeitado H 0 e o erro tipo II quandofor aceito H 0 . Página 39
  • 40. CENTRO DE ENSINO SUPERIOR DOM ALBERTOExemplo:O limite do Departamento de Agricultura para a contaminação por salmonela em frangos é de 20%.Uma granja alega que seus frangos estão dentro do limite. Você realiza um teste de hipótese paradeterminar se a alegação da granja é verdadeira. Quando ocorrerão os erros do tipo I e II? Qual delesé o mais grave? • Estatística de teste: é uma estatística amostral, ou um valor baseado nos dadosamostrais. Utiliza-se uma estatística de teste para tomar uma decisão sobre a rejeição da hipótesenula. Dado por x −µ zt = σ n • Região crítica: é o conjunto de todos os valores da estatística de teste que levam àrejeição da hipótese nula. • Nível de significância: é probabilidade de rejeitar a hipótese nula quando ela éverdadeira. Denota por α . • Valor crítico: é o valor, ou valores, que separa(m) a região crítica dos valores daestatística de teste que não levam à rejeição da hipótese nula. Dependem da natureza dahipótese nula, da distribuição amostral, e do nível de significância α . INTERPRETANDO UMA DECISÃO Exemplo 1. Você realiza um teste de hipótese para a alegação a seguir: Umauniversidade alega que a proporção de seus estudantes graduados em 4 anos é de 82%.( H 0 contém a afirmação original) a) Interpretar a decisão quando for rejeitada a hipótese nula . Há evidências suficientes para garantir a rejeição da hipótese de que a proporção dosestudantes da Universidade graduados em 4 anos é de 82%. b) Interpretar a decisão quando NÃO for rejeitada a hipótese nula (aceita). Não há evidência suficiente para garantir a rejeição da afirmação de que a proporçãodos estudantes da Universidade graduados em 4 anos é de 82%. Exemplo 2. Você realiza um teste de hipótese para a alegação a seguir: Umauniversidade alega que a proporção de seus estudantes graduados em 4 anos é superior a 82%.( H 0 NÃO contém a afirmação original) a) Interpretar a decisão quando for rejeitada a hipótese nula. Os dados amostrais apóiam a afirmação de que a proporção dos estudantes daUniversidade graduados em 4 anos é superior 82%. b) Interpretar a decisão quando NÃO for rejeitada a hipótese nula (aceita). Não há evidência amostral para apoiar a afirmação de que a proporção dos estudantesda Universidade graduados em 4 anos é superior 82%. Quando se aceita ou rejeita uma hipótese, estamos semprefalando da hipótese nula, mesmo que esta não tenha a alegação. Página 40
  • 41. CENTRO DE ENSINO SUPERIOR DOM ALBERTO Teste de hipótese quando  O desvio-padrão populacional σ é conhecido Usamos a distribuição normal (Tabela z) para comparar com a estatística de teste zt : x −µ zt = σ n  O desvio-padrão populacional σ é DESCONHECIDO (n pequeno) Usamos a distribuição t de Student (Tabela t) com Grau de Liberdade n − 1 para comparar com a estatística de teste tt : x −µ tt = s n Exemplo 1. Os dois registros dos últimos anos de um colégio atestam para os calouros admitidosuma nota média de 115 com desvio-padrão de 20 pontos (teste vocacional). Para testar a hipótesede que a média de uma nova turma é a mesma, tirou-se, ao acaso, uma amostra de 20 notasobtendo-se média de 118 no teste. Com um nível de significância α = 5% , faça o teste. Exemplo 2. Um empresário desconfia que o tempo médio de espera para atendimento de seusclientes é superior a 20 minutos. Para testar essa hipótese ele entrevistou 20 pessoas e questionouquanto tempo demoravam a serem atendidas. O resultado dessa pesquisa aparece a seguir:x = 21,8 min. e s = 1, 40 min. Teste as hipóteses usando α = 0,05 3.1. Teste de hipótese sobre uma proporção Segue os mesmos procedimentos para testes com médias, sendo que a estatística deteste é dada por p− p ˆ zt = p (1 − p ) n Página 41
  • 42. CENTRO DE ENSINO SUPERIOR DOM ALBERTO Exemplo 1. Em um teste de gosto de consumidores, 100 bebedores regulares de Pepsireceberam amostras cegas de Coca e Pepsi; 48 deles preferiram a Coca. Ao nível de significânciade 0,05, teste a afirmação de que a Coca é preferida por 50% dos bebedores de Pepsi queparticipam de tais testes. Exemplo 2: Um jornal afirma que aproximadamente 25% dos adultos em sua área de circulação sãoanalfabetos segundo os padrões governamentais. Teste essa afirmação contra a alternativa de quea verdadeira percentagem não é 25% e use um nível de significância de 5%. Uma amostra de 740pessoas indica que apenas 20 % seriam consideradas analfabetas segundo os mesmos padrões.Atividades 1. A Farmácia X vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de eficiência de 380 horas. a) Teste a alegação da companhia, contra a alternativa que a duração é inferior a 400 horas, ao nível de 0,01, se o desvio padrão amostral é de 60 horas. b) Repita a questão anterior sabendo que o desvio padrão populacional é 90 horas. 2. Um fabricante de automóveis alega que seus carros tamanho-família, quando equipados com um tipo de pára-choques absorvente, podem suportar um choque de frente a uma velocidade de 10 mph, com um custo de conserto de no máximo R$ 100, Uma amostra de seis carros, examinada por um escritório independente de pesquisa, revelou um custo médio de reparo de R$ 150 por carro. O desvio padrão amostral foi de R$ 30. Admita que a distribuição dos custos de conserto seja aproximadamente normal. Há indício suficiente para rejeitar a alegação da firma, ao nível de 0,01? 3. Uma companhia de seguros iniciará uma campanha extensa de propaganda para vender apólices de seguro de vida, se verificar que a quantia média segurada por família é inferior a R$10.000,00. Tomou-se uma amostra aleatória de 50 famílias, que acusaram seguro médio de R$9.600,00, com desvio padrão de R$1.000,00. a) Com base na evidência amostral, a alegação deve ser aceita ou rejeitada, ao nível de 0,05? b) A conclusão a que se chegou, utilizando a evidência amostral, pode estar errada? Qual seria o tipo de erro? Por quê? 4. Uma cervejaria distribui um tipo de cerveja sem álcool em garrafas que indicam o conteúdo de 940 ml. Um Instituto de pesquisa seleciona 50 dessas garrafas, mede seu conteúdo e obtém uma média amostral de 934 ml, com desvio-padrão de 22 ml. Ao nível de significância de 0,01, teste a afirmação do Instituto de que a companhia está ludibriando os consumidores. Página 42
  • 43. CENTRO DE ENSINO SUPERIOR DOM ALBERTO5. O gerente de controle de qualidade de certa empresa considera que a fabricação de secretárias eletrônicas como “fora de controle” quando a taxa geral de defeitos excede 4%. O teste de uma amostra de 150 secretárias eletrônicas acusou 9 defeituosas, o que corresponde a uma porcentagem de 6% de defeitos. O gerente de produção alega tratar-se apenas de uma diferença casual, e que a produção realmente está sob controle, não sendo necessária qualquer medida corretiva. Teste a afirmação do gerente de produção, ao nível de 0,05 de significância.6. As condições de mortalidade de uma região são tais que a proporção de nascidos que sobrevivem até 60 anos é de 0,6. Testar essa hipótese ao nível de 2%, se em 1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos. (R = rejeita-se H 0 )7. A compra de uma lavanderia operada por moedas está sendo levada em conta por um empresário. O atual proprietário declara que, nos últimos 5 anos, a receita era de $675 diários, com um desvio padrão de $75. Uma amostra de 30 dias selecionados revela uma receita diária média de $650. a) Há evidências de que a declaração do atual proprietário não seja válida, para um nível de significância de 0,01? b) Qual seria a resposta em (a) se o desvio padrão fosse de $100?8. Suponha que o diretor de produção de uma fábrica de tecidos precise determinar se uma nova máquina está produzindo determinado tipo de tecido de acordo com as especificações do fabricante, que indicam que o tecido deve ter resistência de rompimento de pelo menos 70 libras e um desvio padrão de 3,5 libras. Uma amostra de 36 peças revela uma média da amostra igual a 69,7 libras. (Use nível de significância de 0,01) a) Há evidências de que a máquina não está atendendo às especificações, em termos da resistência de rompimento? b) Qual seria a resposta em (a) se a média da amostra fosse 69 libras?9. O diretor pessoal de uma grande companhia de seguros está interessado em reduzir a taxa de rotatividade de funcionários no setor de processamento de dados no primeiro ano de emprego. Registros do passado indicam que 25% dos novos contratados nesta área não estão mais empregados no final de um ano. Novos e extensos métodos de treinamento são implementados para uma amostra de 150 funcionários do processamento de dados. Ao final do período de um ano, 29 desses 150 indivíduos não estão mais empregados. No nível de significância de 0,01, há evidências de que a proporção de funcionários de processamento de dados que tenham passado pelo novo treinamento e não estejam mais empregados seja diferente de 25%? Página 43
  • 44. CENTRO DE ENSINO SUPERIOR DOM ALBERTO 3.2. Teste para a diferença entre duas médias Caso 1: Desvios-padrão populacionais σ 1 e σ 2 conhecidos x1 − x2 zt = σ 12 σ2 2 + n1 n2 Caso 2: Desvio padrão populacionais σ 1 e σ 2 desconhecidos ( n ≤ 30 ) Estatística calculada: Escolher o menor grau de liberdade GL n1 − 1 ou GL n2 − 1 = = x1 − x2 tt = s12 s2 2 + n1 n2 Hipóteses: H 0 : µ1 = µ2 ou H 0 : µ1 ≤ µ2 ou H 0 : µ1 ≥ µ2 H1 : µ1 ≠ µ2 H1 : µ1 > µ2 H1 : µ1 < µ2 3.3. Teste para a diferença entre duas proporções populacionais p 1 e p 2 Estatística calculada: p1 − p2 ˆ ˆ x1 + x2 zt = sendo p= e q = 1− p p⋅q p⋅q n1 + n2 + n1 n2 Exemplo: Numa pesquisa sobre possuidores de videocassete, encontrou-se 120 nas 200 casaspesquisadas do bairro X e 240 nas 500 pesquisas do bairro Y. Há diferença entre a proporção dospossuidores de videocassete nos dois bairros? Use α = 10% Página 44
  • 45. CENTRO DE ENSINO SUPERIOR DOM ALBERTO EXERCÍCIOS1. Duas pesquisas independentes sobre salários em duas áreas metropolitanas muito separadas revelaram a seguinte informação sobre o salário médio de operadores de equipamento pesado: A B x 6,50/h 7,00/h s 1,50/h 1,00/h n 25 25 Pode-se concluir, ao nível de 0,05, que os salários médios sejam diferentes?2. Uma empresa de pesquisa de opinião seleciona, aleatoriamente, 300 eleitores de Santa Catarina e 400 do Rio Grande do Sul, e pergunta a cada um deles votará ou não num determinado candidato nas próximas eleições, 75 eleitores de SC e 120 do RS responderam afirmativo. Há diferença entre as proporções de eleitores favoráveis ao candidato nesses dois estados? Use α= 5%3. Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa revista, acontecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de significância, os homens e as mulheres apreciam igualmente a revista? 4. O gerente do departamento de crédito de uma companhia de petróleo gostaria de determinar se a renda mensal média de possuidores de cartões de crédito é igual a $75. Um auditor seleciona uma amostra aleatória de 50 contas e descobre que a média é $83,40 com um desvio padrão da amostra de $23,65. Utilizando o nível de significância de 0,05, o auditor deveria concluir que há evidências de que a renda média seja diferente de $75? 5. Um fabricante de televisores declarou, no rótulo de garantia, que, no passado, não mais de 10% de seus aparelhos de televisão precisou de reparo durante os 2 primeiros anos de funcionamento. Para testar a validade dessa declaração, uma agência de testes do governo seleciona uma amostra de 100 aparelhos e descobre que 14 aparelhos necessitaram de algum reparo nos primeiro 2 anos de funcionamento. Utilizando um nível de significância de 0,01, a declaração do fabricante é válida? Página 45
  • 46. Página 46
  • 47. Página 47
  • 48. Página 48
  • 49. Médias de 15 universitarios no Ensino Médio e na Universidade Notas no Notas naAluno Ens. Médio Universidade x.y x2 y2 (x) (y) 1 80 1,0 80 6400 1,0 2 82 1,0 82 6724 1,0 3 84 2,1 4 85 1,4 5 87 2,1 6 88 1,7 Página 49
  • 50. 7 88 2,0 8 89 3,5 9 90 3,1 10 91 2,4 11 91 2,7 12 92 3,0 13 94 3,9 14 96 3,6 15 98 4,0 Total 1335 37,5r= 4.3 Coeficiente de determinação ou de explicação (r2) O coeficiente de determinação serve para avaliar a qualidade do ajuste de ummodelo. Ele indica quantos por cento a variação explicada pela regressão representa davariação total.Coeficiente de determinação = r2Campo de variação de 0 ≤ r2 ≤ 1 ou 0 ≤ r2 ≤ 100%Interpretação de r2 • Se r2 = 1, todos os pontos observados estão sobre a reta estimada. Neste caso, as variações de y são 100% explicadas pelas variações de x, através da função especificada, não havendo desvios em torno da função estimada. • Se r2 = 0, conclui-se que as variaveis de y são puramente aleatorias e a inclusão da variável x no modelo não trara informação alguma sobre as variações de y. Página 50
  • 51. 4.6. Relação entre o coeficiente de correlação e a regressão Página 51
  • 52. O valor de r e um valor sem dimensão, que apenas fornece uma idéia da relação linearentre duas variáveis. No caso da regressão, alem de se ter uma idéia da relação entre as duasvariáveis, também se encontra uma equação que pode ser usada para fornecer estimativas (oupredições). OBS: 1. Se não há correlação linear significativa, não use a equação de regressão para fazer estimativas. 2. Ao aplicar a equação da regressão para predições, mantenha-se dentro do âmbito dos dados amostrais. 3. Uma equação de regressão baseada em dados passados não e necessariamente valida hoje. 4. Não devemos fazer predições sobre uma população diferente daquela de onde provem os dados amostrais. Exemplo: Os dados abaixo representam uma amostra de 8 ursos machos com seus respectivospesos e comprimentos.Comprimento x (cm) 134 171 182 182 186 173 185 94Peso y (kg) 36 156 188 158 119 163 150 15Para esses dados: a) Construa um diagrama de dispersão. b) Determine o coeficiente de correlação e de determinação. Interprete-os. c) Ajuste ma reta de mínimos quadrados com a qual possamos calcular o peso dos ursos em função de sua altura. Página 52
  • 53. Exercícios: Calcule a correlação existente entre as variáveis apresentadas: 1) Preços e Quantidades vendidas do mesmo produto verificados em vários locais de vendas: Preços (x) Quant. Vend(y) X² Y² X.Y 12 41 13 22 14,5 15 15 10 12,6 44 ∑ 2) Dados os valores x (5, 10,20, 8, 4, 6, 12 e 15) e y (27, 46,73, 40, 30, 28, 46 e 59), nesta ordem respectivamente, e supondo que x expresse os valores de aquisição de plano de saúde numa determinada empresa e y a produtividade de seus empregados, determine a correlação entre os dados. 3) Uma amostra aleatória de 10 alunos foi retirada de uma sala de 98 alunos. Deste foi verificado as notas de matemática e estatística: Matemática 5,0 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 Estatística 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 Existe correlação entre as duas disciplinas? Qual?4) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura Temperatura (°C) 10 15 20 25 30 Comprimento 1.003 1.005 1.010 1.011 1.014 (mm) Determine: a) O coeficiente de correlação; b) A reta ajustada a essa correlação; c) O valor estimado do comprimento da barra para a temperatura de 18°C d) O valor estimado do comprimento da barra para a temperatura de 35°C5) Calcular a propaganda necessária para se alcançar uma venda prevista R$ 3.200,00 para 2007, sabendo-se que existe forte correlação direta entre as vendas e propaganda. Anos Vendas (x) Propag (y) x.y x² 2002 1.500 75 2003 1.900 118 2004 2.300 155 2005 2.450 215 2006 2.700 230 Página 53

×