Probabilidade

4,291 views
4,150 views

Published on

Estat´ıstica ´e a ciˆencia da aprendizagem a partir dos dados. Em geral,
fazemos levantamentos de dados para estudar e compreender caracter´ısticas
de uma popula¸c˜ao. Por exemplo, um grande banco, querendo lan¸car um
novo produto, precisa conhecer o perfil socioeconˆomico dos seus clientes e,
nesse caso, a popula¸c˜ao de interesse ´e formada pelos clientes de todas as
agˆencias do banco. A Federa¸c˜ao das Ind´ustrias do Estado do Rio de Janeiro
– FIRJAN – mede o grau de confian¸ca dos empres´arios industriais atrav´es de
uma pesquisa junto `as empresas industriais, sendo a popula¸c˜ao de interesse,
aqui, o conjunto das empresas industriais do estado do Rio de Janeiro. Com
esses dois exemplos apenas, j´a podemos ver que o conceito de popula¸c˜ao de
uma pesquisa estat´ıstica ´e mais amplo, n˜ao se restringindo a seres humanos;
ela ´e definida exatamente a partir dos objetivos da pesquisa. Mais precisamente,
popula¸c˜ao ´e o conjunto de elementos para os quais se deseja estudar
populac¸˜ao determinada(s) caracter´ıstica(s).

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
4,291
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
126
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Probabilidade

  1. 1. Probabilidade e Estatística Volume único Ana Maria Lima de Farias Apoio:
  2. 2. Fundação Cecierj / Consórcio Cederj Rua Visconde de Niterói, 1364 – Mangueira – Rio de Janeiro, RJ – CEP 20943-001 Tel.: (21) 2334-1569 Fax: (21) 2568-0725 Presidente Masako Oya Masuda Vice-presidente Mirian Crapez Coordenação do Curso de Matemática UFF - Regina Moreth UNIRIO - Luiz Pedro San Gil JutucaMaterial Didático Departamento de ProduçãoELABORAÇÃO DE CONTEÚDO EDITORA CAPAAna Maria Lima de Farias Tereza Queiroz Eduardo BordoniCOORDENAÇÃO DE DESENVOLVIMENTO REVISÃO TIPOGRÁFICA PRODUÇÃO GRÁFICAINSTRUCIONAL Cristina Freixinho Fábio Rapello AlencarCristine Costa Barreto Elaine Bayma COORDENAÇÃO DE PRODUÇÃO Jorge Moura PROGRAMAÇÃO VISUAL Marcelo Freitas ILUSTRAÇÃO Ana Maria Lima de Farias Eduardo Bordoni Copyright © 2008, Fundação Cecierj / Consórcio Cederj Nenhuma parte deste material poderá ser reproduzida, transmitida e gravada, por qualquer meio eletrônico, mecânico, por fotocópia e outros, sem a prévia autorização, por escrito, da Fundação. F224m Farias, Ana Maria Lima de. Probabilidade e Estatística. v. único / Ana Maria Lima de Farias. – Rio de Janeiro: Fundação CECIERJ, 2009. 373p.; 21 x 29,7 cm. ISBN: 978-85-7648-500-1 1. Probabilidade. 2. Análise combinatória. 3. Teorema de Bayes. 3. Variáveis aleatórias discretas. I. Título.2009/2 CDD: 519.5 Referências Bibliográficas e catalogação na fonte, de acordo com as normas da ABNT.
  3. 3. Governo do Estado do Rio de Janeiro Governador Sérgio Cabral Filho Secretário de Estado de Ciência e Tecnologia Alexandre CardosoUniversidades ConsorciadasUENF - UNIVERSIDADE ESTADUAL DO UFRJ - UNIVERSIDADE FEDERAL DONORTE FLUMINENSE DARCY RIBEIRO RIO DE JANEIROReitor: Almy Junior Cordeiro de Carvalho Reitor: Aloísio TeixeiraUERJ - UNIVERSIDADE DO ESTADO DO UFRRJ - UNIVERSIDADE FEDERAL RURALRIO DE JANEIRO DO RIO DE JANEIROReitor: Ricardo Vieiralves Reitor: Ricardo Motta MirandaUFF - UNIVERSIDADE FEDERAL FLUMINENSE UNIRIO - UNIVERSIDADE FEDERAL DO ESTADOReitor: Roberto de Souza Salles DO RIO DE JANEIRO Reitora: Malvina Tania Tuttman
  4. 4. Probabilidade e Estatística Volume únicoSUMÁRIO Aula 1 – Apresentação de dados – parte 1 ___________________________ 7 Aula 2 – Apresentação de dados – parte 2 __________________________ 27 Aula 3 – Medidas de posição ____________________________________ 47 Aula 4 – Medidas de dispersão __________________________________ 73 Aula 5 – Probalidade – conceitos básicos ___________________________ 89 Aula 6 – Revisão de análise combinatória ________________________ 109 Aula 7 – Probabilidade ______________________________________ 127 Aula 8 – Probabilidade condicional e independência de eventos ________ 153 Aula 9 – Teorema da probabilidade total e teorema de Bayes __________ 185 Aula 10 – Variáveis aleatórias discretas___________________________ 217 Aula 11 – Esperança e variância de variáveis aleatórias discretas________ 237 Aula 12 – Algumas distribuições discretas_________________________ 257 Aula 13 – Variáveis aleatórias contínuas __________________________ 289 Aula 14 – A distribuição normal ________________________________ 319 Aula 15 – A distribuição normal – conclusão _______________________ 337 Bibliografia _______________________________________________ 373
  5. 5. Apresenta¸˜o de dados – parte 1 ca AULA 1 Aula 1 – Apresenta¸˜o de dados – parte 1 ca Nesta aula, vocˆ aprender´: e a • os conceitos b´sicos de popula¸˜o e amostra de uma pesquisa estat´ a ca ıstica; • a distin¸˜o entre vari´veis qualitativas e vari´veis quantitativas; ca a a • a construir distribui¸˜es de freq¨ˆncias para vari´veis qualitativas co ue a e quantitativas discretas; • a construir gr´ficos de colunas e de setores para representar dados qua- a litativos e quantitativos discretos. Pesquisa estat´ ıstica - conceitos b´sicos aPopula¸˜o e amostra ca Estat´ ıstica ´ a ciˆncia da aprendizagem a partir dos dados. Em geral, e efazemos levantamentos de dados para estudar e compreender caracter´ ısticasde uma popula¸˜o. Por exemplo, um grande banco, querendo lan¸ar um ca cnovo produto, precisa conhecer o perfil socioeconˆmico dos seus clientes e, onesse caso, a popula¸˜o de interesse ´ formada pelos clientes de todas as ca eagˆncias do banco. A Federa¸˜o das Ind´ strias do Estado do Rio de Janeiro e ca u– FIRJAN – mede o grau de confian¸a dos empres´rios industriais atrav´s de c a euma pesquisa junto `s empresas industriais, sendo a popula¸˜o de interesse, a caaqui, o conjunto das empresas industriais do estado do Rio de Janeiro. Comesses dois exemplos apenas, j´ podemos ver que o conceito de popula¸˜o de a cauma pesquisa estat´ ıstica ´ mais amplo, n˜o se restringindo a seres humanos; e aela ´ definida exatamente a partir dos objetivos da pesquisa. Mais precisa- emente, popula¸˜o ´ o conjunto de elementos para os quais se deseja estudar ca e ¸˜ populacaodeterminada(s) caracter´ ıstica(s). Embora tenham popula¸˜es bastante distintas, essas duas pesquisas cotˆm em comum o fato de os resultados desejados serem obtidos a partir de edados levantados junto a um subconjunto da popula¸˜o – uma amostra. ca amostraH´ v´rias raz˜es para se trabalhar com pesquisas por amostragem – custo e a a otempo, em geral, s˜o as mais comuns. Mas, al´m de serem mais baratas e a er´pidas, as pesquisas por amostragem, se bem planejadas, podem fornecer a 7 CEDERJ
  6. 6. Apresenta¸˜o de dados – parte 1 ca resultados quase t˜o precisos quanto aqueles fornecidos por pesquisas cen- acenso sit´rias, em que todos os elementos da popula¸˜o s˜o investigados. Exemplos a ca a cl´ssicos de pesquisa censit´ria s˜o os Censos Demogr´ficos realizados a cada a a a a dez anos no Brasil e em outros pa´ ıses. O objetivo desses censos ´ levantar e informa¸˜es sobre toda a popula¸˜o do pa´ de modo a fornecer subs´ co ca ıs, ıdios para os governantes definirem as pol´ ıticas p´ blicas. u Vari´veis qualitativas e quantitativas a Nas pesquisas estat´ ısticas, as caracter´ ısticas sobre as quais queremos obter informa¸˜o s˜o chamadas vari´veis. Em uma pesquisa domiciliar so- ca a a bre emprego e renda, algumas vari´veis de interesse s˜o sexo, ra¸a, grau de a a c instru¸˜o e valor dos rendimentos do morador. Em uma pesquisa sobre o ca estado nutricional dos brasileiros, o peso e a altura dos moradores de cada domic´ da amostra foram medidos. Para o acompanhamento da atividade ılio industrial no Rio de Janeiro, a FIRJAN obt´m informa¸˜es junto `s empre- e co a sas industriais sobre tipo de atividade econˆmica, n´ mero de empregados, o u ´ n´ mero de horas trabalhadas, valor da folha de pagamento. E importante u diferenciar entre vari´veis qualitativas e vari´veis quantitativas. Sexo, ra¸a, a a c religi˜o e atividade econˆmica de uma empresa s˜o exemplos de vari´veis a o a a qualitativas. J´ valor dos rendimentos, peso, altura, n´ mero de empregados, a u valor da folha de pagamento s˜o exemplos de vari´veis quantitativas. Pode- a a mos ver, ent˜o, que as vari´veis qualitativas descrevem caracter´ a a ısticas dos ´ variaveis qualitativas elementos de uma popula¸˜o, enquanto as vari´veis quantitativas mensuram ca a caracter´ ısticas desses elementos. ´ variaveis quantitativas As vari´veis quantitativas, por sua vez, podem ser discretas ou cont´ a ınuas. Quando a vari´vel puder assumir qualquer valor num´rico em um determi- a e nado intervalo de varia¸˜o, ela ser´ uma vari´vel cont´ ca a a ınua. Essas vari´veis a resultam normalmente de medi¸˜es: peso, altura, dosagem de hemoglobina, co renda etc. A interpreta¸˜o desse tipo de vari´vel leva ` no¸˜o de valor aproxi- ca a a ca mado, pois n˜o existe instrumento de medi¸˜o capaz de fornecer precis˜o a ca a absoluta na informa¸˜o. Assim, quando uma balan¸a mostra o peso de uma ca c pessoa como 65,5 kg, esse valor, na verdade, ´ uma aproxima¸˜o para qual- e ca quer valor entre, digamos, 65,495 e 65,505 kg. Por outro lado, a vari´vel a quantitativa discreta s´ poder´ assumir valores pertencentes a um conjunto o a enumer´vel; os valores normalmente s˜o obtidos atrav´s de algum processo a a e de contagem. Alguns exemplos s˜o: n´ mero de filhos de um casal, n´ mero a u u de empregados de uma firma de contabilidade etc.CEDERJ 8
  7. 7. Apresenta¸˜o de dados – parte 1 ca AULA 1 Atividade 1.1 O texto a seguir foi extra´ da p´gina do IBOPE na Internet: ıdo awww.ibope.com.br. A´ temos parte da descri¸˜o da pesquisa sociodemogr´fica ı ca arealizada por esse instituto. Identifique as vari´veis pesquisadas, classifican- ado-as como qualitativas ou quantitativas. “O Levantamento Socioeconˆmico (LSE) ´ a pesquisa do IBO- o e PE M´ ıdia que mapeia as caracter´ısticas sociais, demogr´ficas e a econˆmicas das fam´ o ılias das principais regi˜es metropolitanas do o pa´ Oferece tamb´m outros dados essenciais para tra¸ar a es- ıs. e c trat´gia de marketing para um produto. Com uma base de dados e estendida em rela¸˜o `s outras pesquisas do IBOPE M´ ca a ıdia, o LSE serve de base para outros estudos. S˜o levantados dados sobre a condi¸˜o do domic´ entrevis- a ca ılio tado (condi¸˜o da rua, tipo de im´vel) e sobre a condi¸˜o socioe- ca o ca conˆmica do domic´ (informa¸˜es sobre renda e classifica¸˜o o ılio co ca econˆmica). Tamb´m s˜o pesquisados o n´ mero de pessoas no o e a u domic´ ılio, a presen¸a e a quantidade de crian¸as e adolescentes, c c a idade, grau de instru¸˜o e condi¸˜o de atividade do chefe da ca ca casa e da dona-de-casa. A pesquisa levanta tamb´m dados sobre e a posse de bens, como geladeira, m´quina de lavar, autom´vel, a o r´dio, computador, telefone, entre outros, e acesso a servi¸os de a c m´ıdia, como TV por Assinatura, Internet, etc.” Apresenta¸˜o de dados qualitativos ca Vamos considerar o seguinte exemplo fict´ ıcio, mas veross´ımil. A dire¸˜o cade uma empresa est´ estudando a possibilidade de fazer um seguro sa´ de para a useus funcion´rios e respectivos familiares. Para isso, ela faz um levantamento ajunto a seus 500 funcion´rios, obtendo informa¸˜o sobre sexo, estado civil, a caidade, n´ mero de dependentes e sal´rio. Como s˜o 500 funcion´rios, temos u a a aque achar uma forma de resumir os dados. Nesta aula vocˆ ir´ aprender e aa resumir dados qualitativos em forma de uma distribui¸˜o (ou tabela) de cafreq¨ˆncia e tamb´m em forma gr´fica. Vocˆ ver´ que os gr´ficos comple- ue e a e a amentam a apresenta¸˜o tabular. ca 9 CEDERJ
  8. 8. Apresenta¸˜o de dados – parte 1 ca Distribui¸˜es de freq¨ˆncia co ue Consideremos inicialmente a vari´vel qualitativa sexo. O que interessa a saber sobre essa vari´vel n˜o ´ que Jo˜o ´ do sexo masculino e Maria ´ do a a e a e e sexo feminino, mas, sim, quantos funcion´rios e quantas funcion´rias h´ na a a a empresa. Esse resultado pode ser resumido em uma tabela ou distribui¸˜o ca de freq¨ˆncias da seguinte forma: ue Sexo N´ mero de Funcion´rios u a Masculino 270 Feminino 230 Total 500 Os n´ meros 270 e 230 resultaram da contagem das freq¨ˆncias de u ue ocorrˆncia de cada uma das categorias da vari´vel sexo. Essa contagem ´ e a e tamb´m chamada de freq¨ˆncia simples absoluta ou simplesmente freq¨ˆncia. e ue ue frequˆncia simples ¨e absoluta O total de 500 ´ obtido somando-se o n´ mero de homens e de mulheres. e u ´ E interessante tamb´m expressar esses resultados em forma relativa, e ou seja, considerar a freq¨ˆncia de cada categoria em rela¸˜o ao total: ue ca frequˆncia relativa ¨e 270 = 0, 54 500 ou seja, 54% dos funcion´rios da empresa s˜o do sexo masculino e a a 230 = 0, 46 500 ou seja, 46% dos funcion´rios s˜o mulheres. A Tabela 1.1 apresenta a vers˜o a a a completa. Tabela 1.1: Distribui¸˜o do n´ mero de funcion´rios por sexo ca u a Sexo Freq¨ˆncia Simples ue Absoluta Relativa Masculino 270 0,54 Feminino 230 0,46 Total 500 1,00 Note que a soma das freq¨ˆncias relativas ´ sempre 1, enquanto a soma ue e das freq¨ˆncias absolutas deve ser igual ao n´ mero total de elementos sendo ue u investigados.CEDERJ 10
  9. 9. Apresenta¸˜o de dados – parte 1 ca AULA 1 De maneira an´loga, obter´ a ıamos a Tabela 1.2 para a vari´vel estado acivil. Note que, a´ a freq¨ˆncia relativa est´ apresentada em forma per- ı, ue acentual, ou seja, multiplicada por 100. Por exemplo, para os casados temos: 280 × 100 = 0, 56 × 100 = 56% 500 Em geral, essa ´ a forma mais usual de se apresentarem as freq¨ˆncias e uerelativas e neste caso, a soma deve dar 100%. Tabela 1.2: Distribui¸˜o do n´ mero de funcion´rios por estado civil ca u a Estado Civil Freq¨ˆncia Simples ue Absoluta Relativa % Solteiro 125 25,0 Casado 280 56,0 Divorciado 85 17,0 Vi´ vo u 10 2,0 Total 500 100,0 Exemplo 1.1 Consideremos que, na situa¸˜o descrita anteriormente, os dados tenham casido levantados por departamento, para depois serem totalizados. Para o De-partamento de Recursos Humanos, foram obtidas as seguintes informa¸˜es:co 11 CEDERJ
  10. 10. Apresenta¸˜o de dados – parte 1 ca Nome Sexo Estado civil N´ mero de dependentes u Jo˜o da Silva a M Casado 3 Pedro Fernandes M Vi´ vo u 1 Maria Freitas F Casada 0 Paula Gon¸alves c F Solteira 0 Ana Freitas F Solteira 1 Luiz Costa M Casado 3 Andr´ Souza e M Casado 4 Patr´ Silva ıcia F Divorciada 2 Regina Lima F Casada 2 Alfredo Souza M Casado 3 Margarete Cunha F Solteira 0 Pedro Barbosa M Divorciado 2 Ricardo Alves M Solteiro 0 M´rcio Rezende a M Solteiro 1 Ana Carolina Chaves F Solteira 0 Para pequenos conjuntos de dados, podemos construir a tabela ` m˜o a a e para isso precisamos contar o n´ mero de ocorrˆncias de cada categoria de u e cada uma das vari´veis. Varrendo o conjunto de dados a partir da primeira a linha, podemos ir marcando as ocorrˆncias da seguinte forma: e Masculino |||||||| Solteiro |||||| Feminino ||||||| Casado |||||| Divorciado || Vi´ vo u | Obtemos, ent˜o, as seguintes tabelas: a Sexo Freq¨ˆncia Simples ue Estado Civil Freq¨ˆncia Simples ue Absoluta Relativa % Absoluta Relativa % Masculino 8 53,33 Solteiro 6 40,00 Feminino 7 46,67 Casado 6 40,00 Total 15 100,0 Divorciado 2 13,33 Vi´ vo u 1 6,67 Total 15 100,00CEDERJ 12
  11. 11. Apresenta¸˜o de dados – parte 1 ca AULA 1Arredondamento de n´meros u No exemplo anterior, a divis˜o de algumas freq¨ˆncias absolutas pelo a uetotal de 15 resultou em d´ ızimas. Nesses casos, torna-se necess´rio arredondar aos resultados, mas esse arredondamento deve ser feito com cautela para seevitarem problemas tais como a soma n˜o ser igual a 1 ou 100%. a A primeira etapa no processo de arredondamento consiste em se decidiro n´ mero de casas decimais desejado. Em geral, freq¨ˆncias relativas per- u uecentuais s˜o apresentadas com, no m´ximo, 2 casas decimais. Isso significa a aque temos que descartar as demais casas decimais. Existe a seguinte regrade arredondamento: Regra: Arredondamento de n´ meros u Quando o primeiro algarismo a ser suprimido ´ menor ou igual a 4 (ou e seja, ´ igual a 0, 1, 2, 3 ou 4), o ultimo algarismo a ser mantido permanece e ´ inalterado. Quando o primeiro algarismo a ser suprimido ´ igual a 5, 6, 7, e 8 ou 9, o ultimo algarismo a ser mantido ´ acrescido de 1. ´ e Na distribui¸˜o de freq¨ˆncias da vari´vel sexo, temos os seguintes re- ca ue asultados: 8 × 100 = 53, 33333 . . . 15 7 × 100 = 46, 66666 . . . 15No primeiro caso, o primeiro algarismo a ser suprimido ´ 3; logo, o ultimo e ´algarismo a ser mantido (3) n˜o se altera e o resultado ´ 53,33. No segundo a ecaso, o primeiro algarismo a ser suprimido ´ 6; logo, o ultimo algarismo a ser e ´mantido (6) deve ser acrescido de 1 e o resultado ´ 46,67. Tente sempre usar eessa regra em seus arredondamentos; com ela, vocˆ evitar´ erros grosseiros. e a Na apresenta¸˜o de tabelas de freq¨ˆncias relativas, ´ poss´ que es- ca ue e ıvelsas freq¨ˆncias n˜o somem 100%, ou seja, ´ poss´ ue a e ıvel que, ao somarmos asfreq¨ˆncias relativas, obtenhamos resultados como 99,9% ou 100,01%. Esses uepequenos erros s˜o devidos a arredondamentos e nem sempre ´ poss´ evit´- a e ıvel alos; no entanto, aceita-se implicitamente que a soma das freq¨ˆncias seja ue100%. Veja a tabela de freq¨ˆncias apresentada na Figura 1.7, relativa ` ue asolu¸˜o do Exerc´ 1- a soma das freq¨ˆncias relativas ´ 99,99%. Se tra- ca ıcio ue ebalh´ssemos com 3 casas decimais, obedecendo ` regra de arredondamento, a aa soma daria 100,001. Isso n˜o significa que as contas estejam erradas! a 13 CEDERJ
  12. 12. Apresenta¸˜o de dados – parte 1 ca Atividade 1.2 Para o Departamento Financeiro, obteve-se a seguinte informa¸˜o sobre ca o sexo dos 23 funcion´rios: a M F F M M M F F M M M M M F M M F F M M M F F onde M = Masculino e F = Feminino. Construa uma tabela de freq¨ˆncias ue para esses dados. Gr´ficos a As distribui¸˜es de freq¨ˆncia para dados qualitativos tamb´m podem co ue e ser ilustradas graficamente atrav´s de gr´ficos de colunas ou gr´ficos de se- e a a tores, tamb´m conhecidos como gr´ficos de pizza. Na Figura 1.1 temos os e a gr´ficos de coluna e de setores para os dados da Tabela 1.2, referentes ao a estado civil dos funcion´rios. No gr´fico de colunas, a altura de cada coluna a a representa a freq¨ˆncia da respectiva classe e o gr´fico pode ser constru´ ue a ıdo ´ grafico de colunas com base nas freq¨ˆncias absolutas ou relativas. Para diferenciar um do ue outro, coloca-se no t´ ıtulo do eixo o tipo de freq¨ˆncia utilizada. Note que, ue no eixo horizontal, n˜o h´ escala, uma vez que a´ se representam as categorias a a ı da vari´vel, que devem ser equi-espa¸adas. a c ´ grafico de setores No gr´fico de setores, a freq¨ˆncia de cada categoria ´ representada pelo a ue e tamanho (ˆngulo) do setor (ou fatia da pizza). Para construir um gr´fico de a a setores ` m˜o, vocˆ precisa de um compasso para fazer um c´ a a e ırculo de raio qualquer. Em seguida, trace um raio qualquer no c´ ırculo e a partir da´ ı, comece a marcar os raios de acordo com os ˆngulos de cada setor, utilizando a um transferidor. Para determinar o ˆngulo de cada setor, vocˆ deve usar a a e seguinte regra de proporcionalidade: o ˆngulo total – 360o – corresponde ao a n´ mero total de observa¸˜es; o ˆngulo de cada setor corresponde ` freq¨ˆncia u co a a ue da respectiva classe. Dessa forma, vocˆ obt´m a seguinte regra de trˆs para e e e os solteiros: 360o x = ⇒ x = 90o 500 125 Esses gr´ficos podem ser constru´ a ıdos facilmente com aux´ de progra- ılio mas de computador, como, por exemplo, o programa de planilhas Excel da Microsoft R .CEDERJ 14
  13. 13. Apresenta¸˜o de dados – parte 1 ca AULA 1 Figura 1.1: Distribui¸˜o do n´ mero de funcion´rios por estado civil. ca u a Atividade 1.3 Construa os gr´ficos de setores e de colunas para os dados da aAtividade 1.2. Apresenta¸˜o de dados quantitativos discretos ca Quando uma vari´vel quantitativa discreta assume poucos valores dis- atintos, ´ poss´ construir uma distribui¸˜o de freq¨ˆncias da mesma forma e ıvel ca ueque fizemos para as vari´veis qualitativas. A diferen¸a ´ que, em vez de ter- a c emos categorias nas linhas da tabela, teremos os distintos valores da vari´vel. aContinuando com o nosso exemplo, vamos trabalhar agora com a vari´vel an´ mero de dependentes. Suponha que alguns funcion´rios n˜o tenham de- u a apendentes e que o n´ mero m´ximo de dependentes seja 7. Obter´ u a ıamos, ent˜o, aa seguinte distribui¸˜o de freq¨ˆncias: ca ue 15 CEDERJ
  14. 14. Apresenta¸˜o de dados – parte 1 ca N´ mero de u Freq¨ˆncia Simples ue dependentes Absoluta Relativa % 0 120 24,0 1 95 19,0 2 90 18,0 3 95 19,0 4 35 7,0 5 30 6,0 6 20 4,0 7 15 3,0 Total 500 100,0 O processo de constru¸˜o ´ absolutamente o mesmo mas, dada a na- ca e tureza quantitativa da vari´vel, ´ poss´ acrescentar mais uma informa¸˜o a e ıvel ca ` tabela. Suponha, por exemplo, que a empresa esteja pensando em limi- a tar o seu projeto a 4 dependentes, de modo que funcion´rios com mais de 4 a dependentes ter˜o que arcar com as despesas extras. Quantos funcion´rios a a est˜o nessa situa¸˜o? Para responder a perguntas desse tipo, ´ costume a ca e acrescentar ` tabela de freq¨ˆncias uma coluna com as freq¨ˆncias acumu- a ue ue frequˆncia acumulada ¨e ladas. Essas freq¨ˆncias s˜o calculadas da seguinte forma: para cada valor da ue a vari´vel (n´ mero de dependentes), contamos quantas ocorrˆncias correspon- a u e dem a valores menores ou iguais a esse valor. Por exemplo, valores da vari´vel a menores ou iguais a 0 correspondem aos funcion´rios sem dependentes. Logo, a a freq¨ˆncia acumulada para o valor 0 ´ igual ` freq¨ˆncia simples: 120. ue e a ue Analogamente, valores da vari´vel menores ou iguais a 1 correspondem aos a funcion´rios sem dependentes mais os funcion´rios com 1 dependente. Logo, a a a freq¨ˆncia acumulada para o valor 1 ´ igual a 120 + 95 = 215. Para o ue e valor 2, a freq¨ˆncia acumulada ´ igual a 120 + 95 + 90 = 215 + 90 = 305. ue e Repetindo esse procedimento, obtemos a Tabela 1.3. Note que a´ acres- ı centamos tamb´m as freq¨ˆncias acumuladas em forma percentual. Essas e ue freq¨ˆncias s˜o calculadas como a propor¸˜o da freq¨ˆncia acumulada em ue a ca ue rela¸˜o ao total; por exemplo, ca 435 87, 0 = × 100 500CEDERJ 16
  15. 15. Apresenta¸˜o de dados – parte 1 ca AULA 1 Tabela 1.3: Distribui¸˜o de freq¨ˆncias para o n´ mero de dependentes ca ue u N´ mero de u Freq¨ˆncia Simples ue Freq¨ˆncia Acumulada ue dependentes Absoluta Relativa % Absoluta Relativa % 0 120 24,0 120 24,0 1 95 19,0 215 43,0 2 90 18,0 305 61,0 3 95 19,0 400 80,0 4 35 7,0 435 87,0 5 30 6,0 465 93,0 6 20 4,0 485 97,0 7 15 3,0 500 100,0 Total 500 100,0 Atividade 1.4 Construa a distribui¸˜o de freq¨ˆncia para o n´ mero de dependentes ca ue udos funcion´rios do Departamento de Recursos Humanos, conforme dados no aExemplo 1.1. A representa¸˜o gr´fica da distribui¸˜o de freq¨ˆncias de uma vari´vel ca a ca ue aquantitativa discreta pode ser feita atrav´s de um gr´fico de colunas. A unica e a ´diferen¸a nesse caso ´ que no eixo horizontal do gr´fico ´ representada a c e a eescala da vari´vel quantitativa e tal escala deve ser definida cuidadosamente ade modo a representar corretamente os valores. Na Figura 1.2 temos ogr´fico de colunas para o n´ mero de dependentes dos 500 funcion´rios. a u a Figura 1.2: Distribui¸˜o do n´ mero de dependentes de 500 funcion´rios. ca u a 17 CEDERJ
  16. 16. Apresenta¸˜o de dados – parte 1 ca Embora n˜o seja incorreto, n˜o ´ apropriado representar dados quan- a a e titativos discretos em um gr´fico de setores, uma vez que, nesse gr´fico, n˜o a a a ´ poss´ representar a escala dos dados. e ıvel Atividade 1.5 Construa o gr´fico de colunas para representar a distribui¸˜o de fre- a ca q¨ˆncias obtida na Atividade 1.4. ue Resumo da Aula Ao final desta aula, vocˆ deve ser capaz de compreender os seguintes e conceitos: • Popula¸˜o – conjunto de elementos para os quais se deseja estudar ca determinada(s) caracter´ ıstica(s). • Amostra – subconjunto de uma popula¸˜o. ca • Pesquisa censit´ria - pesquisa em que toda a popula¸˜o ´ investigada. a ca e • Pesquisa por amostragem – pesquisa em que apenas uma amostra da popula¸˜o ´ investigada. ca e • Vari´vel – caracter´ a ıstica de uma popula¸˜o que desejamos estudar. ca • Vari´vel qualitativa – vari´vel que descreve uma caracter´ a a ıstica dos ele- mentos de uma popula¸˜o.ca • Vari´vel quantitativa – vari´vel que mensura uma caracter´ a a ıstica dos elementos de uma popula¸˜o. ca • Vari´vel quantitativa discreta – vari´vel cujos poss´ a a ıveis valores formam um conjunto enumer´vel. a • Vari´vel quantitativa cont´ a ınua – vari´vel cujos poss´ a ıveis valores per- tencem a um intervalo [a, b]. Nesta aula, vocˆ tamb´m aprendeu a resumir dados de vari´veis quali- e e a tativas e de vari´veis quantitativas discretas atrav´s de tabelas de freq¨ˆncia a e ue ´ e gr´ficos de setores e de colunas. E importante saber os seguintes conceitos: aCEDERJ 18
  17. 17. Apresenta¸˜o de dados – parte 1 ca AULA 1• Freq¨ˆncia simples absoluta – ´ a contagem do n´ mero de elementos ue e u pertencentes a uma determinada categoria de uma vari´vel qualita- a tiva ou n´ mero de elementos que assumem determinado valor de uma u vari´vel quantitativa discreta. a• Freq¨ˆncia simples relativa – representa a participa¸ao percentual de ue c˜ cada categoria ou valor no total de observa¸˜es. co• Freq¨ˆncia acumulada absoluta – para cada valor de uma vari´vel ue a quantitativa discreta, ´ o n´ mero de ocorrˆncias (elementos) correspon- e u e dentes a valores menores ou iguais a esse valor.• Freq¨ˆncia acumulada relativa – ´ a freq¨ˆncia acumulada em forma ue e ue percentual, calculada como uma participa¸˜o no total de observa¸˜es. ca coExerc´ ıcios1. Na Tabela 1.4 temos informa¸˜es sobre o sexo, a mat´ria predileta co e (Portuguˆs, Matem´tica, Hist´ria, Geografia ou Ciˆncias) no 2o grau e a o e e a nota (n´ mero de quest˜es certas) em um teste de m´ ltipla escolha u o u com 10 quest˜es de matem´tica, ministrado no primeiro dia de aula o a dos calouros de Administra¸˜o de uma universidade (dados fict´ ca ıcios). (a) Classifique as vari´veis envolvidas. a (b) Construa a tabela de freq¨ˆncias apropriada para cada uma das ue vari´veis. a (c) Construa gr´ficos apropriados para ilustrar as distribui¸˜es de a co freq¨ˆncia. ue 19 CEDERJ
  18. 18. Apresenta¸˜o de dados – parte 1 ca Tabela 1.4: Dados sobre sexo, mat´ria predileta e nota de alunos e Sexo Predileta Nota Sexo Predileta Nota Sexo Predileta Nota Sexo Predileta Nota F H 5 M M 2 M H 3 F M 8 M M 8 M G 4 M M 5 M P 5 F P 8 M G 9 F P 5 M G 6 F H 6 M M 7 F G 5 F M 7 M C 5 M M 1 M C 7 M P 5 M H 6 F P 8 M H 4 F M 5 F M 8 F G 5 F M 7 F M 5 F P 4 M G 9 F P 7 F P 9 F H 2 M P 5 F M 6 M M 8 M C 6 F M 8 M G 6 F P 8 F G 6 M H 9 2. Na Tabela 1.5 temos dados sobre o consumo de refrigerantes no Brasil em 2005, segundo dados da Associa¸˜o Brasileira das Ind´strias de Re- ca u frigerantes e de Bebidas N˜o Alco´licas. Construa um gr´fico apropri- a o a ado para ilustrar esses dados. Tabela 1.5: Refrigerantes – Participa¸˜o dos sabores – 2005 ca Refrigerantes % Colas 51,1 Guaran´ a 24,4 Laranja 10,9 Lim˜o a 5,9 Uva 3,2 Tuti Fruti 1,1 Tˆnica o 0,7 C´ ıtrico 0,1 Ma¸˜ ca 0,5 Outros sabores 2,1 Total 100,0 Fonte: ABIR - www.abir.org.brCEDERJ 20
  19. 19. Apresenta¸˜o de dados – parte 1 ca AULA 13. Na Tabela 1.6 temos as freq¨ˆncias acumuladas do n´ mero de sin- ue u istros por ap´lice de seguro do ramo Autom´veis. Complete a tabela, o o calculando as freq¨ˆncias simples absolutas e relativas e tamb´m as ue e freq¨ˆncias acumuladas relativas. ue Tabela 1.6: N´ mero de sinistros por ap´lice, para o Exerc´ 3 u o ıcio N´ mero de N´ mero de u u sinistros ap´lices o 0 2913 ≤1 4500 ≤2 4826 ≤3 4928 ≤4 50004. Para a seguinte not´ ıcia, extra´ do jornal Folha de S. Paulo, construa ıda um gr´fico para ilustrar o texto no segundo par´grafo da not´ a a ıcia. Dentro de dez anos, 90% do mercado automobil´ ıstico mundial estar´ nas a m˜os de meia d´ zia de conglomerados. A previs˜o consta de estudo pro- a u a duzido pela consultoria especializada britˆnica Autopolis, que d´ assessoria a a t´cnica a montadoras que est˜o instaladas no Reino Unido. e a Dados levantados pela Autopolis mostram que, hoje, a concentra¸˜o de ca mercado j´ ´ grande. Cerca de 75% do setor ´ dominado por somente seis ae e conglomerados, liderados por General Motors (22,8%), Ford (16,8%), Volk- swagen (9,4%), Toyota (9,2%, incluindo Daihatsu), Reanult-Nissan (8,7%) e Daimler-Chrysler (8,3%). Os outros 24,8% do mercado s˜o dominados por a uma infinidade de empresas pequenas e m´dias, como Fiat, BMW, Peugeot e e Honda, entre outras.Solu¸˜o das Atividades ca Atividade 1.1 ´ E poss´ identificar as seguintes vari´veis: ıvel a• Condi¸˜o do domic´ – vari´vel qualitativa. ca ılio a• Condi¸˜o da rua – vari´vel qualitativa. ca a 21 CEDERJ
  20. 20. Apresenta¸˜o de dados – parte 1 ca • Tipo de im´vel – vari´vel qualitativa. o a • Renda – pode ser qualitativa se for perguntada a faixa ou quantitativa, se for perguntada a renda exata; a primeira op¸˜o ´ a mais prov´vel ca e a para esse tipo de pesquisa. • Classifica¸˜o econˆmica – vari´vel qualitativa. ca o a • N´ mero de pessoas – vari´vel quantitativa. u a • Presen¸a de crian¸as – vari´vel qualitativa. c c a • N´ mero de crian¸as – vari´vel quantitativa discreta. u c a • Presen¸a de adolescentes – vari´vel qualitativa. c a • N´ mero de adolescentes – vari´vel quantitativa discreta. u a • Idade do chefe e da dona-de-casa – pode ser quantitativa, caso se per- gunte a idade exata, ou qualitativa, caso se identifique a faixa et´ria. a • Grau de instru¸˜o do chefe e da dona-de-casa – vari´vel qualitativa. ca a • Condi¸˜o de atividade do chefe – vari´vel qualitativa. ca a • Presen¸a de geladeira, m´quina de lavar, etc. – vari´veis qualitativas c a a do tipo Sim/N˜o. a • Acesso a servi¸os de m´ c ıdia – vari´veis qualitativas do tipo Sim/N˜o. a a Atividade 1.2 A distribui¸˜o ´ dada na tabela a seguir. ca e Sexo Freq¨ˆncia Simples ue Absoluta Relativa % Masculino 14 60,87 Feminino 9 39,13 Total 23 100,00CEDERJ 22
  21. 21. Apresenta¸˜o de dados – parte 1 ca AULA 1 Atividade 1.3 Veja a Figura 1.3. Figura 1.3: Distribui¸˜o dos funcion´rios do Depto Financeiro por sexo. ca a Atividade 1.4 Veja a Tabela 1.7Tabela 1.7: Distribui¸˜o do n´ mero de dependentes dos funcion´rios do Depto de RH ca u a N´ mero de u Freq¨ˆncia Simples ue Freq¨ˆncia Acumulada ue dependentes Absoluta Relativa % Absoluta Relativa % 0 5 33,33 5 33,33 1 3 20,00 8 53,33 2 3 20,00 11 73,33 3 3 20,00 14 93,33 4 1 6,67 15 100,00 Total 15 100,00 23 CEDERJ
  22. 22. Apresenta¸˜o de dados – parte 1 ca Atividade 1.5 Veja a Figura 1.4. Figura 1.4: Distribui¸˜o do n´ mero de dependentes dos funcion´rios do Depto de RH. ca u a Solu¸˜o dos Exerc´ ca ıcios 1. Vari´veis qualitativas: Sexo e mat´ria predileta. a e Vari´vel quantitativa discreta: nota – n´ mero de quest˜es certas. a u o Veja as Figuras 1.5, 1.6, 1.7 com as tabelas e gr´ficos para essas a vari´veis. a Freqüência Simples Sexo Absoluta Relativa % Feminino Masculino Masculino 21 50 21 21 Feminino 21 50 Total 42 100 Figura 1.5: Distribui¸˜o dos alunos de Administra¸˜o por sexo. ca caCEDERJ 24
  23. 23. Apresenta¸˜o de dados – parte 1 ca AULA 1 Figura 1.6: Distribui¸˜o dos alunos de Administra¸˜o por mat´ria predileta. ca ca e Figura 1.7: Distribui¸˜o das notas dos alunos de Administra¸˜o. ca ca2. Veja a Figura 1.8. Figura 1.8: Distribui¸˜o da preferˆncia de sabor de refrigerantes. ca e 25 CEDERJ
  24. 24. Apresenta¸˜o de dados – parte 1 ca 3. No exerc´ s˜o dadas as freq¨ˆncias acumuladas simples, que vamos ıcio a ue representar pela letra F . Para obtermos as freq¨ˆncias absolutas sim- ue ples, que vamos representar pela letra f , devemos notar o seguinte: para o menor valor (zero), a freq¨ˆncia simples ´ igual ` acumulada, ue e a ou seja: f1 = F1 = 2913 Para o segundo valor, temos: f1 + f2 = F2 ⇒ f2 = F2 − F1 ⇒ f2 = 4500 − 2913 = 1587 Para o terceiro valor, temos: f1 +f2 +f3 = F3 ⇒ F2 +f3 = F3 ⇒ f3 = F3 −F2 ⇒ f3 = 4826−4500 = 326 De forma an´loga, obtemos que a f4 = F4 − F3 = 4928 − 4826 = 102f5 = F5 − F4 = 5000 − 4928 = 72 Obtemos, ent˜o, a seguinte tabela: a N´ mero u N´ mero de ap´lices u o de Freq¨ˆncia Simples Freq¨ˆncia Acumulada ue ue sinistros Absoluta Relativa Absoluta Relativa 0 2913 58,26 2913 58,26 1 1587 31,74 4500 90,00 2 326 6,52 4826 96,52 3 102 2,04 4928 98,56 4 72 1,44 5000 100,00 Total 5000 100,00 4. O gr´fico apresentado na Figura 1.9 ´ um gr´fico de colunas. Havendo a e a disponibilidade de se usar o recurso de cores, ´ poss´ usar o gr´fico e ıvel a de setores tamb´m. e Figura 1.9: Concentra¸˜o do mercado automobil´ ca ıstico.CEDERJ 26
  25. 25. Apresenta¸˜o de dados - parte 2 ca AULA 2 Aula 2 – Apresenta¸˜o de dados - parte 2 ca Nesta aula, vocˆ aprender´: e a • a construir distribui¸˜es de freq¨ˆncias agrupadas para vari´veis quan- co ue a titativas discretas e cont´ ınuas; • a construir histogramas e pol´ ıgonos de freq¨ˆncia para representar dis- ue tribui¸˜es de freq¨ˆncias agrupadas; co ue • a construir gr´ficos de linha e diagramas de ramos e folhas. a Apresenta¸˜o de dados quantitativos - conclus˜o ca aVari´veis quantitativas discretas a Na aula anterior, vocˆ aprendeu a construir distribui¸˜es de freq¨ˆncias e co uepara vari´veis discretas com poucos valores. No exemplo ali apresentado, h´ a aduas vari´veis quantitativas discretas: n´ mero de dependentes e idade. a uA diferen¸a entre elas ´ que a idade pode assumir um n´ mero maior de va- c e ulores, o que resultaria em uma tabela grande, caso decid´ ıssemos relacionartodos os valores. Al´m disso, em geral n˜o ´ necess´rio apresentar a in- e a e aforma¸˜o em tal n´ de detalhamento. Por exemplo, para as seguradoras ca ıvelde planos de sa´ de, as faixas et´rias importantes - aquelas em que h´ reajuste u a apor idade - s˜o 0 a 18; 19 a 23; 24 a 28; 29 a 33; 34 a 38; 39 a 43; 44 a 48; 49 aa 53; 54 a 58 e 59 ou mais. Sendo assim, podemos agrupar os funcion´rios asegundo essas faixas et´rias e construir uma tabela de freq¨ˆncias agrupadas a ue tabela de frequˆncias ¨eda mesma forma que fizemos para o n´ mero de dependentes, s´ que agora u o agrupadascada freq¨ˆncia corresponde ao n´ mero de funcion´rios na respectiva faixa ue u aet´ria. Na Tabela 2.1 temos a tabela resultante. a 27 CEDERJ
  26. 26. Apresenta¸˜o de dados - parte 2 ca Tabela 2.1: Distribui¸˜o de freq¨ˆncia da idade de 500 funcion´rios ca ue a Faixa Freq¨ˆncia Simples ue Freq¨ˆncia Acumulada ue Et´ria Absoluta Relativa % Absoluta Relativa % a 19 − 23 1 0,2 1 0,2 24 − 28 23 4,6 24 4,8 29 − 33 103 20,6 127 25,4 34 − 38 246 49,2 373 74,6 39 − 43 52 10,4 425 85,0 44 − 48 50 10,0 475 95,0 49 − 53 25 5,0 500 100,0 Total 500 100,0 Atividade 2.1 Na Tabela 2.2 temos as informa¸˜es sobre idade e sal´rio para os 15 co a funcion´rios do Departamento de Recursos Humanos. Construa uma tabela a de freq¨ˆncias para a idade, levando em conta as mesmas faixas et´rias uti- ue a lizadas acima. Tabela 2.2: Idade e sal´rio dos funcion´rios do Departamento de RH a a Nome Idade Sal´rio a Jo˜o da Silva a 36 6300 Pedro Fernandes 51 5700 Maria Freitas 26 4500 Paula Gon¸alves c 25 3800 Ana Freitas 29 3200 Luiz Costa 53 7300 Andr´ Souza e 42 7100 Patr´ Silva ıcia 38 5600 Regina Lima 35 6400 Alfredo Souza 45 7000 Margarete Cunha 26 3700 Pedro Barbosa 37 6500 Ricardo Alves 24 4000 M´rcio Rezende a 31 5100 Ana Carolina Chaves 29 4500CEDERJ 28
  27. 27. Apresenta¸˜o de dados - parte 2 ca AULA 2Vari´veis quantitativas cont´ a ınuas Para as vari´veis quantitativas cont´ a ınuas, devemos tamb´m trabalhar ecom distribui¸˜es de freq¨ˆncias agrupadas. O processo de constru¸˜o ´ i- co ue ca edˆntico ao visto para as vari´veis discretas, mas aqui devemos tomar um e acuidado especial na constru¸˜o das classes. A escolha dos limites das classes cadeve ser feita com base na natureza, valores e unidade de medida dos dados.As unicas regras que tˆm que ser seguidas s˜o as seguintes. ´ e a Regra: Defini¸˜o das classes em uma distribui¸˜o de freq¨ˆncias agru- ca ca ue padas. 1. As classes tˆm que ser exaustivas, isto ´, todos os elementos devem e e pertencer a alguma classe. 2. As classes tˆm que ser mutuamente exclusivas, isto ´, cada elemento e e tem que pertencer a uma unica classe. ´ O primeiro passo ´ definir o n´ mero de classes desejado; esse n´ mero, e u ude preferˆncia, deve estar entre 5 e 25. Em seguida, devemos determinar a eamplitude dos dados, ou seja, o intervalo de varia¸˜o dos valores observados cada vari´vel em estudo. a Defini¸˜o ca A amplitude de um conjunto de dados, representada por ∆total , ´ definida e como a diferen¸a entre os valores m´ximo e m´ c a ınimo: ∆total = VM´x − VM´ a ın (2.1) Se queremos trabalhar com classes de mesmo comprimento (e essa ´ euma op¸˜o bastante comum), para determinar esse comprimento, temos que cadividir a amplitude total pelo n´ mero de classes desejado. No entanto, para ugarantir a inclus˜o dos valores m´ a ınimo e m´ximo, podemos, como regra geral, ausar o seguinte procedimento: considere o primeiro m´ ltiplo do n´ mero de u uclasses maior que o valor da amplitude e use esse n´ mero como a nova uamplitude. Por exemplo se a amplitude ´ 28 e queremos trabalhar com 5 eclasses, vamos considerar 30 como a nova amplitude. Dividindo esse valor 29 CEDERJ
  28. 28. Apresenta¸˜o de dados - parte 2 ca pelo n´ mero de classes, obtemos o comprimento de cada classe e os limites u de classe podem ser obtidos somando-se o comprimento de classe a partir do valor m´ınimo dos dados. Continuando com o nosso exemplo, o comprimento de classe ´ 30 ÷ 5 = 6; se o valor m´ e ınimo dos dados ´ 4, ent˜o os limites de e a classe ser˜o a 4 + 6 = 10 10 + 6 = 16 16 + 6 = 22 22 + 6 = 28 28 + 6 = 34 e as classes ser˜o: a [4, 10) [10, 16) [16, 22) [22, 28) [28, 34) Note o tipo de intervalo utilizado: para incluir o valor m´ınimo (4) na primeira classe, o intervalo tem que ser fechado na parte inferior: [4. Se fech´ssemos a o intervalo no limite superior, o 10 estaria inclu´ na primeira classe e, ıdo portanto, n˜o poderia estar na segunda classe. Isso resultaria em [4, 10] como a a primeira classe e (10, 16) como a segunda classe. Ou seja, as duas primeiras classes estariam definidas de forma diferente, o que n˜o ´ conveniente, pois a e dificulta a leitura da tabela. Assim, ´ prefer´ incluir o 10 na segunda classe, e ıvel o que resulta nas classes apresentadas anteriormente. Exemplo 2.1 Suponha que entre os 500 funcion´rios da nossa empresa, o menor a sal´rio seja 2800 e o maior sal´rio seja de 12400. Para agrupar os dados a a em 5 classes devemos fazer o seguinte: ∆total = VM´x − VM´ = a ın 12400 − 2800 = 9600 Pr´ximo m´ ltiplo de 5 = o u 9605 9605 Comprimento de classe = = 1921 5CEDERJ 30
  29. 29. Apresenta¸˜o de dados - parte 2 ca AULA 2Os limites de classe, ent˜o, s˜o: a a 2800 2800 + 1921 = 4721 4721 + 1921 = 6642 6642 + 1921 = 8563 8563 + 1921 = 10484 10484 − 1921 = 12405e as classes podem ser definidas como [2800, 4721) (2800 inclu´ ıdo; 4721 exclu´ıdo) [4721, 6642) (4721 inclu´ ıdo; 6642 exclu´ıdo) [6642, 8563) (6642 inclu´ ıdo; 8563 exclu´ıdo) [8563, 10484) (8563 inclu´ ıdo; 10484 exclu´ıdo) [10484, 12405) (10484 inclu´ıdo; 12405 exclu´ ıdo) Essa ´ uma regra que resulta em classes corretamente definidas, mas enem sempre as classes resultantes s˜o apropriadas ou convenientes. No exem- aplo acima, poderia ser prefer´ trabalhar com classes de comprimento 2000, ıveldefinindo o limite inferior dos dados como 2500. Isso resultaria nas classes[2500,4500); [4500,6500); [6500,8500); [8500, 10500) e [10500, 12500), que s˜o aclasses corretas e mais f´ceis de ler. a Atividade 2.2 Construa uma distribui¸˜o de freq¨ˆncias agrupadas em 5 classes de ca uemesmo comprimento para os dados de sal´rios da Tabela 2.2. aHistogramas e pol´ ıgonos de freq¨ˆncia ue O histograma e o pol´ ıgono de freq¨ˆncias s˜o gr´ficos usados para repre- ue a asentar uma distribui¸˜o de freq¨ˆncias simples de uma vari´vel quantitativa ca ue acont´ ınua. Um histograma ´ um conjunto de retˆngulos com bases sobre um eixo e a histogramahorizontal dividido de acordo com os comprimentos de classes, centros nospontos m´dios das classes e ´reas proporcionais ou iguais `s freq¨ˆncias. e a a ueVamos ilustrar a constru¸˜o de um histograma usando como exemplo a dis- catribui¸˜o de freq¨ˆncia dos dados sobre sal´rios da Atividade 2.2, reproduzida ca ue ana Tabela 2.3. 31 CEDERJ
  30. 30. Apresenta¸˜o de dados - parte 2 ca Tabela 2.3: Distribui¸˜o dos sal´rios dos funcion´rios do Departamento de RH ca a a Classe Freq¨ˆncia Simples ue Freq¨ˆncia Acumulada ue de sal´rio Absoluta Relativa % Absoluta Relativa % a [3200,4021) 4 26,67 4 26,67 [4021,4842) 2 1,33 6 40,00 [4842,5663) 2 1,33 8 53,33 [5663,6484) 3 20,00 11 73,33 [6484,7305) 4 26,67 15 100,00 Total 15 100,00 Como as classes tˆm o mesmo comprimento, o histograma, nesse caso, e pode ser constru´ de tal modo que as alturas dos retˆngulos sejam iguais ıdo a `s freq¨ˆncias das classes. Dessa forma, as ´reas ser˜o proporcionais (e n˜o a ue a a a iguais) `s freq¨ˆncias, conforme ilustrado no gr´fico a esquerda na Figura 2.1. a ue a ` No gr´fico ` direita nessa mesma figura, a ´rea de cada retˆngulo ´ igual ` a a a a e a freq¨ˆncia relativa da classe e a altura de cada classe ´ calculada usando- ue e se a express˜o que d´ a ´rea de um retˆngulo. Por exemplo, para a classe a a a a 4 [3200,4021), a freq¨ˆncia (´rea) ´ 15 = 0, 266667 e a base do retˆngulo (com- ue a e a primento de classe) ´ 821. Logo, a altura h do retˆngulo correspondente e a ´ e 0, 266667 h= = 0, 000325 821 O resultado dessa divis˜o ´ denominado densidade, uma vez que d´ a con- a e a densidade centra¸˜o em cada classe por unidade da vari´vel. Em ambos os gr´ficos, a ca a a forma dos retˆngulos ´ a mesma; o que muda ´ a escala no eixo vertical. a e e De modo geral, quando as classes tˆm o mesmo comprimento – e essa e ´ a situa¸˜o mais comum – podemos representar as alturas dos retˆngulos e ca a pelas freq¨ˆncias das classes, o que torna o gr´fico mais f´cil de interpretar. ue a a Figura 2.1: Histogramas da distribui¸˜o dos sal´rios dos funcion´rios do Departamento ca a a de RH.CEDERJ 32
  31. 31. Apresenta¸˜o de dados - parte 2 ca AULA 2 Um pol´ ıgono de freq¨ˆncias ´ um gr´fico de linha que se obt´m unindo ue e a e pol´ ıgono de frequˆncias ¨epor uma poligonal os pontos correspondentes `s freq¨ˆncias das diversas a ueclasses, centradas nos respectivos pontos m´dios. Mais precisamente, s˜o e aplotados os pontos com coordenadas (ponto m´dio, freq¨ˆncia simples). Para e ueobter as interse¸˜es da poligonal com o eixo, cria-se em cada extremo uma coclasse com freq¨ˆncia nula. Na Figura 2.2 temos o pol´ ue ıgono de freq¨ˆncias uepara a renda dos funcion´rios do Departamento de Recursos Humanos. Pode- ase construir o pol´ ıgono de freq¨ˆncias junto com o histograma, o que facilita uea visualiza¸˜o dos resultados. caFigura 2.2: Pol´ ıgono de freq¨ˆncia para os sal´rios dos funcion´rios do Departamento ue a ade RH. Atividade 2.3 Na Tabela 2.4 abaixo temos as notas de 50 alunos em uma prova.Construa uma tabela de freq¨ˆncias agrupadas, usando as classes 2 ⊢ 3, 3 ⊢ ue4, 4 ⊢ 5, · · · , 9 ⊢ 10. Construa o histograma e o pol´ ıgono de freq¨ˆncias. (O ue ımbolo ⊢ indica que o limite inferior est´ inclu´s´ a ıdo, mas n˜o o superior; se aquis´ssemos o contr´rio, usar´ e a ıamos o s´ımbolo ⊣ para indicar que o limitesuperior est´ inclu´ a ıdo, mas n˜o o limite inferior.) a Tabela 2.4: Notas de 50 alunos para a Atividade 2.3 2,9 3,7 3,8 4,7 4,9 5,2 5,6 5,8 6,0 6,2 6,3 6,3 6,3 6,5 6,5 6,6 6,8 6,8 6,9 6,9 7,0 7,0 7,1 7,3 7,3 7,4 7,4 7,5 7,5 7,6 7,6 7,7 7,7 7,9 8,1 8,1 8,2 8,2 8,3 8,3 8,4 8,5 8,7 8,7 8,8 8,9 9,0 9,1 9,4 9,7 33 CEDERJ
  32. 32. Apresenta¸˜o de dados - parte 2 ca Diagrama de ramos e folhas Um outro gr´fico usado para mostrar a forma da distribui¸˜o de um a ca conjunto de dados quantitativos ´ o diagrama de ramos e folhas, desen- eramo e folhas volvido pelo estat´ ıstico americano John Tukey. Este gr´fico ´ constitu´ de a e ıdo uma linha vertical, com a escala indicada ` esquerda desta linha. A escala, a naturalmente, depende dos valores observados, mas deve ser escolhida de tal forma que cada valor observado possa ser “quebrado” em duas partes: uma primeira parte quantificada pelo valor da escala e a segunda quantificada pelo ultimo algarismo do n´ mero correspondente ` observa¸˜o. Os ramos ´ u a caramos do gr´fico correspondem aos n´ meros da escala, ` esquerda da linha vertical. a u a J´ as folhas s˜o os n´ meros que aparecem na parte direita. Na Figura 2.3 a a ufolhas temos o diagrama de ramos e folhas para as notas de 50 alunos dadas na Tabela 2.4. Nesse caso, a “quebra” dos valores ´ bastante natural: os ramos e s˜o formados pelo algarismo inteiro e as folhas pelos algarismos decimais, o a que ´ indicado pela escala do gr´fico. e a Figura 2.3: Notas de 50 alunos. O diagrama de ramos e folhas tamb´m ´ util na compara¸˜o de conjun- e e´ ca tos de dados. Suponha que, no exemplo acima, a mesma prova tenha sido aplicada a duas turmas diferentes. Para comparar os resultados, podemos construir o diagrama que se encontra na Figura 2.4. Para facilitar a com- para¸˜o, ´ usual indicar o n´ mero de dados em cada banda do diagrama. ca e u Note que, na parte esquerda do gr´fico, as folhas s˜o anotadas crescente- a a mente da direita para a esquerda, enquanto que, na parte direita do gr´fico, a as folhas s˜o anotadas crescentemente da esquerda para a direita. aCEDERJ 34
  33. 33. Apresenta¸˜o de dados - parte 2 ca AULA 2 Figura 2.4: Compara¸˜o das notas de 2 turmas. ca Atividade 2.4 Suponha que as idades dos 23 funcion´rios do Departamento Financeiro asejam 27; 31; 45; 52; 33; 34; 29; 27; 35; 38; 50; 48; 29; 30; 32; 29; 42; 41; 40;42; 28; 36; 48. Usando esses dados e aqueles apresentados na Tabela 2.2sobre os funcion´rios do Departamento de Recursos Humanos, construa um adiagrama de ramos e folhas para comparar os 2 departamentos.Gr´ficos de linhas a O gr€

×