Estatística: introdução
Upcoming SlideShare
Loading in...5
×
 

Estatística: introdução

on

  • 602 views

 

Statistics

Views

Total Views
602
Views on SlideShare
602
Embed Views
0

Actions

Likes
0
Downloads
19
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Estatística: introdução Estatística: introdução Document Transcript

    • Cap´ ıtulo 1Introdu¸˜o ca1.1 O que ´ Estat´ e ıstica?N˜o h´ uma defini¸ao unica para Estat´ a a c˜ ´ ıstica assim listaremos algumas possi-bilidades. Kendall e Stuart, no seu manual cl´ssico A Teoria Avan¸ada de a cEstat´stica sugere: “A Estat´stica ´ o ramo do m´todo cient´fico que lida com ı ı e e ıdados obtidos via contagem ou mensura¸ao de propriedades de popula¸oes de c˜ c˜fenˆmenos naturais”. o J´ Keeping em seu Introdu¸ao a Inferˆncia Estat´stica sugere:“A Estat´stica a c˜ ` e ı ılida com vari´veis que flutuam de maneira mais ou menos imprevis´vel ... Car- a ıacter´stica que denominamos aleatoriedade”. ı Hoel em Introdu¸ao a Estat´stica Matem´tica afirma: “Os m´todos estat´s- c˜ ` ı a e ıticos s˜o, essencialmente, m´todos para lidar com dados que foram obtidos por a eopera¸oes repetitivas”. c˜ As trˆs defini¸oes acima s˜o consideradas Cl´ssicas ou Frequentistas. No en- e c˜ a atanto, h´ alternativas, por exemplo, Chernoff e Moses em seu Teoria Elementar ada Decis˜o ressaltam o car´ter de teoria de decis˜o da Estat´ a a a ıstica: “H´ anos aatr´s um estatistico poderia dizer que a Estat´stica lida com o processamento a ıde dados... hoje em dia um estat´stico, com mais probabilidade, diria que a ıEstat´stica lida com a tomada de decis˜o frente a incertezas”. ı a J´ Savage em Os Fundamentos da Estat´stica adota um ponto de vista con- a ıhecido como Bayesiano afirmando: “Por Inferˆncia Estat´stica eu entendo a e ıforma como entendemos as coisas ... e como ocorre que n´s adquirimos opini˜es o opraticamente idˆnticas com base nas mesmas evidˆncias”. e e1.2 Partes da Est´ ıstica1.2.1 Estat´ ıstica DescritivaOs dados brutos podem ocorrer em grandes quantidades. A Estat´ ıstica Des-critiva preocupa-se em extrair informa¸ao util desses dados para isso utiliza- c˜ ´ 5
    • 6 CAP´ ¸˜ ITULO 1. INTRODUCAOse de t´cnicas para organiza¸ao (tabelas e bancos de dados), representa¸ao e c˜ c˜gr´fica (gr´ficos e t´cnicas de visualiza¸ao de dados multidimensionais) e re- a a e c˜sumo (m´dias, medianas, modas, dispers˜es). Historicamente, foi justamente a e oEstat´ıstica Descritiva que surgiu primeiro. Esta parte da Estat´ ıstica, j´ tendo asido objeto da disciplina Tratamento e An´lise de Dados e Informa¸oes, n˜o a c˜ aser´ objeto deste curso. a1.2.2 Inferˆncia Estat´ e ısticaQuando a informa¸ao se baseia em uma amostra dos casos poss´ c˜ ıveis ´ neces- es´rio generalizar a partir do particular n´ mero de casos estudados o universo a ude casos poss´ ıveis. Este processo de generaliza¸ao ´ conhecido como Inferˆncia c˜ e eEstat´ıstica. Por exemplo, dois exemplos claros onde a inferˆncia estat´ e ıstica ´enecess´ria s˜o a generaliza¸ao de resultados de pesquisas eleitorais e a utiliza¸ao a a c˜ c˜ c˜ ´de amostras para verifica¸ao da qualidade de materiais industriais. E poss´ ıvelprever o resultado de uma elei¸ao envolvendo milh˜es de eleitores colhendo c˜ oamostras de alguns poucos milhares. Da mesma forma, a qualidade de mat´rias eprimas ou de produtos manufaturados pode ser verificada monitorando apenasuma pequena fra¸ao. A pergunta central ´: como ´ poss´ projetar resultados c˜ e e ıvelda popula¸ao inteira com base em resultados obtidos em pequenas amostras? c˜ Essa proje¸ao depende da introdu¸ao de Modelos Probabil´ c˜ c˜ ısticos, que ser˜oaum dos objetos centrais na primeira parte deste curso. T´cnicas avan¸adas de e cinferˆncia estat´ e ıstica aparecer˜o no meio e no final deste curso. a1.2.3 Decis˜o Estat´ a ısticaDe posse de um Modelo Probabil´ ıstico e de um conjunto de dados ´ necess´rio e atomar decis˜es quanto a validade do modelo dada a evidˆncia presente nos o edados. Para isso a Estat´ ıstica fornece uma s´rie de t´cnicas na forma de Testes e ede Hip´teses que permitem tomar decis˜es de forma controlada.Os Testes de o oHip´teses formam a segunda parte deste curso. o1.3 Um pouco de Hist´ria oO primeiro a utilizar a palavra Statistik foi o alem˜o Gottfried Achenwall (1719- a1772), significando, aritm´tica do estado. Em sua origem a Estat´ e ıstica es-tava mais relacionada `s tarefas de coleta, tabula¸ao e apresenta¸ao de dados a c˜ c˜num´ricos, o que atualmente reconhecemos como Estat´ e ıstica Descritiva. No Egito antigo coletavam-se dados populacionais e contabilizavam-se rique-zas pelo menos desde 3050 a.C.. H´ documentos chineses contendo estat´ a ısticasj´ em 2030 a.C.. Dois censos israelitas s˜o registrados no livro dos N´ meros do a a uAntigo Testamento e census fiscais j´ ocorriam na Gr´cia pelo menos em 594 a ea.C.. Sabe-se que um censo populacional ocorreu em Atenas em 309 a.C. e queos romanos realizavam levantamentos extensivos de todos os tipos em todas aspartes de suas prov´ıncias.
    • ´1.3. UM POUCO DE HISTORIA 7 Durante a idade m´dia h´ poucos relatos de levantamentos estat´ e a ısticos. H´ aapenas levantamentos detalhados de terras da Igreja encomendados por CarlosMagno em 762 e registros de terra franceses em anos subsequentes. O renasci-mento dos levantamentos estat´ ısticos ocorreu no s´culo 16 com compila¸oes de e c˜dados organizadas por Sebastian M¨ nster na Alemanha, e Francesco Sansovino u(1502) e Giovanni Votero (1589) na It´lia. Na Inglaterra iniciou-se no ano de a1532 o registro de mortes e nascimentos em Londres. A era moderna da Estat´ ıstica teve in´ ıcio com a publica¸ao, em 1662, de c˜Observa¸oes Pol´ticas e Naturais sobre as Taxas de Mortalidade em Londres c˜ ıpelo inglˆs John Graunt (1620-1674). Graunt inaugurou nova fase, n˜o se con- e atentando em fazer apenas uma contagem de casos, mas devotando particularaten¸ao `s regularidades presentes nos fenˆmenos sociais. Passava assim da c˜ a oEstat´ ıstica Descritiva para os prim´rdios da Inferˆncia Estat´ o e ıstica. A teoria de probabilidades conecta a Estat´ ıstica ` Matem´tica, fornecendo a aos fundamentos para a Inferˆncia Estat´ e ıstica. Assim, os pioneiros da teoriaestat´ıstica foram todos matem´ticos. Pierre Simon, o Marquˆs de Laplace (1749- a e1827), um dos grandes nomes da teoria de probabilidades, escreveu que umaquest˜o formulada pelo jogador Chevalier de M´r´ teria “levado ` inven¸ao a e e a c˜do c´lculo de probabilidades”ao alimentar uma polˆmica entre os matem´ticos a e aBlaise Pascal (1623-1662) e Pierre de Fermat (1601-1665). Foi Carl Friedrich Gauss (1777-1855) que primeiro aplicou a teoria de prob-abilidades ` investiga¸ao dos erros de observa¸ao, utilizando t´cnicas baseadas a c˜ c˜ eno trabalho de Laplace. Gauss estava interessado em dados provenientes de ob-serva¸oes astronˆmicas, tais como medidas repetidas da distˆncia entre a Terra c˜ o ae o Sol. Gauss raciocinou que estas medidas seriam determinadas em parte pela“verdadeira”distˆncia, mas tamb´m seriam afetadas por erros de observa¸ao em a e c˜cada medida individual causados por uma multiplicidade de fatores. Ao estudaras caracter´ ısticas destes erros, Gauss estava investigando basicamente os mes-mos princ´ ıpios que determinam, por exemplo, como a porcentagem de eleitoresfavorencendo um certo candidato em uma amostra difere da porcentagem realda popula¸ao inteira. O paralelo ´ imediato: a porcentagem na amostra ´ de- c˜ e eterminada primordialmente pela porcentagem real na popula¸ao, mas tamb´m c˜ evaria segundo fatores particulares ` amostra. Assim pode-se dizer que h´ um a aerro de medida ao estimarmos a porcentagem da popula¸ao com base em uma c˜amostra. O belga Adolph Quetelet (1796-1874) foi quem primeiro aplicou as id´ias da einferˆncia estat´ e ıstica ` sociologia e pol´ a ıtica introduzindo o conceito de homemm´dio. O inglˆs Francis Galton (1822-1911), primo de Charles Darwin, ini- e eciou a grande onda que levou ` Estat´ a ıstica como conhecemos hoje. Ap´s a oleitura de A Origem das Esp´cies de Darwin, Galton direcionou suas pesquisas ea` gen´tica, publicando em 1889 Heran¸a Natural. Outro inglˆs, Karl Pearson e c e(1857-1936) escreveria algum tempo depois, sobre o trabalho de Galton: “Euinterpretei que... Galton ... quiz dizer que h´ uma categoria mais ampla do aque a conex˜o causal, que ´ a correla¸ao,... e que este novo conceito de cor- a e c˜rela¸ao fez da psicologia, da antropologia, da medicina e da sociologia pass´veis c˜ ıde tratamento matem´tico. Foi Galton quem primeiro me libertou do precon- a
    • 8 CAP´ ¸˜ ITULO 1. INTRODUCAOceito de que boa matem´tica poderia apenas ser aplicada a conex˜es de causa e a oefeito em fenˆmenos naturais. Ali, pela primeira vez havia a possibilidade ... de oadquirir conhecimento – t˜o v´lido quanto acredita-se que o conhecimento f´sico a a ıseja – no campo das formas vivas e acima de tudo na area da conduta humana.” ´ Influenciado por Galton, Pearson fez um grande n´ mero de contribui¸oes u c˜a` Inferˆncia Estat´ e ıstica desenvolvendo o conceito de correla¸ao, m´todos de c˜ eregress˜o e introduzindo o teste de Qui-quadrado. Em 1906, William Gosset a(1876-1937), assistiu a um dos cursos de Pearson. Gosset trabalhava para aa cervejaria Guinness e, orientado por Pearson, foi o pioneiro da aplica¸ao da c˜Estat´ ıstica ao controle de qualidade ao publicar, sob o pseudˆnimo Student, oum trabalho no qual descrevia, pela primeira vez, a distribui¸ao t de Student. c˜Ronald A. Fisher (1890-1962) graduou-se em Astronomia em Cambridge em1912. Em 1913, Fisher enviou uma carta a Gosset em resposta a um artigona revista Biometrika, a carta continha uma justificativa te´rica para a dis- otribui¸ao t de Student. Em 1919 Fisher foi contratado pela Esta¸ao de Exper- c˜ c˜imentos Agr´ ıcolas de Rothamstead, l´ ele permaneceu por 14 anos e fez suas amaiores contribui¸oes criando t´cnicas de estima¸ao, planejamento experimental c˜ e c˜e an´lise de variˆncia. Em 1931 Fisher viajou para os EUA e passou um ver˜o a a adando cursos em Iowa. Na audiˆncia estava o Professor George W. Snedecor e(1882-1974) que foi respons´vel por popularizar o trabalho de Fisher nos EUA, aal´m de contribuir para a teoria da an´lise de variˆncia com as distribui¸oes F e a a c˜de Snedecor. O livro A Gram´tica da Ciˆncia, publicado por Karl Pearson em 1892, teve a egrande influˆncia sobre outro professor de Cambridge, Harold Jeffreys. Jef- efreys retomou uma linha de trabalhos sobre l´gica indutiva de James Bernoulli o(1713), Thomas Bayes (1793) e Laplace (1812) e desenvolveu o novo conceitode probabilidades subjetivas. Ao publicar artigos na Philosophical Magazineem 1919 e 1921 (e o livro Theory of Pobability de 1939), Jeffreys deu in´ ıcio ` aInferˆncia Bayesiana e a uma polˆmica com Fisher em torno dos fundamentos e eda Estat´ ıstica que continua at´ os dias de hoje. e Em 1925 chegou a Londres, vindo da fronteira da Romˆnia com a R´ ssia, e uJerzy Neyman (1894-1981) com o objetivo de estudar com Karl Pearson. Logoem sua chegada Neyman conheceu Gosset(Student) que o apresentou a Fisher.Com o tempo Neyman tornou-se amigo pessoal do filho (e assistente) de KarlPearson, Egon Pearson (1895-1980), dessa amizade surgiu a, hoje cl´ssica, teoria ados testes de hip´teses. Quase toda Estat´ o ıstica que estudaremos neste curso foiformulada at´ no m´ximo 1930, dessa maneira, paramos nossa hist´ria por aqui. e a o1.4 Aplica¸˜es co1.4.1 Administra¸˜o caO conceito moderno de Sistemas de Informa¸ao vislumbra a integra¸ao de dados c˜ c˜provenientes das mais variadas ´reas de uma empresa e tamb´m a possibilidade a ede utilizar estes dados brutos na tomada de decis˜es sob incerteza. O modelo o
    • 1.5. PLANO DE CURSO 9b´sico contempla, portanto, o uso extensivo de ferramentas estat´ a ısticas. A ´rea aque estuda este tipo de aplica¸ao ´ conhecida como Inteligˆncia de Neg´cios c˜ e e o(Business Intelligence).1.4.2 Inteligˆncia Artificial eHoje em dia h´ dois paradigmas em Inteligˆncia Artificial: os sistemas especial- a eistas e os sistemas adaptativos. Nos sistemas especialistas constroem-se ´rvores ade decis˜o contemplando o m´ximo de possibilidades poss´ e uma fun¸ao que a a ıvel c˜determina qual ´ a decis˜o ´tima em uma dada circusntˆncia. Um exemplo pop- e a o aular de sistema especialista s˜o os jogadores artificiais de xadrez como o Deep aBlue da IBM que , recentemente, tem conseguido vencer grandes mestres. J´ aos sistemas adaptativos utilizam a Estat´ ıstica Bayesiana para aprender atrav´s ede exemplos. Nesta categoria est˜o as Redes Neurais Artificiais e as Redes aBayesianas utilizadas, por exemplo, no programa de aux´ dispon´ no sis- ılio ıveltema Windows.1.5 Plano de CursoO presente curso seguir´ o seguinte programa: a
    • 10 CAP´ ¸˜ ITULO 1. INTRODUCAO Data Conte´do u 08/mar Apresenta¸ao do curso, Introdu¸ao ` Teoria de Probabilidades c˜ c˜ a 10/mar Probabilidade F´ ısica e Probabilidade Subjetiva 15/mar Vari´veis Aleat´rias Discretas a o 17/mar Distribui¸ao Binomial e Multinomial c˜ 22/mar Poisson e Hipergeom´trica e 24/mar Vari´veis Aleat´rias Cont´ a o ınuas 29/mar Distribui¸ao Normal (Gauss) e Aproxima¸ao ` Binomial c˜ c˜ a 31/mar Uniforme, Exponencial e Beta 05/abr Gama, Chi-Quadrado, t-Student e F-Snedecor 07/abr Vari´veis Aleat´rias Multidimensionais a o 19/abr Momentos e Momentos Centrais 26/abr PROVA 1 (PESO 1) 28/abr No¸oes de Simula¸ao c˜ c˜ 03/mai Gera¸ao de N´ meros Aleat´rios c˜ u o 05/mai Importance Sampling e Rejection Sampling 10/mai Distribui¸oes Amostrais (M´dia e Propor¸ao) c˜ e c˜ 12/mai Estima¸ao Cl´ssica c˜ a 17/mai Intervalos de Confian¸a c 19/mai Prioris e Intervalos de Probabilidade 24/mai Utilidade e Introdu¸ao ` Teoria da Decis˜o c˜ a a 26/mai Testes de Hip´teseo 31/mai Tomada de Decis˜o sobre M´dias a e 02/jun Teste Cl´ssico para M´dia a e 07/jun Testes para Propor¸oes c˜ 09/jun Testes para Variˆncia a 14/jun Inferˆncia para duas popula¸oes e c˜ 23/jun Regress˜o Linear a 28/jun Regress˜o N˜o Linear a a 30/jun PROVA FINAL (PESO 2) 05/jul PROVA SUBSTITUTIVA1.6 Referˆncias ePara uma discuss˜o aprofundada das defini¸oes e partes da Estat´ a c˜ ıstica: • Barnett V., Comparative Statistical Inference, john Wiley & Sons, 1973.Sobre a hist´ria da Estat´ o ıstica: • Eves, H.W., A very brief history os statistics, College Mathematics Jour- nal, Sep. 2002. • Peters, W.S., Counting for Something: Statistical Principles and Person- alities, Springer-Verlag, 1987. • David, F.N., Games, Gods and Gambling, Charles Griffin & Co., 1962.
    • ˆ1.6. REFERENCIAS 11 • Stingler, S.M., Statistics on the Table, Harvard University Press, 1999. • The University of York, Life and Work of Statisticians, http://www.york.ac.uk/depts/maths/histstat/lifework.htm, vers˜o de 15/10/2005. aSobre as aplica¸oes citadas veja: c˜ • Barbieri, C., BI- Business Inteligence: Modelagem e Tecnologia, Axcel Books , 2001. • Russel, S., Norvig P., Inteligˆncia Artificial, Ed. Campus, 2003. e
    • 12 CAP´ ¸˜ ITULO 1. INTRODUCAO