Estadística, 9na edición mario f. triola

36,621 views
36,985 views

Published on

3 Comments
18 Likes
Statistics
Notes
No Downloads
Views
Total views
36,621
On SlideShare
0
From Embeds
0
Number of Embeds
949
Actions
Shares
0
Downloads
1,943
Comments
3
Likes
18
Embeds 0
No embeds

No notes for slide

Estadística, 9na edición mario f. triola

  1. 1. El objetivo de esta novena edición de la obraEstadística de Triola es ofrecer el mejor librode texto introductorio a la materia. La metase logra por medio de recursos como un estiloameno de escritura, el uso de las herramientastecnológicas más recientes, interesantes ejemplosy ejercicios basados en datos reales y abundanteselementos didácticos.Cada capítulo inicia con un problema e incluye en-trevistas realizadas por el autor a hombres y mujeresprofesionales que utilizan la estadística en su trabajocotidiano. Al final de cada capítulo se encuentranun repaso del mismo, donde se resumen los conceptosy temas principales; ejercicios de repaso; ejerci-cios de repaso acumulativo; un problema que re-quiere de pensamiento crítico y de un elemento deredacción; actividades de cooperación en equipo;proyectos con herramientas tecnológicas, los cualesestán diseñados para utilizar STATDISK, Minitab,Excel o la calculadora TI-83 Plus; y proyectos deInternet.El libro contiene 120 textos al margen, que ilustranlos usos y abusos de la estadística en aplicacionesreales, prácticas e interesantes; por ejemplo, se pre-sentan temas como “Precisión del conteo de votos”y “Elección de números en la lotería”.El CD-ROM incluye conjuntos de datos, los cualesestán almacenados como archivos de texto, hojasde cálculo de Minitab, archivos de SPSS, SAS,hojas de Excel y aplicaciones de la calculadoragraficadora TI-83 Plus. El disco compacto tambiéncontiene programas para la calculadora TI-83Plus®, el programa estadístico STATDISK (versión9.1) y el complemento (Add In) para Excel, DataDesk/XL, diseñado para incrementar las capacida-des de los programas estadísticos de Excel.Debido a que la gran cantidad de ejemplos y ejerci-cios cubren una amplia variedad de aplicaciones, estelibro es apropiado para estudiantes de una gran di-versidad de disciplinas, que van de las ciencias so-ciales hasta las económico-administrativas.Visítenos en:www.pearsoneducacion.net
  2. 2. TRADUCCIÓN:M. Leticia Esther Pineda AyalaProfesora de EstadísticaUniversidad AnáhuacREVISIÓN TÉCNICA:Mario Alberto González MedinaProfesor AsociadoUniversidad de Monterrey
  3. 3. Datos de catalogación bibliográficaTRIOLA, MARIO F.Estadística. Novena ediciónPEARSON EDUCACIÓN, México, 2004ISBN: 970-26-0519-9Área: UniversitariosFormato: 21 × 27 cm Páginas: 872Authorized translation from the English language edition, entitled Elementary Statistics, Ninth Edition, by Mario F. Triola, published byPearson Education, Inc., publishing as Addison-Wesley, Copyright ©2004. All rights reserved.ISBN 0-201-77570-0Traducción autorizada de la edición en idioma inglés, titulada Elementary Statistics, Ninth Edition, por Mario F. Triola, publicada porPearson Education, Inc., publicada como Addison-Wesley, Copyright ©2004. Todos los derechos reservados.Esta edición en español es la única autorizada.Edición en españolEditor: Guillemo Trujano Mendozae-mail: guillermo.trujano@pearsoned.comSupervisor de desarrollo: Felipe Hernández CarrascoSupervisor de producción: José D. Hernández GarduñoEdición en inglésPublisher: Greg TobinSenior Acquisitions Editor: Deirdre LynchExecutive Project Manager: Christine O’BrienEditorial Assistant: Keren BlankfeldExecutive Marketing Manager: Yolanda CossioSenior Marketing Manager: Pamela LaskeyManaging Editor: Karen GuardinoSenior Production Supervisor: Peggy McMahonText and Cover Designer: Barbara T. AtkinsonCover Photos: Pencils and vineyard © Getty;People in lab © Stone;Group at table and men at river bank © Creatas;Women with tape measure © Corbis.Associate Media Producer: Jennifer KerberSenior Manufacturing Buyer: Evelyn BeatonSoftware Development: Kathleen Bowler and Jan WannComposition and Production Services: Nesbitt Graphics, Inc.Printer: VonHoffman PressNOVENA EDICIÓN, 2004D.R. © 2004 por Pearson Educación de México, S.A. de C.V.Atlacomulco 500-5to. pisoIndustrial Atoto53519 Naucalpan de Juárez, Edo. de MéxicoE-mail: editorial.universidades@pearsoned.comCámara Nacional de la Industria Editorial Mexicana. Reg. Núm. 1031Addison Wesley es una marca registrada de Pearson Educación de México, S.A. de C.V.Reservados todos los derechos. Ni la totalidad ni parte de esta publicación pueden reproducirse, registrarse o transmitirse, por un sistemade recuperación de información, en ninguna forma ni por ningún medio, sea electrónico, mecánico, fotoquímico, magnético o electroóptico,por fotocopia, grabación o cualquier otro, sin permiso previo por escrito del editor.El préstamo, alquiler o cualquier otra forma de cesión de uso de este ejemplar requerirá también la autorización del editor o de sus repre-sentantes.ISBN 970-26-0519-9Impreso en México. Printed in Mexico.1 2 3 4 5 6 7 8 9 0 - 07 06 05 04
  4. 4. Para Marc y Scott
  5. 5. Acerca del autorMario F. Triola es profesor emérito de matemáticas en el DutchessCommunity College, donde ha enseñado estadística durante más de30 años. Marty es autor de las obras Essentials of Statistics, Ele-mentary Statistics Using Excel, Mathematics in the Modern World ySurvey of Mathematics. Además, es coautor de los títulos StatisticalReasoning for Everyday Life, Introduction to Technical Mathematics yBusiness Statistics. También diseñó el programa estadístico de cómpu-to original STATDISK y ha escrito diversos manuales y libros detrabajo para educación en estadística con soporte tecnológico. Fueradel salón de clases, su trabajo de consultoría incluye el diseño matemá-tico de máquinas tragamonedas para casinos y de cañas de pescar;ha trabajado con abogados en la determinación de probabilidades encasos de demandas de paternidad, en la identificación de desigualda-des salariales entre géneros y en el análisis de resultados de eleccio-nes en disputa. Por otro lado, fungió como testigo experto en la Su-prema Corte del estado de Nueva York, en un litigio electoral queimplicaba a un antiguo alumno. Asimismo, fue miembro del equipode escritores del proyecto Coalición de la NASA y de la AmericanMathematics Association of Two-Year Colleges.Fuera del trabajo, a Marty le gusta viajar, jugar golf, tenis, los ejer-cicios aeróbicos, el montañismo y cualquier actividad que impliquevolar. Posee una licencia de piloto comercial con calificación para ins-trumentos; vuela aviones, helicópteros, planeadores, alas delta y globosaerostáticos. Su pasión por el vuelo incluye saltos en paracaídas, unviaje en un dirigible Goodyear y el uso de un ala paracaídas.La Text and Academic Authors Association otorgó a Mario F.Triola un Texty de Excelencia por su trabajo en el libro Estadística.vii
  6. 6. Acerca de este libroAunque se actualizó gran parte de la novena edición de Estadística, el objetivoprimordial continúa siendo el mismo: proporcionar el mejor libro de introduccióna la estadística, tanto para estudiantes como para profesores. Dicha meta se lograpor medio de factores como un estilo ameno de escritura, un contenido que re-fleja los aspectos importantes de un curso moderno de introducción a la esta-dística, el uso de las herramientas tecnológicas más recientes, conjuntos realese interesantes de datos, abundantes componentes pedagógicos y una batería de com-plementos. El texto sigue las recomendaciones y los lineamientos de la AmericanStatistical Association, la Mathematical Association of America, la American Ma-thematical Association of Two-Year Colleges y el National Council of Teachers ofMathematics.Público/PrerrequisitosEstadística se escribió para estudiantes de cualquier carrera. Aun cuando el usodel álgebra es mínimo, los usuarios deben haber cursado al menos una materia deálgebra elemental en la preparatoria o la universidad. En muchos casos se agreganteorías subyacentes, pero el libro no pone énfasis en el rigor matemático que seadecua más para carreras especializadas en matemáticas. Como la gran cantidadde ejemplos y ejercicios cubren una amplia variedad de aplicaciones estadísticasdistintas e interesantes, la obra es propia para estudiantes de una gran diversidadde disciplinas, que van desde las ciencias sociales, la psicología y la sociologíahasta áreas tales como la educación, los campos de la salud, los negocios, la econo-mía, la ingeniería, las humanidades, las ciencias físicas, el periodismo, las comu-nicaciones y las artes libres.TecnologíaEstadística, en su novena edición, puede utilizarse fácilmente sin referencia a tec-nología específica alguna. Muchos profesores continúan usando las distintas edi-ciones con sus alumnos, con la ayuda de una variedad de calculadoras científicas.Sin embargo, para aquellos que deciden complementar el curso con herramientastecnológicas específicas, éstas se incluyen tanto en el texto como en los materialescomplementarios.ixPrefacio
  7. 7. Cambios en la organización● En el capítulo 5, las secciones 5-3 y 5-4 de la octava edición (distribucionesnormales no estándar) ahora se combinan en la sección 5-3. El cambio lo moti-vo el nuevo formato de la tabla A-2, que facilita a los estudiantes el trabajo conlas distribuciones normales.● En el capítulo 5 viene una nueva sección, la 5-4, que describe “las distribucio-nes y los estimadores de muestreo”.● En los capítulo 6, 7 y 8 los procedimientos para los intervalos de confianza y lacomprobación de hipótesis inician con proporciones, que los estudiantes suelenconsiderar más interesantes que las medias. Además, los procedimientos paratrabajar con proporciones son más simples, por lo que permiten a los estudian-tes concentrarse más en los nuevos métodos de estadística inferencial.● La sección 6-4 de la octava edición (tamaño de la muestra que se requiere paraestimar m) se incluye en la sección 6-3 (estimación de una media poblacional:s conocida), junto con los intervalos de confianza que se utilizan para estimaruna media poblacional m.● Como los profesores incluyen el tema del control estadístico de proceso conmenor frecuencia que el tema de la estadística no paramétrica, ambos se mo-dificaron de tal manera que el capítulo 12 cubre los métodos de estadística noparamétrica y el capítulo 13, el control estadístico de procesos.Cambios en el contenido● Procedimientos En los capítulos 6, 7 y 8 se presenta un cambio de “n > 30” a“s conocida”, como criterio clave para elegir entre la distribución normal y ladistribución t. Tal cambio refleja la práctica común que utilizan los profesiona-les, proporciona resultados más precisos y es mejor para los estudiantes quecontinuarán otros cursos de estadística; además, no es mucho más difícil que eluso del criterio “n > 30”.● Tablas Ahora hay un nuevo formato para la importante distribución normal enla tabla A-2: las áreas que se acumulan en la izquierda se listan en dos páginas.Por lo general, los estudiantes consideran que dicho formato es más fácil deusar. La tabla A-3 se expandió para incluir tamaños más grandes de muestraspara la distribución t de Student.● Notación En la comprobación de hipótesis ya no se utilizan los símbolos $ y# en las expresiones de la hipótesis nula. En el caso de aseveraciones sobre unvalor específico de un parámetro, sólo se utiliza el símbolo de igual (5). Estecambio refleja la práctica que emplea la inmensa mayoría de profesionales queaplican métodos estadísticos y que reportan hallazgos en revistas científicas.● Conjuntos de datos El Apéndice B comprende 30 conjuntos de datos (en lu-gar de 20), incluyendo 14 nuevos.● Iconos Los iconos de herramientas tecnológicas ahora se utilizan para iden-tificar ejercicios que se basan en conjuntos más grandes de datos del ApéndiceB, los cuales se realizan mejor usando un programa de computación o unacalculadora TI-83 Plus.● Interpretación de resultados A lo largo del libro, ahora se pone mayor énfasisen la interpretación de los resultados. En lugar de obtener simplemente lasrespuestas, se consideran sus implicaciones y consecuencias. Por ejemplo, en elx PREFACIOT
  8. 8. tema de la probabilidad, en el capítulo 3, en lugar de sólo calcular los valores deprobabilidad, los interpretamos estableciendo diferencias entre eventos comu-nes y eventos extraños. En la comprobación de hipótesis, no sólo finalizamoscon una conclusión de rechazo o no rechazo de la hipótesis nula, sino que pro-cedemos a establecer una conclusión práctica que pone énfasis en el resultadoreal. Se anima a los estudiantes a pensar acerca de las implicaciones de los re-sultados y no a obtener resultados que se parecen a una receta de cocina y care-cen de sentido.Contenido flexibleLa organización del libro refleja las preferencias de la mayoría de los profesoresde estadística, pero es posible realizar fácilmente dos variaciones con esta novenaedición:● Pronta cobertura de correlación/regresión: Algunos profesores prefierencubrir los aspectos básicos de la correlación y la regresión al inicio del curso,inmediatamente después de los temas del capítulo 2. Las secciones 9-2 (corre-lación) y 9-3 (regresión) llegan a cubrirse en las primeras etapas. Sólo hay queomitir el apartado de la sección 9-2, que se identifica con claridad como “Pruebaformal de hipótesis” (que requiere el estudio previo del capítulo 7).● Variaciones en el tema de probabilidad: Algunos profesores consideran queel tema de probabilidad debe cubrirse de forma extensa, mientras que otrospiensan que la cobertura tiene que ser mínima. Estos últimos llegan a incluir lasección 3-2 y omitir las secciones restantes del capítulo 3, ya que no son esen-ciales para los capítulos siguientes. Muchos profesores prefieren cubrir sólo losfundamentos de la probabilidad, junto con los aspectos básicos de las reglas dela suma y de la multiplicación; la cobertura de la regla de la multiplicación(secciones 3-4 y 3-5) ofrece dicha flexibilidad ahora.EjerciciosSe presentan más de 1500 ejercicios, ¡más del 58 por ciento de ellos nuevos! Enrespuesta a las peticiones de los usuarios de la edición previa, ahora se pusieronmás ejercicios simples que se basan en conjuntos pequeños de datos. Muchos másde los ejercicios requieren la interpretación de los resultados. Ya que los ejerciciosson de gran importancia en cualquier libro de estadística, se tuvo gran cuidado deasegurar su utilidad, relevancia y exactitud. Tres especialistas en estadística leye-ron el material con cuidado, en las etapas finales del libro, para verificar la preci-sión del texto y de las respuestas a los ejercicios. Estos últimos se acomodaron enorden de dificultad creciente para dividirlos en dos grupos: 1. Destrezas y concep-tos básicos, y 2. Más allá de lo básico, que se integró con ejercicios que incluyenconceptos más difíciles o que requieren de un mayor acervo matemático. Enpocos casos, dichos ejercicios también introducen un concepto nuevo.Datos reales: El 64% de los ejercicios utilizan datos reales. Como el uso dedatos reales es tan importante para los estudiantes, se dedicaron cientos de horaspara encontrar información real, significativa e interesante. Además de los datosreales que se incluyeron a lo largo del libro, muchos ejercicios se refieren a los 30conjuntos de datos que se listan en el Apéndice B.Prefacio xi
  9. 9. Características distintivasMás allá del estilo interesante y accesible (y en ocasiones humorístico) de la re-dacción, se tuvo cuidado en asegurar que cada capítulo de Estadística ayude a losalumnos a comprender los conceptos que se presentan. Las siguientes característi-cas se diseñaron para cumplir ese objetivo:● Inicio del capítulo: Se incluye una lista de secciones que introducen el capítu-lo al estudiante; un problema que inicia el capítulo, que se basa en datos reales,motiva el material que se introduce; la primera sección implica un panoramageneral que establece los objetivos del capítulo.● Fin del capítulo:Un repaso del capítulo resume los conceptos y temas principales;los ejercicios de repaso proporcionan práctica respecto de los conceptos y pro-cedimientos;los ejercicios de repaso acumulativo refuerzan el material previo;la sección que se denomina De los datos a la decisión: pensamiento críticoincluye un problema que requiere de un pensamiento crítico y de un componentede redacción;las actividades de cooperación en equipo animan en el aprendizaje activo grupal;los proyectos con herramientas tecnológicas se diseñaron para utilizarSTATDISK, Minitab, Excel o la calculadora TI-83 Plus;los proyectos de Internet ponen en contacto al estudiante con conjuntos de da-tos de Internet y, en algunos casos, con programas de aplicación.● Ensayos al margen: El texto incluye 120 ensayos al margen, que ilustran los usosy abusos de la estadística en aplicaciones reales, prácticas e interesantes. Incluyentemas tales como “¿Prevalece un género en las familias?”, “Precisión del conteode votos”, “Prueba de la terapia de contacto” y “Elección de números de lotería”.● Diagramas de flujo: Éstos aparecen a lo largo del texto para simplificar y acla-rar conceptos y procedimientos más complejos.● Programas estadísticos de cómputo: A lo largo del libro se encuentran ins-trucciones y resultados de STATDISK, Minitab, Excel y TI-83 Plus.● Conjuntos de datos reales: En todo el libro se utilizan datos reales profu-samente. En el Apéndice B se listan 30 conjuntos de datos, 14 de los cualesson nuevos. Dichos conjuntos aparecen de forma impresa en el Apéndice B,así como en forma electrónica en el sitio de Internet y en el disco compactoque se incluye al final del libro. Se agregan temas tan varios como las edadesde los polizontes del Queen Mary, el uso de alcohol y tabaco en películasinfantiles animadas, las erupciones del géiser Old Faithful, las característi-cas y el precio de los diamantes, así como datos financieros y de audiencia depelículas.● Entrevistas: Cada capítulo incluye una entrevista que realizó el autor a hombresy mujeres profesionales de diversos campos, quienes utilizan la estadística ensu trabajo diario.● Contraportadas de referencia rápida: La tabla A-2 (la distribución normal)se reproduce en la segunda de forros y la tabla A-3 (distribución t) en la tercerade forros. Al final del libro se incluye una tabla de símbolos que permite consultarcon rapidez los símbolos clave.xii PREFACIODATOS a la DECISIÓNde losPROYECTO DE INTERNET
  10. 10. ● CD-ROM: El CD-ROM fue elaborado por Mario F. Triola y se incluye encada nuevo ejemplar del texto, además de los conjuntos de datos del Apén-dice B (excepto el conjunto de datos 4). Tales conjuntos se almacenan comoarchivos de texto, hojas de cálculo de Minitab, archivos de SPSS, SAS, hojasde Excel y aplicaciones de la calculadora TI-83 Plus. El disco compacto tam-bién trae programas para la calculadora graficadora TI-83 Plus®, el programaestadístico STATDISK (versión 9-1) y el recurso “Add-Inn” de Excel, quese diseñó para incrementar las capacidades de los programas estadísticos deExcel.ComplementosLos paquetes complementarios del estudiante y profesor buscan conformar el sis-tema de aprendizaje más completo y útil disponible para un curso de introduccióna la estadística. Los profesores deben contactar a su representante local de ventasde Pearson Educación para recibir copias de los exámenes.AL PROFESOR● Manual de soluciones para el profesor (disponible en inglés), escrito porMario F. Triola y Milton Loyer; contiene soluciones a todos los ejercicios y unprograma muestra del curso. ISBN: 0-321-12212-7.● Sistema de evaluación (disponible en inglés): Se cuidó mucho para asegu-rar el sistema de evaluación más sólido para la nueva edición de Estadística.Además de un banco de exámenes impreso, también hay un generador de exá-menes computarizado, el TestGen4.0 y Quizmaster3.0, que permite realizary editar preguntas del banco de exámenes, transferirlas a otros exámenes yobtener impresiones en diversos formatos. El programa también ofrece mu-chas opciones para organizar y presentar los bancos de exámenes y los exá-menes. Por su capacidad de elaboración aleatoria y su generador de exámenes,el TestGen-EQ resulta ideal para crear múltiples versiones de exámenes, yaque ofrece mayor posibilidad de reactivos que las preguntas impresas delbanco de exámenes. Sus poderosas funciones de búsqueda y combinaciónpermiten al profesor localizar con facilidad preguntas y presentarlas en el ordenque se prefiera. Los usuarios tienen la posibilidad de exportar los exámenescomo archivos de texto, de tal modo que éstos pueden leerse en un navega-dor de Internet. Además, las pruebas que se crearon con TestGen son compa-tibles con el QuizMaster, que permite al estudiante resolver exámenes conla ayuda de una computadora. QuizMaster califica los exámenes de formaautomática, almacena los resultados en disco y permite al profesor revisar eimprimir gran diversidad de reportes de estudiantes, clases o cursos. PrintedTestbank ISBN: 0-321-12214-3; TestGen-EQ para Mac y Windows ISBN:0-321-12213-5.● CD con presentación de conferencia en Power Point®(disponible en in-glés): Gratuito para los clientes que cubran los requisitos, dicho programade presentación de conferencias para el salón de clase se diseñó específica-mente para la secuencia y filosofía de Estadística. Incluye los gráficos clavedel libro. Las diapositivas también están disponibles en el sitio Web de Triolawww.pearsoneducacion.net/triola. Para Mac y Windows ISBN: 0-321-12215-1.Prefacio xiiiSTATDISKExcelTI-83 PlusMinitab
  11. 11. AL ESTUDIANTE● Vídeos (disponible en inglés): Se diseñaron para complementar muchas seccio-nes del libro; el autor presenta en ellos varios de los temas. Los vídeos ejemplifi-can todas las herramientas tecnológicas que aparecen en el libro de texto. Los ví-deos son un excelente recurso para aquellos estudiantes que han perdido clases oque desean revisar un tema. También es un buen recurso para los profesores quetrabajan en programas de aprendizaje a distancia, así como para el estudio indivi-dual o los programas de sistemas abiertos. Cintas de vídeo ISBN: 0-321-12209-7;Digital Video Tutor (versión en CD-ROM) ISBN: 0-321-12231-3.● Página en Internet de Estadística de Triola: Se tiene acceso a este sitio enhttp://www.pearsoneducacion.net/triola. El sitio ofrece proyectos de Internet,relacionados con cada uno de los capítulos del texto, y los conjuntos de datostal como aparecen en el disco compacto.Los siguientes manuales tecnológicos incluyen instrucciones y ejemplos del usode las herramientas tecnológicas. Cada uno se anotó en correspondencia con ellibro de texto.● Excel® Manual de laboratorio del estudiante y libro de trabajo (disponible eninglés), escrito por Johanna Halsey y Ellena Reda (Dutchess CommunityCollege). ISBN: 0-321-12206-2.● Minitab® Manual de laboratorio del estudiante y libro de trabajo, escrito porMario F. Triola. ISBN: 0-321-12205-4.● SAS Manual de laboratorio del estudiante y libro de trabajo, escrito por JosephMorgan (DePaul University). ISBN: 0-321-12727-7.● SPSS® Manual de laboratorio del estudiante y libro de trabajo, escrito porRoger Peck (California State University, Bakersfield). ISBN: 0-321-12207-0.● STATDISK Manual de laboratorio del estudiante y libro de trabajo, escritopor Mario F. Triola. ISBN: 0-321-12216-X.● TI-83 Plus® Compañero de Estadística, de Marla Bell (Kennesaw State Uni-versity). ISBN: 0-321-12208-9.● ActivStats®, versión de Triola, que elaboraron Paul Velleman y Data Descrip-tion, Inc.; ofrece cobertura completa de temas introductorios a la estadística enCD-ROM, con el uso de diversos recursos multimedia. ActivStat integra vídeo,simulación, animación, narración, texto, experimentos interactivos, acceso a laWeb y Data Desk®, un programa estadístico de cómputo. En el CD-ROM seagregaron problemas y conjuntos de datos para tareas. ActivStats para Windowsy Macintosh ISBN: 0-201-77139-X. También está disponible en versiones paraExcel, JMP, Minitab y SPSS. Consulte a su representante de ventas de PearsonEducación para obtener detalles o consulte el sitio de Internet www.aw.com/activstats.● La Edición del estudiante de Minitab (disponible en inglés) es una versióncondensada del programa estadístico de cómputo profesional de Minitab. Ofrecea los estudiantes la gama completa de métodos estadísticos y capacidades gráfi-cas de Minitab, además de las hojas de cálculo que llegan a contener hasta 5000puntos de datos. Se acompaña de un manual del usuario, que trae estudios decaso y tutoriales prácticos, mientras que su uso es perfecto para cualquier cursode introducción a la estadística, incluyendo los de ciencias sociales. La versión delestudiante disponible actualmente es la Edición del estudiante de Minitab, Release12 para Windows 95/98 NT. ISBN: 0-201-39715-3.xiv PREFACIO
  12. 12. Cualquiera de estos productos puede adquirirse por separado o junto con los librosde texto de Pearson Educación. Para los profesores es posible ponerse en contactocon el representante de ventas local para conocer los detalles sobre la compra delos complementos del libro de texto.Prefacio xv
  13. 13. xviiEl éxito de Estadística se debe a los esfuerzos de muchos profesionales comprome-tidos. Quiero expresar mi más sincero agradecimiento a Deirdre Lynch, ChristineO’Brien, Greg Tobin, Peggy McMahon, Barbara Atkinson, Brenda Bravener,Yolando Cossio, Karen Guardino, Jen Kerber, Sara Anderson, Keren Blankfeld,Joe Vetere, Joanne Ha, Weslie Lewis y Janet Nuciforo, así como a todo el equipode Addison-Wesley.Agradezco también a Paul Lorczak por su trabajo en los proyectos de Internet.A Dale Peterson, de la United States Air Force Academy, por proporcionar excelen-tes sugerencias para esta nueva edición. A Don Puretz, Heather Carielli y AshleyMc-Connaughay por ayudar con los conjuntos de datos. Estoy agradecido por lasmuchas sugerencias y por los comentarios que proporcionaron instructores y estu-diantes, así como a los cientos de investigadores que realizaron estudios, llevarona cabo encuestas, y compilaron datos interesantes y significativos que se usaron enlos ejemplos y ejercicios a lo largo de este libro.También tengo el orgullo de agradecerle a mi esposa, Ginny, y a mis hijosMarc y Scott por su ayuda y estímulo.Además, me gustaría dar las gracias a las siguientes personas por su ayudacon la novena edición:Revisores de la precisión del textoDavid R. Lund, University of Wisconsin en Eau ClaireTim MogillKimberly Polly, Parkland CollegeJohn Ritschdorff, Marist CollegeTwin Prime EditorialTom WegleitnerRevisores de la novena edición:Dan Abbey, Broward Community CollegeJustine Baker, Peirce CollegeAgradecimientos
  14. 14. xviii AGRADECIMIENTOSDonald Barrs, Pellissippi State Technical Community CollegeMarla Bell, Kennesaw State UniversityWayne Ehler, Anne Arundel Community CollegeJoe Gallegos, Salt Lake Community CollegeJim Graziose, Palm Beach Community CollegeKristin Hartford, Long Beach City CollegeJohn Kozarski, Community College of Baltimore County-CatonsvilleTzong-Yow Lee, University of MarylandDebra Loeffler, Community College of Baltimore County-CatonsvilleCaren McClure, Santa Ana CollegeCarla Monticelli, Camden County Community CollegeRick Moscatello, Southeastern Louisiana UniversityNasser Ordoukhani, Barry UniversityMichael Oriolo, Herkimer County Community CollegeKimberly Polly, Parkland CollegeDiann Reischman, Grand Valley State UniversityDon Robinson, Illinois State UniversityIra Rosenthal, Palm Beach Community College—Eissey CampusAdele Shapiro, Palm Beach Community CollegeLewis Shoemaker, Millersville UniversityConsuelo Stewart, Howard Community CollegeDavid Stewart, Community College of Baltimore County-DundalkSharon Testone, Onondaga Community CollegeCarol Yin, LeGrange CollegeExtiendo mis sinceros agradecimientos a los siguientes revisores y usuariosde ediciones previas de este libro, por sus sugerencias:Mary Abkemeier, Fontbonne CollegeWilliam A. Ahroon, SUNY en PlattsburghScott Albert, College of Du PageJules Albertini, Ulster County Community CollegeTim Allen, Delta CollegeStu Anderson, College of Du PageJeff Andrews, TSG Associates, Inc.Mary Anne Anthony, Rancho Santiago Community CollegeWilliam Applebaugh, University of Wisconsin en Eau ClaireJames Baker, Jefferson Community CollegeAnna Bampton, Christopher Newport UniversityJames Beatty, Burlington County College
  15. 15. Agradecimientos xixPhilip M. Beckman, Black Hawk CollegeMarian Bedee, BGSU, Firelands CollegeDon Benbow, Marshalltown Community CollegeMichelle Benedict, Augusta CollegeKathryn Benjamin, Suffolk County Community CollegeRonald Bensema, Joliet Junior CollegeDavid Bernklau, Long Island UniversityMaria Betkowski, Middlesex Community CollegeShirley Blatchley, Brookdale Community CollegeDavid Blaueuer, University of FindlayRandy Boan, Aims Community CollegeJohn Bray, Broward Community College-CentralDenise Brown, Collin County Community CollegePatricia Buchanan, Pennsylvania State UniversityJohn Buchl, John Wood Community CollegeMichael Butler, Mt. San Antonio CollegeJerome J. Cardell, Brevard Community CollegeDon Chambless, Auburn UniversityRodney Chase, Oakland Community CollegeBob Chow, Grossmont CollegePhilip S. Clarke, Los Angeles Valley CollegeDarrell Clevidence, Carl Sandburg CollegePaul Cox, Ricks CollegeSusan Cribelli, Aims Community CollegeImad Dakka, Oakland Community CollegeArthur Daniel, Macomb Community CollegeGregory Davis, University of Wisconsin, Green BayTom E. Davis III, Daytona Beach Community CollegeCharles Deeter, Texas Christian UniversityJoseph DeMaio, Kennesaw State UniversityJoe Dennin, Fairfield UniversityNirmal Devi, Embry Riddle Aeronautical UniversityRichard Dilling, Grace CollegeRose Dios, New Jersey Institute of TechnologyDennis Doverspike, University of AkronPaul Duchow, Pasadena City CollegeBill Dunn, Las Positas CollegeMarie Dupuis, Milwaukee Area Technical CollegeEvelyn Dwyer, Walters State Community CollegeJane Early, Manatee Community College
  16. 16. xx AGRADECIMIENTOSSharon Emerson-Stonnell, Longwood CollegeP. Teresa Farnum, Franklin Pierce CollegeRuth Feigenbaum, Bergen Community CollegeVince Ferlini, Keene State CollegeMaggie Flint, Northeast State Technical Community CollegeBob France, Edmonds Community CollegeChristine Franklin, University of GeorgiaRichard Fritz, Moraine Valley Community CollegeMaureen Gallagher, Hartwick CollegeMahmood Ghamsary, Long Beach City CollegeTena Golding, Southeastern Louisiana UniversityElizabeth Gray, Southeastern Louisiana UniversityDavid Gurney, Southeastern Louisiana UniversityFrancis Hannick, Mankato State UniversityJoan Harnett, Molloy CollegeLeonard Heath, Pikes Peak Community CollegePeter Herron, Suffolk County Community CollegeMary Hill, College of Du PageLarry Howe, Rowan College of New JerseyLloyd Jaisingh, Morehead State UniversityLauren Johnson, Inver Hills Community CollegeMartin Johnson, Gavilan CollegeRoger Johnson, Carleton CollegeHerb Jolliff, Oregon Institute of TechnologyFrancis Jones, Huntington CollegeToni Kasper, Borough of Manhattan Community CollegeAlvin Kaumeyer, Pueblo Community CollegeWilliam Keane, Boston CollegeRobert Keever, SUNY en PlattsburghAlice J. Kelly, Santa Clara UniversityDave Kender, Wright State UniversityMichael Kern, Bismarck State CollegeJohn Klages, County College of MorrisMarlene Kovaly, Florida Community College en JacksonvilleTomas Kozubowski, University of TennesseeShantra Krishnamachari, Borough of Manhattan Community CollegeRichard Kulp, David Lipscomb UniversityLinda Kurz, SUNY College of TechnologyChristopher Jay Lacke, Rowan UniversityTommy Leavelle, Mississippi College
  17. 17. Agradecimientos xxiR. E. Lentz, Mankato State UniversityTimothy Lesnick, Grand Valley State UniversityDawn Lindquist, College of St. FrancisGeorge Litman, National-Louis UniversityBenny Lo, Ohlone CollegeSergio Loch, Grand View CollegeVincent Long, Gaston CollegeBarbara Loughead, National-Louis UniversityDavid Lund, University of Wisconsin en Eau ClairRhonda Magel, North Dakota State University—FargoGene Majors, Fullerton CollegeHossein Mansouri, Texas State Technical CollegeVirgil Marco, Eastern New Mexico UniversityJoseph Mazonec, Delta CollegeCaren McClure, Rancho Santiago Community CollegePhillip McGill, Illinois Central CollegeMarjorie McLean, University of TennesseeAusten Meek, Canada CollegeRobert Mignone, College of CharlestonGlen Miller, Borough of Manhattan Community CollegeKermit Miller, Florida Community College en JacksonvilleKathleen Mittag, University of Texas—San AntonioMitra Moassessi, Santa Monica CollegeCharlene Moeckel, Polk Community CollegeTheodore Moore, Mohawk Valley Community CollegeGerald Mueller, Columbus State Community CollegeSandra Murrell, Shelby State Community CollegeFaye Muse, Asheville-Buncombe Technical Community CollegeGale Nash, Western State CollegeFelix D. Nieves, Antillean Adventist UniversityLyn Noble, Florida Community College en Jacksonville-SouthDeWayne Nymann, University of TennesseePatricia Oakley, Seattle Pacific UniversityKeith Oberlander, Pasadena City CollegePatricia Odell, Bryant CollegeJames O’Donnell, Bergen Community CollegeAlan Olinksy, Bryant CollegeRon Pacheco, Harding UniversityLindsay Packer, College of CharlestonKwadwo Paku, Los Medanos College
  18. 18. Deborah Paschal, Sacramento City CollegeS. A. Patil, Tennessee Technological UniversityRobin Pepper, Tri-County Technical CollegeDavid C. Perkins, Texas A&M University—Corpus ChristiAnthony Piccolino, Montclair State UniversityRichard J. Pulskamp, Xavier UniversityVance Revennaugh, Northwestern CollegeC. Richard, Southeastern Michigan CollegeSylvester Roebuck, Jr., Olive Harvey CollegeKenneth Ross, Broward Community CollegeCharles M. Roy, Camden County CollegeKara Ryan, College of Notre DameFabio Santos, LaGuardia Community CollegeRichard Schoenecker, University of Wisconsin, Stevens PointNancy Schoeps, University of North Carolina, CharlotteJean Schrader, Jamestown Community CollegeA. L. Schroeder, Long Beach City CollegePhyllis Schumacher, Bryant CollegeSankar Sethuraman, Augusta CollegeRosa Seyfried, Harrisburg Area Community CollegeCalvin Shad, Barstow CollegeCarole Shapero, Oakton Community CollegeLewis Shoemaker, Millersville UniversityJoan Sholars, Mt. San Antonio CollegeGalen Shorack, University of WashingtonTeresa Siak, Davidson County Community CollegeCheryl Slayden, Pellissippi State Technical Community CollegeArthur Smith, Rhode Island CollegeMarty Smith, East Texas Baptist UniversityLaura Snook, Blackhawk Community CollegeAileen Solomon, Trident Technical CollegeSandra Spain, Thomas Nelson Community CollegeMaria Spinacia, Pasco-Hernandez Community CollegePaulette St. Ours, University of New EnglandW. A. Stanback, Norfolk State UniversityCarol Stanton, Contra Costra CollegeRichard Stephens, University of Alaska SoutheastW. E. Stephens, McNeese State UniversityTerry Stephenson, Spartanburg Methodist CollegeConsuelo Stewart, Howard Community Collegexxii AGRADECIMIENTOS
  19. 19. Ellen Stutes, Louisiana State University at EuniceSr. Loretta Sullivan, University of Detroit MercyTom Sutton, Mohawk CollegeAndrew Thomas, Triton CollegeEvan Thweatt, American River CollegeJudith A. Tully, Bunker Hill Community CollegeGary Van Velsir, Anne Arundel Community CollegePaul Velleman, Cornell UniversityRandy Villa, Napa Valley CollegeHugh Walker, Chattanooga State Technical Community CollegeCharles Wall, Trident Technical CollegeGlen Weber, Christopher Newport CollegeDavid Weiner, Beaver CollegeSue Welsch, Sierra Nevada CollegeRoger Willig, Montgomery County Community CollegeGail Wiltse, St. Johns River Community CollegeOdell Witherspoon, Western Piedmont Community CollegeJean Woody, Tulsa Junior CollegeThomas Zachariah, Loyola Marymount UniversityElyse Zois, Kean College of New JerseyM.F.T.LaGrange, Nueva YorkSeptiembre, 2002Agradecimientos xxiii
  20. 20. xxvResumen de contenidoCapítulo 1 Introducción a la estadística 2Capítulo 2 Descripción, exploración y comparación de datos 36Capítulo 3 Probabilidad 118Capítulo 4 Distribuciones de probabilidad 180Capítulo 5 Distribuciones de probabilidad normal 224Capítulo 6 Estimados y tamaños de muestra 296Capítulo 7 Prueba de hipótesis 366Capítulo 8 Inferencias a partir de dos muestras 436Capítulo 9 Correlación y regresión 494Capítulo 10 Experimentos multinomiales y tablas de contingencia 564Capítulo 11 Análisis de varianza 602Capítulo 12 Estadística no paramétrica 636Capítulo 13 Control estadístico de procesos 694Capítulo 14 Proyectos, procedimientos y perspectivas 722Apéndices 730Apéndice A: Tablas 731Apéndice B: Conjunto de datos 747Apéndice C: TI-83 Plus 783Apéndice D: Glosario 785Apéndice E: Bibliografía 793Apéndice F: Soluciones de los ejercicios impares (y de todos los ejerciciosde repaso y de los ejercicios de repaso acumulativo) 795Créditos 827Índice 829
  21. 21. ContenidoIntroducción a la estadística 21-1 Panorama general 41-2 Tipos de datos 51-3 Pensamiento crítico 111-4 Diseño de experimentos 20Descripción, exploración y comparaciónde datos 362-1 Panorama general 382-2 Distribuciones de frecuencias 392-3 Visualización de los datos 462-4 Medidas de tendencia central 592-5 Medidas de variación 732-6 Medidas de posición relativa 922-7 Análisis exploratorio de datos (AED) 102Probabilidad 1183-1 Panorama general 1203-2 Fundamentos 1203-3 Regla de la suma 1323-4 Regla de la multiplicación: fundamentos 1393-5 Regla de la multiplicación: complementos y probabilidadcondicional 1503-6 Probabilidades por medio de simulaciones 1563-7 Conteo 162Distribuciones de probabilidad 1804-1 Panorama general 1824-2 Variables aleatorias 1834-3 Distribuciones de probabilidad binomial 1964-4 Media, varianza y desviación estándar para la distribuciónbinomial 2074-5 La distribución de Poisson 212xxvii
  22. 22. Distribuciones de probabilidad normal 2245-1 Panorama general 2265-2 Distribución normal estándar 2275-3 Aplicaciones de las distribuciones normales 2405-4 Distribuciones muestrales y estimadores 2495-5 Teorema del límite central 2595-6 La distribución normal como aproximación de la distribuciónbinomial 2715-7 Determinación de la normalidad 282Estimados y tamaños de muestra 2966-1 Panorama general 2986-2 Estimación de la proporción de una población 2986-3 Estimación de la media poblacional: s conocida 3186-4 Estimación de la media poblacional: s desconocida 3306-5 Estimación de la varianza de una población 347Prueba de hipótesis 3667-1 Panorama general 3687-2 Fundamentos de la prueba de hipótesis 3697-3 Prueba de una aseveración respecto de una proporción 3887-4 Prueba de una aseveración respecto de una media: S conocida 4007-5 Prueba de una aseveración respecto de una media: S desconocida 4077-6 Prueba de una aseveración respecto de una desviación estándaro de una varianza 419Inferencias a partir de dos muestras 4368-1 Panorama general 4388-2 Inferencias acerca de dos proporciones 4388-3 Inferencias acerca de dos medias: muestras independientes 4528-4 Inferencias a partir de datos apareados 4668-5 Comparación de la variación en dos muestras 476Correlación y regresión 4949-1 Panorama general 4969-2 Correlación 4969-3 Regresión 5179-4 Variación e intervalos de predicción 5319-5 Regresión múltiple 5419-6 Elaboración de modelos 551Experimentos multinomiales y tablasde contingencia 56410-1 Panorama general 56610-2 Experimentos multinomiales: bondad de ajuste 56710-3 Tablas de contingencia: independencia y homogeneidad 582xxviii CONTENIDO
  23. 23. Análisis de varianza 60211-1 Panorama general 60411-2 ANOVA de un factor 60611-3 ANOVA de dos factores 619Estadística no paramétrica 63612-1 Panorama general 63812-2 Prueba del signo 64012-3 Prueba de rangos con signo de Wilcoxon para datos apareados 65012-4 Prueba de la suma de rangos de Wilcoxon para dos muestrasindependientes 65612-5 Prueba de Kruskal-Wallis 66312-6 Correlación de rangos 67012-7 Prueba de rachas para detectar aleatoriedad 679Control estadístico de procesos 69413-1 Panorama general 69613-2 Gráficas de control para la variación y la media 69613-3 Gráficas de control para atributos 710Proyectos, procedimientos y perspectivas 72214-1 Proyectos 72214-2 Procedimiento 72614-3 Perspectiva 728Apéndices 730Apéndice A: Tablas 731Apéndice B: Conjuntos de datos 747Apéndice C: TI-83 Plus 783Apéndice D: Glosario 785Apéndice E: Bibliografía 793Apéndice F: Soluciones de los ejercicios impares (y de todos los ejerciciosde repaso y de los ejercicios de repaso acumulativo) 795Créditos 827Índice 829Contenido xxix
  24. 24. 1-1 Panorama general1-2 Tipos de datos1-3 Pensamiento crítico1-4 Diseño de experimentosIntroduccióna la estadística
  25. 25. P R O B L E M A D E L C A P Í T U L O¿Qué podemos aprenderde estas encuestas?A continuación se presentan descripciones breves decinco encuestas diferentes:1. A mediados de diciembre de un año reciente, elproveedor de servicios de Internet America Online(AOL) realizó una encuesta entre sus usuarios.La siguiente pregunta se refería a los árboles deNavidad:¿Cuál prefiere?● un árbol natural● un árbol artificialDe entre las 7073 respuestas recibidas de los usua-rios de Internet, 4650 prefirieron un árbol naturaly 2423 un árbol artificial.2. La revista Newsweek hace poco realizó una en-cuesta acerca del controvertido sitio de Internetllamado Napster, que ofrecía acceso gratuito paracopiar discos compactos de música. Se planteó lasiguiente pregunta a los lectores:¿Continuaría utilizando Napster si tuviese quepagar?Los lectores podían registrar sus respuestas en el si-tio de Internet www.newsweek.msnbc.com. De las1873 respuestas recibidas, el 19% dijo que sí, ya queaun así resultaría más barato que comprar los dis-cos compactos originales. Otro 5% dijo que sí, quese sentiría más cómodo al utilizarlo si lo pagaba.3. La revista Good Housekeeping invitó a mujerespara que visitaran su página en Internet para con-testar una encuesta, y se registraron 1500 respues-tas. Cuando se les preguntó si preferían tener másdinero o dormir más, el 88% eligió más dinero ysólo el 11%, dormir más.4. USA Today realizó una “Encuesta sobre el cuida-do de la salud” de 3/4 de página. A los lectores seles pedía lo siguiente: “Por favor, tómese un mo-mento para llenar esta encuesta y envíenosla”. Lamayoría de las preguntas se referían a las con-diciones de salud, y al consumo de tabaco y demedicamentos de prescripción. La pregunta 17 dela encuesta era: “¿Podríamos establecer contactonuevamente con usted para que participe en otrasencuestas de USA Today?”.5. USA Today publicó una gráfica de barras con losresultados de una encuesta donde se preguntó alos lectores: “¿Tiene planes para tomar unas vaca-ciones?”. De los 4264 usuarios de Internet quedecidieron responder, el 48% dijo que aún no te-nía planes, y el 14% contestó que planeaba ir aalguna playa.¿Qué característica importante tienen en común estascinco encuestas? Con base en los resultados obtenidosen ellas, ¿cómo se ven afectadas nuestras conclusionesrespecto de la población general? ¿Podríamos con-cluir que la mayoría de los estadounidenses prefierenun árbol de Navidad real que uno artificial? ¿Conclui-ríamos que la gran mayoría de las mujeres estadouni-denses prefieren más dinero que dormir más? ¿O quela gran mayoría de las mujeres lectoras de la revistaGood Housekeeping prefieren más dinero que dormirmás? Las respuestas a tales preguntas son de crucialimportancia para evaluar los resultados de las encues-tas. El asunto a considerar aquí es el tema más impor-tante de todo este capítulo y podría ser el aspecto másrelevante de todo el libro.En este capítulo estudiaremos temas relevantessobre la validez de encuestas como las anteriormen-te descritas. Veremos que con frecuencia sacamosconclusiones relevantes con la simple aplicación delsentido común. Al final de este capítulo, seremos ca-paces de identificar los aspectos clave que afectan lavalidez de las cinco encuestas y lograremos una pro-funda comprensión de los métodos de recolección dedatos en general.
  26. 26. 4 CAPÍTULO 1 Introducción a la estadísticaDatos son las observaciones recolectadas (como mediciones, géneros, respuestasde encuesta).Estadística es una colección de métodos para planear experimentos, obtener datos,y después organizar, resumir, presentar, analizar, interpretar y llegar a conclusionesbasadas en los datos.Población es la colección completa de todos los elementos (puntuaciones, perso-nas, mediciones, etcétera) a estudiar. Se dice que la colección es completa, puesincluye a todos los sujetos que se estudiarán.Censo es la colección de datos de cada uno de los miembros de la población.Muestra es un subconjunto de miembros seleccionados de una población.DefinicionesPor ejemplo, un sondeo de Gallup preguntó a 1087 adultos: “¿Consume bebidas al-cohólicas como licor, vino o cerveza o es abstemio?”. Los 1087 sujetos de la en-cuesta constituyen una muestra mientras que la población consiste en el conjuntode los 202,682,345 estadounidenses adultos. Cada 10 años el gobierno de EstadosUnidos intenta obtener un censo de cada ciudadano; pero no logra hacerlo porquees imposible localizar a cada uno de ellos. En la actualidad hay polémica en tornoal intento de emplear métodos estadísticos acertados para aumentar la exactituddel censo, aunque los aspectos políticos constituyen un factor clave para que losmiembros del Congreso se resistan a esta mejoría. Quizás algún día algunos lecto-res de este texto sean miembros del Congreso y tengan la sabiduría de traer el censoal siglo XXI.Una función importante de este libro es demostrar cómo utilizar las muestrasde datos para llegar a conclusiones respecto de poblaciones. Veremos que es ex-tremadamente importante obtener datos muestrales que sean representativos de lapoblación de la que se tomaron. Por ejemplo, si usted encuesta a los estudiantesgraduados de su universidad y les pide que anoten sus ingresos anuales y le envíenla respuesta por correo, es probable que los resultados no sean representativosde la población de todo el alumnado. Aquellos con bajos ingresos estarían menosinclinados a responder y quienes respondan pueden mostrar tendencia a exagerar.1-1 Panorama generalEl Problema del capítulo en la página anterior implica a las encuestas. La encues-ta es una de muchas herramientas disponibles para recolectar datos. Una metacomún de las encuestas es reunir datos de una pequeña parte de un grupo másgrande para aprender algo acerca de este último. Una meta común e importante dela estadística es aprender acerca de un grupo examinando los datos de algunosde sus miembros. En dicho contexto los términos muestra y población adquierenimportancia. Las definiciones formales de éstos y otros términos básicos se pre-sentan a continuación.
  27. 27. 1-2 Tipos de datos 5Al avanzar en este capítulo debemos enfocarnos en los siguientes conceptosclave:● Los datos muestrales deben reunirse de una forma adecuada, como enun proceso de selección aleatoria.● Si los datos muestrales no se reúnen de forma adecuada, resultaríantan inútiles que ninguna cantidad de tortura estadística podría sal-varlos.Ante todo, le pedimos que comience a estudiar estadística con una mente abierta.No considere que el estudio de la estadística es comparable con un procedimientoinflexible. La experiencia del autor es que los estudiantes a menudo se sorprendenpor lo interesante que resulta la estadística y también porque realmente llegan adominar sus principios básicos sin mucha dificultad, incluso si no han sido sobre-salientes en otros cursos de matemáticas. Estamos convencidos de que cuandousted termine este curso introductorio, tendrá la firme creencia de que la estadísti-ca es una materia rica e interesante con aplicaciones que son extensivas, reales ysignificativas. También estamos convencidos de que con la asistencia a clases y ladedicación constantes, usted tendrá éxito para dominar los conceptos básicos dela estadística presentados en este curso.1-2 Tipos de datosEn la sección 1-1 definimos los términos población y muestra. Los siguientes dostérminos se utilizan para distinguir los casos donde se cuenta con los datos de unapoblación completa, de aquellos en que sólo se tienen datos de una muestra.Parámetro es una medición numérica que describe algunas características deuna población.Estadístico es una medición numérica que describe algunas características deuna muestra.DefinicionesEJEMPLOS1. Parámetro: Cuando Lincoln fue elegido presidente por primera vez, recibióel 39.82% de 1,865,908 votos. Si suponemos que el conjunto de todos esosvotos es la población a considerar, entonces el 39.82% es un parámetro, noun estadístico.2. Estadístico: Con base en una muestra de 877 ejecutivos encuestados, seencontró que el 45% de ellos no contrataría a alguien con un error orto-gráfico en su solicitud de empleo. Esta cifra del 45% es un estadístico,ya que está basada en una muestra, no en la población completa de todoslos ejecutivos.El estado de laestadísticaEl término estadística se derivade la palabra latina status (quesignifica “estado”). Los prime-ros usos de la estadística impli-caron la compilación de datos yla elaboración de gráficas paradescribir diversos aspectos deun estado o de un país. En 1662,John Graunt publicó informa-ción estadística acerca de losnacimientos y los decesos.Altrabajo de Graunt siguieronestudios de tasas de mortalidady de enfermedad, tamaño de po-blaciones, ingresos y tasas de de-sempleo. Los hogares, gobiernosy negocios se apoyan bastante endatos estadísticos para dirigirsus acciones. Por ejemplo, secompilan datos cuidadosamentey con regularidad para establecerlas tasas de desempleo, las tasasde inflación, los índices del con-sumidor y las tasas de nacimientoy muerte, y los líderes empresa-riales utilizan los datos resul-tantes para tomar decisiones queafectan las futuras contrataciones,los niveles de producción y la ex-pansión hacia nuevos mercados.
  28. 28. 6 CAPÍTULO 1 Introducción a la estadísticaLos datos cuantitativos consisten en números que representan conteos o medi-ciones.Los datos cualitativos (o categóricos o de atributo) se dividen en diferentes ca-tegorías que se distinguen por alguna característica no numérica.DefinicionesDatos discretos resultan cuando el número de posibles valores es un número finito,o bien, un número que puede contarse. (Es decir, el número de posibles valoreses 0, 1, 2, etcétera).Datos continuos (numéricos) resultan de un infinito de posibles valores quepueden asociarse a puntos de alguna escala continua, cubriendo un rango de va-lores sin huecos ni interrupciones.DefinicionesEJEMPLOS1. Datos cuantitativos: Los pesos de las supermodelos.2. Datos cualitativos: El género (hombre/mujer) de atletas profesionales.Cuando se trabaja con datos cuantitativos, es importante utilizar las unidadesde medida apropiadas, tales como dólares, horas, pies, metros y otras. Debemosser especialmente cuidadosos para observar aquellas referencias como “todas lascantidades están en miles de dólares” o “todos los tiempos están en centésimas desegundo” o “las unidades están en kilogramos”. Ignorar unidades de medida comoéstas podría llevar a conclusiones incorrectas. La NASA perdió su Mars ClimateOrbiter de 125 millones de dólares cuando la sonda se estrelló, porque la progra-mación de control tenía los datos de aceleración en unidades inglesas, pero ellosincorrectamente consideraron que estaban en unidades métricas.Los datos cuantitativos se describen con mayor detalle distinguiendo entre lostipos discretos y continuos.Algunos conjuntos de datos consisten en números (como estaturas de 66 y 72pulgadas), mientras que otros son no numéricos (como los colores de ojos verde ycafé). Los términos datos cuantitativos y datos cualitativos suelen utilizarse paradistinguir entre ambos tipos.EJEMPLOS1. Datos discretos: Las cantidades de huevos que ponen las gallinas sondatos discretos porque representan conteos.
  29. 29. 1-2 Tipos de datos 7Nivel de medición nominal son los datos consistentes exclusivamente en nombres,etiquetas o categorías que no pueden acomodarse según un esquema de orden(por ejemplo, de bajo a alto).DefiniciónEJEMPLOS Los ejemplos siguientes ilustran datos muestrales en el nivelde medición nominal.1. Sí/no/indeciso: Respuestas de sí, no e indeciso en una encuesta.2. Colores: Los colores de automóviles conducidos por estudiantes univer-sitarios (rojo, negro, azul, blanco y otros).Puesto que los datos nominales carecen de un orden o de un significado nu-mérico, no pueden utilizarse para realizar cálculos. A veces se asignan números alas diferentes categorías (en especial cuando los datos se codifican para el uso desistemas de cómputo), pero tales números no tienen significado computacional ycualquier promedio que se calcule carece de sentido.2. Datos continuos: Las cantidades de leche que las vacas producenson datos continuos porque son mediciones que pueden tomar cualquiervalor dentro de un intervalo continuo. Durante un intervalo de tiempodado, una vaca producirá una cantidad de leche que puede ser cualquiervalor entre 0 y 5 galones. Es posible obtener 2.343115 galones, ya que lavaca no está restringida a producir cantidades discretas de 0, 1, 2, 3, 4, o5 galones.Otra forma común de clasificación de los datos es el uso de cuatro nivelesde medición: nominal, ordinal, de intervalo y de razón. Cuando la estadística seaplica a problemas reales, el nivel de medición de los datos es un factor impor-tante para determinar el procedimiento a usar. (Véase la figura 14.1 en la pági-na 727.) En este libro encontraremos algunas referencias a estos niveles de medi-ción; sin embargo, lo importante aquí es sustentarse en el sentido común: no hayque hacer cálculos ni usar métodos estadísticos con datos que no sean apropiados.Por ejemplo, no tendría sentido calcular un promedio de números del segurosocial, ya que estos números son datos que se usan como identificación, y norepresentan mediciones ni conteos de algo. Por la misma razón, no tendría sen-tido calcular un promedio de los números que aparecen en las camisetas de losjugadores de básquetbol.Medición de ladesobediencia¿De qué manera se recolectandatos que parecen imposibles demedir, como el nivel de desobedien-cia de las personas? El psicólogoStanley Milgram ideó el siguienteexperimento: un investigadorenseñó a un sujeto voluntario aoperar un tablero de control queadministraba “choques eléctricos”cada vez más dolorosos a una ter-cera persona. En realidad no sedaban tales choques y la tercerapersona era un actor. El voluntarioiniciaba con 15 volts y fue instrui-do para incrementar los choquesen aumentos de 15 volts. El ni-vel de desobediencia fue el puntodonde el sujeto se negaba a incre-mentar el voltaje. Resultó sorpren-dente que dos terceras partes delos sujetos obedecieran las órdenesaun cuando el actor gritaba y fin-gía sufrir un ataque cardiaco.
  30. 30. 8 CAPÍTULO 1 Introducción a la estadísticaLos datos están en el nivel de medición ordinal cuando pueden acomodarse enalgún orden, aunque no es posible determinar diferencias entre los valores de losdatos o tales diferencias carecen de significado.DefiniciónEl nivel de medición de intervalo se parece al nivel ordinal, pero con la propie-dad adicional de que la diferencia entre dos valores de datos cualesquiera tieneun significado. Sin embargo, los datos en este nivel no tienen un punto de partidainherente (natural) desde cero (donde nada de la cantidad esté presente).DefiniciónEJEMPLOS Los siguientes son ejemplos de datos muestrales en el nivel demedición ordinal.1. Las calificaciones de un curso: Un profesor universitario asignacalificaciones de A, B, C, D, o E, las cuales pueden acomodarse en orden;sin embargo, no es posible determinar diferencias entre ellas. Por ejemplo,sabemos que A es más alto que B (por lo tanto, existe un orden), pero nopodemos restar B de A (por lo tanto, no se calcula la diferencia).2. Rangos ordenados: Con fundamento en varios criterios, una revista cla-sificó las ciudades de acuerdo con su “calidad de vida”. Tales rangos (primero,segundo, tercero, etcétera) determinan un orden; sin embargo, las diferenciasentre los rangos ordenados no tienen significado alguno. Por ejemplo, unadiferencia de “segundo menos primero” puede sugerir 2 – 1 = 1, pero esteresultado de 1 no tiene significado porque no es una cantidad exacta quepueda compararse con otras diferencias del mismo tipo. La diferencia entrela primera ciudad y la segunda no es la misma que la diferencia entre la se-gunda y la tercera. Utilizando los rangos ordenados de la revista, la diferenciaentre las ciudades de Nueva York y Boston no puede compararse cuantitati-vamente con la diferencia entre las ciudades de San Luis y Filadelfia.Los datos ordinales ofrecen información sobre comparaciones relativas, aun-que no sobre las magnitudes de las diferencias. Por lo general, los datos ordina-les no se usan para cálculos como un promedio, pero esta norma se quebranta enocasiones (como cuando se usan calificaciones con letras para calcular el puntopromedio de calificación).EJEMPLOS Los siguientes ejemplos ilustran el nivel de medición de inter-valo.1. Temperaturas: Las temperaturas corporales de 98.2°F y 98.6°F sonejemplos de datos en este nivel de medición. Tales valores están ordenados,y podemos determinar su diferencia de 0.4°F. Sin embargo, no existe unpunto de partida natural. El valor de 0°F quizá parezca un punto de partida,pero es arbitrario y no representa la ausencia total de calor. Como 0°F no esApuesta por lacienciaEn ocasiones los datos se recolec-tan de maneras muy ingeniosas yde fuentes muy extrañas. Un ejem-plo es el de ciertos investigadoresque estudiaron los cambios climá-ticos. Ellos se dieron cuenta de quecada primavera, desde 1917, en lapequeña ciudad de Nenana,Alaska,hacían un juego de lotería, en elcual las personas apostaban sobrela hora exacta en que la capa dehielo del ríoTanana se rompería(el último premio fue de cerca de300,000 dólares). Se colocó untripié en el río congelado y éste seconectó a un reloj. El reloj sedetendría cuando el hielo, al que-brarse, moviera el tripié. De estaforma los investigadores supieronel momento preciso en que ocurríala rotura cada año desde 1917,y los datos resultaron muy útilesen el estudio de las tendenciasclimáticas.
  31. 31. 1-2 Tipos de datos 9El nivel de medición de razón se parece al nivel de intervalo, aunque tiene lapropiedad adicional de que sí tiene un punto de partida o cero inherente (dondecero indica que nada de la cantidad está presente). Para valores en este nivel,tanto las diferencias como las proporciones tienen significado.DefiniciónEJEMPLOS Los siguientes son ejemplos de datos en el nivel de mediciónde razón. Observe la presencia del valor cero natural y el uso de proporcionesque significan “dos veces” y “tres veces”.1. Pesos: Los pesos (en quilates) de anillos engastados con diamante (0 efec-tivamente representa ausencia de peso y 4 quilates es dos veces el peso de2 quilates).2. Precios: Los precios de los libros de texto universitarios ($0 efectiva-mente representa ningún costo y un libro de $90 es tres veces más costosoque un libro de $30).Este nivel de medición se denomina “de razón” porque el punto de partida cerohace que las razones o cocientes tengan significado. Entre los cuatro niveles demedición, la mayoría de las dificultades surgen con la distinción entre los nivelesde intervalo y de razón.Sugerencia: Para hacer más fácil esta distinción, utilice una sencilla “pruebade razón”: considere dos cantidades en las cuales un número es dos veces el otro ypregúntese si “dos veces” se puede usar para describir correctamente las cantida-des. Puesto que un peso de 200 libras es dos veces más pesado que un peso de 100libras, pero 50°F no es dos veces más caliente que 25°F, los pesos están en el nivelde razón, mientras que las temperaturas Fahrenheit están en el nivel de intervalo.Para una comparación y un repaso concisos, estudie la tabla 1-1 en la página si-guiente, que señala las diferencias entre los cuatro niveles de medición.1-2 Destrezas y conceptos básicosEn los ejercicios 1 a 4, determine si el valor dado es un estadístico o un parámetro.1. El Senado actual de Estados Unidos consta de 87 hombres y 13 mujeres.2. Se selecciona una muestra de estudiantes y el número promedio (media) de libros detexto comprados este semestre es 4.2.3. Se toma una muestra de estudiantes y el promedio (media) de la cantidad de tiempode espera en la fila para comprar libros de texto este semestre es 0.65 horas.4. En un estudio de los 2223 pasajeros del Titanic, se encontró que 706 sobrevivieroncuando se hundió.un punto de partida desde cero natural, es erróneo decir que 50°F es dos ve-ces más caliente que 25°F.2. Años: Los años 1000, 2000, 1776 y 1492. (El tiempo no inició en el año0, así que el año 0 es arbitrario en vez de ser un punto de partida de cero na-tural, que representaría “ausencia de tiempo”).
  32. 32. 10 CAPÍTULO 1 Introducción a la estadísticaTabla 1-1 Niveles de medición de datosNivel Resumen EjemploNominal Sólo rangos de orden. Origen de estudiantes:Los datos no pueden 5 californianosacomodarse en un 20 texanos resquema de orden. 40 neoyorquinosOrdinal Rangos de orden que Automóviles de Orden deter-pueden acomodarse, estudiantes: minado porpero no hay 5 compactos “compacto,diferencias o 20 medianos r mediano,carecen de 40 grandes grande”.significado.De Las diferencias Temperaturasintervalo son significativas, del campus: 0°F no espero no hay punto 5°F “sin calor”. 40°Fde partida natural 20°F r no es dos vecesy las razones no 40°F más calientetienen significado. que 20°F.De razón Hay un punto de Distancias de viajepartida natural de estudiantes:y las razones 5 kmtienen significado. 20 km r40 kmEn los ejercicios 5 a 8, determine si los valores dados provienen de un conjunto de datosdiscreto o continuo.5. El salario presidencial de George Washington era de 25,000 dólares anuales y el sa-lario presidencial actual es de 400,000 anuales.6. Un estudiante de estadística obtiene datos muestrales y encuentra que la media del pe-so de automóviles en la muestra es 3126 libras.7. En una encuesta de 1059 adultos, se encontró que el 39% de ellos tienen pistolas ensus casas (de acuerdo con una encuesta de Gallup).8. Cuando se probaron 19,218 máscaras antigás de divisiones de la milicia de EstadosUnidos, se encontró que 10,322 estaban defectuosas (de acuerdo con datos de la revistaTime).En los ejercicios 9 a 16, determine cuál de los cuatro niveles de medición (nominal, ordinal,de intervalo, de razón) es el más apropiado.9. Las estaturas de las mujeres que juegan básquetbol en la WNBA.10. Las calificaciones de fantástico, bueno, promedio, pobre o inaceptable en citas a ciegas.11. Las temperaturas actuales en los salones de clase en su universidad.12. Los números en las camisetas de las mujeres que juegan básquetbol en la WNBA.Sólo rangos deorden o nombres.40 km es dosveces más lejosque 20 km.
  33. 33. 13. Las calificaciones de la revista Consumer Reports de “mejor compra, recomendado,no recomendado”.14. Los números del seguro social.15. El número de respuestas “sí” recibidas cuando se les preguntó a 1250 conductores sihabían usado alguna vez un teléfono celular mientras conducían.16. Los códigos postales de la ciudad en que vive.En los ejercicios 17 a 20, identifique a) la muestra y b) la población. También determinesi la muestra parece ser representativa de la población.17. Un reportero de Newsweek se para en una esquina y pregunta a 10 adultos si creen queel presidente actual está haciendo un buen trabajo.18. Nielsen Media Research encuesta a 5000 amas de casa seleccionadas al azar y en-cuentra que el 19% de los televisores encendidos están sintonizados en 60 minutos (deacuerdo con datos de USA Today).19. En una encuesta de Gallup aplicada a 1059 adultos seleccionados aleatoriamente, el39% respondió “sí” cuando se le preguntó: “¿Tiene usted una pistola en su casa?”.20. Una estudiante graduada de la Universidad de Newport realizó un proyecto de inves-tigación acerca de cómo se comunican los adultos estadounidenses. Empezó por unaencuesta que envió por correo a 500 de los adultos que ella conocía. Les pidió que leenviaran por correo la respuesta a esta pregunta: “¿Prefiere usted usar el correo elec-trónico o el correo tortuga (el servicio postal estadounidense)?”. Ella recibió a vueltade correo 65 respuestas y 42 de ellas indicaron una preferencia por el correo tortuga.1-2 Más allá de lo básico21. Interpretación de los incrementos de temperatura En la tira cómica “Born Loser” deArt Sansom, Brutus se alegra por un incremento en la temperatura de 1° a 2°. Cuandoalguien le pregunta qué tiene de bueno estar a 2°, él responde que “hace dos vecesmás calor que en la mañana”. Explique por qué Brutus está equivocado una vez más.22. Interpretación de encuesta política Un encuestador aplica una encuesta a 200 perso-nas y les pregunta por el partido político de su preferencia: él codifica las respuestascomo 0 (para demócrata), 1 (para republicano), 2 (para independiente) y 3 (para otrasrespuestas cualesquiera). Entonces calcula el promedio (media) de los números y ob-tiene 0.95. ¿Cómo se interpreta este valor?23. Escala para calificar comida Un grupo de estudiantes desarrolló una escala para ca-lificar la calidad de la comida de la cafetería de su escuela, donde 0 representaba“neutral: ni buena ni mala”. Se asignaron números negativos a las comidas malas ynúmeros positivos a las comidas buenas; la magnitud del número correspondía a la se-veridad de lo bueno o lo malo. Las primeras tres comidas se calificaron con 2, 4 y Ϫ5.¿Cuál es el nivel de medición de calificaciones como éstas? Explique su respuesta.1-3 Pensamiento críticoEl éxito en el curso introductorio de estadística por lo regular requiere de más sen-tido común que destreza matemática (a pesar de la advertencia de Voltaire de que“el sentido común no es muy común”). Ya que ahora tenemos acceso a calculado-ras y a computadoras, las aplicaciones modernas de la estadística ya no requieren1-3 Pensamiento crítico 11
  34. 34. que dominemos algoritmos complejos de operaciones matemáticas. En su lugar,nos enfocamos en la interpretación de los datos y los resultados. Esta sección estádiseñada para ilustrar la forma en que se usa el sentido común cuando pensamosde forma crítica acerca de los datos y la estadística.Hace cerca de un siglo, el estadista Benjamin Disraeli pronunció la famosa frase:“Hay tres clases de mentiras: mentiras, viles mentiras y estadísticas”. También se hadicho que “las cifras no mienten; los mentirosos calculan las cifras”. El historiadorAndrew Lang dijo que algunas personas utilizan la estadística “como un borracho uti-liza los postes de alumbrado: como apoyo más que como iluminación”. El caricatu-rista político Don Wright nos anima diciendo “retome el misterio de la vida: mientaa un encuestador”. El autor Franklin P. Jones escribió que “la estadística puede usar-se para sustentar cualquier cosa, en especial a los estadísticos”. En el Esar’s ComicDictionary encontramos la definición de que un estadístico es “un especialista quereúne pensamientos y luego los conduce al extravío”. Estas afirmaciones se refierena ejemplos donde los métodos estadísticos se utilizaron de forma errónea, de mane-ra que resultaron engañosos en última instancia. Hay dos fuentes principales de talengaño: 1. el intento malintencionado por parte de personas deshonestas, y 2. loserrores de descuido cometidos por personas que no conocen nada mejor. Sin teneren cuenta la fuente, como ciudadanos responsables y como empleados profesionalesvaliosos, debemos tener una habilidad básica para distinguir entre conclusiones es-tadísticas que parecen ser válidas de las que son gravemente defectuosas.Para mantener esta sección en la perspectiva apropiada, hay que saber que ésteno es un libro acerca de los malos usos de la estadística. El resto de este libro estarálleno de usos muy importantes de métodos estadísticos válidos. Aprenderemos mé-todos generales para usar datos muestrales y así poder hacer inferencias relevan-tes acerca de poblaciones; aprenderemos acerca de encuestas y tamaños de muestra,acerca de mediciones importantes de características fundamentales de los datos.Junto con las explicaciones de estos conceptos generales, veremos muchas aplica-ciones específicas reales, tales como los efectos en el fumador pasivo, el predominiodel alcohol y el tabaco en las películas de dibujos animados para niños y la calidadde productos de consumo, incluyendo dulces M&M, cereales, Coca Cola y Pepsi.Pero incluso en estas aplicaciones reales y con significado, debemos ser cuidadosospara interpretar correctamente los resultados de métodos estadísticos válidos.Comenzamos nuestro desarrollo del pensamiento crítico considerando muestraserróneas. Estas muestras son erróneas en el sentido de que el método de muestreoarruina la muestra, de modo que tiene la posibilidad de estar sesgada (es decir, de noser representativa de la población de la que se obtuvo). La sección siguiente analizacon más detalle los métodos de muestreo y describe la importancia de la aleatorie-dad. El primer ejemplo sigue un procedimiento de muestreo que tiene una seria ca-rencia de aleatoriedad, la cual es muy importante. La siguiente definición se refierea uno de los usos incorrectos de la estadística más comunes y graves.12 CAPÍTULO 1 Introducción a la estadísticaMuestra de respuesta voluntaria (o muestra autoseleccionada) es aquelladonde los sujetos deciden ser incluidos por sí mismos.DefiniciónPara ver ejemplos, remítase al problema del capítulo. Cuando America Online o al-guien más aplica una encuesta por Internet, los individuos por sí mismos deciden siparticipan o no, así que constituyen una muestra de respuesta voluntaria. Sin embargo,¿Debe creerse enun estudio esta-dístico?En la segunda edición del libroStatistical Reasoning for EverydayLife, los autores Jeff Bennet,Wi-lliam Briggs y MarioTriola enume-ran las siguientes directrices paraevaluar de forma crítica un estudioestadístico: 1. Identifique la metadel estudio, la población conside-rada y el tipo de estudio. 2. Consi-dere la fuente, particularmenterespecto de la posibilidad de laexistencia de prejuicios. 3.Analiceel método de obtención de mues-tras. 4. Busque problemas en ladefinición o medición de variablesde interés. 5.Tenga cuidado convariables confusas que podríaninvalidar las conclusiones. 6. Con-sidere el escenario y la redacciónde cualquier encuesta. 7.Verifiqueque las gráficas representen losdatos con fidelidad y que las con-clusiones tengan justificación. 8.Considere si las conclusiones logranlos objetivos del estudio, si tienensentido y si tienen un significadopráctico.
  35. 35. existen mayores posibilidades de que las personas con opiniones decididas parti-cipen, de tal forma que las respuestas no sean representativas de toda la población.A continuación se presentan ejemplos de muestras de respuesta voluntaria que,por su naturaleza, adolecen de una carencia importante, pues no debemos obtenerconclusiones sobre una población con base en una muestra sesgada como ésta:● Las encuestas manejadas a través de Internet, en las que los sujetos decidensi responden o no.● Las encuestas por correo, donde los sujetos deciden si contestan.● Las encuestas telefónicas, en las que anuncios en el periódico, la radio, o latelevisión, le piden que tome un teléfono voluntariamente y llame a un nú-mero especial para registrar su opinión.Con muestras de respuesta voluntaria como éstas, sólo es posible llegar a conclusio-nes válidas acerca del grupo específico que decide participar; pero sería una prácticaincorrecta común establecer conclusiones acerca de una población más grande.Desde un punto de vista estadístico, una muestra como ésta falla en lo esencial y nodebe utilizarse para realizar declaraciones generales acerca de una población mayor.Muestras pequeñas Las conclusiones no deben basarse en muestras que sonsumamente pequeñas. Por ejemplo, el Children’s Defense Fund publicó ChildrenOut of School in America, donde se reportó que de los estudiantes de escuela secun-daria suspendidos en una región, el 67% fueron suspendidos al menos tres veces.¡Pero esta cifra está basada en una muestra de sólo tres estudiantes! Los reportes enlos medios de comunicación fallaron al mencionar que el tamaño de la muestra eramuy pequeño. (En los capítulos 6 y 7 veremos que en ocasiones es posible realizaralgunas deducciones valiosas a partir de muestras pequeñas, aunque debemos sercuidadosos y verificar que se satisfagan los requisitos necesarios).En ocasiones una muestra puede parecer relativamente grande (como en unaencuesta de “2000 adultos estadounidenses seleccionados al azar”), pero si se ob-tienen conclusiones acerca de los subgrupos, por ejemplo, los republicanos desexo masculino de 21 años de edad de Pocatello, tales conclusiones estarían basadasen muestras demasiado pequeñas. Si bien es importante tener una muestra que seasuficientemente grande, también lo es el hecho de tener datos muestrales que se re-colecten de una forma adecuada, como la selección aleatoria. Aun las muestrasgrandes llegan a ser muestras erróneas.Gráficas Las gráficas —como las de barras y las circulares— en ocasiones sir-ven para exagerar o disfrazar la verdadera naturaleza de los datos. (En el capítulo 2analizaremos una variedad de gráficas diferentes). Las dos gráficas en la figura 1-1de la siguiente página representan los mismos datos del Bureau of Labor Statistics,aunque el inciso b) está diseñado para exagerar la diferencia entre los salarios se-manales de hombres y mujeres. Al no iniciar el eje vertical en cero, la gráfica delinciso b) tiende a producir una impresión subjetiva engañosa, que hace que los lec-tores incorrectamente crean que la diferencia es mucho peor de lo que en realidades. La figura 1-1 enseña una lección importante: para interpretar una gráfica de ma-nera correcta, debemos analizar la información numérica dada en ella, para no enga-ñarnos por su forma general. (El término mediana que se utiliza en la figura 1-1se describirá con claridad en la sección 2-4).Pictogramas Los dibujos de objetos, llamados pictogramas, también pueden re-sultar engañosos. Algunos objetos que se usan comúnmente para representar datosincluyen objetos tridimensionales, como bolsas de dinero, pilas de monedas, tan-ques militares (para gastos militares), barriles (para producción petrolera) y casas1-3 Pensamiento crítico 13La encuesta delLiterary DigestEn la contienda presidencial de1936, la revista Literary Digestefectuó una encuesta y predijo lavictoria deAlf Landon, peroFranklin D. Roosevelt obtuvo unavictoria abrumadora. MauriceBryson señala: “Se enviaron 10millones de papeletas de muestrapara votar a prospectos de votan-tes, aunque sólo se devolvieron 2.3millones. Como todo el mundodebía saber, tales muestras prácti-camente siempre están sesgadas”.Bryson también afirma: “La res-puesta voluntaria a cuestionariosenviados por correo es tal vez elmétodo más común que los estadís-ticos han encontrado para recolec-tar datos en las ciencias sociales, ytal vez sea también el peor”. (Véaseel artículo de Bryson “The LiteraryDigest Poll: Making of a StatisticalMyth”, TheAmerican Statistician,vol. 30, núm. 4).
  36. 36. (para construcción de viviendas). Al dibujar tales objetos, los artistas llegan acrear impresiones falsas que distorsionan las diferencias. Si duplicamos cada ladode un cuadrado, el área no tan sólo se duplica, sino que aumenta en un factor decuatro. Si se duplica cada lado de un cubo, el volumen no se duplica simplemente,sino que se incrementa en un factor de ocho, como se observa en la figura 1-2. Silos impuestos se duplican durante una década, un artista podría representar lascantidades de impuestos con una bolsa de dinero para el primer año y otra bolsade dinero dos veces más ancha, dos veces más alta y dos veces más profunda parael segundo año. En vez de parecer que los impuestos se duplican, parecerá que au-mentaron en un factor de ocho y así el dibujo distorsionaría la verdad.Porcentajes A veces se utilizan porcentajes engañosos o poco claros. Si ustedtoma el 100% de alguna cantidad, está tomándolo todo. (No debería requerir de un110% de esfuerzo para que la declaración anterior tenga sentido). En referencia ala pérdida de equipaje, la Continental Airlines publicó anuncios afirmando que setrata de “un área en la que ya hemos mejorado un 100% en los últimos seis me-ses”. En un editorial que criticaba ese dato estadístico, el diario The New York Ti-mes interpretó correctamente que la cifra de mejora en un 100% significa que yano se está perdiendo equipaje, logro que todavía no disfruta Continental Airlines.Los siguientes son algunos principios clave que se aplican cuando tratamoscon porcentajes. Todos estos principios usan la noción básica de que % o “por cien-to” significa realmente “dividido entre 100”. Este primer principio se emplearácon frecuencia en este libro.● Porcentaje de: Para encontrar el porcentaje de una cantidad, excluya elsímbolo % y divida el valor del porcentaje entre 100, después multipliquepor la cantidad. Este ejemplo muestra que el 6% de 1200 es 72:el 6% de 1200 respuestas ϭ ϫ 1200 ϭ 72● Fracción S Porcentaje: Para convertir de una fracción a un porcentaje,divida el denominador entre el numerador para obtener un número decimalequivalente, y después multiplíquelo por 100 y agregue el símbolo %. Esteejemplo muestra que la fracción es equivalente al 75%:ϭ 0.75 → 0.75 ϫ 100% ϭ 75%34610014 CAPÍTULO 1 Introducción a la estadísticaFIGURA 1-1 Salarios sema-nales de hombres y mujeres de16 a 24 años(a)$400 $377$331$300$200$1000Hombres Mujeres(b)$377$331Hombres MujeresMedianadeingresosemanalparaedadesde16a24años(endólares)$400$375$350$325$300Medianadeingresosemanalparaedadesde16a24años(endólares)FIGURA 1-2 PictogramaDuplique el largo, el ancho y laaltura de un cubo y el volumense incrementa por un factor deocho, como se indica. Si el cubomás pequeño representa losimpuestos en un año y el cubomás grande representa el doblede los impuestos algún tiempodespués, los últimos impuestosparecen ser ocho veces másgrande, y no dos, la cantidadoriginal.
  37. 37. ● Decimal S Porcentaje: Para convertir de un número decimal a un porcenta-je, multiplíquelo por 100%. Este ejemplo demuestra que 0.234 es equivalentea 23.4%:0.234 → 0.234 ϫ 100% ϭ 23.4%● Porcentaje S Decimal: Para convertir de un porcentaje a un número de-cimal, elimine el símbolo % y divida entre 100. Este ejemplo demuestraque 85% es equivalente a 0.85:85% ϭ ϭ 0.85Preguntas predispuestas Existen muchos aspectos que afectan las preguntas deuna encuesta. Éstas llegan a estar “cargadas” o redactadas intencionalmente de ma-nera que propicien una respuesta deseada. Observe las calificaciones de respuesta“sí” reales para las diferentes redacciones en una pregunta:● 97% sí: “¿Debe el presidente utilizar su poder de veto para eliminar los des-perdicios?”.● 57% sí: “¿Debe el presidente utilizar su poder de veto o no?”En The Superpollsters, David W. Moore describe un experimento donde se pre-guntó a diferentes sujetos si estaban de acuerdo con las siguientes declaraciones:● Se gasta muy poco dinero en subsidios del Estado.● Se gasta muy poco dinero en asistencia a los pobres.Aun cuando es el pobre quien recibe el subsidio del Estado, sólo el 19% estuvo deacuerdo cuando se usaron las palabras “subsidio del Estado”, aunque el 63% estu-vo de acuerdo con “asistencia a los pobres”.Orden de las preguntas En ocasiones las preguntas de una encuesta se cargande forma no intencional, en virtud de factores como el orden de los reactivos quese someten a consideración. Observe estas preguntas de una encuesta aplicada enAlemania:● ¿Cree usted que el tránsito vehicular contribuye a la contaminación del airemás o menos que la industria?● ¿Cree usted que la industria contribuye a la contaminación del aire más omenos que el tránsito vehicular?Cuando se presentó primero el tránsito, el 45% culpó al tránsito y el 27% culpó ala industria; cuando la industria se presentó primero, el 24% culpó al tránsito y el57% culpó a la industria.Rechazo Cuando se invita a las personas a contestar una encuesta, algunas se nie-gan con firmeza a responder. La tasa de rechazo ha crecido en años recientes, enparte porque muchos vendedores persistentes de empresas de telemercadeo buscanvender bienes o servicios comenzando con una inducción de ventas que suena comosi fuera parte de una encuesta de opinión. En Lies, Damn Lies, and Statistics, el autorMichael Wheeler indica con acierto que “las personas que se niegan a hablar con losentrevistadores parecen ser diferentes de quienes no lo hacen. Algunas quizá tenganmiedo a los extraños y otras sean celosas de su privacidad, pero su negativa a hablardemuestra que su visión del mundo circundante es marcadamente diferente de aque-llas otras personas que permiten a los entrevistadores entrar a sus hogares”.851001-3 Pensamiento crítico 15La estadística y lasminas terrestresLa International Campaign toBan Land Mines (la CampañaInternacional para ProscribirMinasTerrestres) y el directorejecutivo de laVietnamVeteransof America Foundation (VVAF)fueron recientemente galardona-dos con el Premio Nobel de laPaz. Cuando la VVAF pidióayuda en la recolección de datosacerca de las minas terrestres, sereunió a un equipo de notablesestadísticos. En vez de trabajarcon datos intangibles, como elvalor de la vida humana, ellostrabajaron con datos tangiblesen bruto, como es el área queinutiliza un campo minado y elcosto de cultivos que no se cose-chan. Los datos se incluyeron enel libro After the Guns Fall Silent:The Enduring Legacy of Land-mines, que vino a ser un recursoclave en las discusiones del temade las minas terrestres. ElAMSTAT News citó a uno de loseditores del libro: “Este esfuerzode reunión y análisis de datos eslo que hizo posible presentarel tema ante los legisladores. Eltrabajo en verdad marcó unadiferencia”.
  38. 38. Correlación y causalidad En el capítulo 9 de este libro analizaremos la aso-ciación estadística entre dos variables, como son la riqueza y el CI. Usaremos eltérmino correlación para indicar que las dos variables están relacionadas. Sin embar-go, en el capítulo 9 hacemos esta importante anotación: la correlación no implicacausalidad. Esto significa que cuando nosotros encontramos una asociación estadís-tica entre dos variables, no podemos concluir que una de las variables es la causade la otra (o que la afecta directamente). Si encontramos una correlación entre lariqueza y el CI, no podemos concluir que el CI de una persona afecta directamentesu riqueza, ni tampoco podemos concluir que la riqueza de la persona afecta direc-tamente su puntuación de CI. En los medios de comunicación es bastante comúnreportar una correlación recién encontrada con una redacción que indica o implicadirectamente que una de las variables es causa de la otra.Estudios para el propio beneficio Algunas veces los estudios reciben elpatrocinio de grupos con intereses específicos que buscan promover. Por ejemplo,Kiwi Brands, un fabricante de abrillantador de calzado, encargó un estudio quesuscitó esta declaración impresa en algunos periódicos: “De acuerdo con una en-cuesta nacional realizada a 250 empleadores profesionales, la razón más comúndel fracaso de un solicitante de trabajo del sexo masculino al dar una buena pri-mera impresión, fue llevar los zapatos desaseados”. Debemos ser muy cautos conencuestas como éstas, cuyos resultados generan ganancias económicas para el pa-trocinador. En los últimos años ha generado preocupación creciente la práctica delas compañías farmacéuticas de financiar a doctores que realizan experimentosclínicos y reportan sus resultados en revistas de prestigio, como Journal of AmericanMedical Association.Números precisos “En la actualidad existen 103,215,027 hogares en EstadosUnidos.” Puesto que esta cantidad es muy precisa, mucha gente considera erró-neamente que también es exacta. En este caso, ese número es un estimado y seríamejor decir que el número de hogares es de alrededor de 103 millones.Imágenes parciales “El 90% de todos nuestros automóviles, vendidos en estepaís en los últimos 10 años, continúa circulando”. Millones de consumidoresescucharon ese anuncio comercial y no se dieron cuenta de que el 90% de los au-tomóviles que el anunciante vendió en este país se vendieron durante los últimostres años, de modo que la mayoría de esos automóviles que circulaban estaban ca-si nuevos. La afirmación era técnicamente correcta, aunque muy engañosa, al nopresentar los resultados completos.Distorsiones deliberadas En el libro Tainted Truth, Cynthia Crossen cita unejemplo de la revista Corporate Travel que publicó resultados que mostraban que,entre las compañías de renta de automóviles, Avis fue la ganadora en una encuestarealizada a personas que utilizan ese servicio. Cuando Hertz solicitó informacióndetallada acerca de la encuesta, las respuestas originales de ésta desaparecieron yel coordinador de encuestas de la revista renunció. Hertz demandó a Avis (por pu-blicidad falsa basada en la encuesta) y a la revista; al final las compañías llegarona un acuerdo.Además de los casos ya citados, se conocen muchos otros usos incorrectosde la estadística; algunos de estos otros casos se encuentran en libros como elclásico de Darrel Huff, How to Lie with Statistics; el de Robert Reichard, TheFigure Finaglers, y el de Cynthia Crossen, Tainted Truth. Comprender tales16 CAPÍTULO 1 Introducción a la estadísticaDetección dedatos falsosUn maestro de clase asigna la tareade registrar los resultados de lan-zar al aire una moneda 500 veces.Un estudiante deshonesto decideahorrar tiempo inventando los re-sultados, en lugar de realmentelanzar la moneda. Como las perso-nas generalmente no pueden inven-tar resultados que en realidad seanaleatorios, con frecuencia identifi-camos datos falsos como éstos. En500 lanzamientos de una monedareal, es en extremo probable queusted obtenga una serie de seis ca-ras o seis cruces, aunque la gentecasi nunca incluye una racha comoésta cuando inventa resultados.Otra forma de detectar datos“fabricados” consiste en establecerque los resultados violan la ley deBenford: para muchos grupos dedatos, los primeros dígitos no es-tán uniformemente distribuidos.Más bien los primeros dígitos de1, 2, . . . , 9 ocurren con frecuen-cia de 30%, 18%, 12%, 10%, 8%,7%, 6%, 5% y 5%, respectiva-mente. (Véase “The Difficulty ofFaking Data” porTheodore Hill,Chance, vol. 12, núm. 3).
  39. 39. prácticas resultará extremadamente útil en la evaluación de los datos estadísticosque se encuentran en situaciones cotidianas.1-3 Destrezas y conceptos básicosEn los ejercicios 1 a 4, utilice el pensamiento crítico para desarrollar una conclusión alter-nativa. Por ejemplo, considere un reporte de medios de comunicación donde los conductoresde BMW gozan de mejor salud que los adultos que no manejan. La conclusión de que losautomóviles BMW son la causa de una mejor salud quizás esté equivocada. La siguientesería una mejor conclusión: Los conductores de BMW tienden a ser más adinerados que losadultos que no manejan y una mayor riqueza se asocia con una mejor atención a la salud.1. El peso y los camiones Un estudio demostró que los conductores de camiones pesanmás que los adultos que no manejan camiones. Conclusión: Los camiones causan quela gente gane peso.2. Las casas y la longevidad Un estudio concluyó que los propietarios de casas tiendena vivir más tiempo que quienes no habitan viviendas propias. Conclusión: Poseer unacasa crea paz y armonía internas que causan que las personas tengan mejor estado desalud y vivan más tiempo.3. Cumplimiento de las leyes de tránsito Un estudio mostró que en el condado deOrange se expidieron más multas por exceso de velocidad a personas de grupos mino-ritarios que a los blancos. Conclusión: En el condado de Orange las personas de gru-pos minoritarios conducen a mayor velocidad que los blancos.4. Remedio para el resfriado En un estudio de síntomas del resfriado, se encontró quecada uno de los sujetos de estudio con resfriado mejoró dos semanas después de to-mar píldoras de jengibre. Conclusión: las píldoras de jengibre curan el resfriado.En los ejercicios 5 a 16, utilice el pensamiento crítico para señalar el tema principal.5. El chocolate es un alimento saludable El New York Times publicó un artículo que in-cluyó esta afirmación: “Por fin, el chocolate ocupa el lugar que merece en la pirámidede los alimentos, junto a sus vecinos de clase alta, el vino tinto, las frutas, los vegetalesy el té verde. Varios estudios reportados en el Journal of Nutrition mostraron que, des-pués de comer chocolate, los sujetos a prueba incrementaron los niveles de antioxi-dantes en su sangre. El chocolate contiene flavonoides, antioxidantes asociados conla disminución del riesgo de enfermedades cardiacas y derrame cerebral. Mars Inc., lacompañía de dulces, y la Chocolate Manufacturers Association financiaron gran partede la investigación”. ¿Qué está equivocado en este estudio?6. Datos de censo Después de realizado el último censo nacional, el PoughkeepsieJournal imprimió este titular de primera página: “281,421,906 en Estados Unidos”.¿Qué está mal en este titular?7. Encuesta por correo Cuando la autora Shere Hite escribió Woman and Love: A CulturalRevolution in Progress, basó sus conclusiones en 4500 respuestas recibidas despuésde enviar por correo 100,000 cuestionarios a varios grupos de mujeres. ¿Es probableque sus conclusiones sean válidas, en el sentido de que puedan aplicarse a la pobla-ción general de todas las mujeres? ¿Por qué sí o por qué no?8. Números “900” En una encuesta de Nightline de la ABC, 186,000 televidentes paga-ron 50 centavos cada uno para llamar a un número telefónico “900” y dar su opiniónacerca de mantener la sede de las Naciones Unidas en Estados Unidos. Los resultadosdemostraron que el 67% de quienes llamaron estuvieron a favor de que las NacionesUnidas salieran de Estados Unidos. Interprete los resultados identificando lo que con-cluiríamos acerca del sentir de la población general, respecto de mantener la sede delas Naciones Unidas en Estados Unidos.1-3 Pensamiento crítico 17
  40. 40. 9. Encuestas telefónicas La Hartford Insurance Company lo contrató a usted para en-cuestar a una muestra de adultos acerca de sus compras de automóviles. ¿Cuál es elerror al considerar a las personas cuyos números telefónicos aparecen listados en losdirectorios como población de la cual se toma la muestra?10. Crimen y autobuses El Newport Chronicle afirma que los paraderos de autobús cau-san crímenes, porque un estudio concluyó que las tasas de crimen son más altas en lasciudades con paraderos de autobús, que en las zonas rurales que carecen de ellos.¿Cuál es el error en esta afirmación?11. Cascos de motocicleta El Senado del estado de Hawai entró en audiencia para consi-derar una ley que obligaba a los motociclistas a usar cascos. Algunos motociclistastestificaron que habían participado en choques donde los cascos habían resultadoinútiles. ¿Qué grupo importante no fue capaz de testificar? (Véase “A Selection of Se-lection Anomalies” de Wainer, Palmer y Bradlow en Chance, vol. 11, núm. 2).12. La encuesta al cliente de Merrill Lynch El autor recibió una encuesta de la empresade inversiones Merrill Lynch. La encuesta fue diseñada para medir su satisfacción comocliente y contenía preguntas específicas para calificar al consultor financiero personaldel autor. La portada de la carta incluyó esta declaración: “Sus respuestas son extrema-damente valiosas para su consultor financiero, Russell R. Smith, y para Merrill Lynch....Compartiremos su nombre y las respuestas con su consultor financiero”. ¿Cuál es elerror en esta encuesta?13. La nicotina de los cigarrillos Remítase al conjunto de datos 5 del Apéndice B y conside-re el contenido de nicotina de 29 diferentes marcas de cigarrillos. El promedio (media)de esas cantidades es 0.94 mg. ¿Es probable que este resultado sea un buen estimadodel promedio (media) de todos los cigarrillos que se han fumado en Estados Unidos?¿Por qué sí o por qué no?14. Pregunta incorrecta Una encuesta incluye este reactivo: “Anote su altura en pulgadas”.A partir de este dato se espera obtener las estaturas reales de los encuestados y analizar-las, aunque hay dos problemas básicos diferentes en este reactivo; identifíquelos.15. Longevidad Usted necesita realizar un estudio de longevidad a personas que nacierondespués del fin de la Segunda Guerra Mundial en 1945. Si usted visitara los cemente-rios y utilizara las fechas de nacimiento y muerte indicadas en las lápidas, ¿obtendríabuenos resultados? ¿Por qué sí o por qué no?16. SMSI En una carta al editor del New York Times, la ciudadana de Moorestown, NewJersey, Jean Mercer criticó la declaración de que “colocar a los bebés en posición supinaha disminuido las muertes por SMSI”. SMSI son las siglas del Síndrome de Muerte Súbi-ta Infantil y la posición supina implica estar tendido sobre la espalda con la cara haciaarriba. Ella sugirió que esta afirmación es mejor: “Los pediatras aconsejaron la posiciónsupina durante un periodo en que disminuyeron las tasas de SMSI”. ¿Qué está equivo-cado al decir que la posición supina ha disminuido las muertes por SMSI?En los ejercicios 17 a 22, conteste las preguntas que se hacen en relación con los porcentajes.17. Porcentajesa. Convierta la fracción 17/25 a un porcentaje equivalente.b. Convierta 35.2% a su equivalente decimal.c. ¿Cuánto es el 57% de 1500?d. Convierta 0.486 a un porcentaje equivalente.18. Porcentajesa. ¿Cuál es el 26% de 950?b. Convierta 5% en su equivalente decimal.c. Convierta 0.01 a un porcentaje equivalente.d. Convierta la fracción 527/1200 a un porcentaje equivalente. Redondee la respuestaa la décima más cercana del porcentaje.18 CAPÍTULO 1 Introducción a la estadística

×