Introducción a la Estadística. Tema2

3,257 views

Published on

Estadística descriptiva univariante

Introducción a la Estadística. Tema2

  1. 1. TEMA 2 ESTADÍSTICA DESCRIPTIVA PARA UNA VARIABLE
  2. 2. TÉCNICAS ESTADÍSTICAS <ul><li>Las técnicas de estadística descriptiva que pueden aplicarse sobre las tablas de datos dependen de la naturaleza de las variables implicadas: </li></ul><ul><ul><li>Técnicas para variables cualitativas </li></ul></ul><ul><ul><li>Técnicas para variables cuantitativas </li></ul></ul>
  3. 3. VARIABLES CUALITATIVAS <ul><li>Lo único que podemos hacer con las variables cualitativas es “contar cuántas veces aparece cada una de sus modalidades en un conjunto de individuos”. </li></ul><ul><li>Sólo cabe hacer RECUENTOS y CÁLCULO DE PORCENTAJES. </li></ul>
  4. 4. FRECUENCIAS ABSOLUTAS Y RELATIVAS <ul><li>Frecuencias absolutas : recuento del número de individuos que pertenecen a cada una de las modalidades de la variable. </li></ul><ul><li>Frecuencias relativas : cálculo del porcentaje de individuos que pertenecen a cada una de las modalidades de la variable. </li></ul>
  5. 5. FRECUENCIAS ACUMULADAS <ul><li>Sólo tienen sentido en el caso de variables de tipo ordinal . </li></ul><ul><li>Pueden ser absolutas o relativas. </li></ul><ul><li>Representan el número (o porcentaje) de pertenecientes “a cada modalidad de la variable ordinal o a las anteriores”. </li></ul><ul><ul><li>Ejemplo : Personas de clase media o menos, es decir de clase baja o clase media . </li></ul></ul>
  6. 6. REPRESENTACIONES GRÁFICAS <ul><li>La fundamental es el gráfico de barras (no confundir con un histograma). </li></ul><ul><li>Caben otras representaciones como pictogramas , gráficos de sectores , etcétera. </li></ul>
  7. 7. VARIABLES CUANTITATIVAS <ul><li>Medidas de posición. </li></ul><ul><li>Medidas de dispersión </li></ul><ul><li>Medidas de simetría </li></ul><ul><li>Representaciones gráficas </li></ul>
  8. 8. LAS MEDIDAS RESUMEN <ul><li>Nos dan una idea de cómo son los valores de la variable que estamos estudiando. </li></ul><ul><li>Veremos tres tipos: </li></ul><ul><ul><li>Medidas de posición o de tendencia central </li></ul></ul><ul><ul><li>Medidas de dispersión </li></ul></ul><ul><ul><li>Medidas de asimetría </li></ul></ul>
  9. 9. MEDIDAS DE POSICIÓN <ul><li>Nos dan una idea acerca de los valores centrales de la variable, aquellos alrededor de los cuales se acumulan los demás. </li></ul><ul><li>Hay tres medidas de posición fundamentales: </li></ul><ul><ul><li>Media aritmética </li></ul></ul><ul><ul><li>Mediana </li></ul></ul><ul><ul><li>Moda </li></ul></ul>
  10. 10. MEDIA ARITMÉTICA <ul><li>Es la medida de posición más “popular” </li></ul><ul><li>Es muy sensible a la existencia de datos extremos (menos robusta que la mediana). </li></ul>
  11. 11. MEDIANA <ul><li>Es aquel valor de la variable que es mayor que la mitad de las observaciones y menor que la otra mitad . </li></ul><ul><li>En caso de que el número de observaciones sea par, es la media aritmética de los dos valores centrales. </li></ul><ul><li>Es una medida muy robusta , esto es, poco sensible a la existencia de valores extremos. </li></ul>Es un caso particular del concepto de PERCENTIL Mediana vs. media
  12. 12. MODA <ul><li>Es el valor de la variable que más se repite </li></ul><ul><li>Se habla de variables unimodales y multimodales </li></ul><ul><li>Es la menos empleada de las medidas de posición </li></ul>
  13. 13. MEDIDAS DE DISPERSIÓN <ul><li>Nos dan una idea acerca de la heterogeneidad de la variable. </li></ul><ul><li>Estudiamos tres medidas de dispersión: </li></ul><ul><ul><li>Varianza </li></ul></ul><ul><ul><li>Desviación estándar o típica </li></ul></ul><ul><ul><li>Coeficiente de variación </li></ul></ul>
  14. 14. VARIANZA <ul><li>Es la medida de dispersión más “popular” junto con la desviación estándar. </li></ul><ul><li>Siempre toma valores no negativos . </li></ul><ul><li>Cuanto mayor sea su valor mayor es la heterogeneidad de la variable. </li></ul>MENOS VARIANZA MÁS VARIANZA
  15. 15. DESVIACIÓN ESTÁNDAR <ul><li>La varianza está en unidades “al cuadrado”. </li></ul><ul><li>Por eso se calcula su raíz cuadrada, la desviación estándar (o desviación típica). </li></ul>
  16. 16. COEFICIENTE DE VARIACIÓN <ul><li>Ni la varianza ni la desviación estándar están acotadas . </li></ul><ul><li>Es necesario contar con un coeficiente relativo: el coeficiente de variación. </li></ul><ul><ul><li>Ejemplo : elefantes y gatos : </li></ul></ul><ul><li>Un CV superior a 1 indica heterogeneidad </li></ul>
  17. 17. MEDIDAS DE ASIMETRÍA <ul><li>Asimetría positiva : cuando existen unos pocos valores extremadamente elevados y la mayoría son bajos. </li></ul><ul><ul><li>El índice de asimetría es positivo </li></ul></ul><ul><ul><li>La media es mayor que la mediana </li></ul></ul><ul><li>Asimetría negativa : cuando existen unos pocos valores extremadamente bajos y la mayoría son altos. </li></ul><ul><ul><li>El índice de asimetría es negativo </li></ul></ul><ul><ul><li>La media es menor que la mediana </li></ul></ul><ul><li>Variable simétrica : </li></ul><ul><ul><li>Índice de asimetría cero </li></ul></ul><ul><ul><li>La media coincide con la mediana </li></ul></ul>
  18. 18. MEDIDAS DE ASIMETRÍA ASIMETRÍA POSITIVA ASIMETRÍA NEGATIVA SIMETRÍA
  19. 19. REPRESENTACIONES GRÁFICAS <ul><li>La representación gráfica básica es el histograma </li></ul><ul><ul><li>“ Agrupamos” los valores en clases, intervalos (de la misma longitud) de la variable inicial. </li></ul></ul><ul><ul><li>Sobre cada intervalo dibujamos un rectángulo de altura proporcional a la frecuencia absoluta o relativa. </li></ul></ul>
  20. 20. FUNCIÓN DE DENSIDAD <ul><li>Si el histograma de la variable representa frecuencias relativas, el área que recoge es 1. </li></ul><ul><li>En el límite, cuando el número de clases tiende a infinito, las irregularidades del histograma se suavizan y llegamos al concepto de función de densidad . </li></ul>
  21. 21. FUNCIÓN DE DENSIDAD (II) <ul><li>Para ser función de densidad, una función R->R debe cumplir dos propiedades: </li></ul><ul><ul><li>Tomar siempre valores positivos . </li></ul></ul><ul><ul><li>El área que encierra bajo ella vale 1 . </li></ul></ul><ul><li>Un ejemplo muy común de función de densidad es la distribución NORMAL . </li></ul>
  22. 22. LA DISTRIBUCIÓN NORMAL <ul><ul><ul><ul><li>Es unimodal, y la moda y la mediana coinciden con la media. </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Es simétrica alrededor de la media. </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Nunca “toca” el eje de abscisas (es asintótica) </li></ul></ul></ul></ul><ul><ul><ul><ul><li>El área bajo la función es 1. </li></ul></ul></ul></ul>
  23. 23. LA DISTRIBUCIÓN NORMAL (II) <ul><li>Tiene dos parámetros que la determinan inequívocamente: </li></ul><ul><ul><li>Media </li></ul></ul><ul><ul><li>Varianza </li></ul></ul><ul><li>Por tanto, existen infinitas distribuciones normales. </li></ul><ul><li>La tipificación nos permite emplear una única tabla. </li></ul>
  24. 24. TIPIFICACIÓN <ul><li>Es el proceso de convertir una variable normal cualquiera en una normal estándar </li></ul><ul><li>La puntuación Z mide la lejanía de un individuo respecto a la media y la compara con la lejanía respecto a la media del conjunto de todos los individuos. </li></ul><ul><li>A partir de la tipificación (y consultando las tablas adecuadas) podemos calcular probabilidades. </li></ul>

×