Unidad 3

  • 54 views
Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
54
On Slideshare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
0
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. ESTADÍGRAFOS DE POSICIÓN YDISPERSIÓNUNIDAD III
  • 2. ESTADÍGRAFOS DE POSICIÓN YDISPERSIÓNTendencia central DispersiónDatos no agrupadosRecorridoDesviación media absolutaVarianza y desviación típicaPercentilesDatos agrupadosPercentilesVarianza y desviación típicaDatos no agrupadosMedia aritméticaMedianaModaMedia aritmética ponderadaMedia geométricaDatos agrupadosMedia aritméticaMedianaModaConceptos relacionadosTeorema deChebyshevRegla empírica Sesgo Coeficiente devariación
  • 3. Medidas de la tendencia central y dela dispersiónLas medidas de tendencia central ttienen como objetivo elsintetizar los datos en un valor representativo, las medidasde dispersión nos dicen hasta que punto estas medidas detendencia central son representativas como síntesis de lainformación. Las medidas de dispersión cuantifican laseparación, la dispersión, la variabilidad de los valores dela distribución respecto al valor central. Distinguimos entremedidas de dispersión absolutas, que no son comparablesentre diferentes muestras y las relativas que nos permitiráncomparar varias muestras.
  • 4. Al describir grupos de observaciones,con frecuencia es conveniente resumirla información con un solo número.Este número que, para tal fin, suelesituarse hacia el centro de ladistribución de datos se denominamedida o parámetro de tendenciacentral o de centralización.
  • 5. MEDIAARITMETICAEjemploLos pesos de seis amigosson: 84, 91, 72, 68, 87 y 78kg. Hallar el peso medio.Es el valor resultanteque se obtiene aldividir la sumatoria deun conjunto de datossobre el número totalde datos. Solo esaplicable para eltratamiento de datoscuantitativos.
  • 6. MEDIANAEjemplo:Encontrar la mediana para los siguientes datos:4 1 2 3 4 2 2 1 5 5 3SOLUCIÓN1: Ordenar los datos.1 1 2 2 2 3 3 4 4 5 52: Localizar el valor que divide en dos parteiguales el número de datos.1 1 2 2 2 3 3 4 4 5 5La mediana es 3, dejando 5 datos a cada lado.Mediana (Me): Valorque divide una serie dedatos en dos partesiguales. La cantidad dedatos que queda pordebajo y por arriba de lamediana son iguales.
  • 7. MODAejemplo: “hallar la moda del siguienteconjunto de datos.”14,15,16,18,5,7,5,9,15,5.se ordenan: 5,5,5,7,9,14,15,15,16,18.la moda es igual a 5..La moda es el valor que se presentacon mayor frecuencia en un conjuntode datos. a una distribucion que tieneuna sola moda se le denominaunimodal, si tiene dos datos que serepiten igualmente, se le conoce comobimodal, y si tiene tres o mas modas sele conoce como multimodal. si ningundato se repite, entonces no tiene moda.
  • 8. MEDIAGOMETRICAPor ejemplo, la mediageométrica de 2 y 18 esEn matemáticas yestadística, la mediageométrica de unacantidad arbitraria denúmeros (digamos nnúmeros) es la raíz n-ésima del producto detodos los números.
  • 9. DATOS AGRUPADOSEn la mayor parte de casos tenemos unnúmero grande de datos y tomamos en cuentaque en estos casos generalmente los datos sonresumidos en una tabla de frecuencia. Lafórmula para el cálculo cuando se trata dedatos agrupados es diferente a la de los noagrupados.
  • 10. MEDIAARITMETICASi los datos vienen agrupadosen una tabla de frecuencias, laexpresión de la media es:La mediaaritmética esigual a la divisiónde la sumatoriadel producto delas clases por lafrecuencia sobreel número dedatos.
  • 11. MEDIANAEJEMPLOLas calificaciones en la asignatura deMatemáticas de 39 alumnos de una clase vienedada por la siguiente tabla:Calificaciones 1 2 3 4 5 6 7 8 9 Número dealumnos 2 2 4 5 8 9 3 4 2Se halla las frecuencias absolutas acumuladas.Asociada a la mediana para n impar, se obtiene .Ni-1< n/2 < Ni = N19 < 19.5 < N20Me = 5 puntos, la mitad de la clase ha obtenidoun 5 o menos, y la otra mitad un 5 o más.En el ámbito de la estadística, unamediana es el valor de la variableque deja el mismo número de datosantes y después que él, una vezordenados estos.
  • 12. MEDIDAS DEDISPERSIÓNSe llaman medidas de dispersión aquellas que permiten retratar la distancia de los valoresde la variable a un cierto valor central, o que permiten identificar la concentración de losdatos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variablescuantitativas.La dispersión es importanteporque:Proporciona información adicional que permite juzgar laconfiabilidad de la medida de tendencia central. Si los datos seencuentran ampliamente dispersos, la posición central es menosrepresentativa de los datos.Ya que existen problemas característicos para datosampliamente dispersos, debemos ser capaces dedistinguir que presentan esa dispersión antes deabordar esos problemas.
  • 13. Desviación media absolutaLa desviación media es la media de las diferencias en valorabsoluto de los valores a la media.Este valor estadístico no es de mucha utilidad en estadística debidoa que no es fácil manipular dicha función al no ser derivable.Siendo más formales, la desviación media debería llamarsedesviación absoluta respecto a la media, para evitar confusionescon otra medida de dispersión, la desviación absoluta respecto a lamediana, DM, cuya fórmula es la misma, sustituyendo la mediaaritmética por la mediana M. Pero tal precisión no es relevante,porque la desviación absoluta respecto a la mediana es de usotodavía menos frecuente.
  • 14. Ejemplo: Desviación media para datos no agrupadosTres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada unasustentada con 10 preguntas. La idea del concurso es encontrar al alumno más idóneo para representar al colegioen un torneo a nivel nacional.El número de preguntas buenas por materia se muestra a continuación:Materia Carlos Pedro Juan1 2 7 52 9 2 63 10 2 54 2 6 55 3 6 56 1 3 57 9 6 48 9 7 59 1 6 610 4 5 4SOLUCIÓNLo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinarel alumno con mayor promedio de preguntas buenas.Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5preguntas correctas por prueba. ¿Cuál sería entonces el indicador diferenciador entre los alumnos?.Complementemos el análisis anterior calculando la desviación media:Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9preguntas buenas. Pedro disminuye su variación (2,9), siendo Juan el que menos variación presenta con 0,9preguntas tanto por arriba como por debajo de la media aritmética. Se recomienda al colegio elegir como ganadoren este caso a Juan, presenta resultados más constantes que los otros dos alumnos, Juan en promedio acierta 5preguntas buenas con una variación muy baja (rondando entre 4 y 6).
  • 15. CENTILES O PERCENTILESLos percentiles son, tal vez, las medidas másutilizadas para propósitos de ubicación o clasificaciónde las personas cuando atienden características talescomo peso, estatura, etc. Los percentiles son ciertosnúmeros que dividen la sucesión de datos ordenadosen cien partes porcentualmente iguales. Estos son los99 valores que dividen en cien partes iguales elconjunto de datos ordenados. Los percentiles (P1,P2,... P99), leídos primer percentil,..., percentil 99.
  • 16. DATOS AGRUPADOSEn la mayor parte de casos tenemos unnúmero grande de datos y tomamos en cuentaque en estos casos generalmente los datos sonresumidos en una tabla de frecuencia. Lafórmula para el cálculo cuando se trata dedatos agrupados es diferente a la de los noagrupados.
  • 17. PERCENTILES:Son 99 valores que dividen en cien partes iguales el conjunto dedatos ordenados.Para datos agrupados los deciles se calculan mediante la fórmula.k= 1,2,3,... 9Donde:Lk = Límite real inferior de la clase del decil kn = Número de datosFk = Frecuencia acumulada de la clase que antecede a la clase del decil k.fk = Frecuencia de la clase del decil kc = Longitud del intervalo de la clase del decil k
  • 18. Salarios No. De fa(I. De Clases) Empleados (f1)200-299 85 85300-299 90 175400-499 120 295500-599 70 365600-699 62 427700-800 36 463EJEMPLO.- Determinación del primer cuartil, el séptimo decil y el 30 percentil, de lasiguiente tabla:Como son datos agrupados, se utiliza la fórmulaComo son datos agrupados, se utiliza la fórmulaSiendo
  • 19. El cuadrado de la desviación estándar recibe el nombre devarianza y se representa por . La suma de los cuadrados de losdesvíos de la totalidad de las observaciones, respecto de lamedia aritmética de la distribución, es menor que la suma delos cuadrados de los desvíos respecto de cualquier otro valorque no sea la media aritmética.VarianzaEl coeficiente devariación:Para comparar la dispersión de variables que aparecen en unidadesdiferentes (metros, kilos, etc.) o que corresponden a poblacionesextremadamente desiguales, es necesario disponer de una medidade variabilidad que no dependa de las unidades o del tamaño de losdatos. Este coeficiente únicamente sirve para comparar lasdispersiones de variables correspondientes a escalas de razón.Para comparar la dispersión de variables que aparecen en unidades diferentes (metros,kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesariodisponer de una medida de variabilidad que no dependa de las unidades o del tamaño delos datos. Este coeficiente únicamente sirve para comparar las dispersiones de variablescorrespondientes a escalas de razón.
  • 20. El coeficiente de variaciónPara comparar la dispersión de variables que aparecen enunidades diferentes (metros, kilos, etc.) o que corresponden apoblaciones extremadamente desiguales, es necesario disponerde una medida de variabilidad que no dependa de las unidades odel tamaño de los datos. Este coeficiente únicamente sirve paracomparar las dispersiones de variables correspondientes aescalas de razón.Una manera de construir una medida de variabilidad que cumplalos requisitos anteriores es el llamado coeficiente de variación(las barras del denominador representan el valor absoluto, esdecir, indican que debe prescindirse de la unidad de medida de lamedia). A menor coeficiente de variación consideraremos que ladistribución de la variable medida es más homogénea.
  • 21. Ejemplo: Una distribución tiene x = 140 y σ = 28.28 yotra x = 150 y σ = 25. ¿Cuál de las dos presenta mayordispersión?