cuadernillo de lectoescritura para niños de básica
Estadisticos
1. MEDIDAS DE POSICION
CUANTILES O SEPARATRICES ( Q , D, P )
DE TENDENCIA CENTRAL
: MODA, MEDIANA , MEDIA
MEDIDAS DE DISPERSION:
AMPLITUD TOTAL,
VARIANZA y DESVIACION TIPICA
SEMIRRECORRIDO INTERCUARTILICO
COEFICIENTE DE VARIACION
MEDIDAS DE FORMA : COEFICIENTE DE ASIMETRIA
MEDIDAS DE APUNTAMIENTO : COEFICIENTE DE CURTOSIS
2. OBJETIVOS DE LA CLASE
• Conocer y calcular las diferentes medidas de
localización (tendencia central y posición)
• Conocer y calcular las diferentes medidas de dispersión
• Identificar y comparar métodos numéricos para resumir
datos
• Saber seleccionar las medidas de resumen más
adecuadas a diferentes tipos de datos
3. MEDIDAS DE RESUMEN DE DATOS NUMERICOS
PARÁMETROS
P
µ
σ2
Características medibles de una
POBLACIÓN.
Representadas por letras griegas.
VALOR FIJO para una población dada.
m1 ,
p1 ,
x1
ˆ
s12
m2 ,
p2 ,
x2
ˆ2
s2
ESTADÍSTICOS
Características medibles de una MUESTRA,
usadas para estimar parámetros poblacionales.
Representadas por letras latinas.
VARIABLE para la población, fija para la
muestra dada.
4. Medidas de Localización
MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMÉTICA
µ ó
MEDIANA
MODA
CUANTILES o SEPARATRICES
centro
5. Media Aritmética o Esperanza de x
Es el cociente entre la suma de los valores de la variable, y el tamaño de la
población o de la muestra (número de observaciones)
MUESTRA
POBLACIÓN
DATOS SIN
AGRUPAR
N
µ=
DATOS
AGRUPADOS
∑x
i
i =1
x=
N
k
µ=
n
k
•
∑x
i
i =1
N
fi
x=
∑x
i
i
n
•
∑x
i =1
n
i
fi
k
=
•
∑x
fi
i
i =1
k
∑f
i =1
i
6. CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA
• Calculada para datos en escala de Intervalo y Razón
• Única para un conjunto dado de datos
• Centro de gravedad de los datos
• Sensible a todos los valores del conjunto de datos, sobre todo a los
valores extremos
• La suma de desvíos de los datos con respecto a la media es 0
• Útil para comparar poblaciones
• No se puede calcular con clases abiertas
7. MEDIANA ( P50, Q2)
Es el valor de la variable que divide a las observaciones en dos grupos con el
mismo número de individuos (percentil 50).
Si el número de datos es par, se elige la media de los dos datos centrales
Si el número de observaciones es IMPAR
Si el número de observaciones es PAR
1, 2, 4, 5, 6, 6, 8
1, 2, 4, 4, 5, 6, 6, 8
Mn es 5
Mn es
(4+5)/2 = 4,5
8. Características
Calculada para datos en escala Ordinal, Intervalo y Proporción (razón)
Única para un conjunto dado de datos
Fácil de determinar en datos no agrupados
No es influenciada por valores extremos
1, 2, 4, 5, 6, 6, 800.
La mediana es 5
La media es 117,7
Se puede calcular con clases con extremos abiertos
9. CALCULO de la MEDIANA
DATOS
SIN AGRUPAR:
DATOS
AGRUPADOS:
1) Ordenar los valores de menor a mayor
i = (n + 1)0.5
2) Determinar la posición i
3) Hallar el valor de x en la
posición i
Mn = xi
1) Determinar la posición (igual que para datos sin agrupar)
2) Determinar la clase que contiene la Mediana
3) Realizar la interpolación
para hallar el valor de la Mn
n
Mn = Li +
2 − Fa
h
f
10. CALCULO de la MEDIANA para datos agrupados
1) Determinar la posición
(35 + 1) × 0.5 = 18
2) clase que contiene la Mediana
Li = 375
3) Realizar la interpolación para hallar el valor de la Mn
n
Mn = Li +
2 − Fa
h
f
35 − 10
Mn = 375 + 2
×15 = 375 + 7.5 = 382.5
12
Extensión del intervalo h = 390-375
12. MODA
Definición : Valor de la variable con mayor frecuencia
Características
• Útil para medidas nominales y ordinales
• No se afecta por valores extremos
• Se puede utilizar con clases abiertas
• Puede no existir o no ser única
datos sin agrupar
297 314 333 350 388 412 421 455 455 455
466 466 502 502 542 587 601 621 629
Mo = 455
13. CALCULO de la MODA para datos agrupados
1) Determinar la clase que contiene la Moda
Li = 375
2) Realizar la interpolación para hallar el valor de la Mo
∆
∆1
Mo = Li +
h
∆1 + ∆ 2
1
∆
2
∆ 1 = 12 – 4 = 8
∆ 2 = 12 – 7 = 5
8
Mo = 375 +
×15 = 375 + 9.23 = 384.23
8+5
Extensión del intervalo h = 390-375
14. forma grafica de
determinar la moda
Diferencia entre la
frecuencia de la
clase modal y la
clase anterior
h
∆1
Extensión del intervalo
∆2
Li
Mo
Limite inferior de la clase modal
Diferencia entre la
frecuencia de la
clase modal y la
clase siguiente
x
15. Medidas de Dispersión
Medida de información respecto a la cantidad de VARIABILIDAD
presente en un conjunto de datos.
dispersión
AMPLITUD TOTAL A
2
2
VARIANZA
y DESVIACIÓN TÍPICA
SEMIRECORRIDO INTERCUARTÍLICO Q
COEFICIENTE DE VARIACIÓN CV
17. la varianza es una media de cuadrados de los desvios (MC)
2
ˆ
s
∑
=
suma de cuadrados de
los desvios (SC)
2
( x − x)
n-1
grados de libertad (GL)
La división por n-1 asegura que la varianza muestral sea una estimación centrada de la
varianza poblacional
Es sensible a valores extremos (alejados de la media).
Sus unidades son el cuadrado de las de la variable
DESVIACIÓN TÍPICA
Es la raíz cuadrada de la varianza
ˆ = S2
ˆ
S
Tiene las misma dimensionalidad (unidades) que la variable.
18. Coeficiente de variación
Es el cociente entre la desviación típica y la media.
– Mide la desviación típica en forma de
“qué tamaño tiene con respecto a la media”
ˆ
s
CV =
x
Es frecuente indicarla en porcentajes
• Si la media es 80 y la desviación típica 20 entonces
CV =20/80 = 0,25 = 25% (variabilidad relativa)
Es adimensional. Interesante para comparar la variabilidad de diferentes
variables.
– Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan
más dispersión en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o donde el valor 0
sea una cantidad fijada arbitrariamente
– Por ejemplo 0ºC ≠ 0ºF
19. Q3 − Q1 P75 − P25
Q=
=
2
2
SEMIRRECORRIDO INTERCUARTILICO
1) Determinar la posición para cada Percentil
(35 + 1) × 0.25 = 9
(35 + 1) × 0.75 = 27
Para el P75
2) La clase que contiene P25 Li = 360
2) La clase que contiene P75 Li = 390
Para el P25
3) Realizar la
interpolación
Q3 = 390 +
35 × 0.75 − 22
Q 2 = 360 +
7
35 × 0.25 − 6
4
× 15 = 399.11
× 15 = 370.31
Pr
= Li +
n.r − Fa
f
×h
399.11 − 370.31
Q=
= 14,4
2
20. Qué medidas de tendencia central y dispersión utilizar
forman DUOS
Según teoría de momentos
Media Varianza y
desviación típica
Datos numéricos –
distribuciones simétricas o asimétricas
con muchas observaciones
Según el método de las separatrices
Mediana Semirrecorrido
intercuartílico
Datos ordinales o numéricos
distribución asimétrica y con pocas
observaciones-
Según el método de los extremos
Moda Amplitud total
Datos nominales
Distribuciones bimodales
21. MEDIDAS DE RESUMEN
medidas de tendencia central
medidas de dispersión
medidas de posición
FORMA DE LADISTRIBUCION
medidas de asimetría (sesgo)
as = +
as = Coeficiente de asimetría
asimetría positiva
asimetría negativa
distribución simétrica
x − Mn
as = 3
ˆ
s
•Es nulo cuando la distribución
es simétrica
22. TIPOS DE CURVAS
•
•
•
SIMÉTRICA
– las observaciones equidistan del máximo central con la misma
frecuencia.
Coinciden Media, Moda y Mediana
ASIMÉTRICA
– la cola más larga determina la dirección del sesgo.
Se separan la Media, Mediana y Moda
BIMODAL
MULTIMODAL
23. FORMA DE LADISTRIBUCION
medidas de asimetría
medidas de apuntamieno o curtosis
Exceso de
frecuencias
Exceso de
frecuencias
Distrib. leptocurtica
Distrib. platicurtica
en azul la distribución normal (de referencia)
distribución mesocurtica