Your SlideShare is downloading. ×
0
 
HOJA 1 DE 9 RESUMEN DE DATOS NUMÉRICOS Medidas de Tendencia Central: Las medidas de tendencia central proporcionan informa...
HOJA 2 DE 9 Es la medida más obvia que se puede elegir, es el valor obtenido de sumar las observaciones y dividir esta sum...
HOJA 3 DE 9 La  media geométrica  de una cantidad finita de números (digamos  n  números) es la raíz  n -ésima del product...
HOJA 4 DE 9 Dentro de la rama de medidas de tendencia central en estadística descriptiva, y considerando los datos de una ...
HOJA 5 DE 9 La Mediana: En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos...
HOJA 6 DE 9 La Mediana: Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimo...
HOJA 7 DE 9 Medidas de Tendencia Central La Moda: Cuando en una distribución de datos se encuentran tres o más modas, ento...
<ul><li>Se llama medidas de dispersion aquellas que permiten retratar la distancia de los valores de la variable a un cier...
<ul><li>La dispersión mide que tan alejadas estan un conjunto de valores respecto a su media aritmética, así, cuanto menos...
<ul><li>Medidas de dispersión </li></ul><ul><li>La medida mas simple de dispersión es el rango o amplitud, es la diferenci...
<ul><li>Esta medida al aumentar el numero de valores aumenta o se queda igual pero , nunca disminuye. </li></ul><ul><li>Po...
<ul><li>El conocimiento de la forma de la distribucion y del respectivo promedio de una colección de valores de una variab...
<ul><li>En el caso de las variables con valores que pueden definirse en terminos de alguna escala de medida de igual inter...
<ul><li>Medidas de dispersion, por cuanto que estan referidas  a la variabilidad que exiben los valores de la observacione...
<ul><li>Las medidas de dispersion cuantifican la separacion, la dispersion, la variabilidad de los valores de la distribuc...
<ul><li>Al  igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda solo nos revelan una parte de...
<ul><li>La dispersion . </li></ul><ul><li>Proporciona informacion adicional que permite juzgar la confiabilidad de la medi...
<ul><li>Es la medida de variabilidad mas facil de calcular, para datos finitos o sin agrupar el rango se define como la di...
<ul><li>Rango para datos agrupados; </li></ul><ul><li>R= (lim. Sup. de la clase n – lim. Inf. De la clase 1) </li></ul><ul...
<ul><ul><li>El recorrido es la medida de dispersión más sencilla de calcular e interpretar puesto que simplemente es la di...
<ul><li>Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersión con respecto a esos valores anormales, ...
El intervalo de confianza describe la variabilidad entre la medida obtenida en un estudio y la medida real de la población...
Existen tres factores que determinan el tamaño del intervalo de confianza para un determinado nivel de confianza, estos so...
 
<ul><li>La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media ...
<ul><li>Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a...
<ul><li>La varianza para datos no agrupados </li></ul><ul><li>Dado un conjunto de observaciones, tales como X1, X2, … , Xn...
<ul><li>Ejemplo: </li></ul><ul><li>Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 25...
 
<ul><li>La varianza para datos agrupados </li></ul><ul><li>Si en una tabla de distribución de frecuencias. Los puntos  med...
<ul><li>Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica, sobre todo cuando se trabaja...
<ul><li>Es  una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media.   </li></ul...
<ul><li>Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva de esta. A la ...
<ul><li>Ejemplo: </li></ul><ul><li>Del calculo de la varianza de las edades de cinco estudiantes universitarios de primer ...
<ul><li>Igual  procedimiento  se aplica para encontrar le desviación estándar de las cuentas por cobrar de la Tienda Cabre...
<ul><ul><li>Propiedades de la Desviación Estándar  </li></ul></ul><ul><li>A su vez la desviación estándar, también tiene u...
<ul><ul><li>Es la medida de dispersión óptima por ser la más pequeña.  </li></ul></ul><ul><ul><li>La desviación estándar t...
 
<ul><li>Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades ...
Donde:  C.V. representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto m...
<ul><li>Propiedades del Coeficiente de Variación : </li></ul><ul><ul><li>Entonces, si a todos los valores de la variable s...
Upcoming SlideShare
Loading in...5
×

estadistica inferencial

2,404

Published on

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
2,404
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
139
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Transcript of "estadistica inferencial"

  1. 2. HOJA 1 DE 9 RESUMEN DE DATOS NUMÉRICOS Medidas de Tendencia Central: Las medidas de tendencia central proporcionan información acerca de los valores céntricos de una variable a estudiar.  Los valores medios nos darán una idea esencial a cerca del comportamiento de la variable, por ejemplo el promedio de los datos. <ul><li>Media Geométrica. </li></ul><ul><li>Mediana. </li></ul><ul><li>Moda. </li></ul><ul><li>Media Aritmética. </li></ul>Las medidas de tendencia central como su nombre lo dice son cálculos o evaluaciones que nos proporcionan idea del comportamiento del fenómeno en la parte céntrica de éste. En otras palabras las medidas de tendencia central se ocupan de medir el centro, el foco o el medio de un fenómeno. Algunas medidas son las siguientes:
  2. 3. HOJA 2 DE 9 Es la medida más obvia que se puede elegir, es el valor obtenido de sumar las observaciones y dividir esta suma por el número que hay en el grupo. Ejemplo: Calificaciones de 5 alumnos en una prueba: Alumno No. Calificación 1 60 entonces se suman las Calificaciones: 2 54 60+54+31+70+62=277 3 31 Luego el total se divide por la cantidad de alumnos: 4 70 277/5=55.4 5 62 LA MEDIA ARITMÉTICA EN ESTE PROBLEMA SERIA 55.4 La Media Aritmética: Medidas de Tendencia Central
  3. 4. HOJA 3 DE 9 La media geométrica de una cantidad finita de números (digamos n números) es la raíz n -ésima del producto de todos los números . La media geométrica de 2 y 18 es La Media Geométrica: Medidas de Tendencia Central La media de 1, 3 y 9 seria Sólo es relevante la media geométrica si todos los números son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un número negativo (o una cantidad impar de ellos) entonces la media geométrica es, o bien negativa o bien inexistente en los números reales. π X1 . X2 ….Xn = n i=1 n X= n xi 6 2 2 2 . 18 = 36 = 3 3 3 1 . 3. 9 = 27 =
  4. 5. HOJA 4 DE 9 Dentro de la rama de medidas de tendencia central en estadística descriptiva, y considerando los datos de una muestra ordenada en orden creciente (de menor a mayor), definiremos como mediana al valor de la variable que deja el mismo número de datos antes y después que él. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La Mediana: Matemáticamente hablando la mediana sería: Me = (Xn +1)/2 , si n es impar > Me será la observación central de los valores, una vez que estos han sido ordenados en orden creciente o decreciente. Me = (Xn/2 + Xn/2+1)/2, si n es par > Me será el promedio aritmético de las dos observaciones centrales.
  5. 6. HOJA 5 DE 9 La Mediana: En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, serán puntos). La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más. Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho). Así, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basándonos en la fórmula que hace referencia a las frecuencias absolutas > Ni-1< n/2 < Ni = N19 < 19.5 < N20
  6. 7. HOJA 6 DE 9 La Mediana: Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimonoveno y el vigésimo lugar. En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde el vigésimo hasta el vigésimo octavo), con lo que Me = (5+6)/2 = 5,5 puntos. La mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o más Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho). Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y basándonos en la fórmula que hace referencia a las frecuencias absolutas > Ni-1< n/2 < Ni = N18 < 19 < N19
  7. 8. HOJA 7 DE 9 Medidas de Tendencia Central La Moda: Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal. Donde la moda entonces es 6. En estadística la moda es el valor que cuenta con una mayor frecuencia en una distribución de datos . Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Ahora vamos a ver un ejemplo:
  8. 9. <ul><li>Se llama medidas de dispersion aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permite identificar la concentracion de los datos en un cierto sector del recorrido de la variable. Se trata de variables cuantitativas. </li></ul>
  9. 10. <ul><li>La dispersión mide que tan alejadas estan un conjunto de valores respecto a su media aritmética, así, cuanto menos disperso sea el conjunto, mas cerca del valor medio se encontraran sus valores. </li></ul>
  10. 11. <ul><li>Medidas de dispersión </li></ul><ul><li>La medida mas simple de dispersión es el rango o amplitud, es la diferencia entre el valor mas grande y el mas pequeño de un conjunto de valores. </li></ul><ul><li>Esta medida presenta problemas mas grande y el mas pequeño de un conjunto de valores. </li></ul>
  11. 12. <ul><li>Esta medida al aumentar el numero de valores aumenta o se queda igual pero , nunca disminuye. </li></ul><ul><li>Por esto se idearon mejores modos de medir la dispersion. </li></ul><ul><li>Desviacion media </li></ul><ul><li>Varianza </li></ul><ul><li>Desviacion tipica o estandar. </li></ul><ul><li>Covarianza </li></ul><ul><li>Coeficiente de variacion. </li></ul>
  12. 13. <ul><li>El conocimiento de la forma de la distribucion y del respectivo promedio de una colección de valores de una variable sirve para una idea clara de conformacion pero no de homogeneidad de cada uno de los valores con respecto a la medida de tendencia central aplicada. </li></ul>
  13. 14. <ul><li>En el caso de las variables con valores que pueden definirse en terminos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersion o variabilidad existente en el grupo de variantes. </li></ul>
  14. 15. <ul><li>Medidas de dispersion, por cuanto que estan referidas a la variabilidad que exiben los valores de la observaciones ya que si no hay variabilidad o dispersion en los datos interes entonces no habria necesidad de la gran mayoria de las medidas de estadistica descriptiva. </li></ul>
  15. 16. <ul><li>Las medidas de dispersion cuantifican la separacion, la dispersion, la variabilidad de los valores de la distribucion respecto al valor central. </li></ul>
  16. 17. <ul><li>Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda solo nos revelan una parte de la informacion que necesitamos acerca de las caracteristicas de los datos . </li></ul><ul><li>Debemos medir tambien su dispersion, extension o variabilidad. </li></ul>
  17. 18. <ul><li>La dispersion . </li></ul><ul><li>Proporciona informacion adicional que permite juzgar la confiabilidad de la medida de tendencia central </li></ul><ul><li>Quiza se desee comparar las dispersiones de diferentes muestras. si no se desea tener una amplia dispersion de valores con respecto al centro de distribucion o presente riesgos inaceptables. </li></ul>
  18. 19. <ul><li>Es la medida de variabilidad mas facil de calcular, para datos finitos o sin agrupar el rango se define como la diferencia entre el valor mas alto(X n ó X max. ) y el mas bajo (X 1 ó X min ) en un conjunto de datos. </li></ul><ul><li>Rango para datos no agrupados; </li></ul><ul><li>R = X máx. - X mín = X n -X 1 </li></ul><ul><li>Ejemplo: </li></ul><ul><li>Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 27,34 y 25., para calcular la media aritmética (promedio de las edades, se tiene que: </li></ul><ul><li>R = X n -X 1 ) = 34-18 = 16 años </li></ul><ul><li>Con datos agrupados no se saben los valores máximos y mínimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los límites de clases. Se aproxima el rango tomando el limite superior de la última clase menos el limite inferior de la primera clase. </li></ul>
  19. 20. <ul><li>Rango para datos agrupados; </li></ul><ul><li>R= (lim. Sup. de la clase n – lim. Inf. De la clase 1) </li></ul><ul><li>Ejemplo: </li></ul><ul><li>Si se toman los datos del ejemplo resuelto al construir la tabla de distribución de frecuencia de las cuentas por cobrar de Cabrera’s y Asociados que fueron los siguientes : </li></ul>Clases P.M. X i f i fr fa↓ fa↑ fra↓ fra↑ 7.420 – 21.835 14.628 10 0.33 10 30 0.33 1.00 21.835 – 36.250 29.043 4 0.13 14 20 0.46 0.67 36.250 – 50.665 43.458 5 0.17 19 16 0.63 0.54 50.665 – 65.080 57.873 3 0.10 22 11 0.73 0.37 65.080 – 79.495 72.288 3 0.10 25 8 0.83 0.27 79.495 – 93.910 86.703 5 0.17 30 5 1.00 0.17 Total XXX 30 1.00 XXX XXX XXX XXX
  20. 21. <ul><ul><li>El recorrido es la medida de dispersión más sencilla de calcular e interpretar puesto que simplemente es la distancia entre los valores extremos (máximo y mínimo) en una distribución </li></ul></ul><ul><ul><li>Puesto que el recorrido se basa en los valores extremos éste tiende ser errático. No es extraño que en una distribución de datos económicos o comerciales incluya a unos pocos valores en extremo pequeños o grandes. </li></ul></ul>
  21. 22. <ul><li>Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersión con respecto a esos valores anormales, ignorando a los demás valores de la variable </li></ul>
  22. 23. El intervalo de confianza describe la variabilidad entre la medida obtenida en un estudio y la medida real de la población(el valor real). corresponde a un rango de valores, cuya distribución es normal y en el cual se encuentra, con alta probabilidad, el valor real de una determinada variable. Esta “alta probabilidad” se ha establecido por consenso en 95%. Así como un intervalo de confianza del 95% nos indica que dentro del rango dado se encuentra el valor real de un parámetro con 95% de certeza.
  23. 24. Existen tres factores que determinan el tamaño del intervalo de confianza para un determinado nivel de confianza, estos son: TAMAÑO DE LA MUESTRA : Cuanto mas grande sea la muestra mayor precisión igual de población autentica grande. PORCENTAJE DE LA MUESTRA : Ej. En una población de 100 personas se le realiza una pregunta cuya respuesta es si o no y el 99% dice si y el 1% dice no la probabilidad del error son remotas. Si el 51% contesta si y el 49 contesta no la probabilidad de error es mas grande. TAMAÑO DE LA POBLACIÓN: Es relevante cuando se trabaja con un grupo de personas relativamente pequeñas.
  24. 26. <ul><li>La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media aritmética de la distribución. Más específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética. </li></ul>
  25. 27. <ul><li>Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es la varianza. Y se define y expresa matemáticamente de la siguiente manera: </li></ul>
  26. 28. <ul><li>La varianza para datos no agrupados </li></ul><ul><li>Dado un conjunto de observaciones, tales como X1, X2, … , Xn, la varianza denotada usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2) y en otros casos S2 según otros analistas, se define como: el cuadrado medio de las desviaciones con respecto a su media aritmética“ </li></ul><ul><li>Matemáticamente, se expresa como: </li></ul>
  27. 29. <ul><li>Ejemplo: </li></ul><ul><li>Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 25, 27, y 34. Al calcular la media aritmética (promedio de las edades, se obtuvo 25.4 años, encontrar la varianza de las edades de estos estudiantes: </li></ul><ul><li>Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera: </li></ul>
  28. 31. <ul><li>La varianza para datos agrupados </li></ul><ul><li>Si en una tabla de distribución de frecuencias. Los puntos medios de las clases son X1, X2, … , Xn; y las frecuencias de las clases f1, f2, … , fn; la varianza se calcula así: </li></ul>Σ(Xi-)2f1 δ2 = ---------------- Σfi
  29. 32. <ul><li>Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica, sobre todo cuando se trabaja con números decimales o cuando la media aritmética es un número entero. Asimismo cuando se trabaja con máquinas calculadoras, La tarea de computar la varianza se simplifica utilizando la formula de computación que se da a continuación: </li></ul><ul><li>ΣXi2fi - [(ΣXifi)2/N] </li></ul><ul><li>δ2 = ---------------------------- </li></ul><ul><li>N donde N=Σfi </li></ul>
  30. 33. <ul><li>Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media. </li></ul><ul><li>Es la medida de dispersión más utilizada, se le llama también desviación típica. La desviación estándar siempre se calcula con respecto a la media y es un mínimo cuando se estima con respecto a este valor. </li></ul>
  31. 34. <ul><li>Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva de esta. A la desviación se le representa por la letra minúscula griega &quot;sigma&quot; ( δ ) ó por la letra S mayúscula, según otros analistas. </li></ul><ul><li>Cálculo de la Desviación Estándar </li></ul><ul><li>δ = √δ2 ó S = √S2 </li></ul>
  32. 35. <ul><li>Ejemplo: </li></ul><ul><li>Del calculo de la varianza de las edades de cinco estudiantes universitarios de primer año se obtuvo δ2=27.44, como la desviación estándar es la raíz cuadrada positiva, entonces δ = √27.44 = 5.29 años. </li></ul>
  33. 36. <ul><li>Igual procedimiento se aplica para encontrar le desviación estándar de las cuentas por cobrar de la Tienda Cabrera’s y Asociados, recordemos que la varianza obtenida fue de 721.645, luego entonces la desviación estándar es igual a δ =√721.645 = 26.86 balboas. </li></ul>
  34. 37. <ul><ul><li>Propiedades de la Desviación Estándar </li></ul></ul><ul><li>A su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza): </li></ul><ul><ul><li>La desviación estándar es siempre un valor no negativo S será siempre ³ 0 por definición. Cuando S = 0 è X = xi (para todo i). </li></ul></ul>
  35. 38. <ul><ul><li>Es la medida de dispersión óptima por ser la más pequeña. </li></ul></ul><ul><ul><li>La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable </li></ul></ul><ul><ul><li>Si a todos los valores de la variable se le suma una misma constante la desviación estándar no varía. </li></ul></ul><ul><ul><li>Si a todos los valores de la variable se multiplican por una misma constante, la desviación estándar queda multiplicada por el valor absoluto de dicha constante. </li></ul></ul>
  36. 40. <ul><li>Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado &quot;Coeficiente de Variación de Pearson&quot; , del que e demuestra que nos da un número independiente de las unidades de medidas empleadas, por lo que entre dos distribuciones dadas diremos que posee menor dispersión aquella cuyo coeficiente de variación sea menor., y que se define como la relación por cociente entre la desviación estándar y la media aritmética; o en otras palabras es la desviación estándar expresada como porcentaje de la media aritmética. </li></ul>
  37. 41. Donde: C.V. representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.
  38. 42. <ul><li>Propiedades del Coeficiente de Variación : </li></ul><ul><ul><li>Entonces, si a todos los valores de la variable se le suma una misma constante el coeficiente de variación queda alterado . </li></ul></ul>
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×