UNIDAD IOrganización de datos
 La Estadística es una disciplina que utiliza  recursos matemáticos para organizar y  resumir una gran cantidad de datos ...
• En este caso la estadística describe la  muestra en términos de datos organizados  y resumidos, y luego infiere conclusi...
• La estadística puede aplicarse a cualquier  ámbito de la realidad, y por ello es utilizada  en física, química, biología...
• Desde un punto de vista histórico, la  humanidad ha utilizado cuatro métodos  para adquirir el conocimiento: La Autorida...
• La Autoridad  – Al utilizar el método de autoridad, algo se    considera verdadero debido a una tradición o a    que alg...
• La Autoridad  – Simplemente aceptamos una gran cantidad de    información como cierta con base en una    autoridad, tan ...
• El racionalismo    – Este método utiliza exclusivamente el      razonamiento para llegar el conocimiento.      Supone qu...
• La intuición  – Se entiende como una inspiración súbita, la idea    que aclara y salta a la conciencia como un todo.    ...
• Método cientifico  – Aunque el método científico utiliza el    razonamiento y la intuición para llegar a la    verdad, s...
• Se trata de valores de la variable estadística que se  caracterizan por la posición que ocupan dentro del  rango de valo...
• Media  – Tambien denominada promedio aritmetico del    conjunto  – Media muestral x                        n            ...
• Mediana  – Otra medida de tendencia central, utilizada    principalmente en estadística no paramétrica,    es la mediana...
• Mediana    Mediana  Me  x n 1  si n es impar                                                  2                ...
• Mediana             n                  fa i 1 Me  LI    2                               A                    fi Me...
• Moda  – La moda, como su nombre lo indica, es el valor    más común (de mayor frecuencia dentro de una    distribución. ...
• Moda                            f m  f m 1         Mo  LI                                  A                     2...
• CUARTILES  – Las cuartillas o cuartiles son valores    posicionales que dividen la información en    cuatro partes igual...
• QUINTILES  – Los quintiles o quintillas dividen la información    en cinco partes iguales, agrupándolas en    porcentaje...
• DECILES  – Similarmente, los deciles o decillas dividen la    información en diez partes iguales, en    cantidades porce...
• CENTILES  – Obviamente los centiles dividen la información    en 100 partes, lo cual facilita la interpretación    porce...
• Para calcular cualquier percentil                 kn                     fa i 1       Qk  LI  r              A    ...
• En el análisis estadístico no basta el cálculo e  interpretación de las medidas de tendencia  central o de posición, ya ...
• En dos informaciones con igual media  aritmética, no significa este hecho, que las  distribuciones sean exactamente igua...
• Para medir el grado de dispersión de una  variable, se utilizan principalmente los  siguientes indicadores:  – Rango o r...
• Rango o recorrido  – Es la medida de dispersión mas sencilla ya que    solo considera los dos valores extremos de una   ...
• Desviación media  – La desviación media, mide la distancia absoluta    promedio entre cada uno de los datos, y el    par...
• Desviación media                  m                 x     i    x fi         DM     i 1                      n       ...
• Varianza y desviación típica o estándar  – El problema de los signos en la desviación    media, es eludido tomando los v...
• Varianza y desviación típica o estándar  – La varianza es uno de los parámetros más    importantes en estadística paramé...
• Varianza y desviación típica o estándar           x                    m             2                 i    x fi   S...
• Varianza y desviación típica o estándar                     x                              m             2           ...
• Coeficiente de variabilidad  – Generalmente        interesa     establecer    comparaciones de la dispersión, entre    d...
• Coeficiente de variabilidad  – El coeficiente de variabilidad tiene en cuenta el    valor de la media aritmética, para e...
• Variable discreta  – Es aquella que entre dos valores próximos    puede tomar a un número finito de valores, es    decir...
• Variable continúa  – Es la que puede tomar infinitos valores de un    intervalo, es decir, es aquella que no contiene   ...
Fin
Upcoming SlideShare
Loading in …5
×

Pe u1

191 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
191
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
4
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Pe u1

  1. 1. UNIDAD IOrganización de datos
  2. 2.  La Estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Por ejemplo, la estadística interviene cuando se quiere conocer estado sanitario de un país, a través de ciertos parámetros como la tasa de morbilidad o mortalidad de la población
  3. 3. • En este caso la estadística describe la muestra en términos de datos organizados y resumidos, y luego infiere conclusiones respecto de la población.• Aplicada a la investigación científica, también infiere cuando provee los medios matemáticos para establecer si una hipótesis debe o no ser rechazada
  4. 4. • La estadística puede aplicarse a cualquier ámbito de la realidad, y por ello es utilizada en física, química, biología, medicina, astronomía, psicología, sociología, lingüística, demografía, y así en diversas ramas.
  5. 5. • Desde un punto de vista histórico, la humanidad ha utilizado cuatro métodos para adquirir el conocimiento: La Autoridad El Racionalismo La Intuición El Método Científico
  6. 6. • La Autoridad – Al utilizar el método de autoridad, algo se considera verdadero debido a una tradición o a que alguna persona eminentemente dice lo que es. Aunque este método de conocimiento es poco favorable en la actualidad y a veces conduce a errores es indispensable en nuestra vida cotidiana
  7. 7. • La Autoridad – Simplemente aceptamos una gran cantidad de información como cierta con base en una autoridad, tan solo sea por la razón que no tenemos el tiempo ni la pericia para verificarlo de primera mano
  8. 8. • El racionalismo – Este método utiliza exclusivamente el razonamiento para llegar el conocimiento. Supone que si las premisas son validas y el razonamiento se realiza de manera correcta, de acuerdo con las reglas de la lógica, entonces las conclusiones llegarán a la verdad•
  9. 9. • La intuición – Se entiende como una inspiración súbita, la idea que aclara y salta a la conciencia como un todo. No se llega por medio de la razón, por el contrario, con frecuencia la idea parece surgir después de que ha fallado el razonamiento consciente.
  10. 10. • Método cientifico – Aunque el método científico utiliza el razonamiento y la intuición para llegar a la verdad, se fundamenta en una evaluación objetiva que es lo que lo distingue de los otros métodos. El experimento científico esta en el centro de la ciencia, y el método de la ciencia es bastante directo.
  11. 11. • Se trata de valores de la variable estadística que se caracterizan por la posición que ocupan dentro del rango de valores posibles de esta. Entre ellos se distinguen: – Las medidas de tendencia central: • Media • Moda • Mediana. – Las medidas de posición no central: • cuantiles (cuartiles, deciles y percentiles)
  12. 12. • Media – Tambien denominada promedio aritmetico del conjunto – Media muestral x n x1  x2  ...  xn x i x  i 1 n n n x1 f1  x2 f 2  ...  xn f n x f i i x  i 1 n n
  13. 13. • Mediana – Otra medida de tendencia central, utilizada principalmente en estadística no paramétrica, es la mediana, la cual no se basa en la magnitud de los datos, como la media aritmética, sino en la posición central que ocupa en el orden de su magnitud, dividiendo la información en dos partes iguales, dejando igual número de datos por encima y por debajo de ella.
  14. 14. • Mediana Mediana  Me  x n 1  si n es impar    2  x n   x n     1  2 2  Mediana  Me  si n es par 2
  15. 15. • Mediana n  fa i 1 Me  LI  2 A fi Me : M ediana LI : Límite inferior del intervalo donde se encuentra la mediana (intervalo mediano), el cual se determina observando en que clase se encuentra la posición n/2. n : Número de observacio nes fa i 1 : Frecuencia acumulada anterior al intervalo mediano f i : Frecuencia del intervalo mediano A : Amplitud del intervalo
  16. 16. • Moda – La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia dentro de una distribución. Una información puede tener una moda y se llama unimodal, dos modas y se llama bimodal, o varias modas y llamarse multimodal. Sin embargo puede ocurrir que la información no posea moda.
  17. 17. • Moda f m  f m 1 Mo  LI  A 2 f m  f m 1  f m 1 Mo : M oda LI : Límite inferior del intervalo modal f m : Frecuancia de clase modal f m 1 : Frecuancia de clase premodal f m 1 : Frecuancia de clase posmodal A : Amplitud de los intervalos
  18. 18. • CUARTILES – Las cuartillas o cuartiles son valores posicionales que dividen la información en cuatro partes iguales, el primer cuartil deja el 25% de la información por debajo de él, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide la información en dos partes iguales, y por último el tercer cuartil deja el 75% por debajo de sí, y el 25% por encima.
  19. 19. • QUINTILES – Los quintiles o quintillas dividen la información en cinco partes iguales, agrupándolas en porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia debemos calcular cuatro parámetro
  20. 20. • DECILES – Similarmente, los deciles o decillas dividen la información en diez partes iguales, en cantidades porcentuales de 10 en 10.
  21. 21. • CENTILES – Obviamente los centiles dividen la información en 100 partes, lo cual facilita la interpretación porcentual de una distribución de frecuencias.
  22. 22. • Para calcular cualquier percentil kn  fa i 1 Qk  LI  r A fi r : Número de partes en que se divide la informació n Frecuancia de clase modal k : Orden del percentil k  1,2.....r  1 LI : Limite inferior del intervalo que contiene el percentil fa i 1 : Frecuencia acumulada hasta el intervalo anterior al que contiene el percentil f i : Frecuencia del intervalo que contiene el percentil n : Número de observacio nes A : Amplitud de los intervalos
  23. 23. • En el análisis estadístico no basta el cálculo e interpretación de las medidas de tendencia central o de posición, ya que, por ejemplo, cuando pretendemos representar toda una información con la media aritmética, no estamos siendo absolutamente fieles a la realidad, pues suelen existir datos extremos inferiores y superiores a la media aritmética, los cuales, en honor a la verdad, no están siendo bien representados por este parámetro.
  24. 24. • En dos informaciones con igual media aritmética, no significa este hecho, que las distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus datos
  25. 25. • Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes indicadores: – Rango o recorrido – Desviación media – Varianza y desviación típica o estándar – Coeficiente de variabilidad
  26. 26. • Rango o recorrido – Es la medida de dispersión mas sencilla ya que solo considera los dos valores extremos de una colección de datos, sin embargo, su mayor utilización está en el campo de la estadística no paramétrica. R  xmax  xmin
  27. 27. • Desviación media – La desviación media, mide la distancia absoluta promedio entre cada uno de los datos, y el parámetro que caracteriza la información. Usualmente se considera la desviación media con respecto a la media aritmética
  28. 28. • Desviación media m x i  x fi DM  i 1 n DM : Desviación media xi : Diferentes valores de la variable x f i : Número de veces que se repite la observació n xi x : M edia arítmetica de la informació n n : Tamaño de la muestra m : Numero de intervalos
  29. 29. • Varianza y desviación típica o estándar – El problema de los signos en la desviación media, es eludido tomando los valores absolutos de las diferencias de los datos con respecto a la media aritmética. Ahora bien, la varianza obvia los signos elevando las diferencias al cuadrado, lo cual resulta ser más elegante, aparte de que es supremamente útil en el ajuste de modelos estadísticos que generalmente conllevan formas cuadráticas.
  30. 30. • Varianza y desviación típica o estándar – La varianza es uno de los parámetros más importantes en estadística paramétrica, se puede decir que, teniendo conocimiento de la varianza de una población, se ha avanzado mucho en el conocimiento de la población misma.
  31. 31. • Varianza y desviación típica o estándar  x  m 2 i  x fi S2  i 1 n  x  n 2 S 2 : Varianza x i xi : Diferentes valores de la variable x S2  i 1 n f i : Frecuencia absoluta de la observació n xi x : M edia arítmetica de la informació n n : Tamaño de la muestra m : Numero de intervalos
  32. 32. • Varianza y desviación típica o estándar  x  m 2 i  x fi S  S2  i 1 n S : Desviación estandar  x  n 2 x S 2 : Varianza i S  S2  i 1 xi : Diferentes valores de la variable x n f i : Frecuencia absoluta de la observació n xi x : M edia arítmetica de la informació n n : Tamaño de la muestra m : Numero de intervalos
  33. 33. • Coeficiente de variabilidad – Generalmente interesa establecer comparaciones de la dispersión, entre diferentes muestras que posean distintas magnitudes o unidades de medida.
  34. 34. • Coeficiente de variabilidad – El coeficiente de variabilidad tiene en cuenta el valor de la media aritmética, para establecer un número relativo, que hace comparable el grado de dispersión entre dos o mas variables, y se define como: S CV  x
  35. 35. • Variable discreta – Es aquella que entre dos valores próximos puede tomar a un número finito de valores, es decir, es aquella que contiene saltos entre un número y otro (1, 2, 3, 4, etc.), por ejemplo: el número de miembros de una familia, el de obreros de una fábrica, el de alumnos de la universidad, etc.
  36. 36. • Variable continúa – Es la que puede tomar infinitos valores de un intervalo, es decir, es aquella que no contiene saltos (1.1, 1.2, 1.3, 1.4, etc.) En muchas ocasiones la diferencia es más teórica que práctica, ya que los aparatos de medida dificultan que puedan existir todos los valores del intervalo. Ejemplos, peso, estatura, distancias, etc.
  37. 37. Fin

×