Estadistica Nociones Lementales

  • 6,553 views
Uploaded on

 

More in: Technology , Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
  • Hola, me podría enviar la presentación? Me sería de mucha utilidad y apoyo para un curso que estoy tomando. Se lo agradecería eternamente. Mi correo es omarahp@yahoo.com.mx
    Are you sure you want to
    Your message goes here
  • Hola, por favor podría envíeme este archivo ? Mi correo es jozhe_mcr@hotmail.com .
    Gracias
    Are you sure you want to
    Your message goes here
  • hola disculpa me puedes enviar la presentacion mi correo es maxkienmas@hotmail.com
    Are you sure you want to
    Your message goes here
  • hola podría usted enviarme este ppt seria muy útil para mi atte Jenny mi correo es jennybetzabet@gmail.com
    Are you sure you want to
    Your message goes here
  • Sr. Johnny Cartin
    Seria posible que me enviara, por favor, el archivode su presentacion ESTADISTICA NOCIONES LEMENTALES. mi correo master.oliv@yahoo.com
    Are you sure you want to
    Your message goes here
No Downloads

Views

Total Views
6,553
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
0
Comments
8
Likes
8

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. ESTADÍSTICA
    Nociones generales
  • 2. ESTADÍSTICA
    La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación, y que han sido recopilado a partir de otros datos numéricos
    La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares (Gini, 1953)
  • 3. TIPOS DE ESTADÍSTICA
    ESTADÍSTICA DESCRIPTIVA.- Conjunto de métodos para organizar; resumir y presentar los datos de manera informativa
    ESTADÍSTICA INFERENCIAL.-Conjunto de métodos utilizados para saber algo acerca de una población, basándose en una muestra
    POBLACIÓN.- Conjunto de todos los posibles individuos, objetos o medidas de interés
    MUESTRA.- Una porción o parte de la población de interés
  • 4. Datos
    • Son números o medidas que han sido recopilados como resultado de observaciones.
    • 5. Los datos pueden provenir de recuentos tales como el número de personas que laboran en una empresa o de mediciones como el peso de una persona.
  • Exactitud y precisión
    Exactitud
    La exactitud es lo cerca que el resultado de una medición está del valor verdadero.
    Precisión
    La precisión es lo cerca que los valores medidos están unos de otros.
    Así que si estás jugando al fútbol y siempre le das al poste izquierdo en lugar de marcar gol, ¡entonces no eres exacto, pero eres preciso!
  • 6. Sesgo (¡que no los engañe la precisión!)
    Así que si medimos algo varias veces y los valores están cerca unos de otros, pueden estar todos equivocados si hay "sesgo".
    Un sesgo es un error sistemático (pasa siempre) que hace que todas las medidas estén desviadas en una cierta cantidad.
    Ejemplos de sesgos
    Un balanza dice "1 kg" cuando no hay ningún peso encima
    Siempre mides tu altura con zapatos de suelas anchas
    Un cronómetro que se para medio segundo después de pulsar el botón
  • 7. Grado de exactitud
    La exactitud depende del instrumento de medida. Pero por regla general:
    El grado de exactitud es la mitad de la unidad de medida.
  • 8. Línea de probabilidades
    La probabilidad indica lo fácil que es que algo pase. Se puede usar una línea para representarla.
  • 9. Podemos decir que la probabilidad de que algo pase está entre imposible y seguro.
    Además de usar palabras se pueden usar fracciones o decimales para indicar la probabilidad de que algo pase. Imposible es cero y seguro es uno. Aquí tienes una línea de probabilidades con fracciones.
  • 10. Podemos indicar con ella la probablidad de que algo pase:a) El sol salga mañana. b) No tenga que aprender matemáticas. c) Si tiro una moneda saldrá cara. d) Si doy a alguien a elegir entre rojo, amarillo, azul o verde, elegirá rojo.
    Recuerde que la probabilidad nunca vale más de 1. Esto es porque vale 1 cuando algo es seguro.
    Y la probabilidad nunca vale menos de 0. Esto es porque vale 0 cuando algo es imposible (seguro que no pasa).
  • 11. Población:
    Es el conjunto de los elementos sobre el cual realizamos nuestro estudio.
    Es un conjunto de elementos con características comunes, que pueden ser finitos o infinitos.
  • 12. TIPOS DE ESTADÍSITICA
    POBLACIÓN
    MUESTRA
  • 13. Tipos de datos estadísticos
    Datos simples: cuando a los datos no se les han aplicado algún tratamiento de agrupación, pudiendo ser dichas series:
    Sin frecuencias: cuando no se repiten los valores.
    Con frecuencias: cuando se repiten los valores.
    Datos agrupados en clase: los datos se agrupan en clases con el fin de sintetizar, condensar, resumir o hacer más fácilmente manejable la información.
    Las clases constan de un límite inferior y de un limite superior.
  • 14. NIVELES DE DATOS
    NOMINAL
    ORDINAL
    DE INTERRVALO
    DE RAZÓN
    Solo clasifica
    los datos
    Ordena los datos
    por jerarquía
    Las diferencias
    entre los valores
    tienen
    significado
    El 0 y el cociente
    entre valores
    tienen significado
    Número en la
    camiseta de un
    jugador de fútbol
    Calificación de un
    estudiante en su clase
    Temperatura
    Número de
    pacientes
    atendidos
  • 15. Muestra y frecuencia
    Muestra:
    Es un conjunto de medidas, observaciones tomadas a partir de una población dada.
    Frecuencia:
    Es el número de veces que se repite un valor, dato o término dentro de una serie en estudio.
  • 16. Mediciones estadísticas
    Estas mediciones serán:
    Distribución de Frecuencias.
    Medidas de Tendencia Central.
    Medidas de Posición.
    Medidas de Dispersión.
  • 17. MEDIDAS DE TENDENCIA CENTRAL
  • 18. MEDIDAS DE TENDENCIA CENTRAL
    Las medidas de tendencia central o medidas de posición central, son aquellos valores promedios hacia los cuales tienden a acercarse o alejarse los demás valores que integran una serie.
  • 19. Media
    • Medida de tendencia central. Suma de los valores de todas las observaciones dividida por el nº de observaciones. Recibe también el nombre de media aritmética. Valores muy alejados del resto pueden modificar sustancialmente la media. En una situación así debe considerarse la utilización de la mediana, que no es sensible a los valores extremos.
  • Media
    = 10
  • 20. MODA
    Es el valor que corresponde a la mayor frecuencia; en otras palabras, es el valor más representativo o típico de una serie de valores en el sentido que ocurre más comúnmente.
    MODA DE UNA SERIE SIMPLE Y DE FRECUENCIAS
    En estos dos casos no es necesario aplicar ninguna fórmula para determinar la moda, basta determinar el valor que más veces se repite.
  • 21. Media
    Moda = 1
  • 22. MEDIANA
    Es el valor que divide una distribución de datos ordenados en dos partes iguales, es decir, por arriba igual número de términos que por debajo de él. Pudiendo estar ordenados en forma ascendente o descendente.
  • 23. Cómo calcular la mediana
    Es el número en el medio de una lista ordenada.
    Para calcular la mediana, ordena los números que te han dado según su valor y encuentra el que queda en el medio. Mira estos números:
    3, 13, 7, 5, 21, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29
    Si los ordenamos queda:3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40, 56
    Hay quince números. El del medio es el octavo número:
    3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 39, 40, 56
    La mediana de este conjunto de valores es 23.
    (Fíjense en que no importan mucho los otros números de la lista)
  • 24. PERO
    si hay una cantidad par de números la cosa cambia un poco.En ese caso tenemos que encontrar el par central de números, y después calcular su valor medio. Esto se hace simplemente sumándolos y dividiendo entre dos. Lo vemos mejor con un ejemplo:
     
    3, 13, 7, 5, 21, 23, 23, 40, 23, 14, 12, 56, 23, 29
    Si ordenamos los números nos queda:3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56
    Ahora hay catorce números así que no tenemos sólo uno en el medio, sino un par:
    3, 5, 7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56
    En este ejemplo los números intermedios son 21 y 23.
    Para calcular el valor en medio de ellos, sumamos y dividimos entre 2:
    21 + 23 = 4444 ÷ 2 = 22
    Así que la mediana en este ejemplo es 22.
  • 25. :
    Si los datos de una muestra ordenada en orden creciente y designando la mediana como Me, distinguimos dos casos
    Si N es impar
  • 26. :
    x1 = 3
    x2 = 6
    Si los datos de una muestra ordenada en orden creciente y designando la mediana como Me, distinguimos dos casos
    x3 = 7
    X4 = 8
    Si N es par
    x5 = 9
    x6 = 10
  • 27. Cantidad (N) impar de datos
    Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase viene dada por la siguiente tabla:
    Primero se halla las frecuencias absolutas acumuladas Ni. Así, aplicando la formula asociada a la mediana para n impar, se obtiene X(39 + 1) / 2 = X20.
  • 28. Ejemplo: Cantidad (N) par de datos
    Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo)
    Primero se hallan las frecuencias absolutas acumuladas Ni. Ni. Así, aplicando la formula asociada a la mediana para n par, se obtiene X(38 / 2) = X19.
    Ni-1< n/2 < Ni = N18 < 19 < N19
    Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el decimonoveno y el vigésimo lugar. En el ejemplo el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6 con lo que Me = (5+6)/2 = 5,5 puntos, la mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o más.
  • 29. MEDIDAS DE DISPERSIÓN
    Por sus propiedades algebraicas las medidas de dispersión son las más importantes ya que nos permiten determinar una vez conocida la medida de tendencia central, su variabilidad, tomando en cuenta que estas medidas tienen relación con la media aritmética.
  • 30. MEDIDAS DE DISPERSIÓN
  • 31. Varianza y desviación estándar
    Desviación estándar
    La desviación estándar (σ) mide cuánto se separan los datos.
    La fórmula es fácil: es la raíz cuadrada de la varianza.
    Así que, "¿qué es la varianza?“
    Varianza
    la varianza (que es el cuadrado de la desviación estándar: σ2 se define así: Es la media de las diferencias con la media elevadas al cuadrado.
  • 32. Varianza
    Es la media de las diferencias con la media elevadas al cuadrado. En otras palabras, sigue estos pasos:
    1. Calcula la media (el promedio de los números)
    2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).
    3. Ahora calcula la media de esas diferencias al cuadrado.
  • 33. Se miden las alturas de los perros (en milímetros):
    Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
  • 34.                
    Así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:
  • 35. Ahora calculamos la diferencia de cada altura con la media:
    Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:                      
    Así que la varianza es 21,704.
    Así que la varianza es 21,704.
  • 36. Y la desviación estándar es la raíz de la varianza, así que:
    Desviación estándar: σ = √21,704 = 147
    y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a distancia menos de la desviación estándar (147mm) de la media:
    Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o extra grande o extra pequeño.
    Los Rottweilersson perros grandes. Y los Dachsundsson un poco menudos...
  • 37. Nota: ¿por qué al cuadrado?
    Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los números negativos reduzcan la varianza)
    Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho más grande que 502=2,500.
    Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con la raíz cuadrada) y así la desviación estándar es mucho más útil.
  • 38. Distribución normal
    En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
    La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro. Esta curva se conoce como campana de Gauss.
  • 39. Distribución normal
    La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la ingente cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.
    La distribución normal también es importante por su relación con la estimación por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.
  • 40. Distribución normal
    Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo de la normal son:
    • caracteres morfológicos de individuos como la estatura;
    • 41. caracteres fisiológicos como el efecto de un fármaco;
    • 42. caracteres sociológicos como el consumo de cierto producto por un mismo grupo de individuos;
    • 43. caracteres psicológicos como el cociente intelectual;
    • 44. nivel de ruido en telecomunicaciones;
    • 45. errores cometidos al medir ciertas magnitudes;
    • 46. etc.
  • 47. Algunas propiedades de la distribución normal son:
    Es simétrica respecto de su media, μ; Distribución de probabilidad alrededor de la media en una distribución N(μ, σ).
  • 48. Algunas propiedades de la distribución normal son:
    La moda y la mediana son ambas iguales a la media, μ;
  • 49. Algunas propiedades de la distribución normal son:
    Los puntos de inflexión de la curva se dan para x = μ − σ y x = μ + σ.
  • 50. Algunas propiedades de la distribución normal son:
    Distribución de probabilidad en un entorno de la media:
    en el intervalo [μ - σ, μ + σ] se encuentra comprendida, aproximadamente, el 68,26% de la distribución;
  • 51. Distribución de probabilidad en un entorno de la media:
    en el intervalo [μ - 2σ, μ + 2σ] se encuentra, aproximadamente, el 95,44% de la distribución;
  • 52. por su parte, en el intervalo [μ -3σ, μ + 3σ] se encuentra comprendida, aproximadamente, el 99,74% de la distribución. Estas propiedades son de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que prácticamente la totalidad de la distribución se encuentre a tres desviaciones típicas de la media justifica los límites de las tablas empleadas habitualmente en la normal estándar.
  • 53. MEDIDAS DE DISTRIBUCION
  • 54. Medidas de Distribución Asimetría y Curtosis
     
    Las medidas de distribución nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y la Curtosis.
  • 55. ASIMETRÍA
    Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes, cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría. Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
  • 56. El Coeficiente de asimetría, se representa mediante la ecuación matemática,
    Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuación se interpretan:
     
    • (g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).
    • 57. (g1 > 0):La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media.
    • 58. (g1 < 0):La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media.
     
    Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media.
  • 59.
    • (g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).
    • 60. (g1 > 0):La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media.
    • 61. (g1 < 0):La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media.
  • El histograma sesgado a la derecha o la izquierda, responde a la variabilidad que presenta ciertas variables que no siguen una ley normal, como los tiempos de vida. En las curvas de frecuencias poco asimétricas, o segadas, la cola de la curva a un lado del máximo central es más larga que al otro lado. Si la cola mayor está a la derecha, la curva se dice asimétrica a la derecha o de asimétrica positiva.
    Promedio de sobre vivencia es de 4 años
  • 62. PARA 5 PACIENTES
    Media: 5 años de sobrevivencia
    Moda : 7 años
    Mediana: 6 años
    Media: 5 años de sobrevivencia
    Moda : 3 años
    Mediana: 4 años
  • 63. CURTOSIS
    Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).
  • 64. Para calcular el coeficiente de Curtosis se utiliza la ecuación:
     
     
    Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, (x) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta fórmula se interpretan:
  • 65. g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil  encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.).
    (g2 &gt; 0) la distribución es Leptocúrtica
    (g2 &lt; 0) la distribución es Platicúrtica
     
    Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1 = ±0.5) y un coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente.
  • 66. El número de días necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda, varianza y desviación típica.
  • 67. La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone:
  • 68.  La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
    15, 21, 32, 59, 60, 60,61, 64, 71, 80.
    Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.
    La moda: el valor de la variable que presenta una mayor frecuencia es 60
  • 69. La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución
  • 70.  La desviación típica S: es la raíz cuadrada de la varianza.
    S = √ 427,61 = 20.67
     El rango: diferencia entre el valor de las observaciones mayor y el menor
    80 - 15 = 65 días
     El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética
    CV = 20,67/52,3 = 0,39