Estadística descriptiva
Upcoming SlideShare
Loading in...5
×
 

Estadística descriptiva

on

  • 1,072 views

El documento compartido por la profesora brinda los principios básicos de la Estadística Descriptiva

El documento compartido por la profesora brinda los principios básicos de la Estadística Descriptiva

Statistics

Views

Total Views
1,072
Views on SlideShare
1,072
Embed Views
0

Actions

Likes
1
Downloads
27
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Estadística descriptiva Estadística descriptiva Presentation Transcript

  • Estadística DescriptivaProf. Eliana Guzmán U.Compilado por: Ma. del CarmenGómez
  • Concepto de Estadística Se refiere a un conjunto demétodos para manejar laobtención, presentación yanálisis de observacionesnuméricas.Tema1.Introducción
  • Concepto de Estadística Sus fines son describir al conjuntode datos obtenidos y tomardecisiones o realizargeneralizaciones acerca de lascaracterísticas de todas lasobservaciones bajo consideración.Tema1.Introducción
  • Áreas que conforman a la Estadística Estadística Descriptiva (Deductiva):es la encargada de la organización,condensación, presentación de losdatos en tablas y gráficos y delcálculo de medidas numéricas quepermitan estudiar los aspectos másimportantes de los datos.Tema1.IntroducciónDESCRIBIRDESCRIBIR
  • Áreas que conforman a la Estadística Estadística Inferencial o InferenciaEstadística: está definida por unconjunto de técnicas, mediante lascuales se hacen generalizaciones ose toman decisiones en base ainformación parcial obtenidamediante técnicas descriptivas.Tema1.IntroducciónINFERIRINFERIR
  • Áreas de Aplicación de la Estadística El uso de la Estadística es muy amplio.Resulta difícil nombrar un área en la cual nose emplee. Los métodos estadísticos han encontradoaplicación en: Gobierno Negocios Ciencias Sociales Ingeniería Ciencias Física y Naturales Control de Calidad Procesos de Manufactura Muchos otros campos de la actividad intelectual.Tema1.Introducción
  • Áreas de Aplicación de la Estadística Esto se debe a la creciente facilidadcon la cual se pueden manejargrandes cantidades de datosnuméricos, debido al uso de …Tema1.Introducción
  • Conceptos de Población y Muestra Población: es la colección de todaslas posibles mediciones uobservaciones que pueden hacersede una variable bajo estudio.Tema1.Introducción
  • Conceptos de Población y Muestra Se clasifica en dos categorías: Finita: es aquella que incluye unacantidad limitada contable deobservaciones, individuos o medidas.Siempre que sea posible alcanzar(contar) el número total de todas lasposibles mediciones, se considera comofinita la población.Tema1.Introducción
  • Conceptos de Población y Muestra Infinita: es aquella que incluye un granconjunto de observaciones omediciones que no pueden alcanzarsepor conteo. Al menos, hipotéticamente,no existe límite en cuanto al número deobservaciones que el experimentopuede generar.Tema1.Introducción
  • Conceptos de Población y Muestra Muestra: es un conjunto de mediciones uobservaciones tomadas a partir de unapoblación. es un subconjunto de la población.Tema1.Introducción
  • Conceptos de Población y Muestra Muestra aleatoria: se consideraaleatoria siempre y cuando cadaobservación, medición o individuode la población tenga la mismaprobabilidad de ser seleccionado.Tema1.Introducción
  • Tipos de datos y escalas de medida Variables: son las características o lo que seestudia de cada individuo de lamuestra. Ej: sexo, edad, peso,estatura, color de ojos, estado civil,temperatura, cantidad de nacimientos,presión, grosor, diámetro, ... Datos: son los valores que toma la variable encada caso.Tema1.Introducción
  • Tipos de datos Cualitativos: son datos que solo tomanvalores asociados a las cualidades oatributos, clasificándolos en una de variascategorías, es decir, no son valoresnuméricos. Ej: Sexo: f/m. Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón, … Religión: católica, evangélica, … Estado civil: soltero, casado, divorciado,…Tema1.Introducción
  • Tipos de datos Cuantitativos: provienen de variables quepueden medirse, cuantificarse oexpresarse numéricamente. Ejemplos: Peso Edad Estatura Presión Humedad Intensidad de un sismo Cantidad de hermanosTema1.Introducción
  • Escalas de medida Tipos de variables cuantitativas: Discretas: es aquella que solo puedetomar un número finito o infinitonumerable de valores. Ejemplo:cantidad de hermanos. Continuas: es la variable que puedetomar cualquier valor en una escalacontinua. Ejemplo: cantidad de líquidocontenido en un recipiente.Tema1.Introducción
  • Escalas de medida Escala Nominal. Escala Ordinal. Escala de Intervalos. Escala de Razón o Proporción. Escala Absoluta.Variables CualitativasVariablesCuantitativasTema1.Introducción
  • Escalas de medida Escala nominal: los datos sepueden agrupar en categorías queno mantienen una relación deorden entre si, por lo tanto noestán definidas las operacioneslógicas (>, <, ≤, ≥) sino solo las deigualdad o diferencia. Ejemplos: color de ojos, sexo,profesión, estado civil, religión.Tema1.Introducción
  • Escalas de medida Escala ordinal: existe un ciertoorden o jerarquía entre lascategorías (>, <, ≤, ≥). Ejemplos: grados militares,organigrama de una empresa,escalafón de los profesoresuniversitarios, grados de disnea,estadiaje de un tumor.Tema1.Introducción
  • Escalas de medida Escala de Intervalos: valores numéricosde las variables y además de lasrelaciones de orden (>, <, ≤, ≥), sepueden establecer distancias, es decir,tienen sentido las operaciones de suma yresta. Tiene dos propiedades: Existe una unidad de medida que se mantieneconstante para todos los valores que toma lavariable. Existe un valor patrón u origen relativo queno significa la ausencia de valor en lavariable.Tema1.Introducción
  • Escalas de medida Ejemplo: temperatura, nivel deruido, movimientos sísmicos.Tema1.Introducción
  • Escalas de medida Escala de razón o proporción: es lamás completa y general de todas lasescalas. Se caracteriza porque losvalores de la variable son númerosentre los cuales, además de lasrelaciones de orden (>, <, ≤, ≥) ydistancia (+,-), se pueden establecermúltiplos y proporciones. Ejemplos: peso, altura, volumen…Tema1.Introducción
  • Escalas de medida Escala Absoluta: se caracterizaporque los valores que toma lavariable son el resultado de contar ypor lo tanto, está constituida por losenteros positivos y el cero. Ejemplos: número de hermanos,cantidad de autos vendidos,cantidad de accidentes en unaintersección, cantidad de hijos,…Tema1.Introducción
  • Datos Univariantes y Multivariantes Univariantes o unidimensionales:sólo recogen información sobre unacaracterística (Ej: edad de losalumnos de una clase). Bivariantes o bidimensionales:recogen información sobre doscaracterísticas de la población. (Ej:edad y estatura de los alumnos deuna clase).Tema1.Introducción
  • Datos Univariantes y Multivariantes Multivariantes o pluridimensionales:recogen información sobre tres ómás características. (Ej: edad,estatura y peso de los alumnos deuna clase).Tema1.Introducción
  • Abusos que se pueden cometer con laEstadística Conclusiones erróneas debido a que losdatos son numéricamente insuficientes. Representaciones gráficas engañosas(escalas). Datos muestrales no representativos: Muestra que no incluye a elementos de toda lapoblación. Ciertas categorías de personas no respondencorrectamente. Respuestas voluntarias (sesgadas).Tema1.Introducción
  • TEMA 2. ESTADÍSTICA DESCRIPTIVA
  • Organización de los datos Una vez que se harealizado larecolección de losdatos, se obtienendatos en bruto,los cuales rara vezson significativossin unaorganización ytabulación.Tema2.EstadísticaDescriptiva
  • Organización de los datos Formas de organizar los datos: Un arreglo: es la forma más sencilla deorganizar los datos en bruto, consiste encolocar las observaciones en orden según sumagnitud: ascendente o descendente. Poco práctica cuando se tiene una grancantidad de datos.Tema2.EstadísticaDescriptiva
  • Organización de los datos Una distribución de frecuencias: es unarreglo de los datos que permite expresarla frecuencia de ocurrencias de lasobservaciones en cada una de las clases,mostrando el patrón de la distribución demanera más significativa.Clase Pto.Mediofi Fi fri FRiTema2.EstadísticaDescriptiva
  • Organización de los datos La Distribución de Frecuencias: Se recomienda su uso cuando se tienengrandes cantidades de datos (n). Su construcción requiere, en primerlugar, la selección de los límites de losintervalos de clase. Para definir la cantidad de intervalosde clase (k), se puede usar: La regla de Sturges: k = 1 + 3.3log(n) k = √nTema2.EstadísticaDescriptiva
  • Organización de los datos La cantidad de clases no puede ser tanpequeño (menos de 5) o tan grande (másde 20), que la verdadera naturaleza de ladistribución sea imposible de visualizar. La amplitud de todas las clases deberá serla misma. Se recomienda que sea impar yque los puntos medios tengan la mismacantidad de cifras significativas que losdatos en bruto. Los límites de las clases deben tener unacifra significativa más que los datos enbruto.Tema2.EstadísticaDescriptiva
  • Organización de los datos Determinar: Punto medio = (Li+Ls)/2. Frecuencia absoluta de la clase (fi). Frecuencia acumulada de la clase (Fi). Frecuencia relativa de la clase (fri): fri = fi/n Frecuencia relativa acumulada de laclase (FRi).Tema2.EstadísticaDescriptiva
  • A continuación se presentanlas calificaciones de 60estudiantes quepresentaron la PINA en elaño 2009:Tema2.EstadísticaDescriptivaEjemplos de Distribución deFrecuencias
  • 23 60 79 32 57 74 52 70 82 3680 77 81 95 41 65 92 85 55 7652 10 64 75 78 25 80 98 81 6741 71 83 54 64 72 88 62 74 4360 78 89 76 84 48 84 90 15 7934 67 17 82 69 74 63 80 85 61a) Construya una distribución de frecuencias.b) Qué puede concluir de estos datos.Ejemplos de Distribución deFrecuencias
  • Representación gráfica de los datos Los gráficos permiten visualizar en formaglobal y rápida el comportamiento de losdatos. Para datos cuantitativos agrupados enclases, comúnmente se utilizan tresgráficos: Histogramas. Polígono de frecuencias. Ojiva o Polígono de frecuencias acumuladas.Tema2.EstadísticaDescriptiva
  • Representación gráfica de los datosHistograma
  • Representación gráfica de los datosTema2.EstadísticaDescriptivaHistograma y Polígono de Frecuencias
  • OjivaRepresentación gráfica de los datosTema2.EstadísticaDescriptiva
  • Representación gráfica de los datos Para datos cualitativos se usan: Curvas Barras SectoresTema2.EstadísticaDescriptiva
  • BarrasRepresentación gráfica de los datosBarras
  • Representación gráfica de los datosCurvas
  • Representación gráfica de los datosSectores, torta o circularTema2.EstadísticaDescriptiva
  • Ejemplos de construcciónde gráficosTema2.EstadísticaDescriptiva
  • Medidas de tendencia central oposición Corresponden a valores quegeneralmente se ubican en la partecentral de un conjunto de datos. Forma como los datos puedencondensarse en un solo valorcentral alrededor del cual todos losdatos muestrales se distribuyen.Tema2.EstadísticaDescriptiva
  • Medidas de tendencia central oposición Las medidas de tendencia centralmás importantes son: Media: Aritmética y Aritméticaponderada. Mediana. Moda.Tema2.EstadísticaDescriptiva
  • Media Aritmética Es la suma de todas las observaciones dividida entreel número total de observaciones. Expresada de forma más intuitiva, podemos decirque la media aritmética es la cantidad total de lavariable distribuida a partes iguales entre cadaobservación. (wikipedia) Por ejemplo, si en una habitación hay tres personas,la media de dinero que tienen en sus bolsillos seríael resultado de tomar todo el dinero de los tres ydividirlo a partes iguales entre cada uno de ellos. Esdecir, la media es una forma de resumir lainformación de una distribución (dinero en el bolsillo)suponiendo que cada observación (persona) tendríala misma cantidad de la variable. (wikipedia)Tema2.EstadísticaDescriptiva
  • Cálculo de la media aritmética Para datos no agrupados:nxXnii∑== 1 Para datos agrupados:nfmXkiii∑== 1Donde: mi: punto medio de la clase ifi: frecuencia absoluta de la clase ik: cantidad de clasesTema2.EstadísticaDescriptiva
  • Mediana Es el valor que ocupa la posicióncentral de un conjunto deobservaciones, una vez que hansido ordenados en formaascendente o descendente. Divide al conjunto de datos en dospartes iguales.Tema2.EstadísticaDescriptiva
  • Cálculo de la mediana Para datos no agrupados: Si n es impar: posición donde se ubicala mediana es igual a (n+1)/2. Si n es par: (n+1)/2 no es entero, porlo tanto la mediana será igual alpromedio de las dos posicionescentrales.Tema2.EstadísticaDescriptiva
  • Cálculo de la mediana Datos agrupados: clase mediana es laque contiene a la observación queocupa la posición n/2.CmxfxFnLmMdmm)()(211−−++=Donde: Lm: límite inferior de la clase mediana.F(xm-1): frecuencia acumulada de la claseanterior a la clase mediana.f(xm): frecuencia absoluta de la clase mediana.Cm: amplitud de la clase mediana.Tema2.EstadísticaDescriptiva
  • Moda Observación o clase que tiene lamayor frecuencia en un conjunto deobservaciones. Un conjunto de datos puede serunimodal, bimodal o multimodal. Es la única medida de tendenciacentral que se puede determinarpara datos de tipo cualitativo.Tema2.EstadísticaDescriptiva
  • Cálculo de la moda Para datos no agrupados: es simplementela observación que más se repite. Para datos agrupados:CmLimMo211∆+∆∆+=Donde: Lim: límite inferior de la clase modal.∆1: diferencia entre fi de la clase modal y laanterior.∆2: diferencia entre fi de la clase modal y laposterior.Cm: amplitud de la clase modal (clase de mayorfrecuencia).Tema2.EstadísticaDescriptiva
  • Relación entre la media, la mediana yla modaTema2.EstadísticaDescriptivaCuando los datos son sesgados es mejor emplear la Md
  • Propiedades, ventajas y desventajasde la mediaPropiedades: La suma de las diferencias entre lasmedia muestral y el valor de cadaobservación es cero. La media de una constante es laconstante. Si todas las observaciones xi semultiplican por una constante a, la Xtambién se debe multiplicar por esemismo valor constante.Tema2.EstadísticaDescriptiva
  • Propiedades, ventajas y desventajasde la media Si se somete a una variableestadística X a un cambio de origeny escala, Y = a + bX, la mediaaritmética de dicha variable X varíaen la misma proporción. La media de la suma de dosvariables es igual a la suma de susmedias.Tema2.EstadísticaDescriptiva
  • Propiedades, ventajas y desventajasde la mediaVentajas: Emplea en su cálculo toda lainformación disponible. Se expresa en las mismas unidadesque la variable en estudio. Es el centro de gravedad de toda ladistribución, representando a todoslos valores observados. Es una valor único.Tema2.EstadísticaDescriptiva
  • Propiedades, ventajas y desventajasde la media Se trata de un concepto familiarpara la mayoría de las personas. Es útil para llevar a caboprocedimientos estadísticos como lacomparación de medias de variosconjuntos de datos.Tema2.EstadísticaDescriptiva
  • Propiedades, ventajas y desventajasde la mediaDesventajas: Se ve adversamente afectada por valoresextremos, perdiendo representatividad. Si el conjunto de datos es muy grandepuede ser tedioso su cálculo manual. No se puede calcular para datoscualitativos. No se puede calcular para datos quetengan clases de extremo abierto, tantosuperior como inferior.Tema2.EstadísticaDescriptiva
  • Ventajas y desventajas de la medianaVentajas: Fácil de calcular si el número deobservaciones no es muy grande. No se ve influenciada por valoresextremos, ya que solo influyen losvalores centrales. Fácil de entender.Tema2.EstadísticaDescriptiva
  • Ventajas y desventajas de la mediana Se puede calcular para cualquiertipos de datos cuantitativos, inclusolos datos con clase de extremoabierto. Es la medida de tendencia centralmás representativa en el caso devariables que solo admiten la escalaordinal.Tema2.EstadísticaDescriptiva
  • Ventajas y desventajas de la medianaDesventajas: No utiliza en su “cálculo” toda lainformación disponible. No pondera cada valor por elnúmero de veces que se harepetido. Hay que ordenar los datos antes dedeterminarla.Tema2.EstadísticaDescriptiva
  • Ventajas y desventajas de la modaVentajas: No requiere cálculos. Puede usarse para datos tantocuantitativos como cualitativos. Fácil de interpretar. No se ve influenciada por valoresextremos. Se puede calcular en clases deextremo abierto.Tema2.EstadísticaDescriptiva
  • Ventajas y desventajas de la modaDesventajas: Para conjuntos pequeños de datos suvalor no tiene casi utilidad, si es quede hecho existe. Solo tiene significadoen el caso de una gran cantidad dedatos. No utiliza toda la informacióndisponible. No siempre existe, si los datos no serepiten.Tema2.EstadísticaDescriptiva
  • Ventajas y desventajas de la moda En ocasiones, el azar hace que unasola observación se norepresentativa se el valor másfrecuente del conjunto de datos. Difícil de interpretar si los datostiene 3 o más modas.Tema2.EstadísticaDescriptiva
  • Medidas de dispersión, variación ovariabilidad. Son valores numéricos que indicano describen la forma en que lasobservaciones están dispersas odiseminadas, con respecto al valorcentral.Tema2.EstadísticaDescriptiva
  • Medidas de dispersión, variación ovariabilidad. Son importantes debido a que dosmuestras de observaciones con elmismo valor central pueden teneruna variabilidad muy distinta.Tema2.EstadísticaDescriptiva
  • Medidas de dispersión, variación ovariabilidad. Rango. Varianza. Desviación Típica. Coeficiente de variación.Tema2.EstadísticaDescriptiva
  • Medidas de dispersión: RangoRango (amplitud o recorrido): Está determinado por los dosvalores extremos de los datosmuestrales, es simplemente ladiferencia entre la mayor y menorobservación. Es una medida de dispersiónabsoluta, ya que dependesolamente de los datos y permiteconocer la máxima dispersión.Tema2.EstadísticaDescriptiva
  • Medidas de dispersión: Rango Casi no se emplea debido a quedepende únicamente de dosvalores. No proporciona una medida devariabilidad de las observacionescon respecto al centro de ladistribución. Notación: RTema2.EstadísticaDescriptiva
  • Medidas de dispersión: Varianza Es un valor numérico que mide elgrado de dispersión relativa porquedepende de la posición de los datosx1,x2,…,xn con respecto a la media. Es el promedio al cuadrado de lasdesviaciones de cada observacióncon respecto a la media. Notación: s2, σ2, var(X)Tema2.EstadísticaDescriptiva
  • Medidas de dispersión: Varianza Si la varianza de un conjunto deobservaciones es grande se dice que losdatos tiene una mayor variabilidad queun conjunto de datos que tenga unvarianza menor.( )2122122xnxsnxxsniinii−=−=∑∑==Tema2.EstadísticaDescriptivaPara datos NOagrupados:
  • Para datos agrupados en unadistribución de frecuencias:Medidas de dispersión: Varianza( )( )2122122xnfmsnfxmskiiikiii−×=×−=∑∑==
  • Medidas de dispersión: DesviaciónTípica Es la raíz cuadrada de la varianza. Notación: s, σ.2ss =Tema2.EstadísticaDescriptiva
  • Medidas de dispersión: Coeficiente deVariación Es una medida de dispersión relativa quepermite comparar el nivel de dispersiónde dos muestras de variables estadísticasdiferentes. No tiene dimensiones. Notación: CV%100×=xsCVTema2.EstadísticaDescriptiva
  • Ventajas y Desventajas del RangoVentajas: Útil cuando se quiere conocer laextensión de las variacionesextremas (valor máximo de ladispersión). Fácil de calcular.Tema2.EstadísticaDescriptiva
  • Ventajas y Desventajas del RangoDesventajas: No es una MD con respecto alcentro de la distribución. Solo emplea dos valores en sucálculo. No se puede calcular endistribuciones de límite de claseabierto.Tema2.EstadísticaDescriptiva
  • Propiedades, Ventajas y Desventajasde la VarianzaPropiedades:1. Siempre es mayor o igual a cero ymenor que infinito.2. La varianza de una constante escero.3. Si a una variable X la sometemos aY=a+bX, la varianza de Y seráVar(Y) = b2Var(X)Tema2.EstadísticaDescriptiva
  • Propiedades, Ventajas y Desventajasde la VarianzaVentajas: Es útil cuando se compara la variabilidadde dos o más conjuntos de datos. Utiliza toda la información disponible.Desventajas: No proporciona ayuda inmediata cuandose estudia la dispersión de un soloconjunto de datos. Difícil de interpretar por tener susunidades elevadas al cuadrado.Tema2.EstadísticaDescriptiva
  • Ventajas y Desventajas de laDesviación TípicaVentajas: Esta expresada en las mismasunidades que la variable en estudio. Utiliza todas las observaciones ensu cálculo. Fácil de interpretar.Desventajas: No tiene.Tema2.EstadísticaDescriptiva
  • Ventajas y Desventajas del Coeficientede VariaciónVentajas: Es la única MD que permitecomparar el nivel de dispersión dedos muestras de variablesdiferentes. Emplea toda la informacióndisponible en su cálculo. Fácil de calcular.Tema2.EstadísticaDescriptiva
  • Ventajas y Desventajas del Coeficientede VariaciónDesventaja: No es una MD con respecto alcentro de la distribución de losdatos.Tema2.EstadísticaDescriptiva
  • Medidas de Forma Son medidas numéricas quepermiten determinar la forma quetiene la curva de los datos, por lotanto, sirven para corroborar lo quelos gráficos muestran.Medidasde forma-Asimetría-Kurtosis o apuntamientoCoeficiente de PearsonCoeficiente de FisherTema2.EstadísticaDescriptiva
  • Medidas de Forma: Asimetría Permiten estudiar la forma de lacurva, dependiendo de cómo seagrupan los datos.Tema2.EstadísticaDescriptiva
  • Medidas de Forma: AsimetríaCoeficiente de Asimetría de Pearson: Fácil de calcular e interpretar. Cálculo:( )sMdXASP−=3o Interpretación:ASP= 0, X=Md Simétrica> 0, X>Md Asimétrica Positiva< 0, X<Md Asimétrica NegativaTema2.EstadísticaDescriptiva
  • Medidas de Forma: AsimetríaCoeficiente de Asimetría de Fisher: No es de fácil cálculo, pero si suinterpretación.Tema2.EstadísticaDescriptiva( )( )313313nsfxMASFnsXxASFkiiinii∑∑==×−=−= Datos NO agrupadosDatos Agrupados
  • Medidas de Forma: Asimetríao Interpretación:ASF= 0, Simétrica> 0, Asimétrica Positiva< 0, Asimétrica NegativaTema2.EstadísticaDescriptiva
  • Medidas de Forma: Kurtosis Miden si los valores de ladistribución están más o menosconcentrados alrededor de losvalores medios de la muestra (zonacentral de la distribución). Se definen tres tipos de distribuciónsegún su grado de Kurtosis:Tema2.EstadísticaDescriptiva
  • Medidas de Forma: Kurtosis Mesocúrtica: grado de concentraciónmedio alrededor de los valorescentrales de la variable. Leptocúrtica: grado de concentraciónelevado. Platicúrtica: grado de concentraciónreducido.Tema2.EstadísticaDescriptiva
  • Medidas de Forma: Kurtosis( )( )33414414−×−=−−=∑∑==nsfXMCKnsXxCKkiiiniiDatos No AgrupadosDatos AgrupadosInterpretación:CK=0 Mesocúrtica>0 Leptocúrtica<0 PlaticúrticaTema2.EstadísticaDescriptiva
  • Referencias: Wikipedia(http://es.wikipedia.org/wiki/Wikipedia:P) Walpole y Myers. Probabilidad yEstadística. Mc Graw-Hill. Triola, Mario F. Estadística. Pearson.