Apuntes de estadistica
Upcoming SlideShare
Loading in...5
×
 

Apuntes de estadistica

on

  • 1,931 views

 

Statistics

Views

Total Views
1,931
Views on SlideShare
1,931
Embed Views
0

Actions

Likes
1
Downloads
63
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft Word

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Apuntes de estadistica Apuntes de estadistica Document Transcript

  • DEFINICION DE CONCEPTOS PARA ANALISIS DE DATOS ESTADISTICOSLa media, moda y mediana son parámetros característicos de una distribución deprobabilidad. Es a veces una forma de medir el sesgo de una distribución tal ycomo se puede hacer en las distribuciones exponencial y de Poisson.MEDIAEn matemáticas y estadística una media o promedio es una medida de tendenciacentral, que resulta al efectuar una serie determinada de operaciones con unconjunto de números y que, en determinadas condiciones, puede representar porsí solo a todo el conjunto». Existen distintos tipos de medias, tales como la mediageométrica, la media ponderada y la armónica aunque en el lenguaje común, eltérmino se refiere generalmente a la media aritmética.Existen numerosos ejemplos de medias, y una de las pocas propiedadesCompartidas por todas las medias es que cualquier media está comprendida entreel valor máximo y el valor mínimo del conjunto de datosLa media aritmética es un promedio estándar que a menudo se denomina"promedio".La media estadística se usa en estadística para dos conceptos diferentes aunquenuméricamente similares.La Media muestral, resume en un valor las características deuna constante teniendo en cuenta a todos los casos. Solamente puede utilizarsecon variables cuantitativas.MEDIANAEn el ámbito de la estadística, la mediana, representa el valor de la variable deposición central en un conjunto de datos ordenados. De acuerdo con estadefinición el conjunto de datos menores o iguales que la mediana representarán el50% de los datos, y los que sean mayores que la mediana representarán el otro50% del total de datos de la muestra. La mediana coincide con el percentil 50, conel segundo cuartil y con el quinto decil. Su cálculo no se ve afectado por valoresextremos.Como concepto se sabe que es un valor único de un conjunto de datos que mideal elemento central en los datos. Este único elemento es el más cercano a la mitado el más central en el conjunto de números.
  • Esta medida nos indica que la mitad de los datos se encuentran por debajo deeste valor y la otra mitad por encima del mismo. Para determinar la posición de lamediana se utiliza la fórmulaMODAEn estadística, la moda es el valor con una mayor frecuencia en una distribuciónde datos. En consecuencia, en una distribución de frecuencias, es el valor de lavariable que viene afectada por la máxima frecuencia de la distribución. Endistribuciones no agrupadas en intervalos se observa la columna de lasfrecuencias absolutas, y el valor de la distribucion al que corresponde la mayorfrecuencia será la moda. A veces aparecen distribuciones de variables con másde una moda (bimodales, trimodales, etc), e incluso una distribución defrecuencias que presente una moda absoluta y una relativa.Hablaremos de una distribución bimodal de los datos adquiridos en una columnacuando encontremos dos modas, es decir, dos datos que tengan la mismafrecuencia absoluta máxima. Una distribución trimodal de los datos es en la queencontramos tres modas. Si todas las variables tienen la misma frecuenciadiremos que no hay moda.El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos condatos agrupados antes de definir la moda, se ha de definir el intervalo modal.La moda, cuando los datos están agrupados, es un punto que divide al intervalomodal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, queverifiquen que:Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de losintervalos anterior y posterior, respectivamente, al intervalo modal.Para obtener la moda en datos agrupados se usa la siguiente fórmula: Donde: = L-inferior de la clase modal. = es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal. = es el delta de frecuencia absoluta modal y la frecuencia absoluta
  • postmodal. i = intervalo. Ejemplo Encontrar la estatura modal de un grupo que se encuentra distribuido de la siguiente forma: Entre 1 y 1.10 hay 1 estudiante Entre 1.10 y 1.15 hay 1 estudiantes Entre 1.20 y 1.25 hay 2 estudiantes Entre 1.30 y 1.35 hay 2 estudiantes. Entre 1.45 y 1.55 hay 3 estudiantes. Entre 1.50 y 1.60 hay 4 estudiantes. Entre 1.60 y 1.70 hay 10 estudiantes. Entre 1.70 y 1.80 hay 8 estudiantes. Entre 1.80 y 1.90 hay 2 estudiantes. Clase modal = 1.60 y 1.70 (es la que tiene frecuencia absoluta más alta, 10) Li-1 = 1.60 D1 = 6 D2 = 2 i = 0.10 Moda = 1.60 + (6/8) * 0.1 = 1.675LA DESVIACIÓN ESTÁNDAR O DESVIACIÓN Típica (Denotada conel símbolo σ) es una la estadística descriptiva.Se define como la raíz cuadrada de la varianza. Junto con este valor medida decentralización o dispersión para variables de razón (ratio o cociente) y de intervalo,de gran utilidad en, la desviación típica es una medida (cuadrática) que informa dela media de distancias que tienen los datos respecto de su media aritmética,expresada en las mismas unidades que la variable.Para conocer con detalle un conjunto de datos, no basta con conocer las medidasde tendencia central, sino que necesitamos conocer también la desviación quepresentan los datos en su distribución respecto de la media aritmética de dichadistribución, con objeto de tener una visión de los mismos más acorde con larealidad al momento de describirlos e interpretarlos para la toma de decisiones.La varianza representa la media aritmética de las desviaciones con respecto ala media que son elevadas al cuadrado.Si atendemos a la colección completa de datos (la población en su totalidad)obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo auna muestra de la población, obtenemos en su lugar la varianza muestral. El
  • término desviación estándar fue incorporado a la estadística por KarlPearson en 1894.La desviación estándar (DS/DE), también llamada desviación típica, es unamedida de dispersión usada en estadística que nos dice cuánto tienden a alejarselos valores concretos del promedio en una distribución. De hecho,específicamente, la desviación estándar es "el promedio del cuadrado de ladistancia de cada punto respecto del promedio".La desviación estándar de un conjunto de datos es una medida de cuánto sedesvían los datos de su media. Esta medida es más estable que el recorrido ytoma en consideración el valor de cada dato.COEFICIENTE DE VARIACIÓNEn estadística es el coeficiente de variación a distintas escalas pero que estáncorrelacionadas estadísticamente y sustantivamente con un factor encomún. Es decir, ambas variables tienen una relación causal con esefactor. Su fórmula expresa la desviación estándar como porcentaje de la mediaaritmética, mostrando una mejor interpretación porcentual del grado de variabilidadque la desviación típica o estándar. Por otro lado presenta problemas ya que adiferencia de la desviación típica este coeficiente es variable ante cambios deorigen. Por ello es importante que todos los valores sean positivos y su media dé,por tanto, un valor positivo. A mayor valor de C.V. mayor heterogeneidad de losvalores de la variable; y a menor C.V., mayor homogeneidad en los valores de lavariable. Suele representarse por medio de las siglas C.V..CURTOSISEn teoría de la probabilidad y estadística, la curtosis es una medida de la forma oapuntamiento de las distribuciones. Así las medidas de curtosis (también llamadasde apuntamiento o de concentración central) tratan de estudiar la mayor o menorconcentración de frecuencias alrededor de la media y en la zona central de ladistribución.El coeficiente de apuntamiento de uso más extendido es el basado en el cuartomomento con respecto a la media y se define como:Donde es el 4º momento centrado o con respecto a la media y esla desviación estándar.En ocasiones se emplea esta otra definición del coeficiente de curtosis:
  • donde al final se ha sustraido 3 (que es la curtosis de la Normal) con objeto degenerar un coeficiente que valga 0 para la Normal y tome a ésta como referenciade apuntamiento:COEFICIENTE DE ASIMETRÍALas medidas de asimetría son indicadores que permiten establecer el grado desimetría (o asimetría) que presenta una distribución de probabilidad deuna variable aleatoria sin tener que hacer su representación gráfica.Como eje de simetría consideramos una recta paralela al eje de ordenadas quepasa por la media de la distribución. Si una distribución es simétrica, existe elmismo número de valores a la derecha que a la izquierda de la media, por tanto, elmismo número de desviaciones con signo positivo que con signo negativo.Decimos que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de lamedia es más larga que la de la izquierda, es decir, si hay valores más separadosde la media a la derecha. Diremos que hay asimetría negativa (o a la izquierda) sila "cola" a la izquierda de la media es más larga que la de la derecha, es decir, sihay valores más separados de la media a la izquierda.Coeficiente de asimetría de FisherEn teoría de la probabilidad y estadística, la medida de asimetría más utilizadaparte del uso del tercer momento estándar. La razón de esto es que nos interesamantener el signo de las desviaciones con respecto a la media, para obtener sison mayores las que ocurren a la derecha de la media que las de la izquierda.El coeficiente de asimetría de Fisher, representado por , se define como:Coeficiente de asimetría de PearsonSólo se puede utilizar en distribuciones uniformes, unimodales y moderadamenteasimétricas. Se basa en que en distribuciones simétricas la media de ladistribución es igual a la moda.
  • Coeficiente de asimetría de BowleyEstá basado en la posición de los cuartiles y la mediana, y utiliza la siguienteexpresión:En una distribución simétrica el tercer cuartil estará a la misma distancia de lamediana que el primer cuartil. Por tanto .Si la distribución es positiva o a la derecha, .La asimetría resulta útil en muchos campos. Muchos modelos simplistas asumenuna distribución normal, esto es, simétrica en torno a la media. La distribuciónnormal tiene una asimetría cero. Pero en realidad, los valores no son nuncaperfectamente simétricos y la asimetría de la distribución proporciona una ideasobre si las desviaciones de la media son positivas o negativas. Una asimetríapositiva implica que hay más valores distintos a la derecha de la media.RANGOEs la diferencia entre el menor y el mayor valor, por ejemplo en 4, 6,9,3,7, elmenor valor es 3, y el mayor es 9, entonces el rango es 9 – 3 igual a 6.Rango puede significar también todos los valores de resultados de una función.El rango es una categoría que puede aplicarse a una persona en función de susituación profesional o de su estatus social. Ejemplo: “tenemos que respetar elrango del superior a la hora de realizar algún pedido.FUENTERuiz Muñoz y Sánchez Sánchez (2006) Apuntes de Estadística Edición electrónica. Textocompleto enwww.eumed.net/libros/2006/rmss/