Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Bio 4 medidas de centralizacion

  • Login to see the comments

  • Be the first to like this

Bio 4 medidas de centralizacion

  1. 1. BIOESTADÍSTICATEMA Nº 3 MEDIDAS DE CENTRALIZACIÓN Y DISPERCIÓNLas distribuciones de frecuencia son aquellas que permiten realizar un estudio de las característicasparticulares de las series, pero no se pueden realizar comparaciones con series similares. Lascaracterísticas que podremos observar en cada distribución de frecuencias son: a) La cantidad de mediciones realizadas. b) El valor acerca del cual parecen agruparse los datos. c) Las frecuencias con que se agrupan los datos alrededor de los distintos valores de la característica.Para poder hacer análisis y comparaciones de varias series semejantes, es necesario lograr una mejorcaracterización de las mismas, concentrar más la información, y esto se logra con las:  MEDICIONES DE RESUMEN  MEDIDAS DE POSICIÓN O TENDENCIA CENTRAL  MEDIDAS DE DISPERSIÓNMEDIDAS DE TENDENCIA CENTRAL.- Estas medidas procuran definir el centro de la distribución;dicho centro tiene distintos significados para las diferentes personas, así se presenta gráficamente lainformación, para algunas personas en que se halla la mayor frecuencia.Las medidas de posición que se emplean más frecuentemente son: a) Media aritmética o promedio b) Mediana c) Moda o modo a) LA MEDIA ARITMÉTICA.- Es la cifra que se obtiene de dividir la suma de todos los valores observados entre el número de observaciones.MÉTODO DE CÁLCULO.- Veremos el cálculo de la media aritmética. La anotación que usaremos será:x : Valor correspondiente a una observación.n : Número de mediciones efectuadas o número de observaciones, que las determinamos contando.x : Media o promedio. : Suma de los valores expresados a continuación.Con estos símbolos y de acuerdo a la definición dada del promedio, la fórmula de cálculo será: x= x nPor tanto para determinar la media cuando no hay agrupación de datos, simplemente se suma el valor detodas las observaciones y se divide entre el número de observaciones.Apliquemos en el siguiente ejemplo la fórmula dada:Deseamos determinar el promedio de días de internación de diez pacientes, cuya permanencia en el hospital fue: 23
  2. 2. BIOESTADÍSTICA 3, 11, 10, 7, 3, 11, 11, 9, 3, 9. x= x = 3 + 11 + 10 + 7 – 3 + 11 + 11 + 9 + 3 + 9 = 77 = 7,7 n 10 10Interpretemos este resultado como los días de internación que hubiese tenido los 10 pacientes si nohubiera variaciones.Veamos un ejemplo: Determinar la media aritmética de los siguientes números:38,49, 24, 6 y 17. 38 – 49 – 24 – 6 – 17 = 134 134 = 26,8 5Para determinar la media aritmética hemos sumado todas las cantidades y luego ese resultado se hadividido entre 5, que en el número de valores que teníamos, como se puede notar en la determinación dela media todas las observaciones intervienen en la misma manera y por ello esta media tiene la siguientepropiedad:“La suma de las desviaciones positivas, respecto a la media, es igual a la suma de las desviacionesnegativas; es decir, la media en el centro de gravedad de la distribución”.Comprobaremos la anterior propiedad:Desviaciones positivas Desviaciones negativas 38 26,8 = 11,2 24 - 26,8 = -2,8 49 26,8 = 22,2 17 - 26,8 = -9,8 33,4 6 - 26,8 = -20,8 -33,4LA MEDIANAEsta es otra medida de tendencia central que se caracteriza por dividir la serie en dos partes iguales demanera que la mitad de las observaciones son iguales o menores que dicho valor y la otra mitad iguales omayores que él.Se usa la mediana cuando se presentan distribuciones asimétricas pues en ellas la media se vería influidapor los valores extremos.Para calcular la mediana se deben ordenar las series en forma creciente, luego se determina el valorcentral de la serie que constituye el valor de la mediana. 24
  3. 3. BIOESTADÍSTICAMETODOS DE CÁLCULO.- Para calcular la mediana de una serie sin agrupación de datos en primerlugar, como ya indicamos, se la ordena en forma creciente, luego se determina la posición del valorcentral utilizando la siguiente fórmula: Ma = n + 1 = 9 + 1 = 5 2 2La mediana ocupa el quinto lugar o sea al 6, esto significa que el 50% de las observaciones tiene un valorigual o inferior a 6 y el otro 50% un valor igual o mayor a 6. Si la serie tiene un número par deobservaciones usamos la fórmula indicada para localizar la mediana pero como no hay un valor centralpara determinar el valor de la mediana se promedian los dos valores centrales. Ejemplo: 26, 33, 36, 39, 40, 41, 42, 44, 45, 47, 48, 48 Ma = n + 1 = 12 + 1 = 6,5 2 2El anterior cociente nos indica que la mediana se encuentra entre la sexta y séptima observaciones, esdecir entre 41 y 42, para determinar su valor promediamos las dos cifras: 41 + 42 = 41,5 42EL MODO O MODAEl modo o moda es el valor típico, el que se observa con más frecuencia, es decir el más común de laserie.Esta medida de tendencia central no es muy usada en Bioestadística.METODOS DE CÁLCULO.- Tenemos las siguientes observaciones: 14, 15, 17, 21, 21, 21, 21, 33, 33, 33, 36, 36, 36, 40El modo en este ejemplo es 21 porque es el valor que se repite más veces.USO DE LAS MEDIDAS DE POSICIÓN CENTRAL.- En la práctica de las medidas entes estudiados laque más se usa es la media o promedio aritmético, que representa el centro o punto de equilibrio de laserie o del valor que tendrían todas las observaciones si no varían; tiene las siguientes ventajas: 1) se puede calcular fácilmente. 25
  4. 4. BIOESTADÍSTICA 2) Es comprendida por todos. 3) Cada observación de la distribución contribuye a ella con igual peso. Sin embargo hay que tener en cuenta que no se puede calcular la media cuando hay clases abiertas o valores extremos, en este caso se usa la mediana que no se ve afectada por los mismos. El modo se emplea cuando hay interés en conocer el o los valores que se presentan con mayor frecuencia. Finalmente podemos afirmar que si la distribución de frecuencias es simétrica la media, la mediana y el modo son idénticos, no ocurriendo así con las series asimétricas.MEDIDAS DE POSICIÓN U ORDEN :LOS CUARTILES O VALORES CUÁRTICOSEsta medida proporciona una información acerca de la distribución de los valores de la serie.Los cuarteles dividen a la serie en cuatro partes iguales, los tramos comprendidos entre los cuarteles sedenominan espacios intercuartilares. En una serie hay 3 cuartiles y 4 intercuartiles. El segundo cuartil esigual a la mediana.METODOS DE CÁLCULO.- El procedimiento de cálculo de los cuartiles es el mismo que el de lamediana.Representado con “Q” a los cuartiles, tenemos que las fórmulas para el primer y tercer cuartil son: Q1 = (n + 1) 4 Q3 = (n + 1) x 3 4Ejemplo:Tenemos los siguientes datos:1, 2, 11, 14, 28, 30, 37, 48, 52, 62, 70, 72, 84, 91, 92, 95, 100Las 17 observaciones han sido ya ordenadas en forma creciente y aplicamos las fórmulas: Q1 = (17 + 1) = 18 = 4,5 4 4 Q3 = (17 + 1) = 18 * 3 = 13,5 4 4Estos resultados nos indican que:El primer cuartil se encuentra entre la cuarta y quinta observaciones y divide a la serie dejando el 25% devalores iguales o inferiores a él por un lado y el 75% de valores iguales o superiores por el otro.El tercer cuartil esta entre la trece y catorce observaciones y deja el 75% de valores iguales o inferiores aél por un lado y el 25% de valores iguales o superiores por el otro.Determinemos los valores de estos dos cuartiles: 26
  5. 5. BIOESTADÍSTICA Q1 = 14 + 28 = 42 = 21 2 2 Q3 = 84 + 91 = 175 = 87,5 2 2METODO DE DISPERSIONSi los hechos no se repitieran o si se repitieran sin variaciones, la estadística no tendría razón de ser, peroen la realidad los hechos o fenómenos generalmente se repiten y lo hacen mostrando variaciones demayor o menor intensidad, surgiendo ahí la repartición o variabilidad de los hechos para luego hacerpredicciones científicamente válidas.Fundamentalmente, al realizar los análisis de un conjunto de datos, se tiene en mente dos objetivos: a) Tratar de determinar un valor típico o central que resuma las observaciones. b) Establecer la importancia de la dispersión de los elementos individuales con respecto a ese valor típico o representativo elegido para representar o caracterizar la serie.Podemos afirmar que es tan importante conocer un promedio como la variabilidad de los datos alrededorde él porque la validez de un valor típico para resumir o representar un situación depende de la forma enque los valores individuales se concentran o se alejan de él; cuanto más concentrados están los datos entorno a un promedio aritmético, este caracterizara en mejor forma al conjunto de datos.Las medidas usadas comúnmente para caracterizar la dispersión de las observaciones son: 1) Amplitud de variación 2) Desviación media 3) Desviación estándar1) AMPLITUD DE VARIACIÓN.- Esta medida se denomina también recorrido, rango, oscilación omódulo. Se la obtiene estableciendo la diferencia entre los valores mayor y menor de la serie.Ejemplo:3, 10, 2, 8, 8, 7, 9 Amplitud = 10 – 2 = 8También se acostumbra a indicarla dando los valores extremos directamente: Amp. = 2 a 10Si se trata de una distribución de frecuencias la amplitud estará dada por el límite inferior del primerintervalo y el límite superior del último intervalo.Esta medida no obstante lo fácil de su cálculo y comprensión de su significado no es muy empleada puessolo toma en cuenta los valores extremos de la serie que se analiza, sin considerar al resto de lasobservaciones; además cualquier variación en el tamaño de las observaciones modifican su valor.En la práctica es utilizada cuando se desea una medida simple de variabilidad o cuando por cualquier otracircunstancia no es posible emplear medidas más complejas.DESVIACIÓN MEDIA.- Se utiliza esta medida para caracterizar la variación en promedio de las medidasrespecto a la mediana generalmente y por tanto en distribuciones asimétricas.Método de cálculo.- La desviación media se obtiene promediando las desviaciones de los valoresindividuales son relación a la mediana, sin tomar en cuenta su signo, denominado: 27
  6. 6. BIOESTADÍSTICA Dm = Desviación media d = desvios Sin agrupación de datos: la formula que se usara sera: Dm = (x1 – Ma) nLos pasos que se siguen son: a) Calcular la mediana. b) Determinar los desvíos (x – Ma) c) Promediar los desvíos, tomando en cuenta solo los valores absolutos y no los signos.Esta medida no es muy empleada debido a que, por una parte, se ignoran desde el punto de vistamatemático los signos, y por otra parte, para el estudio de la dispersión se utiliza mas el desvio estándarque determina las desviaciones de los valores individuales alrededor de la media.Con agrupación de datos.- La formula que se usa es: Dm = (x1 – Ma) . fi nLos pasos de cálculo son:1.- Calcular la mediana.2.- Calcular los puntos medios y restar de ellos la mediana.3.- La diferencia antes obtenida en cada intervalo multiplicar por su respectiva frecuencia.4.- Sumar sin tomar en cuenta el signo los productos obtenidos.5.- Dividir al anterior total entre el número de observaciones.Ese resultado se interpreta como la dispersión en promedio de las observaciones en torno a la mediana.DESVIACION ESTANDAR.- Es la medida de variación que se utiliza con carácter universal parademostrar la dispersión de los valores individuales alrededor de la media.También es denominada desviación cuadrática media o desvio tipo.Podemos definir el desvio estándar como la raíz cuadrada de la suma de los cuadrados de los desvios conrespecto a la media aritmética, divididos entre el número de observaciones, es decir:Cuando se calcula la desviación estándar de una muestra o un pequeño grupo de individuos es mas exactodividir entre n – 1 en lugar de n.Los desvíos se elevan al cuadrado para evitar dificultades con los signos pues con este procedimientotodos ellos se convierten positivos y esto evita el tener que ignorar los signos, por otra parte al extraer laraíz cuadrada del promedio de los cuadrados de las desviaciones, obtenemos la media de la dispersión enlas medidas originales. 28
  7. 7. BIOESTADÍSTICA Dm = Desviación media d = desvios Sin agrupación de datos: la formula que se usara sera: Dm = (x1 – Ma) nLos pasos que se siguen son: a) Calcular la mediana. b) Determinar los desvíos (x – Ma) c) Promediar los desvíos, tomando en cuenta solo los valores absolutos y no los signos.Esta medida no es muy empleada debido a que, por una parte, se ignoran desde el punto de vistamatemático los signos, y por otra parte, para el estudio de la dispersión se utiliza mas el desvio estándarque determina las desviaciones de los valores individuales alrededor de la media.Con agrupación de datos.- La formula que se usa es: Dm = (x1 – Ma) . fi nLos pasos de cálculo son:1.- Calcular la mediana.2.- Calcular los puntos medios y restar de ellos la mediana.3.- La diferencia antes obtenida en cada intervalo multiplicar por su respectiva frecuencia.4.- Sumar sin tomar en cuenta el signo los productos obtenidos.5.- Dividir al anterior total entre el número de observaciones.Ese resultado se interpreta como la dispersión en promedio de las observaciones en torno a la mediana.DESVIACION ESTANDAR.- Es la medida de variación que se utiliza con carácter universal parademostrar la dispersión de los valores individuales alrededor de la media.También es denominada desviación cuadrática media o desvio tipo.Podemos definir el desvio estándar como la raíz cuadrada de la suma de los cuadrados de los desvios conrespecto a la media aritmética, divididos entre el número de observaciones, es decir:Cuando se calcula la desviación estándar de una muestra o un pequeño grupo de individuos es mas exactodividir entre n – 1 en lugar de n.Los desvíos se elevan al cuadrado para evitar dificultades con los signos pues con este procedimientotodos ellos se convierten positivos y esto evita el tener que ignorar los signos, por otra parte al extraer laraíz cuadrada del promedio de los cuadrados de las desviaciones, obtenemos la media de la dispersión enlas medidas originales. 28
  8. 8. BIOESTADÍSTICA Dm = Desviación media d = desvios Sin agrupación de datos: la formula que se usara sera: Dm = (x1 – Ma) nLos pasos que se siguen son: a) Calcular la mediana. b) Determinar los desvíos (x – Ma) c) Promediar los desvíos, tomando en cuenta solo los valores absolutos y no los signos.Esta medida no es muy empleada debido a que, por una parte, se ignoran desde el punto de vistamatemático los signos, y por otra parte, para el estudio de la dispersión se utiliza mas el desvio estándarque determina las desviaciones de los valores individuales alrededor de la media.Con agrupación de datos.- La formula que se usa es: Dm = (x1 – Ma) . fi nLos pasos de cálculo son:1.- Calcular la mediana.2.- Calcular los puntos medios y restar de ellos la mediana.3.- La diferencia antes obtenida en cada intervalo multiplicar por su respectiva frecuencia.4.- Sumar sin tomar en cuenta el signo los productos obtenidos.5.- Dividir al anterior total entre el número de observaciones.Ese resultado se interpreta como la dispersión en promedio de las observaciones en torno a la mediana.DESVIACION ESTANDAR.- Es la medida de variación que se utiliza con carácter universal parademostrar la dispersión de los valores individuales alrededor de la media.También es denominada desviación cuadrática media o desvio tipo.Podemos definir el desvio estándar como la raíz cuadrada de la suma de los cuadrados de los desvios conrespecto a la media aritmética, divididos entre el número de observaciones, es decir:Cuando se calcula la desviación estándar de una muestra o un pequeño grupo de individuos es mas exactodividir entre n – 1 en lugar de n.Los desvíos se elevan al cuadrado para evitar dificultades con los signos pues con este procedimientotodos ellos se convierten positivos y esto evita el tener que ignorar los signos, por otra parte al extraer laraíz cuadrada del promedio de los cuadrados de las desviaciones, obtenemos la media de la dispersión enlas medidas originales. 28

×