Resumen de unidad v de felix castro garcia

6,321 views
6,041 views

Published on

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
6,321
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
136
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Resumen de unidad v de felix castro garcia

  1. 1. “INSTITUTO TECNOLÒGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN” CARRERA: ING. ADMÒN DE EMPRESAS. MATERIA: ESTADISTICA II TRABAJO: RESUMEN DE LA UNIDAD VTEMA: “ESTADÍSTICA NO PARAMÉTRICA.” MAESTRO: ING.JOSÈ GUADALUPE RODRIGUEZ RAMOS.ELABORADO POR: FELIX CASTRO GARCÌA FECHA DE ENTREGA: MAYO DE 2012
  2. 2. INDICEUNIDAD 4ESTADÍSTICA NO PARAMÉTRICA. 5.1 Escala de medición 5.2 Métodos estadísticos contra no Paramétricos 5.3 Prueba de corridas para aleatoriedad 5.4 Una muestra: prueba de signos 5.5 Una muestra: prueba de Wilcoxon 5.6 Dos muestras: prueba de Mann- Whitney 5.7 Observaciones pareadas: prueba de signos 5.8Observaciones pareadas prueba de Wilcoxon 5.9Varias muestras independientes: prueba de Krauskal-Wallis
  3. 3. INTRODUCCIÒNLa estadística no paramétrica es una rama de la estadística que estudia las pruebasy modelos estadísticos cuya distribución subyacente no se ajusta a los llamadoscriterios paramétricos. Su distribución no puede ser definida a priori (se utilizan paradistinguir entre dos tipos de conocimiento: el conocimiento a priori es aquel que, enalgún sentido importante, es independiente de la experiencia; mientras que elconocimiento a posteriori es aquel que, en algún sentido importante, depende de laexperiencia.), pues son los datos observados los que la determinan. La utilización deestos métodos se hace recomendable cuando no se puede asumir que los datos seajusten a una distribución conocida, cuando el nivel de medida empleado no sea,como mínimo, de intervalo. 5.1 ESCALA DE MEDICIÓNExisten diversas definiciones del término "medición", pero estas dependen de losdiferentes puntos de vista que se puedan tener al abordar el problema de lacuantificación y el proceso mismo de la construcción de una escala o instrumento demedición. En general, se entiende por medición la asignación de números aelementos u objetos para representar o cuantificar una propiedad. El problemabásico está dado por la asignación un numeral que represente la magnitud de lacaracterística que queremos medir y que dicho números pueden analizarse pormanipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los atributosde nuestras percepciones se transforman en entidades conocidas y manejablesllamadas "números". Es evidente que el mundo resultaría caótico si no pudiéramosmedir nada. En este caso cabría preguntarse de que le serviría la físico saber que elhierro tiene una alta temperatura de fusión.
  4. 4. Niveles o Escalas de mediciones Escala Nominal:La escala de medida nominal, puede considerarse la escala de nivel más bajo, yconsiste en la asignación, puramente arbitraria de números o símbolos a cada unade las diferentes categorías en las cuales podemos dividir el carácter queobservamos, sin que puedan establecerse relaciones entre dichas categorías, a noser el de que cada elemento pueda pertenecer a una y solo una de estas categorías.Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a lamisma sean equivalentes respecto del atributo o propiedad en estudio, después de locual se asignan nombres a tales clases, y el hecho de que a veces, en lugar dedenominaciones, se le atribuyan números, puede ser una de las razones por lascuales se le conoce como "medidas nominales".Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESRNúcleo San Carlos de acuerdos a la carrera que cursan. Carrera Número asignada a la categoría Educación 1 Administración 2Se ha de tener presente que los números asignados a cada categoría sirven única yexclusivamente para identificar la categoría y no poseen propiedades cuantitativas. Escala Ordinal:En caso de que puedan detectarse diversos grados de un atributo o propiedad de unobjeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a lapropiedad de "orden" de los números asignándolo a los objetos en estudio de modoque, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que Aposee un mayor grado de atributo que B.La asignación de números a las distintas categorías no puede ser completamentearbitraria, debe hacerse atendiendo al orden existente entre éstas.
  5. 5. Los caracteres que posee una escala de medida ordinal permiten, por el hechomismo de poder ordenar todas sus categorías, el cálculo de las medidas estadísticasde posición, como por ejemplo la mediana.Ejemplo:Al asignar un número a los pacientes de una consulta médica, según el orden dellegada, estamos llevando una escala ordinal, es decir que al primero en llegarordinal, es decir que al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y asísucesivamente, de esta forma, cada número representará una categoría en general,con un solo elemento y se puede establecer relaciones entre ellas, ya que losnúmeros asignados guardan la misma relación que el orden de llegada a la consulta. Escalas de intervalos iguales:La escala de intervalos iguales, está caracterizada por una unidad de medida comúny constante que asigna un número igual al número de unidades equivalentes a la dela magnitud que posea el elemento observado. Es importante destacar que el puntocero en las escalas de intervalos iguales es arbitrario, y no refleja en ningúnmomento ausencia de la magnitud que estamos midiendo. Esta escala, además deposeer las características de la escala ordinal, encontramos que la asignación de losnúmeros a los elemento es tan precisa que podemos determinar la magnitud de losintervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas,podemos decir que la escala de intervalos es la primera escala verdaderamentecuantitativa y a los caracteres que posean esta escala de medida puedencalculársele todas las medidas estadísticas a excepción del coeficiente de variación.Ejemplo:El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.Escala de coeficientes o Razones:El nivel de medida más elevado es el de cocientes o razones, y se diferencia de lasescalas de intervalos iguales únicamente por poseer un punto cero propio como
  6. 6. origen; es decir que el valor cero de esta escala significa ausencia de la magnitudque estamos midiendo. Si se observa una carencia total de propiedad, se dispone deuna unidad de medida para el efecto. A iguales diferencias entre los númerosasignados corresponden iguales diferencias en el grado de atributo presente en elobjeto de estudio. Además, siendo que cero ya no es arbitrario, sino un valorabsoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de lapropiedad presente en B.Ejemplo:En una encuesta realizada en un barrio de esta localidad se observó que hay familiasque no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos queaquellas que tienen 3 hijos. 5.2 MÉTODOS ESTADÍSTICOS CONTRA NO PARAMÉTRICOSEs una rama de la estadística que estudia las pruebas y modelos estadísticos cuyadistribución subyacente no se ajusta a los llamados criterios paramétricos. Sudistribución no puede ser definida a priori, pues son los datos observados los que ladeterminan. La utilización de estos métodos se hace recomendable cuando no sepuede asumir que los datos se ajusten a una distribución conocida, cuando el nivelde medida empleado no sea, como mínimo, de intervalo.Las principales pruebas no paramétricas son las siguientes:Prueba χ² de PearsonPrueba binomialPrueba de Anderson-DarlingPrueba de CochranPrueba de Cohen kappaPrueba de FisherPrueba de FriedmanPrueba de KendallPrueba de Kolmogórov-SmirnovPrueba de Kruskal-WallisPrueba de Kuiper
  7. 7. Prueba de Mann-Whitney o prueba de WilcoxonPrueba de McNemarPrueba de la medianaPrueba de Siegel-TukeyCoeficiente de correlación de SpearmanTablas de contingenciaPrueba de Wald-WolfowitzPrueba de los signos de WilcoxonLa mayoría de estos test estadísticos están programados en los paquetesestadísticos más frecuentes, quedando para el investigador, simplemente, la tarea dedecidir por cuál de todos ellos guiarse o que hacer en caso de que dos test nos denresultados opuestos. Hay que decir que, para poder aplicar cada uno existendiversas hipótesis nulas que deben cumplir nuestros datos para que los resultadosde aplicar el test sean fiables. Esto es, no se puede aplicar todos los test y quedarsecon el que mejor convenga para la investigación sin verificar si se cumplen lashipótesis necesarias. La violación de las hipótesis necesarias para un test invalidacualquier resultado posterior y son una de las causas más frecuentes de que unestudio sea estadísticamente incorrecto. Esto ocurre sobre todo cuando elinvestigador desconoce la naturaleza interna de los test y se limita a aplicarlossistemáticamente. 5.3 PRUEBA DE CORRIDAS PARA ALEATORIEDADUna corrida es una serie de observaciones similares. La prueba de corridas se usa paraprobar la aleatoriedad de una serie de observaciones cuando cada observación puedeser asignada a una de dos categorías.Ejemplo. En relación con una muestra aleatoria de n = 10 individuos, supongamos quecuando se les clasifica por sexo la secuencia de observaciones es: M, M, M, M, F, F, F,F, M, M. Estos datos contienen tres corridas, o series de elementos semejantes.Respecto de datos numéricos, un medio para obtener el esquema requerido de doscategorías es clasificar cada observación según si es superior o inferior a la mediana delgrupo. En general, mucho menos corridas o mucho más corridas que las que serían deesperar al azar resultarían en el rechazo de la hipótesis nula de que la secuencia deobservaciones es una secuencia aleatoria.
  8. 8. El número de corridas de elementos semejantes se determina de acuerdo con los datosmuéstrales, con el uso del símbolo R para designar el número de corridas observadas. Sin1 equivale al número de elementos muestreados de un tipo y n2 al número deelementos muestreados del segundo tipo, la media y el error estándar asociados con ladistribución de muestreo de la estadística de prueba R cuando la secuencia es aleatoriasonSin, n1 > 20 o n2 > 20, la distribución de muestreo de r aproxima la distribución normal.Por lo tanto, en estas circunstancias la estadística R puede convertirse a la estadísticade prueba z. 5.4 UNA MUESTRA: PRUEBA DE SIGNOSLa prueba de los signos puede utilizarse para probar una hipótesis nula referente alvalor de la medida de la población. En consecuencia, es el equivalente noparamétrico a la prueba de una hipótesis referente al valor de la medida de lapoblación. Es necesario que los valores de la muestra aleatoria se encuentren almenos en la escala ordinal, aunque no se requiere de supuestos acerca de la formade la distribución de la población.Las hipótesis nula y alternativa pueden aludir ya sea a una prueba bilateral ounilateral. Si Med denota la mediana de la población y Med0 designa al valorhipotético, las hipótesis nulas y alternativa para una prueba de dos extremos son: H0: Med=Med0 H1: Med≠Med0Se aplica un signo de más a cada valor muestra observada mayor que el valorhipotético de la mediana y un signo de menos a cada valor menor que el valorhipotético de la mediana. Si un valor maestral es exactamente igual a la medianahipotética, no se le aplica ningún signo, con lo que el tamaño de muestra efectivo sereduce. Si la hipótesis nula sobre el valor de la mediana es cierta, el número designos de más debería ser aproximadamente igual al número de signos de menos.O, para decirlo de otra manera, la proporción de signos de mas debe ser dealrededor de 0.50. Por consiguiente, la hipótesis nula que se prueba en una pruebabilaterales H0: π=0.50, donde π es la proporción de la población de los signos demas o de menos. Así, una hipótesis referente al valor de la mediana se prueba enrealidad como una hipótesis sobre π. Si la muestra es grande, se puede hacer usode la distribución normal.
  9. 9. 5.5 UNA MUESTRA: PRUEBA DE WILCOXONLa prueba de Wilcoxon puede usarse para probar una hipótesis nula referente alvalor de la medida de la población. Pero dado que la prueba Wilcoxon considera lamagnitud de la diferencia entre cada valor muestral y el valor hipotético de lamediana, es una prueba más sensible que la prueba de los signos.Sea X una variable aleatoria continua. Podemos plantear cierta hipótesis sobre lamediana de dicha variable en la población, por ejemplo, M=M0. Extraigamos unamuestra de tamaño m y averigüemos las diferencias Di = X - M0. Consideremosúnicamente la n diferencias no nulas (n “m). Atribuyamos un rango u orden (0i) acada diferencia según su magnitud sin tener en cuenta el signo. Sumemos por unlado los 0+i, rangos correspondientes a diferencias positivas y por otro lado los 0-i,rangos correspondientes a diferencias negativas. La suma de los órdenes dediferencias positivas sería igual a la suma de los órdenes de diferencias negativas,caso que la mediana fuera el valor propuesto M0. En las muestras, siendo M0 elvalor de la verdadera mediana, aparecerán por azar ciertas discrepancias, pero si lasuma de los rangos de un ciclo es considerablemente mayor que la suma de losrangos de otro signo, nos hará concebir serias dudas sobre la veracidad de M0. Laprueba de Wilcoxon va a permitir contrastar la hipótesis de que una muestra aleatoriaprocede de una población con mediana M0. Además, bajo el supuesto de simetríaeste contraste se puede referir a la media, E(X). Esta prueba es mucho más sensibley poderosa que la prueba de los signos; como se puede apreciar utiliza másinformación, pues no solo tiene en cuenta si las diferencias son positivas o negativas,sino también su magnitud. El contraste de Wilcoxon puede ser utilizado paracomparar datos por parejas. Supongamos que la distribución de las diferencias essimétrica, y nuestro propósito es contrastar la hipótesis nula de que dicha distribuciónestá centrada en 0. Eliminando aquellos pares para los cuales la diferencia es 0 secalculan los rangos en orden creciente de magnitud de los valores absolutos de lasrestantes diferencias. Se calculan las sumas de los rangos positivos y negativos, y lamenor de estas sumas es el estadístico de Wilcoxon. La hipótesis nula serárechazada si T es menor o igual que el valor correspondiente. Cuando n≥25 y lahipótesis nula es cierta, la estadística t tiene una distribución aproximadamentenormal. La media y el error estándar asociados con esta distribución de muestreoson, respectivamente: µ_T=(N(N+1))/4 σ_T=√ ((N(N+1) (2N+1))/24) En el caso deuna muestra relativamente grande la prueba puede realizarse usando la distribuciónnormal de probabilidad y calculando la estadística de prueba z, de la siguientemanera: Z= (T-µ_R)/σ_T
  10. 10. 5.6 DOS MUESTRAS: PRUEBA DE MANN-WHITNEYLa prueba de Mann-Whitney se emplea en aquellos casos en los que deseamoscontrastar si existen diferencias entre las poblaciones de donde se extraen dosmuestras, que han de ser aleatorias e independientes. La utilidad de esta prueba esla misma que la de la prueba t, pero no parte de supuestos y puede ser aplicada adatos medidos en escala ordinal.El procedimiento es el siguiente:1. Hipótesis:Hipótesis nula: No existen diferencias entre los dos grupos.Hipótesis alternativa: Hay diferencias entre los dos grupos.2. Estadístico de contraste:En este caso, el estadístico a emplear se denomina U de Mann-Whitney, que secalcula siguiendo estos pasos:a) Se procede a ordenar las puntuaciones de las dos muestras como si fueran unasola.b) A cada una de ellas se le asigna un rango.c) Se calcula el estadístico T, a partir de la suma de los rangos de la muestra demenor tamaño.d) Teniendo T, se calcula U: Donde U = n1n2 + n1 (n1 + 1)/2 - TDonde n1 es el número de sujetos de la muestra de menor tamaño, y n 2 el de lamuestra mayor.3. Como en el caso anterior, el valor observado es comparado con valores tabulados.En dicha tabla encontramos la probabilidad asociada a cada valor del estadísticopara una prueba unilateral. Si nuestro contraste es bilateral, sólo tendremos quemultiplicar por dos el valor tabular correspondiente a una cola.
  11. 11. 5.7 OBSERVACIONES PAREADAS: PRUEBA DE SIGNOSTambién se puede utilizar la prueba de signo para probar la hipótesis nula para observaciones pareadas. Aquí se reemplaza cada diferencia,di, con un signo más o menos dependiendo si la diferencia ajustada, d i-d0, es positivao negativa. A lo largo de esta sección suponemos que las poblaciones sonsimétricas. Sin embargo, aun si las poblaciones son asimétricas se puede llevar acabo el mismo procedimiento de prueba, pero las hipótesis se refieren a lasmedianas poblacionales en lugar de las medias.Ejemplo: 1. Una compañía de taxis trata de decidir si el uso de llantas radiales en lugar de llantas regulares con cinturón mejora la economía de combustible. Se equipan 16 automóviles con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de conductores, se equipan los mismos autos con llantas regulares con cinturón y se manejan una vez más por el recorrido de prueba. Se registra el consumo de gasolina, en kilómetros por litro, de la siguiente manera: Llantas con Automóvil Llantas radiales cinturón 1 4.2 4.1 2 4.7 4.9 3 6.6 6.2 4 7.0 6.9 5 6.7 6.8 6 4.5 4.4 7 5.7 5.7 8 6.0 5.8 9 7.4 6.9 10 4.9 4.9 11 6.1 6.0 12 5.2 4.9
  12. 12. 13 5.7 5.3 14 6.9 6.5 15 6.8 7.1 16 4.9 4.8 ¿Se puede concluir en el nivel de significancia de 0.05 que los autos equipados con llantas radiales obtienen mejores economías de combustible que los equipados con llantas regulares con cinturón?Solución:Regla de decisión:Si zR 1.645 no se rechaza Ho.Si zR> 1.645 se rechaza Ho.Se procede ha realizar las diferencias entre de los kilómetros por litro entre llantasradiales y con cinturón: Llantas con d Automóvil Llantas radiales cinturón 1 4.2 4.1 + 2 4.7 4.9 - 3 6.6 6.2 +
  13. 13. 4 7.0 6.9 + 5 6.7 6.8 - 6 4.5 4.4 + 7 5.7 5.7 0 8 6.0 5.8 + 9 7.4 6.9 + 10 4.9 4.9 0 11 6.1 6.0 + 12 5.2 4.9 + 13 5.7 5.3 + 14 6.9 6.5 + 15 6.8 7.1 - 16 4.9 4.8 +Al observar las diferencias se ve que sólo existe una n=14, ya que se descartan losvalores de cero. Se tiene r+ = 11Decisión y conclusión:Como 2.14 es mayor a 1.645 se rechaza H0 y se concluye con un = 0.05 que lasllantas radiales mejoran la economía de combustible.
  14. 14. 5.8 OBSERVACIONES PAREADAS PRUEBA DE WILCOXON PRUEBA DE RANGO CON SIGNO DE WILCOXONSe puede notar que la prueba de signo utiliza sólo los signos más y menos de lasdiferencias entre las observaciones y 0 en el caso de una muestra, o los signosmás y menos de las diferencias entre los pares de observaciones en el caso de lamuestra pareada, pero no toma en consideración la magnitud de estas diferencias.Una prueba que utiliza dirección y magnitud, propuesta en 1945 por Frank Wilcoxon,se llama ahora comúnmente prueba de rango con signo de Wilcoxon.Esta prueba se aplica en el caso de una distribución continua simétrica. Bajo estacondición se puede probar la hipótesis nula 0. Primero se resta de cadavalor muestral y se descarta todas las diferencias iguales a cero. Se asigna un rangode 1 a la diferencia absoluta más pequeña, un rango de 2 a la siguiente máspequeña, y así sucesivamente. Cuando el valor absoluto de dos o más diferencias esel mismo, se asigna a cada uno el promedio de los rangos que se asignarían si lasdiferencias se distinguieran. Por ejemplo, si la quinta y sexta diferencia son igualesen valor absoluto, a cada una se le asignaría un rango de 5.5. Si la hipótesis 0es verdadera, el total de los rangos que corresponden a las diferencias positivasdebe ser casi igual al total de los rangos que corresponden a las diferenciasnegativas. Se representan esos totales como w+ y w-, respectivamente. Se designa elmenor de w+ y w- con w.Al seleccionar muestras repetidas esperaríamos que variaran w+ y w-, y por tanto w.De esta manera se puede considerar a w+ y w-, y w como valores de lascorrespondientes variables aleatorias W +, W-, y W. La hipótesis nula 0 sepuede rechazar a favor de la alternativa 0 sólo si w+ es pequeña y w- esgrande. Del mismo modo, la alternativa 0 se puede aceptar sólo si w+ esgrande y w- es pequeña. Para una alternativa bilateral se puede rechazar H 0 a favorde H1 si w+ o w- y por tanto w son suficientemente pequeñas. No importa cuálhipótesis alternativa puede ser, rechazar la hipótesis nula cuando el valor de laestadística apropiada W +, W -, o W es suficientemente pequeño. Dos Muestras con Observaciones PareadasPara probar la hipótesis nula de que se muestrean dos poblaciones simétricascontinuas con para el caso de una muestra pareada, se clasifican lasdiferencias de las observaciones paradas sin importar el signo y se procede como enel caso de una muestra. Los diversos procedimientos de prueba para los casos deuna sola muestra y de una muestra pareada se resumen en la siguiente tabla:
  15. 15. No es difícil mostrar que siempre que n<5 y el nivel de significancia no exceda 0.05para una prueba de una cola ó 0.10 para una prueba de dos colas, todos los valoresposibles de w+, w-, o w conducirán a la aceptación de la hipótesis nula. Sin embargo,cuando 5 n 30, la tabla A.16 muestra valores críticos aproximados de W + y W -para niveles de significancia iguales a 0.01, 0.025 y 0.05 para una prueba de unacola, y valores críticos de W para niveles de significancia iguales a 0.02, 0.05 y 0.10para una prueba de dos colas. La hipótesis nula se rechaza si el valor calculado w+,w-, o w es menor o igual que el valor de tabla apropiado. Por ejemplo, cuando n=12la tabla A.16 muestra que se requiere un valor de w+ 17 para que la alternativaunilateral sea significativa en el nivel 0.05.
  16. 16. Ejemplos: 1. Los siguientes datos representan el número de horas que un compensador opera antes de requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2 y 1.7. Utilice la prueba de rango con signo para probar la hipótesis en el nivel de significancia de 0.05 que este compensador particular opera con una media de 1.8 horas antes de requerir una recarga. Solución: H0; H1; Se procederá a efectuar las diferencias y a poner rango con signo a los datos. 1. Dato di = dato - 1.8 Rangos 1.5 -0.3 5.5 2.2 0.4 7 0.9 -0.9 10 1.3 -0.5 8 2.0 0.2 3 1.6 -0.2 3 1.8 0 Se anula 1.5 -0.3 5.5 2.0 0.2 3 1.2 -0.6 9 1.7 -0.1 1
  17. 17. Regla de decisión: Para una n = 10, después de descartar la medición que es igual a 1.8, la tabla A.16 muestra que la región crítica es w 8. Cálculos: W+ = 7 + 3 + 3 = 13 w- = 5.5 + 10 + 8 + 3 + 5.5 + 9 + 1 = 42 Por lo que w = 13 (menor entre w+ y w-). Decisión y Conclusión: Como 13 no es menor que 8, no se rechaza H0 y se concluye con un = 0.05 que el tiempo promedio de operación no es significativamente diferente de 1.8 horas.1. Se afirma que un estudiante universitario de último año puede aumentar su calificación en el área del campo de especialidad del examen de registro de graduados en al menos 50 puntos si de antemano se le proporcionan problemas de muestra. Para probar esta afirmación, se dividen 20 estudiantes del último año en 10 pares de modo que cada par tenga casi el mismo promedio de puntos de calidad general en sus primeros años en la universidad. Los problemas y respuestas de muestra se proporcionan al azar a un miembro de cada par una semana antes del examen. Se registran las siguientes calificaciones del examen: Con problemas de Sin problemas de Par muestra muestra 1 531 509 2 621 540 3 663 688 4 579 502 5 451 424
  18. 18. 6 660 683 7 591 568 8 719 748 9 543 530 10 575 524Pruebe la hipótesis nula en el nivel de significancia de 0.05 de que los problemasaumentan las calificaciones en 50 puntos contra la hipótesis Alternativa de que elaumento es menor a 50 puntos.Solución: ajustadas sin importar el signo y se aplica el mismo procedimiento.En este caso d0 = 50, por lo que se procede a calcular las diferencias entre lasmuestras y luego restarles el valor de 50. Se representara con y lacalificación media de todos los estudiantes que resuelven el examen en cuestión cony sin problemas de muestra, respectivamente.H0;H1;Regla de decisión:Para n=10 la tabla muestra que la región crítica es w+ 11.Cálculos:La prueba de rango con signo también se puede utilizar para probar la hipótesis nula d0. En este caso las poblaciones no necesitan ser simétricas. Como con laprueba de signo, se resta d0 de cada diferencia, se clasifican las diferencias Con Sin di problemas problemas Par di – Rangos de de d0 muestra muestra
  19. 19. - 1 531 509 22 5 28 2 621 540 81 31 6 - - 3 663 688 9 25 75 4 579 502 77 27 3.5 - 5 451 424 27 2 23 - - 6 660 683 8 23 73 - 7 591 568 23 3.5 27 - - 8 719 748 10 29 79 - 9 543 530 13 7 37 10 575 524 51 1 1W+ = 6 + 3.5 + 1 = 10.5Decisión y Conclusión:Como 10.5 es menor que 11 se rechaza H0 y se concluye con un = 0.05 que losproblemas de muestra, en promedio, no aumentan las calificaciones de registro degraduados en 50 puntos.
  20. 20. 5.9 VARIAS MUESTRAS INDEPENDIENTES: PRUEBA DE KRAUSKAL-WALLISEsta prueba estadística de análisis de varianza de entrada simple de Kruskal-Wallises una extensión de la prueba de U Mann-Whitney, en razón de que se usan rangospara su aplicación; por otra parte, este procedimiento se emplea cuando el modeloexperimental contiene más de dos muestras independientes.Dicha prueba se define matemáticamente de la forma siguiente: Donde: H = valor estadístico de la prueba de Kruskal-Wallis. N = tamaño total de la muestra. 2 Rc = sumatoria de los rangos elevados al cuadrado. ni = tamaño de la muestra de cada grupo. L = ajuste dado por el ajuste de ligas o empates de los rangos.El ajuste L se calcula de la manera siguiente: Donde: Li = valor de número de empates de un rango. N = tamaño total de la muestra.Se utiliza cuando:Cuando son diferentes tratamientos o condiciones.Muestras pequeñas.Se utiliza escala ordinal.Si las muestras se seleccionaron de las diferentes poblaciones.Contrastar hipótesis (direccional o no direccional).
  21. 21. Pasos: 1. Ordenar las observaciones en rangos de todos los grupos, del más pequeño al mayor. 2. Asignar el rango para cada observación en función de cada grupo de contraste, elabora la sumatoria de rangos, elevar al cuadrado este valor y dividirlo entre el número de elementos que contiene (ni). 3. Detectar las ligas o empates entre los rangos de cada grupo y aplicar la ecuación (L) para obtener el ajuste. 4. Aplicar la ecuación de Kruskal-Wallis y obtener el estadístico H. 5. Calcular los rangos de libertad (gl): gl = K grupos - 1. 6. Comparar el estadístico H, de acuerdo con los grados de libertad, en la tabla de distribución de ji cuadrada en razón de distribuirse de forma similar. 7. Decidir si se acepta o rechaza la hipótesis.Ejemplo:Un investigador estudia el efecto benéfico de cuatro sustancias anticonvulsionantes(fenobarbital, difenilhidantoinato -DFH-, diacepam y clonacepam), para protegercontra la muerte producida por un convulsionante, la tiosemicarbazida, la cual semanifiesta después de crisis clónica y tónica, respectivamente. El investigador eligeal azar a 24 ratones de la misma edad y peso y les inyecta anticonvulsionantepreviamente a la tiosemicarbazida. A partir de este momento, inicia la cuenta entiempo, hasta que mueren los ratones; además mide las observaciones en horas detiempo transcurrido.Elección de la prueba estadística.Las mediciones se realizan en horas, por lo que la variable puede ser continua y, enconsecuencia, una escala de intervalo; sin embargo, algunos ratones no murieron yel tiempo está calificado nominalmente como infinito. Este obstáculo impide
  22. 22. concederle la calificación de escala de intervalo, por lo cual se elige una escala detipo ordinal.Planteamiento de la hipótesis.Hipótesis alterna (Ha).La protección de la muerte por drogas anticonvulsionante contra el fármacoconvulsionante tiosemicarbazida, se muestra diferente entre los cuatro grupos, y haymejor protección por el diacepam.Hipótesis nula (Ho).Las diferencias observadas en los cuatro grupos de fármacos anticonvulsionantes,para evitar la muerte producida por la tiosemicarbazida, se deben al azar.Nivel de significación.Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechazaHo.Zona de rechazo.Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza HaTiempo en horas que tarda el fármaco en causar la muerte en ratones.Aplicación de la prueba estadística.De acuerdo con los pasos, se inicia con el ordenamiento de todas las observacionesa partir del valor más pequeño hasta el mayor y la detección de las ligas o empates.
  23. 23. Arreglo de los datos para asignar rangos y detectar las ligas o empates.Una vez efectuado el ordenamiento en rangos de las observaciones, se hacen lassumatorias de los rangos. Para facilitar esta tarea, elabórese una tabla en la quesustituyan los datos.Sustitución por rangos. Observaciones de la primera tabla.Se calcula el valor de ajuste por ligas con la siguiente fórmula:
  24. 24. Con el ajuste de L, se procede a calcular el valor estadístico de la prueba de Kruskal-Wallis.Calculamos los grados de libertad.gl = K grupos - 1 = 4 - 1 = 3El estadístico H calculado de 15.4, se compara con los valores críticos de jicuadrada. En seguida se busca en esa hilera la cifra de grados de libertad (3) hastael nivel de significancia de 0.05 y se observa el valor 7.82, hasta los críticos 11.34 y16.27, donde se encuentra el calculado. Esto quiere decir que la probabilidad de queexista una diferencia se halla a una probabilidad de error entre 0.01 y 0.001.Decisión.Como el valor estadístico H tiene una probabilidad menor que 0.01 y éste es menorque el nivel de significancia, se acepta Ha y se rechaza Ho.Interpretación.Entre las drogas anticonvulsionantes, existe diferencia significativa en cuanto a laprotección de muerte a los ratones cuando se les inyecta el fármacotiosemicarbazida. El diacepam se manifestó principalmente con los rangos más altosy se muestra distinto de los demás anticonvulsionantes (véase la siguiente figura).Sumatoria de rangos de las observaciones.
  25. 25. BIBLIOGRAFÍA1. Sprent P. Applied nonparametric statistical methods. 2nd Ed., Chapman- Hall, London, 1993:1-3.2. Glantz SA. Primer of Biostatistics, 3th ed., McGraw Hill, New Yor, 19923.- Bloquear todos los resultados de es.wikipedia.org

×