Manual estadístico completo

1,218 views

Published on

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,218
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
40
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Manual estadístico completo

  1. 1. DIVISIÓN DE ELECTRÓNICA Y AUTOMATIZACIÓN MANUAL DE PROBABILIDAD Y ESTADÍSTICA ASIGNATURA: Estadística P R E S E N T A N LÓPEZ GONZALEZ LEONARDO SÁNCHEZ TREJO ROBERTO CARLOS GRUPO 7IMI1ASESOR: M. en C. FRANCISCO JAVIER GARCÍA ZARAGOZA
  2. 2. Manual de probabilidad y estadística ÍndiceUnidad 1 Conceptos básico de probabilidad ....................................................................................... 4Estadística:......................................................................................................................................... 4Probabilidad: ...................................................................................................................................... 4Eventos ................................................................................................................................................ 5 Eventos Mutuamente excluyentes ................................................................................................ 5 Eventos Mutuamente incluyentes ................................................................................................. 6Eventos independientes:.................................................................................................................. 7Eventos dependientes:..................................................................................................................... 7Ejemplos de probabilidad .................................................................................................................... 8Teorema de Bayes ............................................................................................................................. 10Tipos de estadística ........................................................................................................................... 14Mediana: ........................................................................................................................................... 14Percentiles: ...................................................................................................................................... 14Moda ................................................................................................................................................. 14Minitab 15.......................................................................................................................................... 15COMPARACIÓN DE GRUPOS .............................................................................................................. 20Prueba t-student ................................................................................................................................ 20Mann- whitney .................................................................................................................................. 26Uso de Software Sigma-Stat .............................................................................................................. 30Entorno de SigmaStat .................................................................................................................... 30T-pareada ........................................................................................................................................... 30Wilcoxón ............................................................................................................................................ 34ANOVA (Análisis De Varianza) ........................................................................................................... 36ANOVA 1 VIA...................................................................................................................................... 36 2
  3. 3. Manual de probabilidad y estadísticaANOVA 2 VIAS .................................................................................................................................... 40Relación ............................................................................................................................................. 46Regresión Polynomial ........................................................................................................................ 46Regresión Múltiple Linear .................................................................................................................. 50Correlación de Spearman .................................................................................................................. 54Relación Chi-Cuadrada....................................................................................................................... 58 3
  4. 4. Manual de probabilidad y estadística Unidad 1 Conceptos básico de probabilidad Estadística: Es la parte de las matemáticas que se encarga de recolectar, ordenar, analizar presentar datos. Probabilidad: Las Probabilidades pertenecen a la rama de la matemática que estudia ciertos experimentos llamados aleatorios, o sea regidos por el azar, en que se conocen todos los resultados posibles, pero no es posible tener certeza de cuál será en particular el resultado del experimento. Por ejemplo, experimentos aleatorios cotidianos son el lanzamiento de una moneda, el lanzamiento de un dado, extracción de una carta de un mazo de naipes. Todo esto se refiere a la posibilidad de que un evento suceda. Esta a su vez consta de tres puntos clave, que son:  Experimento: es la parte de la metodología.  Resultado: es el número de posibilidades que origina el experimento.  Evento: es el conjunto de resultados con una característica en común. La probabilidad se divide en 2 partes: Objetiva P Subjetiva Probabilidad objetiva: La probabilidad objetiva se divide en 2 partes: Ejemplo: La posibilidad de que un # 𝑃𝑜𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒𝑠 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎𝑠 Clásica 𝑃= dado resulte un número # 𝑃𝑜𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 par; es de 3 opciones de 3Objetiva totales. 2 Ejemplo: La posibilidad de que el Empírica 𝑃= América gane, si ha perdido 7 5 partidos de 7 totales. 4
  5. 5. Manual de probabilidad y estadística Objetiva clásica: Es el número de posibilidades que tengan las mismas características entre el número total de posibilidades. Objetiva Empírica: Los datos se verifican en el historial de fechas no muy lejanas “Datos no pasados”.Probabilidad subjetiva:Este tipo de probabilidad depende de la subjetividad.EventosLos Eventos se dividen en 2:  Eventos Mutuamente excluyentes En este solo se puede llevar a cabo un evento a la vez (es uno o es otro, sí o no, etc.)Ejemplo: Blanco-Negro, Cara-Cruz =Y se representa de la siguiente forma representando mediante un diagrama debenn. “Donde los círculos no se intersectan” A BLos eventos complementarios deben ser sumamente excluyentes y las sumasde sus probabilidades deben ser igual a 1.Problema: Es una muestra de 24 piezas, 5 fueron defectuosas. Calcular la Pde encontrar: a) 1 pieza defectuosa b) Encontrar 1 pieza defectuosa o 1 ok. Para dar solución al inciso 1 se debe dividir en número de piezas defectuosas entre el número total de piezas. 5
  6. 6. Manual de probabilidad y estadística a) = = 21 Para responder el inciso 2 se debe realizar lo siguiente:  Paso 1: restar el número de piezas defectuosas del total 24-5= 19 piezas con la misma característica.  Paso 2: para dar solución al inciso b se divide el número de piezas con la misma característica entre el total de piezas. b) = = 7 Interpretación: La probabilidad de encontrar una pieza defectuosa es menor a seleccionar una que este en buen estado. Comprobación de resultados Se suman las 2 probabilidades para corroborar que los resultados son correctos, en caso en que la suma de ambos resultados sea igual a 1 es correcto de lo contrario está mal: = 2 7 =  Eventos Mutuamente incluyentesEste es cuando pasan 2 eventos a la vez. En este ejemplo de diagrama de benn, se muestra como dos eventos suceden a la vez. Ejemplo: En un análisis de fallas. Se reportaron 70 fallas, 35 de la banda de transmisión y 40 de la polea. Calcular: a) P de que la banda falle. b) P de que la polea falle. c) La P de que al menos uno de los elementos falle. 6
  7. 7. Manual de probabilidad y estadística a) = = b) = = 7 *Para encontrar la P del inciso “c” se utilizó la regla de la adición, donde se sumaron las fallas ocurridas a la banda de transmisión y las ocurridas en la polea es decir (35+40=75) y se le resto el resultado al número de fallas totales (75-70=5) con lo que nos da el valor de 5. c) = = 7 = 7 7= Interpretación: La probabilidad de que la polea falle es mayor debido a que anteriormente la falla se presentó mayor número de veces. Sin en cambio la probabilidad de que al menos uno de los 2 elementos falle es considerablemente baja debido al desconocimiento de cuál será el que fallara primero.Eventos independientes: Estos son aquello que no son afectadospor otros eventos. Ejemplo: Al aventar al aire una moneda.  Primer lanzamiento: cruz  Segundo lanzamiento :cara El resultado del segundo evento no se vio afectado por el resultado del primero. Es decir no porque en el primer lanzamiento haya salido cruz en el segundo deba caer nuevamente cruz.Eventos dependientes: Estos son aquellos donde el resultado seafecta con el resultado de otros eventos. Ejemplo: Sacar pelotas de una canasta y de las pelotas sacadas noregresarlas a la canasta, disminuyendo el número de pelotas totales de lacanasta.Numero de pelotas totales dentro de la canasta 5, 2 blancas y 3 negras.a) La P de sacar una pelota negra.b) La P de sacar otra pelota negra.Interpretación:La P de sacar una pelota negra en el primer intento es de:Paso 1: dividir el número de pelotas negras entre el total de pelotas dentro dela caja. 7
  8. 8. Manual de probabilidad y estadística a) = =La probabilidad de sacar nuevamente una pelota negra en el segundo intentoteniendo en cuenta que el número de pelotas negras ha disminuido despuésdel primer intento es de:Paso 2: dividir el número de pelotas negras entre el total de pelotas dentro dela caja. b) b) = =La Probabilidad de sacar una pelota negra después del segundo evento es de:Paso 3: multiplicar las P de los incisos anteriores para obtener un resultado acorto plazo. c) 2 = 2 = =La posibilidad de salir otra bola negra es del 30%. A esta posibilidad se le llamaposibilidad conjunta. Ejemplos de probabilidadEjemplo 1. Se le pregunto a 400 diseñadores su preferencia referente al gustode los colores primarios las respuestas más significativas se muestran acontinuación: Color Diseñadores preferencia ¿Cuál es el experimento? R= La encuesta 92 Verde ¿Cuál es el posible evento? 91 R= El colorAmarillo 2 46 = = = 2 Rojo = = = 22 = = = Interpretación: Se muestra que el color preferido por los diseñadores es el rojo, la posibilidad de que un diseñador responda a la encuesta con el color “rojo” es mayor a la de los otros colores. ¿Cuál es la probabilidad de no responder amarillo, con respecto a los colores antes mencionados? 8
  9. 9. Manual de probabilidad y estadística = =.90 La probabilidad de no responder amarillos es considerablemente alta. Eje 2. A) En una caja de engranes hay 3 engranes defectuosos de 25. B) En una caja de cadenas hay 2 defectuosas de 12. Calcular P de que un ensamble coincidan engranaje y cadena defectuosa. = = 2 = = = 2 = Interpretación: La probabilidad de seleccionar un engrane y una cadena defectuosa es poco probable debido a que el número de elementos defectuosos es bastante bajo con respecto de los que se encuentran Ok.De la caja de engranes calcular: a) La P de que se salgan 2 engranes defectuosos en forma consecutiva. = 2 = = 2 = 2 = 9
  10. 10. Manual de probabilidad y estadística Teorema de BayesEl teorema de bayes se utiliza para obtener la probabilidad de un grupo dondelas características son distintas entre los miembros teniendo ya como basealgunos datos.Formula general: = ( ) ( )  El valor de H va a ser igual a lo que estás buscando.Ejemplo 1: Se analizaron los lotes producidos en un día en una empresa losdatos que se obtuvieron son los siguientes.Calcular el porcentaje individual de lotes con piezas defectuosas. 2% Mal 30% A1 Ok 1% Mal Lotes 100% 40% A2 Ok 30% 0.5% Mal A3 OkProcedimiento. Encontrar el número la probabilidad de encontrar elementosdañados en el primer lote.  Paso 1: Sustituir los valores en la formula general para encontrar la P de encontrar elementos dañados en el primer lote (A1). 2 = = ( 2 ) ( ) 10
  11. 11. Manual de probabilidad y estadística  Paso 2: Restar el porcentaje de elementos malos al porcentaje total del lote A1. %ok=100-2=98%  Paso 3: Sustituir los valores en la formula general para encontrar la P de encontrar elementos dañados en el primer lote (A2). 2 = = ( 2 ) ( )  Paso 4: Restar el porcentaje de elementos malos al porcentaje total del lote A2. %ok=100-1=99%  Paso 5: Sustituir los valores en la formula general para encontrar la P de encontrar elementos dañados en el primer lote (A3). = = ( 2 ) ( )  Paso 6: Restar el porcentaje de elementos malos al porcentaje total del lote A1. %ok=100-50=50%Interpretación: La probabilidad de que haya mayor número de productosdefectuosos es en el lote A3 debido a que solo la mitad del lote producido seencuentra ok. 11
  12. 12. Manual de probabilidad y estadísticaEjemplo 2: En un avión con pasajeros de distintas nacionalidades (México,Londres, Español), viaja alrededor del mundo.Calcular la P de que alguno este enfermo en base al porcentajes de pasajerosde la misma nacionalidad. 5% Enfermo Méx Sano 25% 7% Enfermo Pasajeros Lon 100% 40% Sano 0.10% Enfermos Esp 35% Sano¿De qué nacionalidad será más probable que estén enfermos algunos de lospasajeros?Paso 1: Sustituir los valores en la formula general para encontrar la P deencontrar de que nacionalidad es más probable se encuentre enfermo con losvalores de los Méx. 2 = = ( 2 ) ( 7 )Paso 2: Restar el porcentaje de pasajeros enfermos al porcentaje total delpasajeros Méx. %Sano=100-5=95% 12
  13. 13. Manual de probabilidad y estadísticaPaso 3: Sustituir los valores en la formula general para encontrar la P deencontrar de que nacionalidad es más probable se encuentre enfermo con losvalores de los de Lon. 7 = = ( 2 ) ( 7 )Paso 4: Restar el porcentaje de pasajeros enfermos al porcentaje total delpasajeros Lon. %ok=100-7=93%Paso 5: Sustituir los valores en la formula general para encontrar la P deencontrar de que nacionalidad es más probable se encuentre enfermo con losvalores de los de Esp. = = ( 2 ) ( 7 )Paso 6: Restar el porcentaje de pasajeros enfermos al porcentaje total delpasajeros Esp. %ok=100-10=90% Interpretación: La probabilidad de que este se encuentre un pasajero con nacionalidad Española es mayor debido al porcentaje de enfermos que van.En la estadística existen datos de tipo:  Numéricos  Discretos: Números enteros  Continuos: Números con decimales  Atributos “Categorizados”Los datos pueden ser:  Lineales: Son objetivos, paramétricos y se fundamentan en media y en la desviación estándar, son aquellos donde el resultado no depende del objeto al que se esté analizando. Ejemplo. Las dimensiones.  No lineales: Son subjetivos, son aquellos que dependen de la persona que este respondiendo, son aquellos en donde la pregunta es la misma pero el resultado es distinto. Ejemplo. Los niveles de agrado. 13
  14. 14. Manual de probabilidad y estadísticaExisten datos:  Dependientes: Son aquellos que tienen dueño y no se pueden mezclar, y se hace de forma individual.  Independientes: Son aquellos que no tienen dueño y se pueden mezclar, y es de forma grupal. Tipos de estadística  Descriptiva: Es aquella que demuestra cómo es una muestra o una población.  Población: Total de elementos que poseen una característica en común. Pueden ser finitas o infinitas.  Muestra: Fracción tomada de la población mediante una metodología establecida. Se da por el método deductivo=deducir= probabilidad. La Esta. Descriptiva utiliza elementos de tendencia central.  La media  La moda  La mediana  La desviación estándar  Inferencial: Esta es aquella que a partir de una muestra se describe cómo será la población. Se da por el método inductivo=inducción=inducir=inferir=Niveles de agrado.Mediana: Es el dato que parte a la mitad todos los datos ordenados de mayora menor o viceversa.Percentiles: Son las fracciones en las que se dividen los datos.Moda: Es el dato que más se repite. 14
  15. 15. Manual de probabilidad y estadística Población Deducir Inducir MuestraDónde:Método de deducción: se obtiene haciendo uso de la probabilidadMétodo de inducir: se hace por niveles de confianza. Minitab 15Se trata de un software para realizar análisis estadísticos de datos, Minitab esuna herramienta que permite enseñar estadística e implementar el famosísimo6 Sigma y otros proyectos de mejoramiento de la calidad. Minitab presentacaracterísticas de soporte importación y exportación de archivos, manipulaciónde datos y presentación de datos como en una hoja de cálculo. 15
  16. 16. Manual de probabilidad y estadística Entorno de minitab 15Ejemplos para la utilización del Minitab. a) Calcular la P de encontrar un alumno que haya tenido 5 o más novias. Paso 1: Abrir programa Minitab 15. Recordemos que nuestro programa es portable por lo que debemos saber dónde se ubica nuestro icono ejecutable; pero se recomienda hacer un acceso directo sobre el escritorio para evitar confusiones.Paso 2: Introducir datos. Este paso se lleva a cabo insertando los valores deseado dentro de las celdas; pero sin olvidar que estas necesitan etiquetas para evitar confusiones al momento de estar elaborando el estudio. 16
  17. 17. Manual de probabilidad y estadística Zona de colocación de las etiquetasIntroducimos los datos y las etiquetas en las celdas adecuadas: Llenado de celdas de etiquetado Llenado de celdas con los datos Paso 3: En la Barra de herramientas seleccionar la pestaña con el nombre “Calc” se desplegara el menú y seleccionar la penúltima opción con el nombre “Distribución de probabilidad”. Proceso de selección de las opciones 17
  18. 18. Manual de probabilidad y estadística Paso 4: en el menú que se desplego de “Distribución de probabilidad” seleccionamos la opción de Normal.... Paso 5: Aparecerá una ventana para seleccionar los datos.La opción de Densidad de probabilidad se utiliza para cuando buscas elnúmero que pides.La opción de Probabilidad acumulada calcula el valor impuesto o el mínimoque necesitemos.La opción de probabilidad acumulada inversa en esta tú das la probabilidad yel programa el número que corresponda. 18
  19. 19. Manual de probabilidad y estadísticaPaso 7: sacar la media de los datos Ya teniendo los valores solicitados, solo es cuestión de tomar la sumatoria de los datos y eso será la probabilidad total. 19
  20. 20. Manual de probabilidad y estadísticaComparación de gruposPrueba t-studentSe utiliza para comparar los datos de 2 o más grupos.Ejemplo de problema de t-student donde se busca elegir entre dos proveedoresde hilos tomado en cuanta los niveles de resistencias que estos tiene a suruptura. A B 2.5 2.5 2.7 2.9 2.7 2.4 2.9 2.8 2.6 2.3 2.9 2.7 2.3 2.0 2.8 2.6 2.6 2.1 2.9 2.7 2.4 2.3 2.6 2.6 2.6 2.6Realización de comparaciones de grupos con la ayuda de Minitab 15.Paso 1: Análisis de datos.Para este tipo de eventos cuando los datos son numéricos, y de clasificaciónlineal, son independientes, y como son 2 grupos utilizaremos la opción de t-student.Paso 2: Introducir datos al programa. 20
  21. 21. Manual de probabilidad y estadística Llenado de la casillas con los datos obtenidos del muestreo.*Paso 3: En la barra de herramientas seleccionamos el menú estadística.Donde se desplegara un menú y seleccionamos el primero llamado estadísticabásica. También se expresa el proceso de selección del estudio de los pasos 3y 4 mediante un diagrama. 21
  22. 22. Manual de probabilidad y estadística*Paso 4: posteriormente seleccionamos la opción t de 2 muestras…Paso 5: al dar click sobre el estudio saldrá un cuadro para introducir datos elcual se muestra a continuación, y nos aseguramos de seleccionar muestra endiferentes columnas.Debemos recordar elseleccionar Muestra dediferentes columnas porqueal aparecer la ventana,aparece en otra opción. 22
  23. 23. Manual de probabilidad y estadísticaPasó 6: seleccionar los datos a utilizar dando doble clic.NOTA: La opción de Asumir varianzas iguales siempre se escoge.Paso 7: para facilitar el entendimiento de este tipo de estudio, también hay laopción de graficar; y para eso temémonos que dar clic en la opción de gráficas.Paso 8: saldrá un recuadro, seleccionaremos la opción de diagrama de caja dedatos y damos click en Aceptar.Paso 9: nos regresara al cuadro anterior le damos clic en aceptar.Paso 10: aparecerá una ventana con los resultados; donde los valores que nosinteresan son los marcados con el recuadro rojo. 23
  24. 24. Manual de probabilidad y estadísticaDonde:  T: la estadística.  GL: grados de libertad.  P: la probabilidad.Paso 12: ahora con los datos obtenidos hay que comparar la probabilidad paradeterminar si hay alguna diferencia, y contestar las preguntas de si hay algunadiferencia entre los grupos:P= 0.000T=-4.97GL=24 24
  25. 25. Manual de probabilidad y estadística  Si P>0.05 entonces son iguales.  Si P<0.05 entonces son diferentes.¿Hay alguna diferencia? R= SiEsta pregunta la contestamos con los siguientes datos:Justificando por medio del valor más alto, demostrando cual es el de mayorcalidad. R= el proveedor de hilo B vende hilo de mejor calidad, ya que es quetiene una media a la resistencia mayor. También comprobado por la gráfica donde se denota claramente las diferencias de las medias de los dos proveedores y demostrando el resultado expuesto. 25
  26. 26. Manual de probabilidad y estadísticaMann- whitneySe realizó una encuesta en un grupo de 28 donde las dividieron en 2 enizquierda y derecha para ver cuáles eran los que resistían más el alcohol. Izquierdo Derecho .45 .27 .61 .49 .47 .35 .52 .55 .46 .34 .49 .61 .32 .36 .48 .67 .40 .32 .53 .60 .38 .40 60 .58 .36 .37 .63 .59La prueba de Mann-Whitney se utiliza cuando no se sabe a quién se le realizala evaluación, es decir cuando los datos son independientes.Pasos para la solución del ejercicio en Minitab 15.Paso 1: Análisis de datos.En este caso los datos son numéricos, son No lineales por ser porcentajes, sonindependientes al no especificar el dueño de los datos y son 2 grupos por lotanto utilizaremos la opción de “Mann-Whitney”.Paso 2: Introducir datos al programa. 26
  27. 27. Manual de probabilidad y estadística*Paso 3: En la barra de herramientas seleccionamos el menú estadística, Noparamétricos, y Mann-whitney; representado por el siguiente diagrama. 27
  28. 28. Manual de probabilidad y estadísticaPaso 5: al seleccionar Mann-whitney, donde habrá que introducir los datos ymediante la selección de las columnas contenedoras; y por ultimo damos enAceptar. Seleccionamos las columnas de datos y presionamos sobre el botón de aceptar.Paso 8: nos es arrojada la siguiente tabla de datos. 28
  29. 29. Manual de probabilidad y estadísticaPaso 9: donde los datos a utilizar son los siguientes:Dónde:  ETA2: la probabilidad.Paso 10: lo consiguiente es comparar la probabilidad para determinar si hayalguna diferencia, y contestar las preguntas:ETA2 o P= 0.000 Si P<0.05 entonces son diferentes. Si P>0.05 entonces son iguales.¿Hay alguna diferencia entre los 2 grupos? R= Si¿De qué lado son las personas que metabolizan más rápido el alcohol?R= DerechoEsta pregunta la contestamos con los siguientes datos:El valor más alto es el de mayor asimilación del alcohol. Conclusión: Si existe una diferencia la asimilación del alcohol y los dellado derecho son aquellos a quienes digieren más rápido el alcohol. 29
  30. 30. Manual de probabilidad y estadísticaUso de Software Sigma-StatSoftware de uso estadístico con el cual se logra hacer un sinnúmero de método, teniendo dentro de su agenda también métodos que se ven con Minitab. Entorno de SigmaStatT-pareadaEjemplo: En un estudio muestra drogas para la presión arterial, que podrían evitarse los síntomas de pánico escénico. Para testear esta hipótesis profesionales y estudiantes dieron 2 recitales como solistas ante una audiencia de críticos y miembros de una universidad. 90 minutos antes de cada recital se les suministro propanolol o un placebo. El pulso cardiaco se le midió mediante un monitoreo electrocardiográfico remoto durante la presentación. Si el pulso normal de reposo es de 70 p/m. Los datos correspondientes a 8 ejecuciones son los siguientes. 30
  31. 31. Manual de probabilidad y estadística ejecutante Droga Placebo 1 85 126 2 107 140 3 69 95 4 122 148 5 106 142 6 121 172 7 137 133 8 87 143Paso 1: Análisis de datos. En este caso los datos son numéricos, son dependientes, al especificar el dueño de los datos y son 2 grupos por lo tanto utilizaremos la opción de “t-pareada”. Paso 2: se introducen los datos en el programa, siguiendo la misma mecánica que con minitab. No se debe olvidar colocar las etiquetas, ya que estas sirven como referencia para el momento de selección de las columnas. 31
  32. 32. Manual de probabilidad y estadísticaPaso 3: colocar el puntero sobre la opción Statistics, se desplegara una barra donde seleccionaremos before and after y por ultimo paired t-test…para hacer entender los anterior se muestra el siguiente diagrama. Forma de seleccionar el método.Paso 4: al haber presionado sobre el método, aparecerá una ventana donde que habrá que verificar que se encuentre la opción Raw; y posteriormente dar sobre Next. 32
  33. 33. Manual de probabilidad y estadísticaPaso 5: en la siguiente ventana es el proceso de selección de las columnas de datos, siguiendo la misma secuencia; y damos sobre el botón Finish.Paso 6: esto nos arrojara la tala de resultados siguiente.Y con base en los valores de la media se puede determinar que en verdad la droga sirve para calmar o disminuir el ritmo cardiaco. 33
  34. 34. Manual de probabilidad y estadística WilcoxónPaso 1: Análisis de datos. En este caso los datos son numéricos, no lineales, dependientes al especificar el dueño de los datos y son 2 grupos por lo tanto utilizaremos la opción de “wicolxón”.Paso 2: se introducen los datos en el software.Paso 3: se detalla la manera de entrar al método mediante un diagrama.Paso 4: al entra a la ventana del método, nos aseguramos de que en la barrade despliegue este seleccionada la opción raw, y damos click sobre el botón deNext. 34
  35. 35. Manual de probabilidad y estadística En este método debemos de seleccionar la opción raw, ya que si seleccionamos otra, posiblemente no acepte nuestro proceso el programa.Paso 5: ahora solo falta seleccionar las columnas y presionar sobre el botón finish; y de forma inmediata aparecerá una ventana de resultados del estudio.Paso 6: analizar los datos obtenidos, tomando como punto clave los valores de la media de las muestras. 35
  36. 36. Manual de probabilidad y estadísticaANOVA (Análisis De Varianza)ANOVA 1 VIA Este método se utiliza para comparar 2 o más grupos, donde se ven involucradas las condiciones para usarlo son las siguientes: A. Que sean datos numéricos B. 2 o más grupos C. Datos lineales D. Datos independientes E. Un solo factorEjemplo: Una planta de dicada a la venta de plásticos se manejas cuatro tipo de plásticos. Al momento de ofrecer sus productos la planta le muestra una tabla donde se muestran la resistencia de los plásticos, y así determinar cuál es el que resiste más; la tabla se muestra a continuación. 36
  37. 37. Manual de probabilidad y estadística Plástico A Plástico B Plástico C Plástico D 5.7 4.9 6.0 5.0 6.4 5.7 6.7 4.5 5.0 6.0 6.9 4.3 6.0 4.5 6.9 4.2 6.7 4.3 6.8 4.3 6.0 5.0 6.7 4.7 6.1De acuerdo a los datos, determinar que plástico que sea mejor.Paso 1: Para resolverlo lo primero que se debe hacer es meter los datos en Sigmastat en 4 diferentes columnas, debe quedar como en la siguiente imagen: En éste método no importa si los datos por muestreo no son los mismos respecto a la cantidad; por lo que no perjudica el estudio.Paso 2: Ya que los datos estén en 4 columnas ir al menú Statistics, Compare Many Groups, One Way ANOVA…, tal como se muestra en el diagrama. Damos click en la opción y nos aparecerá una ventana como se muestra. 37
  38. 38. Manual de probabilidad y estadísticaPaso 3: Nos aseguramos de que la pestaña desplegable este en la selección Raw, y continuamos presionando sobre Next.Paso 4: Nos pedirá que seleccionemos las columnas como nos muestra en la ventana del lado izquierdo, y damos click en Finish. 38
  39. 39. Manual de probabilidad y estadísticaPaso 5: Si nos aparece un mensaje que diga que ha habido una falla si queremos correr un ANOVA On Ranks, le damos en la opción No, a menos que se trate de datos No lineales.Paso 6: Cuando demos click en No, nos aparecerá una ventana como la siguiente.Paso 7: Seleccionamos Tukey y damos click en Finish, nos aparecerá una nueva ventana con muchos datos, lo primero es identificar la tabla de ANOVA, que es la siguiente; también haciendo ayuda de la última tabla de comparación donde dice si hay diferencia o no la hay.Paso 8: Dependiendo del valor de P se determina si hay diferencias, si P es menor a 0.05 hay diferencias, si P en mayor a 0.05 no hay diferencias, en este caso si hay diferencias entre los grupos. 39
  40. 40. Manual de probabilidad y estadística Paso 9: Una vez determinado que si hay diferencias se analizan las medias de cada grupo, y se determina que hay diferencias, la media más alta se interpreta como la media del mejor plástico. Y en caso de no haber similitud, no afecta cual se escoja de los cuatro plásticos. Las medias están en una tabla como la siguiente. Conclusión: Como se ve en la tabla el valor de la media (mean) más alto es del plástico C, por lo tanto este es el mejor.ANOVA 2 VIAS Este método se utiliza para comparar 2 o más grupos, las condiciones para usar este método son las siguientes: A. Datos numéricos B. Datos lineales C. Datos dependientes D. 2 FactoresEjemplo: Una empresa automotriz produce 3 tipos de automóvil distintos, sedan, vagoneta y compacto, están haciendo un análisis de cual automóvil tiene mayor promedio de reacción con una ponderación del 1 al 10, según 3 pruebas que se están realizando, con terreno con nieve (p 1), terreno rocoso (p 2), asfalto SEDAN8.9mojado (p 3). Los datos obtenidos fueron los siguientes4.1 40
  41. 41. Manual de probabilidad y estadística Tipo de prueba Sedan Vagoneta Compacto P1 6.5 8.6 7.9 8.7 4.0 9.9 7.6 5.7 8.3 8.4 8.9 8.5 9.7 5.8 9.8 7.8 9.8 9.3 P2 8.9 4.9 7.2 9.2 9.5 6.0 4.1 5.8 8.7 6.1 9.5 3.3 6.2 6.3 8.4 7.0 7.6 7.2 P3 8.3 9.7 6.5 5.7 6.5 6.0 7.5 8.9 9.4 8.8 5.7 6.6 9.6 7.0 9.3 8.9 5.6 4.3 a) Determinar con qué tipo de prueba en un auto se garantiza un mayor nivel de satisfacción para el cliente. b) Determinar que el auto que tiene mayor promedio. c) Determinar en qué prueba y que auto se garantiza la máxima confiabilidad al momento de conducirlo.Resultadosa)Paso 1: Para resolver el inciso A, primero hay que meter los 54 datos en Sigmastat en 3 columnas, debe quedar de la siguiente manera 41
  42. 42. Manual de probabilidad y estadística Se debe de cuidar mucho el orden de los datos, ya que si se comete el error de capturarlos de forma incorrecta, los resultados pueden ser erróneos.Nota: Estos no son todos los datos, solo un ejemplo de cómo deben meterse.Paso 2: Una vez que se tienen todos los datos en 3 columnas como en la imagen anterior, lo siguiente es ir al menú Statistics, Compare Many Groups, Two Ways ANOVA…, como en el siguiente diagrama. 42
  43. 43. Manual de probabilidad y estadísticaPaso 3: nos aparece una ventana primero nos pedirá el Factor A (en este caso la prueba), después el factor B (en este caso el tipo de vehículo), y por último los resultados del estudio (el promedio), metemos los datos en este orden y damos click en finish. Enseguida nos va a aparecer una ventana donde en la barra desplegable hay que asegurarnos de seleccionar la opción tukey.Paso 5: al dar click en Finish, el software nos arrojara los resultados de la prueba.Paso 6: Nos aparece una hoja con muchos datos, lo primero es identificar la tabla de ANOVA, es la siguiente. 43
  44. 44. Manual de probabilidad y estadística Paso 7: Analizamos el valor de P, el primer inciso nos pregunta qué tipo de pruebas tiene mayor impacto, analizamos el valor de P de “pruebas” y vemos que es mayor a 0.05, por lo tanto no hay diferencia entre un pruebas y otro, es decir las pruebas no afecta la el promedio.b) Paso 1: Para resolver el inciso B ubicamos la Tabla de ANOVA, es la siguiente. Paso 2: Analizamos el valor de P, el inciso B nos pregunta qué tipo de vehículo tiene mayor duración, analizamos el valor de P del “tipo de vehículo” y vemos que es menor a 0.05, por lo tanto hay diferencias en las promedios según el tipo de vehículo, para determinar cual tiene mayor 44
  45. 45. Manual de probabilidad y estadística duración debemos ubicar la tabla donde están las medias del tipo de vehículo, es la siguiente. Paso 3: Analizamos las medias (mean) y ubicamos la mayor corresponde al automóvil vagoneta, esto quiere decir que los autos vagoneta tienen una mayor satisfacción durante las pruebas.c) Paso 1: Para resolver el inciso C primero ubicamos la tabla de ANOVA, es la siguiente. Paso 2: Analizamos el valor de P, el inciso C nos pregunta qué tipo de prueba y que auto nos garantizan la máxima confiabilidad, así que analizamos el valor de P de “uso X tipo de automóvil” y vemos que es menor a 0.05, es decir, el dependiendo del uso y tipo de monitor es la duración del mismo, para determinar qué tipo de uso y monitor nos garantizan la mayor duración debemos ubicar la tabla donde están las medias de “uso X monitor”, la tabla es la siguiente. 45
  46. 46. Manual de probabilidad y estadística Paso 3: interpretamos las medias (mean) y localizamos la mayor, la cual corresponde al uso 3 X Plasma, esto nos dice que un monitor de plasma que se utilice para uso doméstico nos va a garantizar la mayor duración del monitor.RelaciónRegresión Polynomial Este método se utiliza para determinar si hay relación entre 2 variables, siempre y cuando se puedan identificar X y Y, estas variables se identifican como X y Y, la X define la variable que nosotros podemos controlar y la Y define la variable que no podemos controlar, por ejemplo el vapor de agua que se genera cuando se pone cierta temperatura, en este caso la temperatura seria la variable X y el vapor seria la variable Y. Este método se utiliza para poder predecir eventos basados en la ecuación que define el problema. Cuando se hace este estudio en Sigmastat los valores para determinar si hay relación se buscan en Rsqr, si el valor esta entre -1 y -0.7 hay relación o si el valor esta entre 0.7 y 1 también hay relación. Entre 0.7 y 1 ó -0.7 y -1 son iguales; mientras que entre -0.7 y 0.7 son diferentes. El software nos dará la relación en 3 órdenes distintos cada se representa mediante una representa a una gráfica: 46
  47. 47. Manual de probabilidad y estadística Orden 1 Orden 2 Orden 3 Solo se toma la del valor Rsqr que este entre los mencionados anteriormente.Ejemplo: Una empresa dedicada al envasado de leche se dio cuenta de que si envasan la leche a diferente temperatura se genera una nata que al enfriarse se deshace, esto provoca que los envases no estén llenos al 98%, que es lo que se requiere, y los clientes se quejan. Se hizo un estudio y los datos que se obtuvieron fueron los siguientes: Temperatura ºC % de llenado -2 96 -1 94 0 92 1 88 2 90 4 92 a) ¿Qué % de llenado habrá a 7ºC? b) ¿Qué temperatura nos dará el mayor % de llenado?Resultadosa) Paso1: Para resolverlo primero meteremos los datos en Sigmastat los datos en 2 columnas de la siguiente manera 47
  48. 48. Manual de probabilidad y estadísticaPaso 2: Nos vamos a Statistics, Regression y Polynomial tal como se ve en la imagen.Paso 3: Nos aparecerá una ventana que nos solicita X y Y, identificamos Y porque es la que no podemos controlar o variar, en este caso es el % de llenado y después X que es la que podemos modificar, en este caso la temperatura, quedara como en la siguiente imagen y después presionamos sobre la tecla Finish para continuar con el proceso.Paso 4: enseguida nos aparecerán una serie de datos, debemos buscar el que dice Regression Results: Incremental como se muestra en la imagen. 48
  49. 49. Manual de probabilidad y estadísticaEl valor Rsqr que está dentro de los límites es el de Order 2, esto significa que la gráfica que representa a la ecuación de este problema es una parábola.Paso 5: Ya que identificamos que es de orden 2 buscamos en la misma hoja de los datos la ecuación, esta se encuentra en la parte superior como en la imagen.Buscamos la ecuación de Orden 2 y es la que identifica el problema.Paso 6: El inciso A nos pregunta el porcentaje de llenado a 7ºC, para esto solo sustituimos los datos en la ecuación de orden 2 de la siguiente manera.% de llenado= 90.821-(1.702 * temperatura) + (0.619 * temperatura ^2)% de llenado= 90.821-(1.702 * 7ºC) + (0.619 * 7ºC ^2)% de llenado= 90.821 – 11.914 + 30.331=109.22Este será el porcentaje de llenado y quiere decir que a 7 ºC se garantiza llenar al 100%.Paso 7: El inciso B nos pregunta que temperatura nos dará el mayor porcentaje de llenado. Para esto calculamos la pendiente de la parábola, esto se hace derivando la ecuación:90.821 – 1.702T + 0.619T20 – 1.702 + 2(0.619T)-1.702 + 1.238T=0 49
  50. 50. Manual de probabilidad y estadística 1.238T= 1.702T= 1.702 1.238 T= 1.3 ºC Regresión Múltiple Linear Este método se utiliza para establecer si hay relación entre 2 o más variables, en este método se ven involucradas dos variables, una es la variable Y (variable dependiente) y varias variables X (variables independientes) y establecer la relación entre ellas. Para determinar si existe relación entre los elementos es necesario el razonamiento de la P; ya que si es menor a 0.05 hay relación, y si fuese mayor a 0.05 entonces no habría relación. Otro punto que se analiza son los valores VIF, esto es para descartar las variables X que no hay relación con la variable Y, esto se hace analizando el valor VIf, que más se dispare comparado con los otros, es decir, si hay valores únicamente de 1 y un valor de 10, este se elimina y después de eliminar la variable se hace nuevamente el estudio, si todos los VIF están dentro del mismo rango todas las variables son necesarias.Ejemplo En una escuela se hizo un estudio acerca del total de dinero que gastan los alumnos a la semana, se quiere saber si hay relación entre las calificaciones, los cigarros que fuman al día, el número de novias, el número de personas con las que viven, la distancia a la que viven de la escuela, el número de camiones que toman para llegar a la escuela y cuantos miembros de la familia fuman con respecto al dinero que gastan, los datos obtenidos fueron los siguientes: a) ¿Hay relación? b) ¿Todas las variables son necesarias? 50
  51. 51. Manual de probabilidad y estadística Resultadosa)Paso 1: Primero se tienen que introducir los datos en Sigmastat en lasdiferentes columnas, tal como se muestra a continuación. Cigarro Distan $ Prome novias Pers. fumad camino s cia dio Viv ore es e s 3 5 200 8.5 1 4 1 1 4 8 250 8 1 5 2 2 3 6 200 9.1 1 4 0 1 6 4 300 8.9 2 3 0 3 10 4 500 7.8 2 4 3 4 5 12 350 8.4 2 2 1 2 3 3 150 7.1 1 1 1 1 9 15 450 7 4 5 2 3 10 20 500 6.9 5 4 1 4 Paso 2: entramos al menú Statistics, Regression, Multiple Linear y nos aparecerá una ventana, donde nos pide la variable Y (variable dependiente) y las variables X (independientes), donde en este caso Y es el dinero gastado a la semana y todas las demás son X; y presionamos sobre el botón Finish. 51
  52. 52. Manual de probabilidad y estadística Debemos de recordar que solo hay una variable dependiente y el resto son independientes; por lo que hay que saber distinguir entre los distintos factores.Paso 3: nos aparecerán una serie de datos, lo primero que debemos ubicar esla tabla de ANOVA y en esta la P si la P es menor a 0.05 entonces hayrelación, si P es mayor a 0.05 no hay relación, la tabla de ANOVA para esteproblema es la siguiente.Tabla de resultados del problema, donde se nota el valor de p, el cual es menor a 0.05 Resultado: Como P es menor a 0.05 entonces si hay relación entre las variables.b) 52
  53. 53. Manual de probabilidad y estadísticaPaso 1: Para responder el inciso B, en la hoja de datos del estudio buscamosla tabla donde están los VIF, la cual se muestra a continuación. Paso 2: Una vez ubicada la tabla buscamos el valor VIF más alto de todos y este lo eliminamos, esto quiere decir que no es necesario o que no tiene relación y por lo tanto no tiene caso tenerlos. En este caso el VIF más alto es el “número de novias”, volvemos a hacer el estudio pero omitimos la columna de número de novias. Se debe considerar variable Y el dinero y todas la demás como X, en la imagen la columna que está marcada en azul no debe considerarse. Paso 3: Una vez repetido el estudio volvemos a verificar el valor de P para comprobar si aún hay relación, y también los valores VIF, estos tendrán cambios, volvemos a seleccionar el más alto y lo volvemos a eliminar, donde se verán los nuevos valores VIF. Nuevos valores VIF 53
  54. 54. Manual de probabilidad y estadística El valor VIF más alto ahora es el de “cigarros al día”, lo eliminamos del estudio como se menciona anteriormente al igual que el “número de novias” y se vuelve a realizar el estudio. Paso 4: Volvemos a checar P para ver si hay relación y los nuevos VIF, estos son los nuevos valores VIF. Paso 5: El valor VIF mas alto ahora es “promedio” lo eliminamos y hacemos nuevamente el estudio. Paso 6: Consultamos nuevamente el Valor de P para ver si hay relación y los valores VIF, los nuevos valores VIF son estos. Paso 9: Ahora los valores VIF están dentro del rango del valor 1, esto significa que las variables restantes son las únicas necesarias para predecir el dinero gastado a la semana. Correlación de Spearman Este método se utiliza únicamente para saber si existe relación entre las variables, este método no predice comportamientos.Ejemplo: Un psicólogo tiene la teoría de que dependiendo del mes en el que una persona nazca determina su nivel de agresividad y esas dos variables determinan el número de hijos que esta persona tiene, se hizo una encuesta a varias personas y los datos obtenidos fueron los siguientes. *Nivel de agresividad: escala del 1 al 10 54
  55. 55. Manual de probabilidad y estadísticaMes en que Nivel de Hijos que nació agresivi tiene (numero dad ) 2 9 2 4 5 3 1 3 1 3 7 0 5 6 2 8 8 4 3 4 2 6 4 1 12 9 3 7 6 0 9 8 3 11 3 0 10 6 0 2 4 2 6 1 3 8 5 1 5 7 4 5 8 2 10 9 3 12 5 2 4 2 2 1 4 2 3 3 3 55
  56. 56. Manual de probabilidad y estadística 9 4 1 12 8 3 7 6 1 11 7 2 9 1 1 6 5 1 3 2 1 4 3 2 1 10 3Determine que tan cierto es lo que este psicólogo dice.ResultadosPaso 1: Lo primero es meter los datos en 3 columnas en Sigmastat de la siguiente manera. Llenado de celdas con los datos, teniendo cuidado de no equivocarse con los números, ya que el manejo de tantos puede resultar un poco confuso. 56
  57. 57. Manual de probabilidad y estadística Paso 2: Ir al menú Statistics, Correlation y Spearman Rank Order, como en la imagen, y damos click.Paso 3: nos aparecerá una ventana donde nos solicita las variables,seleccionamos las columnas, y damos click en Finish; debe quedar de lasiguiente manera. Paso 4: nos aparece una hoja con datos con una tabla, para este ejemplo la tabla es la siguiente. 57
  58. 58. Manual de probabilidad y estadísticaEn la imagen vemos que cada grupo de datos tiene 3 valores  El primero: es el coeficiente de correlación.  El segundo: es el valor de P.  El tercero: es el número de muestras.Los valores que nos interesan son los valores de P, es decir, el segundo valor.Paso 5: Analizamos los valores de, si P es menor a 0.05 entonces hay relación, si P es mayor a 0.05 entonces no hay relación.Paso 6: Primero analizamos la P del “mes de nacimiento VS agresividad” y vemos que la P es mayor a 0.05, esto quiere decir que no hay relación entre el mes de nacimiento con la agresividad.Paso 7: Después analizamos el valor de P del “mes de nacimiento VS número de hijos”, y vemos que la P es mayor a 0.05, esto nos dice que no hay relación entre el mes de nacimiento y el número de hijos.Paso 8: Ahora analizamos el valor de P de “agresividad VS número de hijos” y vemos que la P es menor a 0.05 por lo tanto si hay relación entre la agresividad de las personas y el número de hijos que tienen.Conclusiones:Relación Chi-CuadradaEn un estudio se dice que dependiendo la edad de las persona depende su gusto por un estilo de música.música edad 14-17 18-25 25-35Pop-electrónica 25 18 10Rock-alternativa 17 30 11Grupera- 15 13 27 románticasProceso de solución mediante el programa SigmaStat. 58
  59. 59. Manual de probabilidad y estadísticaPaso 1: El primer paso es de colocar los valores dentro de las etiquetassuperiores, que en este caso son los rangos de edades. Colocación de datos dentro de las celdas; nótese que se respeta el orden de la tabla original.Para proceder a realizar el estudio se debe de seguir el siguiente diagrama, que representa a continuación: 59
  60. 60. Manual de probabilidad y estadísticaPaso 2: Ya estando dentro del programa se ve de la siguiente forma.Paso 3: Al dar click sobre esta opción se desplegara una ventana donde hay que asegurarnos de que en la parte de la barra desplegable tenga la opción de Tabulated Data, y después presionar sobre el botón Next. 60
  61. 61. Manual de probabilidad y estadística Selección de la opción Tabulaled Data. Y presionamos Next para continuar.Paso 4: En el siguiente paso del proceso, es el seleccionar las columnas que queremos estudiar, que se hace de la misma manera en que se seleccionaba en los estudios anteriores. Selección de las tres columnas 61
  62. 62. Manual de probabilidad y estadísticaPaso 5: Y al tener las tres columnas seleccionadas damos click sobre el botón Finish. Presionamos Finish para que se lleve a cabo el estudio que arroje los resultados finales.Paso 6: Al dar sobre el botón terminar se lleva a cabo el estudio arrojándonos los resultados que se muestran a continuación. 62
  63. 63. Manual de probabilidad y estadísticaPaso 7: De esta tabla solo nos interesa el resultado de la p, la cual nos arroja la relación entre los distintos aspectos estudiados.La relación se define por los siguientes parámetros: Mayor 0.05 No Hay relación a… Menor 0.05 Si Hay relación a…Conclusiones: Tomando en cuenta los parámetros atrás mencionados, tomando en cuenta el resultado de la p, decidimos si los resultados tienen relación o no hay relación. 63
  64. 64. Manual de probabilidad y estadísticaManual de Problemas Estadísticos 64

×