Your SlideShare is downloading. ×

Portafolio Estadística Inferencial

1,813

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,813
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
21
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL PORTAFOLIO DE ESTADÍSTICA INFERENCIAL DOCENTE: MSC. JORGE POZO INTEGRANTES: Tamara Liceth Apráez Lima MARZO 2012- AGOSTO 2012 Tulcán – Ecuador
  • 2. INTRODUCCIONLa estadística inferencial es necesaria cuando queremos hacer algunaafirmación sobre más elementos de los que vamos a medir. La estadísticainferencial hace que ese salto de la parte al todo se haga de una manera“controlada”. Aunque nunca nos ofrecerá seguridad absoluta, sí nos ofreceráuna respuesta probabilística. Esto es importante: la estadística no decide;sólo ofrece elementos para que el investigador o el lector decidan. Enmuchos casos, distintas personas perciben diferentes conclusiones de losmismos datos.El proceso será siempre similar. La estadística dispone de multitud demodelos que están a nuestra disposición. Para poder usarlos hemos deformular, en primer lugar, una pregunta en términos estadísticos. Luegohemos de comprobar que nuestra situación se ajusta a algún modelo (si nose ajusta no tendría sentido usarlo). Pero si se ajusta, el modelo nosofrecerá una respuesta estadística a nuestra pregunta estadística. Es tareanuestra devolver a la psicología esa respuesta, llenándola de contenidopsicológico.La estadística descriptiva, como indica su nombre, tiene por finalidaddescribir. Así, si queremos estudiar diferentes aspectos de, por ejemplo, ungrupo de personas, la estadística descriptiva nos puede ayudar. Lo primeroserá tomar medidas, en todos los miembros del grupo, de esos aspectos ovariables para, posteriormente, indagar en lo que nos interese. Sólo conesos indicadores ya podemos hacernos una idea, podemos describir a eseconjunto de personas. 1
  • 3. OBJETIVO DE LA ESTADÍSTICALa estadística es el conjunto de técnicas que se emplean para larecolección, organización, análisis e interpretación de datos. Los datospueden ser cuantitativos, con valores expresados numéricamente, ocualitativos, en cuyo caso se tabulan las características de lasobservaciones. La estadística sirve en administración y economía para tomarmejores decisiones a partir de la comprensión de las fuentes de variación yde la detección de patrones y relaciones en datos económicos yadministrativos.JUSTIFICACIÓNEl presente portafolio tiene como justificación recolectar todo el trabajo dadoen clases como portafolio de apoyo del estudiante y además ampliar mas elcontenido con investigaciones bibliográficas de libros ya que esto nospermitirá analizar e indagar de los temas no entendidos para auto educarseel estudiante y así despejar los dudas que se tiene con la investigación y elanálisis de cada uno de los capítulos ya que la estadística inferencial esamplia y abarca problemas que estas relacionados con el entorno parapoder sacar nuestras propias decisiones ya que la estadística inferencial nosayudara a la carrera en la que estamos siguiendo como lo es comercioexterior ampliar mas nuestros conocimientos y utilizar más el razonamiento ysacar conclusiones adecuadas según el problema que se presente en elentorno ay que las matemáticas y la estadística nos servirá a futuro para asípoderlos emplear a futuro . 2
  • 4. CAPITULO I EL SISTEMA INTERNACIONAL DE UNIDADESLas unidades del sistema internacional de unidades se clasifican enfundamentales y derivadas. Las unidades fundamentales no se puedenreducir. Se citan las unidades fundamentales de interés en la asignatura deciencias e ingenierías de os materiales.Las unidades derivadas se expanden en función de las unidadesfundamentales utilizando signos matemáticos de multiplicación y de división.Por ejemplo las unidades de densidad del sí son el kilogramo por metrocubico algunas unidades derivadas tienen nombres y símbolos especiales.Unidad de masa El kilogramo (kg) es igual a la masa del prototipointernacional del kilogramo (Diaz, 2008)Unidad de tiempo El segundo (s) es la duración de 9 192 631 770 periodosde la radiación correspondiente a la transición entre los dos nivelesHIPERFINOS del estado fundamental del átomo de cesio 133. (Diaz, 2008)Unidad de intensidad de corriente eléctrica El ampere (A) es la intensidadde una corriente constante que manteniéndose en dos conductoresparalelos, rectilíneos, de longitud infinita, de sección circular despreciable y 3
  • 5. situados a una distancia de un metro uno de otro en el vacío, produciría unafuerza igual a 2·10-7 newton por metro de longitud. (Diaz, 2008)Unidad de temperatura termodinámica El kelvin (K), unidad detemperatura termodinámica, es la fracción 1/273,16 de la temperaturatermodinámica del punto triple del agua. (Diaz, 2008)Unidad de cantidad de sustancia El mol (mol) es la cantidad de sustanciade un sistema que contiene tantas entidades elementales como átomos hayen 0,012 kilogramos de carbono 12. (Diaz, 2008)Unidad de intensidad luminosa La candela (CD) es la unidad luminosa, enuna dirección dada, de una fuente que emite una radiación monocromáticade frecuencia 540·1012 HERTZ y cuya intensidad energética en dichadirección es 1/683 WATT por estereorradián. (Diaz, 2008)Peso: es una magnitud derivada se considera como una unidad vectorial.(Diaz, 2008)Escalar: aquel que indica el número y la unidad. (Diaz, 2008)Vector: indica número unidad dirección etc. (Diaz, 2008)Magnitud derivada: el peso de la unidad newton es una unidad de fuerza.(Diaz, 2008)Gravedad: es la que permite a los cuerpos caer en perpendiculares según lagravedad de la tierra (Diaz, 2008) MULTIPLOS Y SUBMULTIPLOSMúltiploUn múltiplo de un número es otro número que lo contiene un número enterode veces. En otras palabras, un múltiplo de n es un número tal que, divididopor n, da por resultado un número entero Los primeros múltiplos del uno aldiez suelen agruparse en las llamadas tablas de multiplicar. (Pineda, 2008) 4
  • 6. SubmúltiploUn número entero a es submúltiplo de otro número b si y sólo si b es múltiplode a, (Pineda, 2008).COMENTARIO:El Sistema Internacional de Unidades (SI) tiene la finalidad de: Estudiar elestablecimiento de un conjunto de reglas para las unidades de medida ycomo estudiantes de comercio exterior nos ayuda muchísimo porque con elpodemos obtener los resultados al almacenar una mercancía en elcontenedor sin perder el tiempo que es valioso en la carrera, y también siperder el espacio dentro de dicho contenedor.El sistema internacional de unidades es estudiado para obtener datos realesy a su vez poder dar nuestros resultados sacando conclusiones propias de lacarrera Para una comunicación científica apropiada y efectiva, es esencialque cada unidad fundamental de magnitudes de un sistema, seaespecificada y reproducible con la mayor precisión posible. 5
  • 7. ORGANIZADOR GRAFICO: Sistema Internacional de Medidas y Unidades Para resolver el problema que suponga la utilización de unidades diferentes en distintos lugares del mundo, en la XI Conferencia General de Pesos y Medidas (París, 1960) se estableció el Sistema Internacional de Unidades (SI). En el cuadro siguiente puedes ver las magnitudes fundamentales del SI, la unidad de cada una de ellas y la abreviatura que se emplea para representarla:Magnitudes fundamentales Magnitudes derivadas Múltiplos SubmúltiplosUna magnitud fundamental Son la que Un número es un Un múltiplo de n eses aquella que se define dependen de las submúltiplo si otro lo un número tal que, dividido por n, da porpor sí misma y es magnitudes contiene varias veces resultado un númeroindependiente de las fundamentales. exactamente. Ej.: 2 es enterodemás (masa, tiempo, un submúltiplo de 14,longitud, etc.). ya que 14 lo contiene 7 veces.= 14 = 2 • 7 6
  • 8. TRABAJO # 1 MÚLTIPLOS Y SUBMÚLTIPLOSMÚLTIPLOS.- Se pueden obtener múltiplos de cualquier número, sonaquellos que se obtiene al sumar el mismo número varias veces o almultiplicarlo por cualquier número. (son infinitos), (Aldape & Toral, 2005,pág. 94).Ejemplo:Múltiplos de 5:5-10-15-20-25-30-35-405-500-1000SUBMÚLTIPLOS.- Los submúltiplos son todo lo contrario, son las divisionesexactas de un número, (Aldape & Toral, 2005).Por ejemplo :Submúltiplos de 30:6, 10, 5, 2, 3, etc. 7
  • 9. MAGNITUDES FUNDAMENTALES Y DERIVADASLAS MAGNITUDES FUNDAMENTALES.- Una magnitud fundamental esaquella que se define por sí misma y es independiente de las demás (masa,tiempo, longitud, etc.). LONGITUD: Es la medida del espacio o la distancia que hay entre dos puntos. La longitud de un objeto es la distancia entre sus extremos, su extensión lineal medida de principio a fin, (Serway & Faughn, 2006). MASA: Es la magnitud que cuantifica la cantidad de materia de un cuerpo, (Serway & Faughn, 2006). TIEMPO: Es la magnitud física que mide la duración o separación de acontecimientos sujetos a cambio, de los sistemas sujetos a observación, (Serway & Faughn, 2006). INTENSIDAD DE CORRIENTE ELECTRICA: Se denomina intensidad de corriente eléctrica a la cantidad de electrones que pasa a través de una sección del conductor en la unidad de tiempo, (Serway & Faughn, 2006). TEMPERATURA: Es una magnitud referida a las nociones comunes de calor o frío. Por lo general, un objeto más "caliente" tendrá una temperatura mayor, (Serway & Faughn, 2006). INTENSIDAD LUMINOSA: En fotometría, la intensidad luminosa se define como la cantidad flujo luminoso, propagándose en una dirección dada, que emerge, atraviesa o incide sobre una superficie por unidad de ángulo solido, (Enríquez, 2002). CANTIDAD DE SUSTANCIA: Su unidad es el mol. Surge de la necesidad de contar partículas o entidades elementales microscópicas indirectamente a partir de medidas macroscópicas (como la masa o el volumen). Se utiliza para contar partículas, (Enríquez, 2002). 8
  • 10. MAGNITUDES DERIVADAS.- Son la que dependen de las magnitudesfundamentales. VELOCIDAD: Es la magnitud física que expresa la variación de posición de un objeto en función del tiempo, o distancia recorrida por un objeto en la unidad de tiempo, (Enríquez, 2002). AREA: Área es la extensión o superficie comprendida dentro de una figura (de dos dimensiones), expresada en unidades de medida denominadas superficiales, (Enríquez, 2002). VOLUMEN: Es una magnitud definida como el espacio ocupado por un cuerpo, (Enríquez, 2002). FUERZA: se puede definir como una magnitud vectorial capaz de deformar los cuerpos (efecto estático), modificar su velocidad o vencer su inercia y ponerlos en movimiento si estaban inmóviles, (Enríquez, 2002). TRABAJO: El trabajo, en mecánica clásica, es el producto de una fuerza por la distancia que recorre y por el coseno del ángulo que forman ambas magnitudes vectoriales entre sí, (Enríquez, 2002). La unidad del trabajo es el JOULE. ENERGIA: Es una magnitud física abstracta, ligada al estado dinámico de un sistema y que permanece invariable con el tiempo en los sistemas aislados. La unidad de la energía es el Joule, (Enríquez, 2002). 9
  • 11. Fórmulas de área y volumen de cuerpos geométricosFigura Esquema Área VolumenCilindroEsferaConoCubo A = 6 a2 V = a3 A = (perim. base •h) + 2 • V = área basePrisma area base •hPirámide 10
  • 12. CONCLUSIONES  El sistema internacional de unidades es muy importante porque se involucra en nuestra carrera permitiendo la relación económica con otros países mediante comercio internacional y su negociación entre ellos. como también la práctica de problemas del sistema internacional de unidades nos ayudan a ver la realidad de nuestro entorno de cómo podemos solucionar problemas al momento de exportar una mercancía, que cantidad de materia prima, electrodomésticos, enceres que actualmente se exporta en gran cantidad, puede alcanzar dentro de un contenedor.  El sistema internacional de unidades nos ayudan a vincularnos en los negocios, como realizar negociaciones en el exterior porque a través de este sistema podemos indicar el volumen, área, del tipo de trasporte el cual se va a exportar la mercancía, que cantidad de cajas por ejemplo podemos enviar al exterior este sistema es muy fundamental en la carrera de comercio exterior.Recomendaciones  Se recomienda saber todas las medidas del sistema internacional de unidades como también las magnitudes , longitud, masa y volumen de las figuras geométrica para que nuestro producto o mercancía pueda ser exportada al exterior, es necesario conocer debido a que nos permitirá realizar una buena negociación conociendo la cantidad de mercancía que puede introducirse en el transporte.  Es de mucha importancia, que como estudiantes de la carrera de comercio exterior conozcamos las unidades básicas más utilizadas que se encuentran presentes en el Sistema internacional para una correcta aplicación en los ejercicios propuestos. La utilización de las medidas del Sistema Internacional se presenta a nivel internacional y por ende son aplicadas en el los negocios de Comercio Internacional ya que permite una mejor movimiento e intercambio. 11
  • 13. 12
  • 14. BIBLIOGRAFÍAAldape, A., & Toral, C. (2005). Matemáticas 2. México: PROGRESO S.A.Altamirano, E. (2007).Anderson, D. R. (2005). Estadística para Administración y Economía.México: Cengage Learning.Diaz, R. G. (2008). Unidades fundamentales .Enríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA S.A.Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A.García, M. A. (2000). Estadística Avanzada con el Paquete Systat. Murcia:I.S.B.N.J.R, W. D. (20007). Ciencias e Ingenieria de las Materias . 13
  • 15. Pineda, L. (2008). matematicas.Rodrígues, M. E. (2001). Coeficientes de Asociación. México: Plaza yValdés.Sabadías, A. V. (2001). Estadística Descriptiva e Inferencial . Murcia:COMPOBELL.Serway, R. A., & Faughn, J. S. (2006). FÍSICA para bachillerato general.New York: THOMSON.Weiers, R. M. (2006). Introducción a la Estadística para Negocios. México:Learning Inc.Willliams, T. A. (2008). Estadística para Administración y Economía. México:Cengage Learning.LINKOGRAFIAhttp://www.sc.ehu.es/sbweb/fisica/unidades/unidades/unidades.htmfile:///K:/Tabla-de-Magnitudes-Unidades-Y-Equivalencias.htmfile:///K:/books.htmfile:///K:/volumenes/areas_f.htmlfile:///K:/cuerposgeoAreaVolum.htmANEXOS:1.- Convertir 2593 Pies a Yardas. 14
  • 16. 2.- Convertir 27,356 Metros a Millas3.- Convertir 386 Kilogramos a Libras.4.- Convertir 2,352 Segundos a Año.5.- Convertir 1.1 Millas/Hora a Metros/Segundo. 15
  • 17. TRANSFORMACIONESEn muchas situaciones tenemos que realizar operaciones con magnitudesque vienen expresadas en unidades que no son homogéneas. Para que loscálculos que realicemos sean correctos, debemos transformar las unidadesde forma que se cumpla el principio de homogeneidad, (Ledanois & Ramos,2002).Por ejemplo, si queremos calcular el espacio recorrido por un móvil que semueve a velocidad constante de 72 Km/h en un trayecto que le lleva 30segundos, debemos aplicar la sencilla ecuación S = v·t, pero tenemos elproblema de que la velocidad viene expresada en kilómetros/hora, mientrasque el tiempo viene en segundos. Esto nos obliga a transformar una de lasdos unidades, de forma que ambas sean la misma, para no violar el principiode homogeneidad y que el cálculo sea acertado, (Ledanois & Ramos, 2002).Para realizar la transformación utilizamos los factores de conversión.Llamamos factor de conversión a la relación de equivalencia entre dosunidades de la misma magnitud, es decir, un cociente que nos indica losvalores numéricos de equivalencia entre ambas unidades, (Ledanois &Ramos, 2002).EJERCICIOS REALIZADOS EN CLASEVolumen 300 transformar en pulgadas 3V= 100000 16
  • 18. V= 100000Q= 7200000Vol. Paralelepípedo L xaxhVol. CuboVol. EsferaVol. CilindroVol. PirámideÁrea cuadradaÁrea de un rectángulo BxhÁrea de un circuloÁrea de un trianguloEn una bodega tiene un largo de 60 m un ancho de 30 m cuantas cadjas demanzana puede ubicar en esta bodega en estas cajas tiene 60cm de lado y30 de ancho y 40 de altura.Vol. de p bodega = l x a h = 60 x 30 x3 = 5400Vol. De p caja = 60 x 30 x 40 = 72000 17
  • 19. TRANSFORMACIÓNX=Un tanquero tiene una longitud de 17 m y un radio del tanque de 1.50 m.¿Cuántos litros se puede almacenar en dicho tanque?.RESOLUCIONVOL. CILINDRO =VOL. CILINDRO= 3.1416 X (1.50 X (17)= 0 120.17TRANSFORMACIÓN120.17 18
  • 20. SISTEMA INTERNACIONAL DE UNIDADESLONGITUD1 Km 1000 m1m 100 cm1 cm 10 mm1 milla 1609 m1m 1000 mmMASA1qq 100 lbs.1 Kg 2.2 lbs.1 qq 45.45 Kg1 qq 1 arroba1 arroba 25 lbs.1 lb 454 g1 lb 16 onzas1 utm 14.8 Kg1 stug 9.61 Kg1m 10 Kg1 tonelada 907 KgÁREA 1001 100001 hectárea 100001 acre 40501 pie (30.48 cm1 pie 900.291 10.76 19
  • 21. COMENTARIO EN GRUPO:Como comentario en grupo podemos decir que las transformaciones nosservirá en la carrera del comercio exterior y además poder resolverproblemas que se presenten ya que al realizar ejercicios de cilindros ytanque etc., y otras formas geométricas nos servirá para determinar cuántascajas o bultos, etc. que pueden alcanzar en una almacenera o en cada unode los contenedores esto nos servirá al realizar prácticas o al momento deemprender nuestro conocimientos a futuro.ORGANIZADOR GRAFICO: 20
  • 22. LONGITUDObservamos que desde los submúltiplos, en la parte inferior, hasta losmúltiplos, en la parte superior, cada unidad vale 10 veces más que laanterior, (Riley & Sturges, 2004). LONGITUD 1 KM 100 M 1M 100M, 1000MM 1 MILLA 1609M 1 PIE 30,48CM, 0,3048M 1 PULGADA 2,54CM 1 AÑO LUZ 9,46X1015MTIEMPO.El tiempo es la magnitud física con la que medimos la duración o separaciónde acontecimientos sujetos a cambio, de los sistemas sujetos a observación,esto es, el período que transcurre entre el estado del sistema cuando ésteaparentaba un estado X y el instante en el que X registra una variaciónperceptible para un observador (o aparato de medida). El tiempo ha sidofrecuentemente concebido como un flujo sucesivo de situacionesatomizadas, (López, March, García, & Álvarez, 2004). MEDIDAS DEL TIEMPO 1 AÑO 365 DIAS 1 MES 30 DIAS 1SEMANA 7 DIAS 1 DIA 24 HR 1 HORA 60 MIN,3600SEG 1 MINUTO 60 SEG.MASA Y PESO.La masa es la única unidad que tiene este patrón, además de estar enSevres, hay copias en otros países que cada cierto tiempo se reúnen paraser regladas y ver si han perdido masa con respecto a la original. Elkilogramo (unidad de masa) tiene su patrón en: la masa de un cilindrofabricado en 1880, compuesto de una aleación de platino-iridio (90 % platino 21
  • 23. - 10 % iridio), creado y guardado en unas condiciones exactas, y que seguarda en la Oficina Internacional de Pesos y Medidas en Seres, cerca deParís, (Hewitt, 2004).PESODe nuevo, atención a lo siguiente: la masa (la cantidad de materia) de cadacuerpo es atraída por la fuerza de gravedad de la Tierra. Esa fuerza deatracción hace que el cuerpo (la masa) tenga un peso, que se cuantifica conuna unidad diferente: el Newton (N), (Torre, 2007). SISTEMA DE CONVERSION DE MASA 1 1000 KG TONELADA 1 QQ 4 ARROBAS, 100 L 1 ARROBA 25 L 1 KG 2,2 L 1 SLUG 14,58 KG 1 UTM 9,8 KG 1 KG 1000 GR 1L 454 GR, 16 ONZAS 22
  • 24. TRABAJO # 223
  • 25. 24
  • 26. 25
  • 27. 26
  • 28. 27
  • 29. 28
  • 30. 29
  • 31. 30
  • 32. 31
  • 33. CONCLUSIÓN:La conversión de unidades es la transformación de una cantidad, expresadaen una cierta unidad de medida, en otra equivalente. Este proceso suelerealizarse con el uso de los factores de conversión y las tablas deconversión del Sistema Internacional de Unidades.Frecuentemente basta multiplicar por un factor de conversión y el resultadoes otra medida equivalente, en la que han cambiado las unidades.Cuando el cambio de unidades implica la transformación de varias unidadesse pueden utilizar varios factores de conversión uno tras otro, de forma queel resultado final será la medida equivalente en las unidades que buscamos.Cuando se trabaja en la resolución de problemas, frecuentemente surge lanecesidad de convertir valores numéricos de un sistema de unidades a otro,por lo cual es indispensable tener conocimientos sobre las equivalencias delos diferentes sistemas de unidades que nos facilitan la conversión de unaunidad a otra, tomando en cuenta el país y la medida que se emplee en losdiferentes lugares.RECOMENDACIÓN:En toda actividad realizada por el ser humano, hay la necesidad de medir"algo"; ya sea el tiempo, distancia, velocidad, temperatura, volumen,ángulos, potencia, etc. Todo lo que sea medible, requiere de alguna unidadcon qué medirlo, ya que las personas necesitan saber qué tan lejos, qué tanrápido, qué cantidad, cuánto pesa, en términos que se entiendan, que seanreconocibles, y que se esté de acuerdo con ellos; debido a esto esnecesario tener conocimientos claros sobre el Sistema De Conversión DeUnidades pues mediante el entendimiento de este sistema o patrón dereferencia podremos entender y comprender con facilidad las unidades demedida las cuales las podremos aplicar en la solución de problemas denuestro contexto. 32
  • 34. CRONOGRAMA DE ACTIVIDADES: MES DE MARZO-ABRILACTIVIDADES M J V S D L MInvestigar sobre el Sistema Internacional de Unidades y la X XÁreas y volúmenes de diferentes figuras geométricasEjecución del Formato del Trabajo XResumen de los textos investigados X XFinalización del Proyecto XPresentación del Proyecto XBIBLIOGRAFIAEnríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA S.A.Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A.García, M. A. (2000). Estadística Avanzada con el Paquete Systat. Murcia:I.S.B.N.Hewitt, P. G. (2004). Física Conceptual. México: Pearson Educación S.A.J.R, W. D. (20007). Ciencias e Ingenieria de las Materias .Ledanois, J. M., & Ramos, A. L. (2002). Magnitudes, Dimensiones yConversiones de Unidades. Caracas: EQUINOCCIO.López, J. C., March, S. C., García, F. C., & Álvarez, J. M. (2004). Curso deIngeniería Química. Barcelona: REVERTÉ S.A.Pineda, L. (2008). matematicas.Riley, W. F., & Sturges, L. F. (2004). ESTÁTICA. Barcelona: REVERTÉ.LINKOGRAFIA: 33
  • 35. http://es.wikipedia.org/wiki/Magnitud_fundamental#Unidades_en_el_Siste ma_Internacional_de_Unidades_.28SI.29 http://es.wikipedia.org/wiki/Superficie_%28matem%C3%A1tica%29 http://www.quimicaweb.net/ciencia/paginas/magnitudes.html http://www.profesorenlinea.cl/geometria/VolumenCilindro.htm http://mimosa.pntic.mec.es/clobo/geoweb/volum1.htm http://www.sc.ehu.es/sbweb/fisica/unidades/unidades/unidades.htmANEXOS:1.- Investigar las medidas de un tráiler, de una mula y de un camión sencillo,además las medidas de las cajas de plátano, manzanas, quintales de papa yarroz. Con esa información calcular el número de cajas y quintales quealcanzan en cada uno de los vehículos. TRAILER MULA CAMION SENCILLO Largo 14.30m Largo 8.27m Largo 10.80m Ancho 2.45m Ancho 2.50m Ancho 2.60m Alto 2.6m Alto 1.44m. Alto 4.40mMedidas de las cajas: Medidas de las cajas de plátano LARGO ANCHO ALTO 20cm 51cm 34cm Medidas de las cajas de manzana 7.5cm 9.5cm 7.5cm 34
  • 36. Desarrollo: 35
  • 37. a.1 caja de plátano-----------------911*10-05m3 X 91.09m3 b.1 caja de manzana-----------------5.3*108m3 X 9.11*10-05m3 c. 36
  • 38. 1 qq de papa-----------------0.05m3 X 9.11*10-05m3 d.1 qq de arroz-----------------0.05m3 X 9.11*10-05m3 e.1 caja de plátano-----------------911*10-05m3 X 29.77m3 37
  • 39. f.1 caja de manzana-----------------5.3*108m3 X 29.77m3 g.1 qq de papa-----------------0.05m3 X 29.77m3 . h.1 qq de arroz-----------------0.05m3 X 9.11*10-05m3 38
  • 40. i.1 caja de plátano-----------------911*10-05m3 X 123.55m3 j.1 caja de manzana-----------------5.3*108m3 X 123.55m3 k.1 qq de papa-----------------0.05m3 X 123.55m3 39
  • 41. . l.1 qq de arroz-----------------0.05m3 X 123.55m3 . 40
  • 42. CRONOGRAMA DE ACTIVIDADES DEL PRIMER CAPÍTULO: Tiempo MARZO ABRIL MAYOActividades SEMANAS SEMANAS SEMANAS 1 2 3 4 1 2 3 4 1 2 3 4PRIMERA CLASECompetencia especifica X(27-Marzo-2012)Introducción de la Materia x(27-Marzo-2012)SEGUNDA CLASESistema Internacional deUnidades X(03-Abril-2012)Tarea Sistema Internacionalde Unidades.Entregar el 10 de abril del X2012TERCERA CLASEAplicación detransformaciones X(17 de abril del 2012)Tarea Ejercicios deaplicación acerca delSistema Internacional de Xunidades según lastransformaciones(24 de abril del 2012)CUARTA CLASEEvaluación primer capitulo x(03 de Mayo del 2012)41
  • 43. 42
  • 44. 43
  • 45. CAPITULO IIMARCO TEORICO: COEFICIENTE DE CORRELACIÓN Y REGRESIÓN LINEALLa correlación estadística determina la relación o dependencia que existe entre lasdos variables que intervienen en una distribución bidimensional. Es decir,determinar si los cambios en una de las variables influyen en los cambios de laotra. En caso de que suceda, diremos que las variables están correlacionadas oque hay correlación entre ellas. Una medida estadística ampliamente utilizada que mide el grado de relación lineal entre dos variables aleatorias. El coeficiente de correlación debe situarse en la banda de -1 a +1. El coeficiente de correlación se calcula dividiendo la covarianza de las dos variables aleatorias por el producto de las desviaciones típicas individuales de las dos variables aleatorias. Las correlaciones desempeñan un papel vital en la creación de carteras y la gestión de riesgos, (Weiers, 2006).Comentario: A una correlación se la puede apreciar con un grupo de técnicas estadísticas empleadas para medir la intensidad de dicha relación entre dos variables, en donde se deben identificar la variable dependiente y la independiente.DIAGRAMA DE DISPERSIÓNRepresentación gráfica del grado de relación entre dos variables cuantitativas. 44
  • 46. Características principalesA continuación se comentan una serie de características que ayudan acomprender la naturaleza de la herramienta.Impacto visualUn Diagrama de Dispersión muestra la posibilidad de la existencia de correlaciónentre dos variables de un vistazo.ComunicaciónSimplifica el análisis de situaciones numéricas complejas.Guía en la investigaciónEl análisis de datos mediante esta herramienta proporciona mayor información queel simple análisis matemático de correlación, sugiriendo posibilidades yalternativas de estudio, basadas en la necesidad de conjugar datos y procesos ensu utilización, (García, 2000).Comentario: El diagrama de dispersión sirve para una representación gráfica más fácil y útil cuando se quiere describir el comportamiento de un conjunto de dos variables, en donde aparece representado como un punto en el plano cartesiano.COEFICIENTE DE CORRELACIÓN RECTILINEA DE PEARSONEn estadística, el coeficiente de correlación de Pearson es un índice que mide larelación lineal entre dos variables aleatorias cuantitativas. A diferencia de lacovarianza, la correlación de Pearson es independiente de la escala de medida delas variables. 45
  • 47. De manera menos formal, podemos definir el coeficiente de correlación dePearson como un índice que puede utilizarse para medir el grado de relación dedos variables siempre y cuando ambas sean cuantitativas. El coeficiente de correlación es una medida de asociación entre dos variables y se simboliza con la literal r; los valores de la correlación van de + 1 a - 1, pasando por el cero, el cual corresponde a ausencia de correlación. Los primeros dan a entender que existe una correlación directamente proporcional e inversamente proporcional, respectivamente, (Willliams, 2008).Comentario: El coeficiente de correlación de Pearson nos da una idea de que tan relacionadas están dos variables, este número varía entre 0 y 1; si el coeficiente es > 0.9, entonces es una buena correlación y cuando un coeficiente es < 0.3 indica que las variables no están correlacionadas entre ellas y por lo que el 1 representa una correlación perfecta.INTERPRETACIÓN DE UN COEFICIENTE DE CORRELACIÓNEl coeficiente de correlación como previamente se indicó oscila entre –1 y +1encontrándose en medio el valor 0 que indica que no existe asociación lineal entrelas dos variables a estudio. Un coeficiente de valor reducido no indicanecesariamente que no exista correlación ya que las variables pueden presentaruna relación no lineal como puede ser el peso del recién nacido y el tiempo degestación. En este caso el r infraestima la asociación al medirse linealmente. Losmétodos no paramétrico estarían mejor utilizados en este caso para mostrar si lasvariables tienden a elevarse conjuntamente o a moverse en direcciones diferentes. Como ya se ha planteado el grado de correlación mide la intensidad de relación lineal, ya sea directa, inversa o inexistente entre dos variables, se 46
  • 48. dice que es directa si tiene signo positivo, inversa de signo negativo y nula cuando el valor sea aproximadamente igual a cero, (Anderson, 2005).Comentario: El coeficiente de correlación mide solo la relación con una línea recta, dos variables pueden tener una relación curvilínea fuerte, a pesar de que su correlación sea pequeña; por lo tanto cuando analicemos las relaciones entre dos variables debemos representarlas gráficamente y posteriormente calcular el coeficiente de correlación para un mejor entendimiento.FORMULAREGRESIÓN LINEAL SIMPLEElegida una de las variables independientes y representadas los valores de lavariable bidimensional, si observamos que la función que mejor se adapta a laforma de la nube de puntos es una recta, tendremos un problema de regresiónlineal. Si hemos elegido el carácter X como variable independiente, tendremos a larecta de regresión de Y sobre X. Si elegimos Y como variable independiente, seobtendrá la recta de regresión de X sobre Y.Regresión Lineal Simple.- suponga que tenemos una única variable respuestacuantitativa Y, y una única variable predictora cuantitativa X. Para estudiar larelación entre estas dos variables examinaremos la distribución condicionales de Ydado X=x para ver si varían cuando varia x. (MORER, 2004) 47
  • 49. COMENTARIO: Podemos concluir diciendo que una de las variables independientes y representadas los valores que mejor se adapta a la forma de la nube de puntos es una recta, tendremos un problema de regresión lineal. A demás el hecho de entender de que se trata una regresión lineal y saberla aplicar relacionando dos variables nos será de mucha ayuda en nuestro futuro ya que nos permitirá aplicar lo aprendido en problemas reales que se nos presenten en nuestra vida profesional como por ejemplo el saber que tan buena resulta una relación entre exportaciones e importaciones que el Ecuador ha realizado y así con esto poder tomar decisiones.CORRELACIÓN POR RANGOSCuando se obtienen datos en parejas, tales como observaciones de dos variablespara un mismo individuo, deseamos conocer si las dos variables estánrelacionadas o no y de estarlo, el grado de asociación entre ellas.Correlación Por Rangos.- Este coeficiente de Sperman, es muy utilizado eninvestigaciones de mercado, especialmente cuando no se deben aplicar medidascuantitativas para ciertas características cualitativas, en aquellos casos , en dondese pueden aplicar ambos coeficientes de correlación, encontraremos que susresultados son bastante aproximados. (BENCARDINO, 2006)COMENTARIO: Son datos en pareja para poder conocer la relación que existe entre ellas para un solo individuo en común, y medir el grado de asociación entre ellas. Esto es muy interesante ya que en un futuro nos ayudara en lo que nos vamos a desarrollar que es un ambiente de negocios, ya que podemos aplicar esta técnica estadística aprendida, y así poder solucionar problemas que se nos presenten comúnmente y saber que tan buena es la relación 48
  • 50. entre las dos variables propuestas es decir nos ayudara mucho ya que nos dará una idea de que tan relacionadas linealmente están dos variables y si su relación es positiva o negativa.RANGOLa diferencia entre el menor y el mayor valor. En {4, 6, 9, 3, 7} el menor valor es 3,y el mayor es 9, entonces el rango es 9-3 igual a 6. Rango puede significartambién todos los valores de resultado de una función.Rango.- es una categoría que puede aplicarse a una persona en función de susituación profesional o de su status social. Por ejemplo: “Tenemos que respetar elrango del superior a la hora de realizar algún pedido”, “Diríjase a mi sin olvidar surango o será sancionado. (MORER, 2004)COMENTARIO: Rango es el valor que se diferencia entre el menor y el mayor valor. Rango puede significar también todos los valores de resultado de una función, y se puede así relacionar y correlacionar a dos variables para obtener resultados que nos ayudan a la toma de decisiones. A demás un rango es importante ya que nos permite la obtención de datos más exactos y pues con esto nuestro trabajo se entonara de forma más real y sobre todo de forma más precisa, y por ende tomaremos decisiones más acertadas.COMENTARIO GENERAL:La correlación y regresión lineal están estrechamente relacionadas entre si lascuales nos ayudan a comprender el análisis de los datos muéstrales para saberqué es y cómo se relacionan entre sí dos o más variables en una población quedeseemos estudiar para así poder determinar posibles resultados que nos darán 49
  • 51. en un estudio de mercado por ejemplo ya que nuestra carrera de comercio exteriorestá muy relacionada con ese ámbito.La regresión lineal por otro lado nos permitirá graficar las dos variables a estudiardeterminando su situación y si es conveniente o no desarrollar lo propuesto oinvestigado. La finalidad de una ecuación de regresión seria estimar los valores deuna variable con base en los valores conocidos de la otra.Es decir en resumen que nos permitirá tomar decisiones acertadas dentro de unestudio ya sea en una población que determinara el éxito o fracaso entre dosvariables a estudiar, y facilitara la recolección de información.ORGANIZADOR GRAFICO: ayuda a la toma de decisiones segun lo resultante en la aplicacion de estos grupodetécnic herramienta basica asestadísticas para estudios y usadasparame analisis que pueden determinar el exito o dirlafuerzadel fracaso entre dos aasociaciónen opciones tredosvariable s CORRELACION Y REGRESION LINEAL se ocupa de establecer si existe una relación así como permite evaluar de determinar su magnitud decisiones que se y dirección mientras que la tomen en una regresión se encarga poblacion principalmente de utilizar a la relación para efectuar una predicción. determinar posibles resultados como por ejemplo del exito en un estudi de mercado 50
  • 52. TRABAJO #351
  • 53. 52
  • 54. 53
  • 55. 54
  • 56. 55
  • 57. 56
  • 58. 57
  • 59. 58
  • 60. 59
  • 61. 60
  • 62. 61
  • 63. 62
  • 64. 63
  • 65. 64
  • 66. 65
  • 67. 66
  • 68. 67
  • 69. 68
  • 70. 69
  • 71. 70
  • 72. 71
  • 73. 72
  • 74. 73
  • 75. 74
  • 76. 75
  • 77. 76
  • 78. 77
  • 79. 78
  • 80. 79
  • 81. 80
  • 82. CRONOGRAMA DE ACTIVIDADES: Días Actividad Responsable Mar, 08 Mié, 09 Jue, 10 Vie,11 Sáb,12 Dom,13 Lun,14 Mar,15 Mié,16 Jue,17Copias Tamara Apraez, Diana Coral, Diana García, Tania Herrera., Janeth ReinaIniciar con Tamaralos Apraez, Dianaejercicios Coral, Diana Garcia, Tania Herrera., Janeth ReinaTerminar los Tamaraejercicios Aprez, Diana Coral, Diana García, Tania Herrera., Janeth ReinaPrueba Tamara Aprez, Diana Coral, Diana Garcia, Tania Herrera., Janeth Reina 81
  • 83. ANEXOS:Ejemplo 1:La siguiente tabla representa las puntuaciones de 7 sujetos en dos variables X eY. X: 6 3 7 5 4 2 1 Y: 7 6 2 6 5 7 2Calcule: a. El coeficiente de correlación de Pearson entre X e Y b. La recta de regresión de Y sobre X en puntuaciones directas c. La varianza de Y ( ), la varianza de las puntuaciones pronosticadas ( ) y la varianza error ( a) X Y XY X2 Y2 6 7 42 36 49 3 6 18 9 36 7 2 14 49 4 5 6 30 25 36 4 5 20 16 25 2 7 14 4 49 1 2 2 1 4 28 35 140 140 203 82
  • 84. b)c)Ejemplo 2:Se tienen los datos conjuntos de dos variables, X e Y, con los valores que semuestran en la tabla:X: 1; 3; 5; 7; 9; 11; 13Y: 1; 4; 6; 6; 7; 8; 10 a. Si utilizamos la variable X como predictora de la variable Y, ¿qué porcentaje de variabilidad de Y no puede ser explicada por la variabilidad de X?. b. ¿Qué valor pronosticaríamos en la variable Y, si en la variable X obtenemos un valor de 10? c. Suponiendo que no dispusiéramos de la información relativa a la variable X, ¿qué valor pronosticaríamos para la variable Y? (Razone su respuesta). 83
  • 85. a) Completamos la siguiente tabla: X Y XY X2 Y2 1 1 1 1 1 3 4 12 9 16 5 6 30 25 36 7 6 42 49 36 9 7 63 81 49 11 8 88 121 64 13 10 130 169 100 49 42 366 455 302El cuadrado del coeficiente de correlación (coeficiente de determinación) seinterpreta como proporción de varianza de la variable Y que se explica por lasvariaciones de la variable X. Por tanto: es la proporción de varianza noexplicada. Esta proporción multiplicada por 100 es el tanto por ciento o porcentaje.b) Aplicamos la ecuación de regresión de Y sobre X: Y= b.X + a. Siendo b lapendiente y ala ordenada cuyas expresiones aparecen entre paréntesis. 84
  • 86. c) Le pronosticaríamos la media, porque no disponiendo información de la variableX es con el que cometemos menos error de pronóstico.Ejemplo 3:Elección de la prueba estadística para medir la asociación o correlación. Lasedades en días están en escala de tipo intervalo, tenemos dos variables, entoncesaplicamos esta prueba.Objetivo: Conocer qué grado de asociación existe entre la edad y peso corporal deniños de edades desde el nacimiento hasta los 6 meses.Hipótesis.Entre las observaciones de edad de los niños y peso corporal existe correlaciónsignificativa.Ho. Entre las observaciones de edad de los niños y pero corporal no existecorrelación significativa. 85
  • 87. Ejemplo 4:Se ha evaluado a 7 sujetos su inteligencia espacial (variable X) y suspuntuaciones fueron: 13, 9, 17, 25, 21, 33, 29. Además se les pidió a los sujetosque reconocieran un conjunto de figuras imposibles (variable Y). Después decalcular la ecuación de regresión para pronosticar Y a partir de X, se sabe que 86
  • 88. para una puntuación típica de 1,2 en X se pronosticaría una puntuación típica de0,888 en Y. También se sabe que la desviación típica de las puntuacionespronosticadas para Y es 11,1. Con estos datos calcular: a. El coeficiente de correlación de Pearson entre X e Y Sujeto Xi 1 13 169 2 9 81 3 17 289 4 25 625 5 21 441 6 33 1089 7 29 841 Sumatorio 147 3535 a. La ecuación de regresión en puntuaciones diferenciales para pronosticar Y a partir de X 87
  • 89. a. La varianza de los errores del pronóstico.Ejemplo 5:De dos variables X e Y, y para un grupo de 5 sujetos, se saben los siguientesdatos que se muestran en la tabla:Calcular:a) Recta de regresión de Y sobre X en puntuaciones directas. 88
  • 90. b) Coeficiente de correlación de Pearson entre X e Yc) La varianza de las puntuaciones pronosticadas.EJEMPLO 6:Se desea importar desde el país de Colombia transformadores eléctricos. ElEcuador tiene las cotizaciones de cinco empresa diferentes, y se hace el análisisde cual empresa es la más conveniente, y las unidades que se va a vender en elpaís de importación. Valor de los Unidades posiblesEmpresas transformadores a vender X2 Y2 XY x y 1 1800 100 3.240.000 10.000 180.000 2 1500 98 2.250.000 9.604 147.000 3 1200 80 1.440.000 6.400 96.000 4 900 62 810.000 3.844 55.800 5 850 58 722.500 3.364 49.300 2 2 ∑x = 6.250 ∑y = 398 ∑x =8.462.500 ∑y =33.212 ∑xy= 528.100Fórmula: 89
  • 91. Análisis: si se obtiene ese porcentaje se puede lograr una venta exitosa para laempresa importadora.EJEMPLO 7:Se desea importar desde el país de Colombia transformadores eléctricos. ElEcuador tiene las cotizaciones de cinco empresa diferentes, y se hace el análisisde cual empresa es la más conveniente, y las unidades que se va a vender en elpaís de importación. 90
  • 92. Valor de los Unidades posiblesEmpresas transformadores a vender X2 Y2 XY x y 1 1800 100 3.240.000 10.000 180.000 2 1500 98 2.250.000 9.604 147.000 3 1200 80 1.440.000 6.400 96.000 4 900 62 810.000 3.844 55.800 5 850 58 722.500 3.364 49.300 ∑x = 6.250 ∑y = 398 ∑x2=8.462.500 ∑y2=33.212 ∑xy= 528.100Fórmula:Análisis: si se obtiene ese porcentaje se puede lograr una venta exitosa para laempresa importadora. 91
  • 93. EJEMPLO 8:La empresa MIDECAR ha clasificado como mercancías de mayor responsabilidadlas mercancías peligrosas y frágiles obteniendo así los siguientes datosmensuales sobre las toneladas de mercancías que ingresan sobre este tipo:MESES Mercancías Mercancías Peligrosas Frágiles x y x^2 y^2 xyEnero 189 85 35721 7225 16065,00Febrero 105 96 11025 9216 10080,00Marzo 125 78 15625 6084 9750,00Abril 116 48 13456 2304 5568,00Mayo 124 98 15376 9604 12152,00 659 405 91203 34433 53615 92
  • 94. 93
  • 95. La relación que existe dentro de las mercancías frágiles y peligrosas tiende apositiva como lo demuestra el resultado numérico coma la formula y al graficarespecto al eje x y eje y.EJEMPLO 9:3. De una determinada empresa Exportadora de Plátano se conocen lossiguientes datos, referidos al volumen de ventas (en millones de dólares) y algasto en publicidad ( en miles de dólares) de los últimos 6 años:a) ¿Existe relación lineal entre las ventas de la empresa y sus gastos enpublicidad? 94
  • 96. ANALISIS: En este caso r es 0.304 por tanto existe correlación ordinal positiva yes imperfecta, es decir a mayor gasto en publicidad mayor volumen de ventas.EJEMPLO 10:La empresa FERRERO desea importar nueces desde Colombia por lo cual noestá seguro que empresa de transporte contratar para la mercancía de acuerdo aesto esta empresa decide verificar los rendimientos que han tenido estasempresas en el transporte por lo cual ha hecho una investigación de mercado y aobtenido los siguientes resultados. 95
  • 97. EMPRESAS DE CALIDAD DE RENDIMIENTO XYTRANSPORTE SERVICIO (X) (Y)TRANSCOMERINTER 19 46 361 2116 874TRANSURGIN 17 44 289 1936 748TRANSBOLIVARIANA 16 40 256 1600 640SERVICARGAS 14 30 196 900 420 66 160 1102 6552 2682 rr=r= 0,038Es una relación positiva pero se podría decir que la empresa no podrá dependerde las dos variables ya que no son muy dependientes el uno del otro. 96
  • 98. EJEMPLO 11:Se está efectuando un proyecto de investigación en una empresa para determinarsi existe relación entre los años de servicio y la eficiencia de un empleado. Elobjetivo de estudio fue predecir la eficiencia de un empleado con base en los añosde servicio. Los resultados de la muestra son: Empleados Años de Puntuación Servicio de “X” eficiencia “Y” XY X2 Y2 Y` A 1 6 6 1 36 3.23 B 20 5 100 400 25 4.64 C 6 3 18 36 9 3.61 D 8 5 40 64 25 3.77 E 2 2 4 4 4 3.31 F 1 2 2 1 4 3.23 G 15 4 60 225 16 4.30 H 8 3 24 64 9 3.77 61 30 254 795 128 7 6 5 4 3 2 1 0 0 5 10 15 20 25 97
  • 99. r = .3531DESVIACIÓN ESTÁNDARb = 202 = .07652639a = 3.75 - .0765 (7.625) = 3.16 ( y - y )2 ( y - y´ )2 5.0625 7.6729 1.5625 0.0961 0.5625 0.3721 1.5625 1.5129 3.0625 1.7161 3.0625 1.5129 98
  • 100. 0.0625 0.09 0.5625 0.5929 r2 = 15.5 - 13.5659 = 0.1247 = 0.1247EJEMPLO 12:Un analista de operaciones de comercio exterior realiza un estudio para analizar larelación entre la producción y costos de fabricación de la industria electrónica. Setoma una muestra de 10 empresas seleccionadas de la industria y se dan lossiguientes datos: MILES DE MILES DEEMPRESA XY X2 Y2 UNIDADES x $y A 40 150 6000 1600 22500 B 42 140 5880 1764 19600 C 48 160 7680 2304 25600 D 55 170 9350 3025 28900 E 65 150 9750 4225 22500 F 79 162 12798 6241 26244 G 88 185 16280 7744 34225 H 100 165 16500 10000 27225 I 120 190 22800 14400 36100 J 140 185 25900 19600 34225 2 2 Σx 777 Σy 1657 Fxy 132938 Σx 70903 Σy 277119 99
  • 101. 200 180 160 140 120 100 80 60 40 20 0 0 20 40 60 80 100 120 140 160r = 1´329,380 - 1´287,489 =[709030 - 603729][2771190 - 2745949]r = ___41891 = r= _41891__ = 0.8078(105301) (25541) 51860.32DESVIACION ESTANDAR 100
  • 102. Syx = (277119) - 134.7909 (1657) - (.3978) (132.938) 10 - 2Syx = 10.53MARCO TEORICO: CORRELACIÓN Y REGRESIÓN LINEALLa correlación y la regresión están muy relacionadas entre sí. Ambas implican larelación entre dos o más variables. La correlación se ocupa principalmente. Deestablecer si existe una relación, así como de determinar su magnitud y dirección,mientras que la regresión se encarga principalmente de utilizar a la relación. Eneste capítulo analizaremos la correlación y más adelante la regresión linealRelaciones;La correlación se ocupa de establecer la magnitud y la dirección de las relaciones.Analizaremos algunas características importantes generales de estas con las quecomprenderemos mejor este tema.Relaciones lineales:Veamos una relación lineal entre dos variable. La siguiente tabla nos muestra elsalario mensual que percibieron cinco agentes de ventas y el valor en dólares delas mercancías vendidas por cada uno de ellos en ese mes. 101
  • 103. Agente variable X mercancía vendida ($) Y variable salario ($) 1 0 500 2 1000 900 3 2000 1300 4 3000 1700 5 4000 2100Podemos analizar mejor la relación entre estas variables. Si trazamos una graficatrazamos los valores XyY, para cada agente de ventas, como los puntos de dichagrafica. Sería una grafica de dispersión o de dispersigrama.La grafica de dispersión para los datos de los agentes de ventas aparece en elcuadro.Una relación lineal.- entre dos variables, es aquella que puede representarse conla mejor exactitud mediante una línea recta.Problema de que ambos tienen escalas muy diferentes. Como mencionamosanteriormente podemos resolver esta dificultad al convertir cada calificación en suvalor Z transformado, lo cual colocaría a ambas variables en la misma escala, enla escala Z.Para apreciar la utilidad de los puntajes Z en la determinación de la correlación,consideremos el siguiente ejemplo. Supongamos que el supermercado de subarrio está vendiendo naranjas, las cuales ya están empacadas; cada bolsa tienemarcado el precio total. Ud. quiere saber si existe una relación entre el peso de lasnaranjas de cada bolsa y su costo. Como Ud. Es investigador nato, elige al azarseis bolsas y la pesa, de hecho están relacionadas estas variables. Existe unacorrelación positiva perfecta entre el costo y el peso de las naranjas. Asi elcoeficiente de correlación debe ser igual a + 1.Para utilizar esta ecuación primero hay que convertir cada puntaje en bruto en suvalor transformado. Esto puede tardar mucho tiempo y crear errores de redondeo 102
  • 104. con alguna algebra, esta ecuación se puede transformar en una ecuación decálculo que utilice datos en bruto:Ecuación para el cálculo de la r de pearson rDonde es la suma de los productos de cada pareja XyYtambién se llama la suma de los productos cruzados.Datos hipotéticos a partir de cinco sujetos: SUBJETIVO X Y X2 Y2 XY A 1 2 1 4 2 B 3 5 9 25 15 C 4 3 16 9 12 D 6 7 36 49 42 E 7 5 49 25 35 TOTAL 21 22 111 112 106 103
  • 105. r r PROBLEMA DE PRÁCTICA: Tenemos una relación lineal imperfecta y estamos interesados en calcular la magnitud y dirección de la magnitud y dirección de la relación mediante la r Pearson. # de IQ Promedio X2 Y2 XYestudiantes (promedio de de datos calificaciones) Y 1 110 1.0 12.100 1.00 110.0 2 112 1.6 12.544 2.56 179.2 3 118 1.2 13.924 1.44 141.6 4 119 2.1 14.161 4.41 249.9 5 122 2.6 14.884 6.76 317.2 6 125 1.8 15.625 3.24 225.0 7 127 2.6 16.129 6.76 330.2 8 130 2.0 16.900 4.00 260.0 9 132 3.2 17.424 10.24 422.4 10 134 2.6 17.956 6.76 384.4 11 136 3.0 18.496 9.00 408.0 12 138 3.6 19.044 12.96 496.8 TOTAL 1503 27.3 189.187 69.13 3488.0 104
  • 106. r rUna segunda interpretación de la r de pearson es que también se puedeinterpretar en términos de la variabilidad de Y explicada por medio de X. estepunto de vista produce más información importante acerca de r y la relación entreX y Y en este ejemplo la variable X representa una competencia de ortografía y lavariable Y la habilidad de la escritura de seis estudiantes de tercer grado. Supongaque queremos que queremos predecir la calificación de la escritura de Esteban, elestudiante cuya calificación en ortografía es de 88.Para calcular la r de Pearson para cada conjunto. Observe que en el conjunto B,donde la correlación es menor, a algunos de los valores r= Son positivos y otros son negativos. Estos tienden a cancelarse entre si, locual hace que r tenga una menor magnitud. Sin embargo, en los conjuntos A y Ctodos los productos tienen el mismo signo, haciendo que la magnitud de raumente. Cuando las parejas de datos ocupan las mismas u opuestas posiciones 105
  • 107. dentro de sus propias distribuciones, los productos tienen el mismo signo, lacual produce una mayor magnitud de rCalculando r utilizando para el conjunto B, utilizando la ecuación para los datos en bruto¿Qué quiere utilizar la ecuación de los datos en bruto o la los puntajes z?Sume la constante 5 de los datos X en el conjunto A y calcule r de nuevo, mediante laecuación de datos en bruto ¿ha cambiado el valor?Construya una grafica de dispersión para las parejas de datos.Sería justo decir que este es un examen confiableUn grupo de investigadores a diseñado un cuestionario sobre la tensión, consistente enquince sucesos. Ellos están interesados en determinar si existe una coincidencia entredos culturas acerca de la cantidad relativa de ajustes que acarrea cada suceso. Elcuestionario se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe utilizarel evento “matrimonio” como estándar y juzgar los demás eventos en relación con elajuste necesario para el matrimonio recibe un valor arbitrario de 50 puntos. Si seconsidera un evento requiere de más ajustes que el matrimonio, el evento debe recibirmás de 50 puntos. el número de puntos excedentes depende de la cantidad de ajustesrequeridos. Después de cada sujeto de cada cultura ha asignado de puntos a todos loseventos, se promedian los puntos de cada evento. Los resultados aparecen en lasiguiente tabla. EVENTOS ESTADOUNIDENSES ITALIANOS Muerte de la esposa 100 80 Divorcio 73 95 Separación de la pareja 65 85 Temporada en prisión 63 52 Lesiones personales 53 72 Matrimonio 50 50 106
  • 108. Despedido del trabajo 47 40 Jubilación 45 30 Embarazo 40 28 Dificultades sexuales 39 42 Reajustes económicos 39 36 Problemas con la 29 41 familia política Problemas con el jefe 23 35 Vacaciones 13 16 Navidad 12 10 a. Suponga que los datos tienen al menos una escala de intervalo y calcule la correlación entre los datos de los estadounidenses y la de los italianos b. Suponga que los datos solo tienen una escala ordinal y calcule la correlación entre los datos de ambas culturas INDIVIDUO EXAMEN CON PSIQUIATRA PSIQUIATRA LÁPIZ Y PAPEL A B 1 48 12 9 2 37 11 12 3 30 4 5 4 45 7 8 5 31 10 11 6 24 8 7 7 28 3 4107
  • 109. 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3un Psicólogo ha construido un examen lápiz-papel, a fin de medir la depresión. Paracomparar los datos de los exámenes con los datos de los expertos, 12 individuos “conperturbaciones emocionales” realizan el examen lápiz-papel. Los individuos soncalificados de manera independiente por los dos psiquiatras, de acuerdo con el grado dedepresión determinado para cada uno como resultado de las entrevistas detalladas. Losdatos aparecen a continuación.Los datos mayores corresponden a una mayor depresión. a. ¿Cuál es la correlación de los datos de los dos psiquiatras? b. ¿Cuál es la correlación sobre las calificaciones del examen de lápiz y papel de cada psiquiatra?Para este problema, suponga que Ud. Es un psicólogo que labora en el departamento derecursos humanos de una gran corporación. El presidente de la compañía acaba dehablar con Ud. Acerca de la importancia de contratar personal productivo en la sección demanufactura de la empresa y le ha pedido que ayude a mejorar la capacidad de lainstitución para hacer esto. Existen 300 empleados en esta sección y cada obrero fabricael mismo artículo. Hasta ahora la corporación solo ha recurrido a entrevistas para elegir aestos empleados. Ud. Busca bibliografía y descubre dos pruebas de desempeño lápiz ypapel, bien estandarizadas y piensa que podrían estar relacionadas con los requisitos dedesempeño de esta sección. Para determinar si alguna de ellas se puede usar comodispositivo de selección elige a 10 empleados representativos de la sección de lamanufactura, garantizando que una amplio rango de desempeño quede representado en 108
  • 110. la muestra y realiza las dos pruebas con cada empleado por semana, promediandodurante los últimos seis meses.Desempeño 1 2 3 4 5 6 7 8 9 10en eltrabajo 50 74 62 90 98 52 68 80 88 76Examen 1 10 19 20 20 21 14 10 24 16 14Examen 2 25 35 40 49 50 29 32 44 46 35 CORRELACIÓN4.1.1. TÉCNICAS DE CORRELACIÓNEn los capítulos anteriores, ustedes estudiaron las distribuciones de una solavariable. A continuación abordaremos el estudio de dos variables y no solamentede una. Particularmente estudiaremos qué sentido tiene afirmar que dos variablesestán relacionadas linealmente entre si y cómo podemos medir esta relaciónlineal.4.1.2. RELACIONES LINEALES ENTRE VARIABLESSupongamos que disponemos de dos pruebas siendo una de ellas una prueba dehabilidad mental y otra una prueba de ingreso a la Universidad. Seleccionemoscinco estudiantes y presentemos en la tabla Nº 4.1.1 los puntajes obtenidos enestas dos pruebas. 109
  • 111. Tabla Nº 4.1.1 Estudiantes X Y Prueba de habilidad Examen de Admisión mental María 18 82 Olga 15 68 Susana 12 60 Aldo 9 32 Juan 3 18La tabla nos dice que si podemos hacer tal suposición ya que los estudiantes conpuntajes altos en la prueba de habilidad mental tienen también un puntaje alto enel examen de admisión y los estudiantes con puntaje bajo en la prueba dehabilidad mental. Tienen también bajo puntajes en el examen de admisión. Encircunstancia como la presente (cuando los puntajes altos de una variable estánrelacionados con los puntajes altos de la otra variable y los puntajes) afirmaríamosque hay una relación lineal positiva entre las variables, entonces podemos definiruna relación lineal positiva entre ese conjunto de pares valores X y Y, tal lamuestra la tabla N º 4.1.1Supongamos que en lugar de los resultados de la tabla Nº 4.1.1, hubiéramosobtenido los puntajes que se muestran en la tabla Nº 4.1.2 ¿podríamos afirmarque en esta situación los puntajes de la prueba de habilidad mental pueden usarsepara pronosticar los puntajes del examen de admisión? También, aunque en estecaso mostramos una relación contraria a la que ocurre en la realidad ya que lossujetos con puntajes altos en el test de habilidad mental aparecen con puntajesbajos en el examen de admisión y los sujetos con puntajes bajos en el test dehabilidad mental presentan los puntajes altos en el examen de admisión, entonces 110
  • 112. podemos definir una relación lineal negativa entre un conjunto de pares valores Xy Y (tal como en la tabla Nº 4.1.2) es decir, los puntajes altos de X estánapareados con los puntajes bajos de Y y los puntajes bajos de X están apareadoscon los puntajes de Y. Tabla Nº 4.1.2 Estudiantes X Prueba de habilidad Y Examen de Admisión mental María 18 18 Olga 15 32 Susana 12 60 Aldo 9 68 Juan 3 82 Tabla Nº 4.1.3 Estudiantes X Prueba de habilidad Y Examen de Admisión mental María 18 18 Olga 15 82 Susana 12 68 Aldo 9 60 Juan 3 32Examinemos ahora la tabla Nº 4.1.3. En este casi ya no podemos afirmar que lospuntajes de la prueba de habilidad mental sirvan para pronosticar los puntajes delexamen de admisión, ya que unos puntajes bajos del examen de admisión yalgunos puntajes bajos del test de habilidad mental están apareados con otros 111
  • 113. puntajes altos del examen de admisión, entonces en este caso, decimos que noexiste una relación lineal entre las variables X y Y.4.1.3. DIAGRAMA DE DISPERSIÓNEn las situaciones que se presentan en la vida real no tenemos solamente cincoparejas de valores para ambas variables, sino muchísimas parejas. Otra formaalternativa de ver si existe o no relación lineal entre dos variables seria hacer unagrafica de los valores X y Y en un sistema de coordenadas rectangulares, este tipode gráfica es conocido con el nombre de diagrama de dispersión, gráfico dedispersión o nube de puntos. Dibujemos el diagrama que corresponde a la Tabla Nº 4.1.1. Lo haremos haciendo corresponder a cada valor de la variableindependiente X, un valor de la variable dependiente Y, es decir, para la alumnaSusana haremos corresponder du puntaje en la prueba de habilidad mental (12)con su puntaje de la prueba de admisión (60); al alumno Juan le hacemoscorresponder su puntaje del test de habilidad mental (3) con su puntaje delexamen de admisión (18). Luego ubicaremos los cinco pares de puntajes en elsistema de ejes rectangulares y obtendremos los gráficos Nº 4.1.1 y Nº 4.1.2Observemos en el gráfico Nª 4.1.1 que la tabla Nª 4.1.1. Es descrita por eldiagrama de dispersión. Vemos en este gráfico que los cinco puntos dan lasensación de ascender en línea recta de izquierda a derecha. Esto escaracterístico en datos en los que existe una relación lineal positiva. Aunque estoscinco datos no configuren una línea recta en forma perfecta. Se puede trazar unalínea recta que describa que estos puntos en forma bastante aproximadaconforme se ve en el gráfico Nª 4.1.2 y por esto decimos que la relación es lineal.Si ocurre que todos los puntos de la gráfica de dispersión están incluidos en unasola línea en forma exacta afirmamos que la relación lineal es perfecta. El gradoen que se separan los puntos de una sola línea recta nos da el grado en que larelación lineal no es perfecta. Así cuando menos puntos se encuentran en una 112
  • 114. sola línea decimos que la relación lineal no es perfecta. Así cuando menos puntosse encuentran en una sola línea decimos que la relación lineal entre las dosvariables es menos fuerte y cuando más puntos queden incluidos en una línearecta afirmamos que la relación lineal es más fuerte. GRÁFICO Nª 4.1.1. 113
  • 115. Usando los datos de una tabla Nº 4.1.2 y utilizando la misma forma de razonarempleada hasta ahora podemos construir el correspondiente gráfico de dispersión,tal como se muestra en el gráfico Nº 4.1.3.Podemos observar en el gráfico Nº 4.1.4. que la nube de puntos de la gráficapueden delinearse bien por una línea recta, lo que nos indica que hay una relaciónlineal entre las dos variables X y Y Vemos también que la línea desciende deizquierda a derecha (tienen pendiente negativa) por lo que decimos que la relaciónlineal entre las dos variables es negativa.Si tenemos en cuenta la tabla Nº 4.1.3 podemos obtener una figura como semuestra en la gráfica Nº 4.1.5 Notamos, en esta situación, que resultará inútilcualquier línea recta que trate describir adecuadamente este diagrama dedispersión. Y 80 70 60 50 40 30 20 10 2 4 6 8 10 12 14 16 18 20 X Diagrama de Dispersión 114
  • 116. GRÁFICO Nº 4.1.4. 80 70 60 50 40 30 20 10 2 4 6 8 10 12 14 16 18 20 XDiagrama de Dispersión aproximado por una línea recta4.1.4 COEFICIENTE DE CORRELACIONE RECTILINEA DE PEARSONCon ayuda de las gráficas nos podemos formar una idea si la nube de puntos, odiagrama de dispersión, representa una reacción lineal y si esta relación lineal espositiva o negativa, pero con la sola observación de la gráfica no podemoscuantificar la fuerza de la relación, lo que si conseguiremos haciendo uso delcoeficiente r de Pearson.El coeficiente de correlación r de Pearson, toma valores comprendidos entre 1 y +pasando por 0. El número -1 corresponde a una correlación negativa perfecta (lospuntos del diagrama de dispersión deben encontrarse formando perfectamenteuna línea recta). El numero +1 corresponde a una correlación positiva perfecta.(los puntos del diagrama de dispersión deben encontrarse formandoperfectamente una línea recta). El coeficiente de correlación r=0 se obtiene 115
  • 117. cuando no existe ninguna correlación entre las variables. Los valores negativosmayores que -1 indican una correlación negativa y los valores positivos menoresque 1 indican una correlación positiva.Referente a la magnitud de r podemos decir que independientemente del signo,cuando el valor absoluto de r esté más cercana de 1, mayor es la fuerza de lacorrelación, es así que -0,20 y +0.20 son iguales en fuerza (ambos son dosvalores débiles) los valores -0.93 y +0.93 también son iguales en fuerza (ambosson dos valores fuertes).Cálculo del Coeficiente r de Pearson utilizando una máquina calculadoracuando los datos no son muy numerosos.Dadas dos variables X y Y con sus respectivos valores. En la Tabla podemoscalcular el coeficiente de Pearson con una máquina calculadora mediante lasiguiente fórmula. Tabla Auxiliar 4.1.4. (1) (2) (3) (4) (5) x Y X^2 Y^2 XY 18 82 324 6724 1476 15 68 225 4624 1020 12 60 144 3600 720 9 32 81 1024 288 3 18 9 324 54 2 2 ∑X = 57 ∑Y = 260 ∑X =783 ∑Y =16296 ∑XY =3558En las columnas (1) y (2) se han escrito los valores de X y Y. En la columna (3) sehan elevado al cuadrado los valores de X. En la columna (4) se han elevado al 116
  • 118. cuadrado los valores de Y. En la columna (5) se ha efectuado el producto de cadapareja de valores X y Y. Aplicando los datos en la fórmula 4.1.1., se tiene: INTERPRETACIONES DE UN COEFICIENTE DE CORRELACIÓN¿Qué tan elevado es un coeficiente de correlación dado? Tofo coeficiente decorrelación que no sea cero indica cierto grado de relación entre dos variables.Pero es necesario examinar más esta materia, porque el grado de intensidad derelación se puede considerar desde varios puntos de vista. No se puede decir queun r de 0,50 indique una relación dos veces más fuerte que la indicada por un r de0, 25. Ni se puede decir tampoco que un aumento en la correlación de r = 0,40 a r= 0,60 equivalga a un aumento de r = 0,70 a r = 0,90. Es de observar que unacorrelación de 0,60 indica una relación tan estrecha como una correlación de +0,60. La relación difiere solamente en la dirección.Siempre que éste establecido fuera de toda duda razonable una relación entre dosvariables, el que el coeficiente de correlación sea pequeño puede significarúnicamente que la situación medida está contaminada por algún factor o factoresno controlados. Es fácil concebir una situación experimental en la cual, si se hanmantenido constantes todos los factores que o sean pertinentes, el r podría habersido 1 en lugar de 0,20. Por ejemplos: generalmente la correlación entre la 117
  • 119. puntuación de aptitud y el aprovechamiento académico es 0,50 puesto que ambosse miden en una población cuyo aprovechamiento académico también esinfluenciable por el esfuerzo, las actitudes, las peculiaridades de calificación de losprofesores, etc. Si se mantuvieran constantes todos os demás factoresdeterminantes del aprovechamiento y se midieran exactamente la aptitud y lasnotas, el r seria 1 en vez de 0,50.Una conclusión práctica respecto a la correlación es que ésta es siempre relativa ala situación dentro de la cual se obtiene y su magnitud no representa ningúnhecho natural absoluto. El coeficiente de correlación es siempre algo puramenterelativo a las circunstancias en que se ha obtenido y se ha de interpretar a la luzde esas circunstancias y sólo muy rara vez en algún sentido absoluto.Además podemos agregar que la interpretación de un coeficiente de correlacióncomo de medida del grado de relación lineal entre dos variables es unainterpretación matemática pura y está completamente desprovista deimplicaciones de causa y efecto. El hecho de que dos variables tiendan aaumentar o disminuir al mismo tiempo no implica que obligadamente una tengaalgún efecto directo o indirecto sobre la otra.A continuación calcularemos con la fórmula antes indicada el coeficiente dePEARSON de la relación presentada en la tabla. Cuadro Auxiliar 4.1.5. (1) (2) (3) (4) (5) x Y X^2 Y^2 XY 18 18 324 324 324 15 32 225 1024 480 12 60 144 3600 720 9 68 81 4624 612 3 82 9 6724 246 2 2 ∑X = 57 ∑Y = 260 ∑X =783 ∑Y =16296 ∑XY =2382 118
  • 120. Vemos que la correlación es fuerte y negativa.Ahora calculemos con la misma fórmula de Pearson Nº 4.1.1. El Coeficiente deCorrelación lineal con los datos de la tabla nº 4.1.3. Cuadro Auxiliar Nº 4.1.6 (1) (2) (3) (4) (5) x Y X^2 Y^2 XY 18 18 324 324 324 15 82 225 6724 1230 12 68 144 4624 816 9 60 81 3600 540 3 32 9 1024 96 2 ∑X=57 ∑Y=260 ∑X =783 ∑Y2=16296 ∑XY=3006 La correlación es muy débil y positiva. 119
  • 121. CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN CLASESEl presente tema nos conduce a calcular el coeficiente de correlación r, que nosproporciona información de la fuerza de la relación que existe entre dosconjuntos.Ejemplo: calcular el grado de correlación entre las puntuaciones obtenidas eninventario de hábitos de estudio y los puntajes obtenidos de un examenmatemático, aplicados a un total de 134 alumnos de un colegio de la localidad. ^-^X Hábitos de Y ^esiudio 20 - 30 30 - 40 40 - 50 50 - 60 Total fy Matemáticas^ 3 2 2 7 70 -* 80 60 -> 70 1 0 4 5 10 50 ~» 60 2 6 16 3 27 40 50 4 14 19 10 47 30 >-■» 40 7 15 6 0 28 20 M 30 8 2 0 1 t1 10 20 1 1 2 4 Total f. 23 40 48 23 134Podemos notar que el problema no es tan simple, como el casa anterior, dado,que ahora los datos se han clasificado en una tabla de doble entrada N" 4.1.7.Este): cuadro muestra, en la primera columna del lado izquierdo los intervalos declase 0» la variable Y, los que cubren todos los posibles datos acerca de laspuntuaciones! alcanzadas por los estudiantes en la prueba de Matemática.Nótese que los i n t e r v a l o s los crecen de abajo hacia arriba. En la fila superiorse presentan les intervalos <% 120
  • 122. Dentro del cuadro en los casilleros interiores o celdas de la tabla, se encuentranlas frecuencias de celda que correspondan a puntajes que pertenecen tanto a unintervalo de la variable Y como un intervalo de la variable X.La fórmula que utilizaremos es la siguientePara obtener los datos que deben aplicarse en la formula vamos a construir elcuadro auxiliar al mismo tiempo que se explica el significado de los símbolos deesa formulaLo primero que hacemos es reemplazar los intervalos horizontales y verticales porsus respectivas marcas de clase a continuación adicionalmente al cuadro N4.1.7cinco columnas por el lado derecho, cuyos encabezamientos son : f para laprimera. 1) Para determinar las frecuencias marginales que se deben colocar en la columna f sumamos las frecuencias de las celdas que están en la misma fila de la marca de clase 75, obtenemos 3+2+2=7, numero que se escribe en el primer casillero o celda de la columna f. en la fila de la marca de clase 65 sumamos 1+4+5=10 numero que se escribe debajo del 7. 2) Ahora vamos a determinar las frecuencias marginales de la variable x: en la columna encabezada con la marca de clase 25 sumemos verticalmente las frecuencias 1+2+4+7+8+1=23 3) Centremos nuestra atención en la columna encabezada u, este signo significa desviación estándar y procedemos a la misma forma en las tablas. Recuerden que las desviaciones unitarias positivas: +1+2 y negativas : -1-2 y -3 corresponden a los intervalos menores. 4) Luego vamos a determinar las desviaciones unitarias horizontales de la variable X. el origen de trabajo es la marca de clase 45 que se halla en la fila superior del cuadro , por esa razón , escribimos cero debajo de la frecuencia marginal 48. 121
  • 123. 5) A continuación vamos a determinar los valores que deben colocarse en la columna encabezada. Para obtener los valores de la cuarta columna encabezada debemos tomar en cuenta que por lo tanto basta multiplicar cada valor de la segunda columna por su correspondiente valor de la tercera columna así se obtiene el respectivo valor de la cuarta columna. En efecto: (3)(21)=63 (20)(20)=40(+1)(27)=27; 00*00=0; (-1)(-28)=28; (-2)(-22)=44 y (- 3)(-12)=36 La suma 63+40+27+28+44+36=238 Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que (f)(u)=fu por consiguiente basta multiplicar verticalmente un valor de la primera fila por su correspondiente valor de la primera fila por su correspondiente valor de la segunda fila para obtener el respectivo valor de la tercera fila. (23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23 Sumando horizontalmente: (-46)+ (-40)+ (23)=-86+23=-63 Vamos por la cuarta fila vemos que u (fu)= Fu2 luego basta multiplicar cada elemento de la segunda fila por su correspondiente elemento de la tercera fila por su correspondiente elemento de la tercera fila para obtener el respectivo elemento de la cuarta fila así: (-2)(-46)=9; (-1)(-40)=40; 0*0=0y (+1)(23)=23 Para obtener valores de la quinta columna observamos que hay tres factores el 1 es la frecuencia f de la celda o casillero que se está considerando el segundo factor es la desviación unitaria u, el tercer factor es la desviación unitaria, por lo tanto el procedimiento será el siguiente: tomemos el número 3 que es la frecuencia de la celda determinada por el cruce de los intervalos que tienen la marcha de la clase 75 horizontalmente y 35 verticalmente.122
  • 124. Para ubicar el tercer factor corremos la vista del numero 3 hacia su derecha hasta llegar a la columna de las desviaciones unitarias u y ubicamos el numero +3 formemos el producto de estos tres números: (3)(--1)(+3)=-9 encerrado de un semicírculo lo escribimos en la celda elegida En la misma fila tomamos la celda siguiente: (2) (0)(+) Continuando hacia la derecha (2) (+1)(+3)=6X hábitosestudio suma de losY # enmatemática 25 35 45 55 Fy Uy FyUy FyU^2y semicírculos 75 2 3 2 2 7 3 21 63 -3 65 1 0 4 5 10 2 20 40 6 55 2 6 16 3 27 1 27 27 -7 45 4 14 19 10 47 0 0 0 0 35 7 15 6 0 28 -1 -28 23 29 25 8 2 0 1 11 -2 -22 44 34 15 1 0 1 2 4 -3 -12 36 0 ∑FxUx = ∑FxUx^2= ∑FxyUxUy= 6 238 59Fx 23 40 48 23 134Ux -2 -1 0 1FxUx -46 -40 0 23 ∑FxUx=-63FxUx^2 92 40 0 23 ∑FxUx^2=155La fórmula del paso (9) lleva el signo ∑para indicar que se deben sumarhorizontalmente los números que están encerrados en los semicírculos de esaprimera fila elegida así: -9+0+6. Este número se escribe en la quita columna.Trabajemos con la segunda fila: (1) (-2)(+2)= -4 se encierra en un semicírculo.(0)(-1)(+2)= 0(4)(0)(+2)= 0(5)(+1)(+2)= 10 123
  • 125. Sumando 0 + 0 + 10 = 10Ahora con la tercera fila:(2)(-2)(+1)= -4(6)(-1)(+1)= -6(16)(0)(+1)= 0(0)(+1)(+1)= 3Sumando: (-4) + (-6) + 0 + 3 = -7Cuarta fila(-4) + (-2) + 0 = 0 todos los productos vales cero, luego la suma = 0Quinta fila(7)(-2)(-1)= 14(15)(-1)(-1)= 15(6)(0)(-1)= 0(0)(+1)(-1)= 0La suma es: 14+15= 29(8)(-2)(-2)= 32(2)(-1)(-2)= 4(0)(0)(-2)= 0(1)(+1)(-2)= -2La suma es: 32 + 4 -2 = 34Séptima fila: 124
  • 126. (1)(-2)(-3)= 6(1)(0)(-3)= 0(2)(1)(-3)= -6Sumando: 6 + 0 – 6 = 0Sumando los valores de la columna quinta.Reuniendo los resultados anteriores, se tienen los datos para aplicar en la formulan= 134∑ = 59∑ = -63∑ =6∑ = 155∑ = 238r=r=r= 0,358 125
  • 127. Ejercicio Resuelto N° 2 de Cálculo de Coeficiente de Correlación Entre Conjuntos de Datos AgrupadosCalcular el coeficiente de correlación lineal de las puntuaciones en matemáticas yfísicas de 100 estudiantes de la Facultad de Ciencias de la Universidad MN X Puntuación matemáticas Y Puntuación fisica 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 TOTAL 90 - 100 0 0 0 2 5 5 12 80 - 90 0 0 1 3 6 5 15 70 - 80 0 1 2 11 9 2 25 60 - 70 2 3 10 3 1 0 19 50 - 60 4 7 6 1 0 0 18 40 - 50 4 4 4 0 0 0 11 TOTAL 10 15 22 20 21 12 100 126
  • 128. SUMA DE LOS NÚMEROS ENCERRADOS EN SEMICÍRCULOS EN PUNTACIÓN EN MATEMÁTICA CADA FILA 45 55 65 75 85 95 Fy Uy Fy Uy Fy U2y 95 2 5 5 12 2 24 48 54PUNTUACION ENFISISCA Y 85 1 3 6 5 15 1 15 15 30 75 1 2 11 9 2 25 0 0 0 0 65 2 3 10 3 1 19 -1 -19 19 2 55 4 7 6 1 18 -2 -36 72 28 45 4 4 3 11 -3 -33 99 36 fx 10 15 22 20 21 12 100 -3 -49 253 150 Ux -2 -1 0 1 2 3 3 Σfy Uy Σfy U2y Σ fxy Ux Uy FxUx -20 -15 0 20 42 36 63 Σfx Ux Fx U2x 40 15 0 20 84 10 267 Σfx U2x 8 127
  • 129. En este problema tenemos que calcular el confidente de correlación lineal r parados conjuntos de datos constituidos por los calificativos en una escala de 0 a 100,en matemáticas y en física para 100 estudiantes de la facultad de Ciencias decierta universidadLos datos se muestran en el cuadro N° 4.1.9 Notemos que a lo largo de la líneahorizontal superior se encuentran los intervalos que contienen los calificativos dematemáticas desde 40 hasta 100.Igualmente en la primera columna vertical izquierda, se encuentran los calificativospara física de los mismos estudiantes, desde el calificativo 40 hasta 100. Noteseque en la columna de los calificativos de física los datos crecen de abajo haciaarriba y para la fila horizontal superior vemos que los calificativos en matemáticascrecen izquierda a derecha.A continuación procederemos a calcular el confidente de correlación r para estosdatos aplicando el mismo método que utilizaremos en el problema anterior. 1) Traslademos los datos del cuadro N° 4.1.9. Llamaremos xy a cualquiera de las frecuencias de los casilleros interiores del cuadro N° 4.1.9. En el cuadro N° 4.1.10. podemos observar que se han agregado cinco columnas por el lado derecho y cuatro filas por la parte interiorObservemos en el cuadro N° 4.1.10 que los intervalos para la puntuación enmatemáticas y para la puntación en física se han remplazado por las marcas declase correspondientes. Así en la fila horizontal superior se han remplazado elprimer intervalo 40 50 por su marca de clase45, el segundo intervalo 50 60por su marca de clase 55 y de esta manera se han remplazado los demásintervalos por sus marcas de clases en el cuadro N° 4.1.10.De igual forma para la columna primera de la izquierda vemos que los intervalosse han remplazado por sus respectivas marcas de clase así para la puntuación enfísica el primer intervalo superior 90 100 se han remplazado por su marca declase 95, el segundo intervalo superior 80 90 se ha remplazado por su marca 128
  • 130. de clase 85 y así sucesivamente hasta llegar al intervalo inferior 40 50 que seha remplazado por su marca de clase 45.Ahora vamos a realizar los pasos siguientes 1) Para las frecuencia marginales fy sumemos todos los valores fxy de la primera fila que tiene la marca de clase 95. De esta forma tenemos: 2+5+5= 12 Para la segunda fila que corresponde a la marca de clase 85 obtenemos: 1+3+6+5= 15 que escribimos en el segundo casillero de f y. 2) Dediquemos nuestra atención a las frecuencias marginales fx. el primer resultado de fx lo obtenemos sumando las frecuencias fxy para la colunia que tiene la marca de clase 45, de esta forma tenemos: 2+4= 10 que se escribe en el primer casillero de fx para el segundo casillero tenemos el número 15 que se obtiene verticalmente de las frecuencias f xy de la columna que tiene de marca de clase 55. Continuando con las sumas de las f de las demás columnas llenamos las frecuencias marginales f x. 3) Atendamos la columna Uy la columna Uy tiene en total 6 casilleros arbitrariamente escogemos uno de estos casilleros como origen de trabajo y le asignamos el numero 0. Aquí hemos escogido el tercer casillero contando de arriba hacia abajo. Observamos ahora la primera columna de la izquierda en donde están las marcas de clase de los puntajes de física. Aquí observamos que las marcas de clase crecen de abajo hacia arriba entonces las desviaciones unitarias en la columna Uy crecerán de abajo hacia arriba entonces del 0 hacia abajo, las desviaciones unitarias son números negativos que van decreciendo hacia abajo. Desde el 0 hacia arriba las desviaciones serán positivas y crecientes. De manera que podemos observar que la columna Uy está conformada por los siguientes números que crecen del 0 hacia arriba: 1,2 y desde el 0 hacia abajo decrece: -1,-2,-3. 4) Veamos la fila Ux 129
  • 131. Notamos que el fila horizontal superior las marcas de clase crecen de izquierda a derecha de igual forma las desviaciones unitarias crecerán de izquierda a derecha. Elegiremos como origen de trabajo arbitrariamente uno del casillero Ux el tercero contando de izquierda a derecha, y vamos asignando números positivos crecientes hacia la derecha del 0, así tenemos 1, 2,3 ya hacia la izquierda, a partir del cero, tendremos:-1y-2. 5) Expliquemos la columna fy Uy. Multipliquemos cada valor de f y por su correspondiente valor de Uy y se obtiene un valor Fy Uy. Por ejemplo el numero 24 se obtiene multiplicando la frecuencia marginal f y = 12 por su correspondiente desviación unitaria Uy = 2esto es, 12*2= 24. Para el segundo casillero multiplicamos 15*1=15; para el tercero 25*0=, así hasta terminar con 11*(-3)= -33. 6) Observemos la columna Fy U2y. L primera celda de esta columna tiene el número 48 que se obtiene de multiplicando el valor Uy =2 de la segunda columna por su correspondiente valor Fy Uy = 24 de la tercera columna, es decir, 2*24= 48. Para el segundo casillero de la columna f y U2y , tenemos 15 que es igual a 1 por 15. De esta forma continuamos llenando los demás valores de la columna Fy U2y. 7) Veamos ahora la fila fx ux. El número -20 del primer casillero de esta fila se obtiene multiplicando la frecuencia marginal f x = 10 por su correspondiente desviación unitaria Ux = -2 es decir: 10 (-2)= -20. Para el segundo casillero de FX UX, multiplicamos (-1)*(-15)= 15 y así sucesivamente 12*3= 36. 8) Veamos Fx U2x. El primer casillero de esta fila es 40 y es el resultado de multiplicar -2 del primer casillero de la fila Fx Ux por menos 20 de su correspondiente primer casillero de la fila Ux esto es, (-2)* (-20)= 40. Para el segundo casillero de fx U2x multiplicamos -1 del segundo casillero de Ux por -15 de su correspondiente segundo casillero de FX UX, luego obtenemos (-1) *(-15)=15 .Así continuamos multiplicando los valores de los casilleros130
  • 132. Ux por sus correspondientes valores de la fila Fx Ux hasta llegar a (3) (36)= 108. 9) Interesa ahora obtener los números encerrados en semicírculo, por ejemplo ahora, el numero 4, que corresponde a la marca de clase 75 para la puntuación en matemáticas y a la marca de clase 95 de la puntuación en física. 10) Para saber cómo se obtiene este numero 4, corramos nuestra vista hacia la derecha dirigiéndonos hacia la columna UY y obtenemos el numero 2. Del numero 4, encerrado en semicírculo, bajemos la vista con dirección a la fila Ux y obtenemos 1. La frecuencia del casillero donde esta el 4, encerrado en semicírculo, es fxy = 2. Multiplicando estos 3 factores tendremos f xy Ux Uy = (2) (1) (2) = 4.Podemos anunciar la siguiente regla:Para obtener los valores encerrados en semicírculos en los casilleros interiores delcuadro N°4..1.10 multiplicamos el valor de la frecuencia f xy del casillero para elcual estamos haciendo el cálculo, por los valores de las desviaciones unitarias U y yUx , obtenidas corriendo la vista hacia la derecha hasta columna Uy y tambiénhacia abajo hasta legar a la fila Ux.Así por ejemplo, para el casillero que corresponde a las marcas de clase 75 enmatemática y 85 en física, tenemos la frecuencia de la celda F xy = 3, los otros dosfactores son: Uy =1 y Ux = 1.Luego (3) x (1) x (1) = 3 que es el valor encerrado en semicírculo.Para el casillero correspondiente a la marca de clase 55 en matemáticas marca declase 45 en física, tenemos: 131
  • 133. fxy = 4, Uy = -3, Ux = -1fxy Ux Uy = (4) (-3) (-1) = 12 que es el valor encerrado en semicírculo. Así podemosproceder para obtener todos los demás valores encerrados en semicírculos.Sumando las frecuencias marginales de la columna f y, se tiene ∑ fy =100.Sumando los valores de la tercera columna se obtiene ∑f y Uy = - 49. Sumando losvalores de la cuarta columna, tenemos ∑f y U^2y = 253. La suma de los valores dela quinta columna:∑fxy Ux Uy = 150Para todas las filas, en el último casillero de la derecha se tiene la suma de losvalores de la fila. Así, por ejemplo, ∑fx = 100; ∑fy = 100.Para la tercera fila: ∑fx Ux = 63Para la cuarta fila: ∑fx U^2x = 267Estos totales de filas y columnas reemplazaremos en la fórmula. Vemos que el coeficiente de correlación en este caso es 0.79. 132
  • 134. Ejercicio Propuesto Nº 1 del Cálculo del Coeficiente de Correlación entre dosConjuntos Agrupados de Datos.Supongamos que tenemos 30 sujetos a los que hemos aplicado una prueba deconocimientos de Psicología General (variable x) y un test de inteligencia (variabley).Aplicando los datos tomados del Cuadro Auxiliar en la fórmula tenemos:Resultado:Ejemplo propuesto N°2 del cálculo del coeficiente de correlación entre dosconjunto de datos agrupados. Supongamos que se tienen 50 vendedores de ciertacompañía. Estos vendedores durante un año 1985 han realizado ventas tal comolo muestra el cuadro N°4.1.13, el que también muestra el número de años deexperiencia que tiene como vendedores.Para dicho cuando, se pide calcular el coeficiente de correlación lineal r. 133
  • 135. Años de experiencia X Monto de 0 2 2 4 4 6 6 8 8 10 TOTAL ventas Y15 18 1 112 15 2 3 4 9 9 12 7 3 2 12 6 9 6 9 4 19 3 6 5 2 7 1 3 2 2TOTAL 2 11 18 12 7 50Tomando los datos obtenidos n el cuadro Auxiliar N°4.1.14 apliquemos en laformula N° 4.1.12, se tiene. 134
  • 136. 135
  • 137. Progresiones lineales simples4.2.1. Regresión lineal simpleAl comenzar a estudiar las técnicas de correlación afirmamos queestudiaríamos dos variables y no solamente una. Llamamos a esa ocasión X auna de las variables Y a la otra. En el tema que nos ocuparemos ahora,estudiaremos la forma de predecir v valores de Y conociendo primero losvalores de X. Es así que viendo la tabla N 4.2.1, similar a la que utilizamoscuando estudiamos correlación, conociendo el puntaje en la prueba dehabilidad mental (variable X) para un alumno determinado, podemos anticiparel puntaje del examen de admisión (variable Y) del mismo alumno.Consideraremos la relación lineal expresada por el cuadro N4.2.1 si dibujamosesa relación, obtenemos el grafico N4.2.1. Como podemos observar todos lospuntos se alinean exactamente. En una sola línea recta, la que recibe elnombre de línea de regresión. Teniendo en cuenta esta línea, podemospredecir cualquiera d los valores de Y conociendo el valor de X; para X=25,según la recta, correspondiente de Y=35, para X=20 corresponde Y=30. Etc.En este caso se trata de una correlación positiva perfecta cuyo coeficiente decorrelación es +1. Prueba de habilidad Examen de Admisión mental X YSUSANA 5 15IVAN 10 20LOURDES 15 25ALDO 20 30JUAN 25 35MARIA 30 40 136
  • 138. CESAR 35 45OLGA 40 50Recordemos ahora el grafico N 4.1.2 que dibujamos cuando estudiamoscorrelación, en este grafico observamos el diagrama de dispersión aproximadopor una línea recta, la recta que mejor se ajuste a los puntos del diagrama dedispersión, es decir, en la mejor medida procure dejar igual número de puntosdel diagrama de dispersión por encima de ella que igual número de puntosdebajo, se llama línea de regresión.ECUACION DE LA REGRESION RECTILINEALa ecuación que describe la línea de regresión es:GRÁFICO y 45 40 Serie 1 f(x)=1*x+10; R²=1 35 30 25 20 15 10 r = 1,00 5 x -5 5 10 15 20 25 30 35 40 45 -5 137
  • 139. = media de la variable X en la muestra.X = un valor de la variable Xr = coeficiente de Pearson, de la correlación lineal entre las variables X y Y.SY = desviación estándar de Y en la muestra.SX = desviación estándar de X en la muestra.Yr = Valor Y resultado del cálculo de la fórmula.Veamos cómo podemos predecir los valore de Y a partir de los valores de X.como el gráfico de este cuadro es una línea recta ascendente sabemos que sucoeficiente de correlación de Pearson r = +1. Además tenemos los siguientesresultados:X = 22,5 SX = 11,46 Y= 32,5 SY = 11,46Estos resultados se pueden calcular a partir de los datos del cuadro.Apliquemos estos datos a la fórmula, obtenemos la siguiente expresión:Simplificando términos obtenemos:Escojamos cualquier valor de X, por ejemplo para María x = 30, reemplazandoeste valor en (b).Vemos en le cuadro el valor que corresponde a María efectivamente es 40, esdecir podemos usar la ecuación para predecir los valores de Y conociendo losvalores de X. 138
  • 140. Esta fórmula de regresión se puede aplicar par dos variables X y Y, entre lascuales no es obligatorio que exista una correlación lineal perfecta, es decir, noes obligatorio que el r para la correlación entre X y Y sea siempre igual a 1.Este valor de r para otras aplicaciones de la regresión, puede tomar cualquiervalor distinto de 1. Ejercicios Resueltos de Regresión Lineal SimpleAl aplicar un test de inteligencia a una muestra representativa constituida por800 alumnos, se obtuvo la puntuación media de 30,4 puntos, con la desviaciónestándar de 12,6 puntos.La edad media de la muestra fue de 14,5 años, con la desviación estándar de3,2 años.El coeficiente de correlación lineal de Pearson entre la variable Y, edad de lossujetos estudiados y la variable X, rendimiento mental de los mismos sujetos,fue r = 0,89.Con estos datos se pide determinar la ecuación de regresión rectilínea de edaden base del puntaje del rendimiento mental.¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de:X1 = 18 Puntos X4 = 50 PuntosX2 = 25 Puntos X5 = 60 PuntosX3 = 45 Puntos X6 = 80 PuntosDatos: = 14,5 SY = 3,2 r = 0, 89 = 30,4 SX = 12,6Aplicando estos datos en la fórmula se tiene: 139
  • 141. Es la ecuación de regresión buscada.Respuesta de la 1ra. PreguntaX1 = 18YR = 7,63 + 0,226 (18) = 7,63 + 4,07YR = 11,7 añosSegunda preguntaX2 = 25YR = 7,63 + 0,226 (25) = 7,63 + 5,65YR = 13,28 añosTercera preguntaX3 = 45YR = 7,63 + 0,226 (45) = 7,63 + 10,17YR = 17,8 añosCuarta preguntaX4 = 50YR = 7,63 + 0,226 (50) = 7,63 + 11,3YR = 18,93 añosQuinta preguntaX5 = 60YR = 7,63 + 0,226 (60) = 7,63 + 13,56YR = 21,19 años 140
  • 142. Sexta preguntaX6 = 80YR = 7,63 + 0,226 (80) = 7,63 + 18,08YR = 25,71 añosEste cuadro contiene la primera columna los nombres de los alumnos, en lasegunda están los rangos de esos alumnos en la variable, en la tercera sehallan los rangos de los alumnos en la variable Y. En la cuarta columna estánlas diferencias de los rangos correspondientes de las variables X y Y. en laquinta columna se colocan las cuadros de las diferencias, ya calculadas. CUADRO AUXILIAR Nº 4.3.4ALUMNOS RENGO DE RANGO DE D= X Y DIFERENCIARodríguez 3 3 0 0Fernández 4 5 -1 1Córdova 2 1 1 1Flores 1 2 -1 1Lema 5 4 1 1APLICANDO LOS DATOS EN LA FORMULA Nº 4.3.1, SE TIENEP= 0.08Es una correlación positiva. Su valor es muy alto y poco común puesto que lapráctica enseña que en la correlación de la inteligencia con el rendimientoescolar en las asignaturas, casi siempre se alcanza un valor próximo a 0.5.EJEMPLO 2 141
  • 143. Supongamos el siguiente cuadro nº 4.3.5. Queremos calcular el coeficiente decorrelación por rangos. CUADRO Nº 4.3.5EXAMINADOS PRUEBA DE APTITUD ACADÉMICA HABILIDAD MENTAL Y XSusana 49 55Iván 46 50Lourdes 45 53Aldo 42 35Juan 39 48maría 37 46cesar 20 29Olga 15 32Observamos que los examinados están ordenados con respecto a la prueba dehabilidad mental de mayor a menor; podemos afirmar que la posición o rangoque se podría asignar a Susana es el primero, a Iván le correspondería elsegundo, para Lourdes el tercero tal como se muestra en el cuadro Nº4.3.6.De igual forma podríamos ordenar la posición o rango de los postulantes segúnlos resultados de la prueba de aptitud académica Y del examen de admisión, loque se muestra en el cuadro Nº4.3.6 es así como Susana también ocupa elnúmero de orden o rango primero y Lourdes ocupa el segundo lugar o rangodos en esa prueba, así podemos continuar ordenando los alumnos según surango en la pruebe de aptitud académica y terminaremos con cesar que ocupael rango 8 en tal prueba.CORRELACIÓN POR RANGOS 142
  • 144. Es el orden que posee o se asignan a cada miembro de un conjunto de deelementos de acuerdo a una escala ordinal dada. El rango ubica el elemento enun punto de esa escala.Por ejemplo: podemos establecer un ordenamiento de los alumnos de acuerdoa los puntajes alcanzados en un examen. Así tenemos en el cuadro Nº 4.3.1que sigue: CUADRO Nº 4.3.1ALUMNOS García león Pérez Ruíz Lazo LoraPUNTAJES 40 65 52 70 76 56Ordenándolos de acuerdo a la magnitud del puntaje, establecemos los rangossiguientes en el cuadro Nº 4.3.1. CUADRO Nº 4.3.2ALUMNOS García león Pérez Ruíz Lazo LoraRANGOS 6 3 5 2 1 44.3.2 COEFICIENTE DE CORRELACIÓN POR RANGOSLa correlación por rangos se refiere a la correspondencia en el ordenamientode los elementos de dos conjuntos dados. La fuerza de la correlación se midepor medio del coeficiente por rangos de spearman, cuya fórmula es:En donde.P= letra griega rho, designa el coeficiente de correlación por rangos. 143
  • 145. D= diferencias de rangos correspondientes entre si pertenecientes a dosvariables X y Y. Por ejemplo d=n= numero de pares correspondientes.EJEMPLOS Nº 1En la primera columna de la izquierda del cuadro Nº 4.3.3 se presenta un grupode 5 estudiantes; en la segunda columna están sus niveles mentales que seconsideran como categorías de la variable X, en la tercera columna se indicanlos resultados de una prueba de matemáticas aplicadas al grupo, cuyaspuntuaciones son valores de la variable Y. CUADRO Nº 4.3.3ALUMNOS NIVEL MENTAL MATEMÁTICAS X YRodríguez medio 35Fernández interior al promedio 17Córdova superior al promedio 48flores muy superior al 42 promediolema muy inferior al promedio 20Calcular el coeficiente de correlación por rangos.ESTUDIANTES CLASIFICACION CLASIFICACION DE D= DIF D2 DE LOS RANGOS LOS RANGOS RANGO X RANGO Y 144
  • 146. SUSANA 1 1 0 0 ESTEBAN 2 3 -1 1 LOURDES 3 2 1 1 ALDO 4 6 -2 4 JUAN 5 4 1 1 MARIA 6 5 1 1 CESAR 7 8 -1 1 OLGA 8 7 1 1∑D2 = 10En la descripción de este cuadro la columna X corresponde a los rangos en laspruebas de habilidad mental, la columna Y corresponde a los rangos de laspruebas de los estudiantes de actitud académica. La columna D corresponde ala diferencia del rango de un elemento de la columna X menos el rango de sucorrespondiente elemento en la columna Y. en la columna D2 se halla elcuadrado de la diferencia anotada en la columna D.Ahora para medir la correlación entre los resultados de la prueba de habilidadmental y del examen de admisión, tomamos los datos del cuadro anterior en elque los datos están transformados en rangos.Conforme ya mencionamos en el ejemplo 1 la fuerza de la correlación en estetipo de problemas, se determina por el coeficiente p (rho) de correlación derangos de spearman. Aplicamos la formula N° 4,3,1 en dondeN= 8 pares∑D2 = 10, este número es el resultado de la suma de los números D elevadosal cuadrado que figuran la columna D2. 145
  • 147. Vemos que existe una correlación positiva fuerte entre las puntuaciones de laprueba de la habilidad mental y los puntajes de la actitud académica delexamen de admisión. Caso de rangos empatados o repetidosExaminemos el caso N° 4.3.7 y supongamos que en el examen de admisión deSusana y Esteban obtuvieron el mismo puntaje 55 y por lo tanto a cualquierade los dos le corresponde los rangos primero o segundo para romper estaindeterminación, convenimos en asignar a cada uno de ellos el promedio deambosRangos, o sea = 1.5 entonces tanto Susana como esteban tendrán elrangoTratemos ahora los rangos del VI Ciclo vemos que los profesores L Y P estánempleados o igualados en puntaje por lo que a cualquiera de los dos lecorresponde el rango 5 o el rango 6.el rango que le asignemos serán elresultado de promedio 5 y 6 que son los dos rangos empatados, luego (5+6) / 2=5.5 será el número que le asignamos como rango.Los profesores Fy Z tienen en el VI ciclo los rangos 3 y 4 a cualquiera de estosdos les corresponde el tercer o cuarto lugar. El número que les asignaremosserá (3+4) /2 = 3.5.Luego elaboramos una columna para los nuevos rangos Y en donde a losprofesores L y P les asignaremos el rango 5.5 y a los profesores F Y Z lesasignaremos el rango 3 Y 5. los profesores J Y K seguirán con los rangos 1 y 2respectivamente.En La Columna D se colocan las diferencias X – YNos ocuparemos ahora de la columna D2. En esta columna se encuentranvalores de la columna D elevados al cuadrado, luego sumamos los valores dela columna D2 y obtenemos = 17.Ahora aplicaremos la formula número 4.3.1. 146
  • 148. Aquí = 17.N= 6P= 1- 6 (17) = 0.5 6 (36 -1) 6 (36 – 1)Luego la correlación entre los puntajes asignados a los 6 pro0fesores por el Vciclo y los puntajes asignados por el VI ciclo es positiva, pero su magnitud noes ni muy fuerte ni muy débil.2º EJERCICIOCinco niños se someten a una pruebe de habilidad mental y los resultados deestas se ordenan por rangos en la columna X. también se muestran en lacolumna Y los rangos de estos mismos 5 niños respecto al tiempo que gastanal mirar la tv.? (Ver cuadro Nº 4.3.1)¿Existe correlación entre el rendimiento mental de los niños y el tiempo quegastan mirando tv.?Calculando los nuevos rangos para la columna Y teniendo en cuenta rangosigualados obtenemos: ALUMNOS x Y A 1 4o5 B 2 4o5 C 3 2o3 D 4 1 E 5 2o3¿Existe correlación entre el rendimiento mental de los niños y el tiempo quegastan mirando tv.? 147
  • 149. Calculando los nuevos rangos para la columna Y. teniendo en cuenta losrangos iguales obtenemos: X Y D D2 X-Y A 1 4.5 -3.5 12.25 B 2 4.5 -2.5 6.25 C 3 2.5 0.5 0.25 D 4 1 3 9 E 5 2.5 2.5 6.25 2 = 34.00Para Obtener Los Rangos Correspondientes A Los Niños A Y B HemosSumado Los Lugares Que Podrían Ocupar Cualquiera De Los Dos Y Que Son5 Y 4 Y Luego Esta Suma La Dividimos Entre El Numero De Rango IgualadosQue Son Dos, Esto Es: (4+5)/ 2= 4.5 Luego Rango Que Les Corresponda A AY B Es 4.5DE IGUAL FORMA PROCEDEMOS PARA LOS RANGO C Y E obteniendopara ellos como nuevo rango 2.5.Ahora añadiremos una nueva columna D, en esta columna escribiremosdiferencia entre uno de los rangos de x menos el correspondiente rango de Y.Elevamos al cuadrado cada valor de y y escribimos cada resultado en lacolumna del cuadrado. Luego sumamos los valores de la columna de D 2 y 2obtenemos =34.00 P= 1 – 1.7=+0.7 Luego obtenemos una correlación negativa cuya magnitud es 0.7 que es un valor fuerte para este tipo de situación.EJERCICIO PROPUESTO DE CÁLCULO DE COEFICIENTE DE SPEARMAN 148
  • 150. La tabla muestra siete estudiantes que ordenados alfabéticamente obtuvieronsu número de orden según sus calificaciones en teoría y práctica académica enun curso de lenguaje. Calcular el coeficiente de correlación de SPEARMAN. ALUMNOS PRACTICA X TEORIA Y A 7 6 B 4 7 C 6 5 D 3 2 E 5 1 F 2 4 G 1 32º EJERCICIOEl cuadro muestra las correspondientes alturas en centímetros de grupo depadres y de sus hijos primogénitos.1) calcular el coeficiente de correlación de espermas2) calcular también el coeficiente de Pearson3) son parecidos? ALTURA PADRE X ALTURA HIJOS Y 172 178 164 154 180 180 190 184 164 166 164 166 165 166 180 175RESPUESTA 1 p= 0.893º EJERCICIOEn la tabla los cinco siguientes individuos se han colocado por rangos de 1 a 5sobre X e Y. calcular el coeficiente de correlación. X Y 149
  • 151. A 2 3 B 1 2 C 3 1 D 5 5 E 4 4 RESPUESTA 1 p= 0.7 EJERCICIO El gerente del personal una empresa agroindustrial estudia la relación entre la variable dependiente Y y la variable independiente X de su personal obrero. Recoge una muestra aleatoria de 10 trabajadores y se obtuvieron los datos en dólares por semana. a) Determinar el diagrama de dispersión b) De su comentario sobre el valor de la pendiente La relación es positiva e imperfecta porque al pasar la recta no cruza por todos los puntos, sin embargo el valor de la pendiente se aproxima a uno. c) Estime el gasto que correspondería a un salario semanal de 90USD. (xi - Ẋ)^2 2 2Salario Gasto X Y XY (xi -Ẋ) (Yi -Ῡ) (Yi -Ῡ)^2 (x) (y) 28 25 784 625 700 -17,8 316,84 -13,4 179,56 150
  • 152. 25 20 625 400 500 25 625 20 400 35 32 1225 1024 1120 35 1225 32 1024 40 37 1600 1369 1480 40 1600 37 1369 45 40 2025 1600 1800 45 2025 40 1600 50 40 2500 1600 2000 50 2500 40 1600 50 45 2500 2025 2250 50 2500 45 2025 35 30 1225 900 1050 35 1225 30 900 70 55 4900 3025 3850 70 4900 55 3025 80 60 6400 3600 4800 80 6400 60 3600Ʃ X=458 Ʃ Y=384 Ʃ X =23784 Ʃ Y =16168 Ʃ XY=19550 Ʃ (xi -Ẋ) Ʃ (xi - Ʃ (Yi -Ῡ) Ʃ (Yi-Ῡ)^2= 2 2 =412,2 Ẋ)^2= =345,6 15722,56 23316,84 Desviación Estándar (X) Sx = Sx = = 48,28 Ẋ= Sy = = 39, 65 151
  • 153. Ῡ= + + + + + = 73, 54 gasto de un salario semanalr = -0.005 152
  • 154. COMENTARIO.- Vemos que los vehículos de 20 toneladas no tienen relación con los de40 toneladas, ya que a los de 20 se los utiliza más para las importaciones que los de 40debido a que son más ligeros al transportar las mercancías. 153
  • 155. 154
  • 156. 155
  • 157. 156
  • 158. 157
  • 159. PRUEBA DE HIPÓTESISHipótesis EstadísticaSe llama hipótesis, a una suposición o conjetura; que se formula, con elpropósito de ser verificada. Cuando se establece la veracidad de una hipótesis,se adquiere el compromiso de verificada en base a los datos de la muestraobtenida. La hipótesis estadística es fundamentalmente distinta de unaproposición matemática, debido que al decidir sobre su certeza podemos tomardecisiones equivocadas, mientras que en la proposición matemática podemosafirmar categóricamente si es verdadera o falsa.Hipótesis NulaEs una hipótesis que afirma lo contrario de lo que se quiere probar. En ella sesupone que el parámetro de la población que se está estudiando, tienedeterminado valor. A la hipótesis nula, se le representa con el símbolo Ho, y seformula con la intención de rechazarla.Ejemplo: Para decidir que una moneda está cargada, suponemos lo contrario,es decir, que la moneda es legal, esto es, que tiene igual probabilidad oproporción de salir cara, que de salir sello. Llamamos P (proporción poblacionalde cara) y Q (proporción poblacional de sello), P +Q = 1 (proporción del total o100% de los casos); pero la moneda es legal, entonces esperamos que P = Q,reemplazando P por Q, P + P = 1, 2P = 1 y P = 0.5, es decir, la proporciónpoblacional de éxito (cara), para todas las monedas legales es 0.5. Sobre estabase, durante la ejecución del experimento, aceptamos que actúan únicamentelas leyes del azar, descartando la influencia de cualquier otro factor.Hipótesis AlternativaEs una hipótesis diferente de la hipótesis nula. Expresa lo que realmentecreemos es factible, es decir, constituye la hipótesis de investigación. Se ledesigna por el símbolo . En el ejemplo citado, la hipótesis alternativa sería: : P ≠ 0.5, es decir, P > 0.5 o P < 0.5, si es que queremos realmenteaveriguar que la moneda no es legal.Concepto de significación en una Prueba EstadísticaSuponiendo que está formulada una hipótesis y que al realizar un experimentopara someterla a prueba encontramos que el estadístico de la muestra, difieremarcadamente del valor del parámetro que establece la hipótesis nula , enese caso, decimos que la diferencias encontradas son significativas y estamos 158
  • 160. en condiciones de rechazar la hipótesis nula o, al menos no aceptarla enbase a la muestra obtenida.En realidad estamos determinando, si la diferencia, entre el valor del parámetroestablecido en y el valor del estadístico obtenido en la muestra, se debe tansolo al error de muestreo (en este caso aceptamos ); o si la diferencia es tangrande que el valor obtenido por el estadístico de la muestra, no es fruto delerror de muestreo, en este caso rechazamos .Prueba de HipótesisSe le llama también ensayo de hipótesis o dócima de hipótesis. Sonprocedimientos que se usan para determinar, se es razonable o correcto,aceptar que el estadístico obtenido en la muestra, puede provenir de lapoblación que tiene parámetro, el formulado en .Como resultado de la prueba de hipótesis, aceptamos o rechazamos . Siaceptamos , convenimos en que el error de muestreo (el azar), por sí solo,puede dar lugar al valor al estadístico que origina la diferencia entre éste y elparámetro. Si rechazamos , convenimos que la diferencia es tan grande, queno es fruto del error de muestreo (al azar) y concluimos que el estadístico de lamuestra no proviene de una población que tenga el parámetro estudiado.El mecanismo para rechazar la hipótesis , es el siguiente: suponemos comoválida la hipótesis nula , la que afirma que el parámetro tiene cierto valor(supongamos el caso de la media poblacional entonces : ʯ = . Tomamosuna muestra y calculamos e ). Como suponemos que escierta, podemos suponer que la muestra proviene de la población que tienecomo parámetro el de (es decir, no serán muy diferentes) y la probabilidadde que dicha diferencia muestral pequeña aparezca, será grande. Si en cambiotomamos una muestra de una población que no tiene como parámetro - será muy distinto que ), esdecir, y , nos permita aceptar o rechazar y es muy pequeña (menor que α), rechazaremos y lamuestra aleatoria no proviene de la población con parámetro - es grande (mayor que α) aceptamos y la muestra aleatoria proviene de la población con parámetro . 159
  • 161. Cuando se toma la decisión de rechazar o aceptar la hipótesis y y no de un hecho establecido), es decir, decometer errores.Estos posibles errores son:Error tipo IConsiste en rechazar la hipótesis , cuando en realidad no debería serrechazada, por ser verdadera. La probabilidad de cometer el error tipo I, sellama alfa (α).Error tipo IIConsiste en no rechazar a hipótesis Ho, cuando debería ser rechazada por serfalsa. La probabilidad de cometer el error tipo II, se llama beta (β).Se debe procurar que la probabilidad de los errores tipo I y tipo II, sean las máspequeñas posibles, sin embrago, para un tamaño de muestra dado, el quererdisminuir un tipo de error, trae consigo, incrementar el otro tipo de error. Laúnica forma de disminuir ambos errores, es aumentar el tamaño de la muestra.Nivel de significación de una Prueba Estadística.En relación a la comprobación de una hipótesis dada, se llama nivel designificación, a la probabilidad a de cometer el error tipo I, al rechazar lahipótesis nula Ho.Los niveles de significación más usados en la práctica son: de 0.05 (5%) y de0.01 (1%).El nivel de significación de 5% se interpreta de la siguiente manera: en 100casos, cabe esperar, que en 5 de ellos se cometa una decisión equivocada, alrechazar la hipótesis Ho, cometiendo, en consecuencia, un error de tipo I.Pasos de una Prueba de Hipótesis1o Formular la Ho y la H1 160
  • 162. 2o Determinar si la prueba es unilateral o bilateral.3o Asumir el nivel de significación de la prueba.4oDeterminar la distribución muestral que se usara en la prueba.5o Elaborar el esquema de la prueba.6o Calcular el estadístico de la prueba.7o Tomar la decisión, para esto, se comparan el esquema de la parte. 5o, con el estadístico del paso 6o.Ejemplo de una prueba de hipótesis utilizando los pasos anteriores.Se realiza el experimento aleatorio de lanzar 50 veces una moneda,obteniéndose 34 veces el resultado cara. Al nivel de significación de 5%, sequiere averiguar si la moneda está cargada. 1) Ho: P= 0.5, la moneda no está cargada. H1: P≠ 0.5 la moneda está cargada (P>0.5 ó P<0.5). 2) La prueba debe ser bilateral o de dos colas, porque hay dos posibilidades en la H1: a) Si se obtiene muchas veces cara, entonces la moneda está cargada de un lado (P>0.5). b) Si se obtiene pocas veces cara, entonces la moneda está cargada del otro lado (P<0.5). 3) Asumimos el nivel de significación de 5%, con lo que estamos aceptando de que con la probabilidad de 0.05, puede ocurrir que se rechace Ho, a pesar de ser verdadera; cometiendo por lo tanto el error de tipo I. la probabilidad de no rechazar Ho, será de 0.95. 4) Determinar la distribución muestral que se utilizara en la prueba. Tenemos por dato muestral la proporción , el parámetro de Ho, es la proporción poblacional P; entonces utilizaremos la distribución muestral de proporciones para describir la variación de las muestras por el error d 161
  • 163. muestreo. Tamaño de muestra n= 50> 30. (Muestra grande) aproximaremos la distribución muestral de proporciones, mediante la distribución normal, porque n=50> 30. 5) Esquema de la prueba: En la distribución normal de probabilidades estandarizadas, para el nivel de significación de 5%, el nivel de confianza será de 95%, entonces los coeficientes críticos o coeficientes de confianza para la prueba bilateral serán: -1.96 1.96, es decir -1.96 ≤ z ≤ 1.96. El esquema correspondiente es:162
  • 164. Si al realizar el experimento y calcular el puntaje estandarizado Z, encontramosque Z cae fuera del intervalo -195 ≤ z ≥ 1.96, esto indicara que se deberechazar H˳Si por el contrario Z cae dentro del intervalo ya mencionado, eso indicara queno debemos rechazar H˳Vemos que hay dos regiones e rechazo, por eso la prueba se llama pruebabilateral o de dos colas.6) Cálculo de Z. utilizando la fórmula 5.3.2Donde Xi corresponde en este caso a la producción de la muestra: p` : es la medida de la distribución muestral de proporciones, igual a laproporción poblacional P de H˳ : es la desviación estándar de la distribución muestral de proporciones,llamada también error estándar de la proporción: p` 163
  • 165. Ejemplo de Prueba de una Cola o Unilateral.Un laboratorio afirma que uno de sus productos tiene 905 de efectividad paracurar una enfermedad. En una muestra de 200 persona de aliviaron 160.Determinar que a afirmación no es cierta, es decir, la medicina cura meno del90% de los casos. Sea el nivel de significación 0.05. 1) .- H˳ P = 0.90 : P, proporción poblacional de éxito. H1: P < 0.90 Es lo que queremos probar. 2) .- Habrá una sola región de rechazo o región crítica y es aquella en la que la proporción de personas curadas por la medicina es menor que 0.90; luego se trata de una prueba unilateral, o de una sea cola; en esta 164
  • 166. caso de cola izquierda, que es la dirección a la que apunta la desigualdad de H1. 3) Asumiendo el nivel de significación de 5% (0.05), en la distribución normal de probabilidades estandarizada se tiene el coeficiente critico de Z= -1.65. 4) Como el dato es una proporción muestral, y en Ho hay una proporción poblacional, usaremos la distribución muestral de proporciones. 5) El esquema de la prueba es:165
  • 167. ´P = Proporción de la muestra =P = Proporción de la población P = 0.9Grados de libertad: el termino libertad se refiere a libertad para variar y recogerdatos de la muestra. Analicemos la fórmula para la desviación estándarcorregidaPara calcular la desviación estándar es necesario estimar la media poblacionalû mediante x= u, es decir se eta estimando un parámetro poblacional por lotanto por grados de libertad serán n-1. Al querer calcular la desviación estándarha disminuido en uno la libertad de escoger los datos, por haber estimado unparámetro, la media poblacional.En la prueba de student de diferencia de medidas, se estimaran dos mediaspoblacionales de cada una de las dos poblaciones de las cuales se toman losdatos, para calcular las dos medias. Los grados de libertad serán n1+n2-2donde n1 es el tamaño de la muestra 1, tomada de la población 1 y n2 es eltamaño de la muestra tomada de la población 2.Los grados de libertad están representados por la siguiente formulaGl=n-kN: numero de observaciones independientesK: numero de parámetros estimadosDistribución de StudentCuando:i) el tamaño de la muestra es pequeño y este es menor que 30ii) la población de donde se obtienen los datos está distribuida normalmente 166
  • 168. iii) se desconoce la desviación estándar de la población entonces haremos uso de la distribución de Student La distribución de Student está representada por el estadístico t: El estadístico z de la distribución normal era En el denominador de t tenemos s, que varía de muestra en muestra. En el denominador de z tenemos o , la desviación estándar de la población que es una constante; t sigue una distribución de Student con n-1 grados de libertad, los valores de t se pueden encontrar en la tabla correspondiente en el apéndice de este libro. Existe un valor específico para cada grado de libertad asociado con un determinado nivel de significación. La grafica de la distribución de Student es mas aplanada que la distribución normal Z.Distribución normal Distribución de student Ejemplo de prueba de una media utilizando la distribución de student Se aplico un test de inteligencia a una muestra de 15 alumnos de un salón de clase de cierto Colegio y se determino un CI promedio de 105.4 con una desviación estándar de 5.3. Se saber que al estandarizar el mencionado test en los colegios secundarios de la localidad, se hallo un CI medio de 101. Asumiendo un nivel de significación de 1% probar que el rendimiento mental 167
  • 169. del grupo de 15 alumnos, es más alto que el promedio de estandarización deltest.U= rendimiento mental medio de estandarización = 101X= rendimiento mental medio de la muestra = 105,41) formulación de la hipótesisH0:µ = 101, no existe diferencias significativas en el rendimiento mental, de lamuestra X y de la poblaciónH1: µ= >1012) prueba unilateral de cola derecha, de acuerdo con H1,3) Nivel De Significación Asumido: 1% = 0.014) Distribución aplicable para la pruebaConsiderando que los datos son la media de la muestra X y la mediapoblacional µ, se debe reutilizar la distribución maestral de medias, ademáscomo n <30 (muestra pequeña) y se desconoce 0 (desviación estándar de lapoblación) se empleara la distribución de student, ya que ese sabe los valoresde CI siguen una distribución normal.5) Esquema grafico de la pruebaEl nivel de significación es a = 0.01Los grados de libertad son:Gi= n-1 = 15 – 1=14g. de libEn la tabla de distribución de student, con 14gl, a = 0.01 y prueba de 1 cola,encontramos el t crítica: tc =2.624 168
  • 170. 6) Cálculo del estadístico de la pruebaDatosX= 105.4 ; µ = 101 ; s= 5.3 ; n= 15 169
  • 171. 7) toma de decisionesObservamos que t=3.11 se ubica en la región de rechazo por tanto se descartaque µ = 101 y se acepta la alternativa µ > 101 es decir el grupo de 15 alumnostiene rendimiento mental mayor que el promedio de estandarización.Ejemplo:Una tableteadora de un laboratorio farmacéutico produce comprimidos de ciertomedicamento, con un peso medio de 2grs. Por comprimido. Para determinar sila maquina sigue en buenas condiciones de producción, se tomó una muestrade 10 tabletas cuyos pesos en gramos son: 2.04; 1.96; 2.00; 1.98: 2.02; 2.01;1.97; 1.94; 2.03; 2.01, asumiendo un nivel de significación de 0.01, verificar quela maquina no está enBuenas condiciones de producción.Llamemos:µ: el peso medio de las tabletas producidas por la máquina. 1) Formulación de hipótesis H0: µ= 2, la maquinas se halla en buenas condiciones. 170
  • 172. H1: µ ≠ 2, la maquina no se halla en buenas condiciones 2) Prueba bilateral porque en H1 hay dos posibilidad µ>2 o µ< 2 3) Nivel de significación , s4e asume el 1% = 0.01 4) Distribución de probabilidad apropiada para la prueba. Considerando que las hipótesis se refieren a medios poblacionales, que se da como dato el valor de la media población µ= 2grs, y que se puede calcular la media de la muestra, utilizaremos la distribución muestral de las medias para efectuar la prueba. Siendo la muestra pequeña (n= 10) y la desviación de student o de la población desconocida, no es aplicable la distribución normal y por tanto recurridos a la distribución de student, asumiendo que la población.171
  • 173. 172
  • 174. Ejercicio.Un laboratorio afirma que uno de sus productos tiene el 90% de efectividadpara curar una enfermedad. En una muestra de 200 personas se aliviaron 160.Determinar que la afirmación no es cierta, es decir que la medicina cura menosdel 90% de los casos. Si el nivel de significancia (error de estimación) es del0,051.- HALLAR H0 Y HA2.- DETERMINAR LA CAMPANA DE GAUSSEs unilateral de una cola3.- DETERMINAR EL VALOR DE CONFIANZA4.- DETERMINAR EL VALOR DE n5.- GRAFICAR LA CAMPANA DE GAUSS 173
  • 175. 6.- CALCULAR EL VALOR DE Z = 0,80 174
  • 176. 7.- rechazo de la hipótesis nula y aceptación de la hipótesis alternativa, porquelos medicamentos curan menos del 90% a los pacientes.Ejercicio.Una muestra de 80 alambres de acero producidos por la Fábrica A, da unaresistencia media a la rotura de 1230lobras con una desviación estándar de120 libras. Una muestra de 100 alambres de acero producidos por la Fábrica Bda una resistencia media a la rotura de 1190 libras con una desviaciónestándar de 90 libras. ¿Hay una diferencia real en la resistencia media de lasdos marcas de alambre de acero, si el nivel de confianza es el 95%?1.- DETERMINAR LA HO Y LA HA. Ho: U1 = U2 Ha: U1 U22.- DETERMINAR LA CAMPANA DE GAUSSLa campana de gauss es bilateral de 2 colas3.- DETERMINAR EL VALOR DE CONFIANZA Nivel de significancia o E.E. = 0,05 Z = 1,96 valor estandarizado 175
  • 177. 4.- DETERMINAR QUÉ TIPO DE MUESTRA SE UTILIZA n 1 = 80 n > 30 n 2 = 100 n > 30 Prueba de Hipótesis5.- CONSTRUIR LA CAMPANA DE GAUSS6.- CALCULAR EL PUNTAJE Z 1 = 1230 S1 = 120 2 = 1190 S2 = 90 176
  • 178. 7.- Rechazo la hipótesis nula y acepto la hipótesis alternativa. La rotura de losalambres de la Fábrica A es diferente a la rotura de los alambres de la FábricaB.Ejercicio.Los salarios diarios de una industria particular tiene una distribución normal conmedia de 23,20 dólares y una desviación estándar de 4,50 dólares. Si unacompañía de esta industria emplea 40 trabajadores, les paga un promedio de21,20 dólares. ¿Puede se acusada esta compañía de pagar salarios inferiorescon un nivel de significancia del 1%?1.- DETERMINAR LA HO Y LA HA. Ho: U = 23,20 Ha: U > 23,202.- DETERMINAR LA CAMPANA DE GAUSS La campana de gauss es de una cola3.- NIVEL DE CONFIANZA = 99% 177
  • 179. 4.- DETERMINAR QUÉ TIPO DE MUESTRA SE UTILIZA5.- CONSTRUIR LA CAMPANA DE GAUSS6.- CALCULAR EL PUNTAJE Z7.- Rechazo la hipótesis nula y acepto la hipótesis alternativa. No está pagandoa los trabajadores lo que les corresponde entonces debe entrar a un juicio pararesolver este inconveniente. 178
  • 180. Ejercicio.Según una encuesta realizada se afirma que la exportación de petróleo crudotiene el 95% de efectividad para comercializarse en el mercado internacional.En una muestra de 45 países a los que se envía el petróleo ecuatoriano, sereflejaron que 35 países los más grandes importadores de petróleo tienenventas elevadas. Determinar que la afirmación no es cierta, es decir que laexportación de petróleo se comercializa en menos del 95%. Si se tiene un nivelde significancia del 0,05. 1. Ho: U = 95% Ha: U < 95% 2. La campana de Gauss es de una cola 3. α = 95% Error de Estimación: 0,05 Z = -1,65 4. n = 45 n > 30 Prueba de Hipótesis 5. Construir Campana de Gauss 6. 179
  • 181. 7. Rechazo la hipótesis nula y acepto la hipótesis alternativa. Las exportaciones de petróleo que el Ecuador realiza a diferentes países se comercializan en más del 95%, por lo que el país puede continuar realizando sus exportaciones al exterior.ORGANIZADOR GRTÁFICO Es una suposición o conjetura respecto a una característica Proposición sobre los parámetros de una PRUEBA Al aceptar o rechazar la hipótesis nula debe población o sobre la distribución de DE asumirse un determinado error al probabilidad de una variable aleatoria HIPÓTESIS tomar una decisión Procedimiento de toma de decisión que conduce a la aceptación o rechazo de hipótesisestadísticas 180
  • 182. DISTRIBUCIÓN T-STUDENTEn probabilidad y estadística, la distribución t-Student es una distribución deprobabilidad que surge del problema de estimar la media de una poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño.Una variable aleatoria se distribuye según el modelo de t-Student con n gradosde libertad, donde n es un entero positivo, si su función de densidad es lasiguiente: n 1 ( ) 1 2 t2 2 ( n 1) (1 ) n n ( p) x p 1e x dx ( ) nf(t)= 2 , - t , 0 siendo p>0La gráfica de esta función de densidad es simétrica respecto del eje deordenadas, con independencia del valor de n, y de forma semejante a ladistribución normal.Propiedades: n 1. La media es 0 y su varianza n 2 , n>2. 2. La gráfica de la función de densidad es en forma de campana. 3. Los datos están más disperso que la curva normal estándar. 4. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1). 5. La gráfica es muy parecida a la de la normal estándar diferenciándose en que las colas de t están por encima de la normal, y el centro se encuentra por debajo del de la normal. 6. Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal.Ejercicio:La empresa de transporte pesado TRANSURGIR de la ciudad de Tulcánadquirió camines nuevos que cargan un peso aproximado a 15 toneladascada uno para determinar si esta afirmación es verdad se tomo una muestra de7 camiones con repletos de carga cuya carga pesaba; 15,04tonn, 14,96tonn,15tonn, 14,98tonn, 15,2tonn, 15,1tonn y 14,96tonn. Asumiendo un nivel de 181
  • 183. significancia de 0,01 verificar que los camiones si cumplen con el pesoestablecido.Ho: u=15tonn Ha: u≠2 u es diferente de dos 1) Bilateral 2) 99% 0,01 gl=n-1 gl= 10-1= 9 t=±3,250 3) nʯ30 T-student 4) GRAFICA 2Xi (Xi-X) (Xi-X) 15,04 0,006 0,000032653 14,96 -0,074 0,005518367 15 -0,034 0,00117551 14,98 -0,054 0,002946939 15,2 0,166 0,027461224 15,1 0,066 0,004318367 14,96 -0,074 0,005518367 - 105,24 0,000000000000008881784197 0,046971429 – – 5) 182
  • 184. 6) Aceptamos la hipótesis nula y rechazamos la hipótesis alternativa ya que el peso que puede transportar cada camión se encuentra en la zona de aceptación.ORGANIZADOR GRÁFICO LAS TABLAS DE LA DISTRIBUCIÓN T DE STUDENT DAN VALORES ACUMULADOS DE IZQUIERDA A DERECHA. ES UNA PRUEBA SURGE DE ESTIMAR LA ESTADISTICA PARA MEDIA DE UNA EVALUAR SI DOS DISTRIIBUCIÓN POBLACIÓN GRUPOS DIFIEREN NORMALMENTE ENTRE SI DE MANERA T - STUDENT DISTRIBUIDA CUANDO SIGNIFICATIVA EL TAMAÑO DE LA RESPECTO DE SUS MUESTRA ES PEQUEÑA. MEDIAS SIRVE PARA LA DETERMINACIÓN DE LAS DIFERENCIAS ENTRE LAS DOS MEDIAS MAESTRALES Y PARA LA CONSTRUCCIÓN DEL INTERVALO DE CONFIANZA 183
  • 185. TAREA REGRESIÓN SIMPLE Y CORRELACIÓNLa Regresión y la correlación son dos técnicas estadísticas que se puedenutilizar para solucionar problemas comunes en los negocios.Muchos estudios se basan en la creencia de que es posible identificar ycuantificar alguna Relación Funcional entre dos o más variables, donde unavariable depende de la otra variable.Se puede decir que Y depende de X, en donde Y y X son dos variablescualquiera en un modelo de Regresión Simple."Y es una función de X"Y = f(X)Como Y depende de X,Y es la variable dependiente, yX es la variable independiente.En el Modelo de Regresión es muy importante identificar cuál es la variabledependiente y cuál es la variable independiente.En el Modelo de Regresión Simple se establece que Y es una función de sólouna variable independiente, razón por la cual se le denomina tambiénRegresión Divariada porque sólo hay dos variables, una dependiente y otraindependiente y se representa así:Y = f (X)"Y está regresando por X"La variable dependiente es la variable que se desea explicar, predecir.También se le llama REGRESANDO ó VARIABLE DE RESPUESTA.La variable Independiente X se le denomina VARIABLE EXPLICATIVA óREGRESOR y se le utiliza para EXPLICAR Y. 184
  • 186. REGRESIÓN LINEAL SIMPLEEn el estudio de la relación funcional entre dos variables poblacionales, unavariable X, llamada independiente, explicativa o de predicción y una variable Y,llamada dependiente o variable respuesta, presenta la siguiente notación:Y=a+bX+eDonde:a: es el valor de la ordenada donde la línea de regresión se intercepta con eleje Y.b: es el coeficiente de regresión poblacional (pendiente de la línea recta)e: es el errorSUPOSICIONES DE LA REGRESIÓN LINEAL 1. Los valores de la variable independiente X son fijos, medidos sin error. 2. La variable Y es aleatoria 3. Para cada valor de X, existe una distribución normal de valores de Y (subpoblaciones Y) 4. Las variancias de las subpoblaciones Y son todas iguales. 5. Todas las medias de las subpoblaciones de Y están sobre la recta. 6. Los valores de Y están normalmente distribuidos y son estadísticamente independientes.ESTIMACIÓN DE LA ECUACIÓN DE REGRESIÓN MUESTRALConsiste en determinar los valores de "a" y "b " a partir de la muestra, es decir,encontrar los valores de a y b con los datos observados de la muestra. Elmétodo de estimación es el de Mínimos Cuadrados, mediante el cual seobtiene: 185
  • 187. Luego, la ecuación de regresión muestral estimada esQue se interpreta como:a es el estimador de aEs el valor estimado de la variable Y cuando la variable X = 0b es el estimador de b , es el coeficiente de regresiónEstá expresado en las mismas unidades de Y por cada unidad de X. Indica elnúmero de unidades en que varía Y cuando se produce un cambio, en unaunidad, en X (pendiente de la recta de regresión).Un valor negativo de b sería interpretado como la magnitud del decremento enY por cada unidad de aumento en X. PRUEBA DE HIPÓTESISA partir de esta unidad estudiaremos lo relacionado a probar diferentes tipos dehipótesis, empezando por definir que es una hipótesis y una prueba dehipótesis, enlistaremos los pasos para probar una hipótesis, y realizaremospruebas de hipótesis relativas a la media de una población y a las medias dedos poblaciones.¿Qué es una hipótesis?Hipótesis es una afirmación o suposición respecto al valor de un parámetropoblacionalSon ejemplos de hipótesis, o afirmaciones hechas sobre un parámetropoblacional las siguientes:ʯ El ingreso mensual promedio de todos los ciudadanos es $4500.00ʯ El 20% de los delincuentes capturados son sentenciados a prisión 186
  • 188. ʯ El 90% de las formas fiscales son llenadas correctamenteTodas estas hipótesis tienen algo en común, las poblaciones de interés son tangrandes que no es factible estudiar todos sus elementos. Como ya sabemos,una alternativa a estudiar la población entera es tomar una muestra de lapoblación de interés. De esta manera podemos probar una afirmación paradeterminar si la evidencia soporta o no la afirmación.¿Qué es una prueba de hipótesis?Una prueba de hipótesis comienza con una afirmación o suposición acerca deun parámetro poblacional, tal como la media poblacional. Una hipótesis podríaser que la colegiatura que pagan los estudiantes universitarios de la RepúblicaMexicana es en promedio de 3000 pesos. Para comprobar esta hipótesis nopodríamos contactar a todos los estudiantes universitarios de la república, elcosto sería exorbitante. Para probar la validez de esta afirmación podríamosseleccionar una muestra de la población de estudiantes y basados en ciertasreglas de decisión, aceptar o rechazar la hipótesis. Si la media muestral fuerade 1000 pesos ciertamente tendríamos que rechazar la hipótesis, pero si lamedia muestral fuera 2990 pesos ¿podríamos asumir que la media poblacionalsi es de 3000 pesos?, ¿podemos atribuir al error de muestreo la diferencia de10 pesos entre las dos medias, o es una diferencia significativa?Prueba de hipótesis es un procedimiento basado en una evidencia muestral yla teoría de la probabilidad, usado para determinar si la hipótesis es unaafirmación razonable para no ser rechazada, o es una afirmación pocorazonable y ser rechazada.Procedimiento de 4 pasos para probar una hipótesisHay un procedimiento de cuatro pasos que sistematizan la prueba de hipótesis.Para ilustrar el procedimiento, completemos el ejemplo anterior. Supongamosque la muestra es de 20 estudiantes y el nivel de significancia es de .05. Loscuatro pasos son los siguientes:Paso 1. Establecer las hipótesis nula y alternaEl primer paso es establecer la hipótesis a ser probada. Esta es llamada lahipótesis nula, simbolizada por H0, el subíndice cero implica “cero diferencia”.Usualmente el término “no” es encontrado en la hipótesis nula significando “nocambio”. La hipótesis nula de la introducción podría ser “la colegiatura mensual 187
  • 189. promedio de los estudiantes universitarios no es diferente de 3000 pesos”. Estoes lo mismo que decir “…es igual a 3000 pesos”. La hipótesis nula se puedesimbolizar H0: µ = 3000.La hipótesis nula es una afirmación que será aceptada si los datos de lamuestra no nos proveen de evidencia convincente de que es falsa, es decir, sise acepta la hipótesis nula decimos que la evidencia no es suficiente pararechazarla pero no podemos afirmar que es verdadera.La hipótesis alterna es la afirmación que se acepta si se rechaza la hipótesisnula. Esta hipótesis, también llamada hipótesis de investigación, se simbolizacon Ha. La hipótesis alterna es aceptada si la evidencia proporcionada por lamuestra es suficiente para afirmar que la Ho es falsa.En este ejemplo las hipótesis serían las siguientes:Ho: La colegiatura promedio de los estudiantes no es diferente de 3000 pesosHo: µ = 3000Ha: La colegiatura promedio de los estudiantes es diferente de 3000 pesosHa: µ ≠ 3000Paso 2. Determinar el criterio de contrasteDeterminar el criterio de contraste consiste en especificar el nivel designificancia, el tipo de distribución, y los valores críticos.Existen cuatro posibilidades al tomar una decisión respecto a una hipótesis: Aceptar Ho Rechazar Ho Decisión Error Ho verdadera correcta Tipo I Error Decisión Ho falsa Tipo II correctaNivel de significancia es la probabilidad de rechazar una hipótesis nulaverdadera 188
  • 190. El nivel de significancia es simbolizado por α, y también es conocido comonivel de riesgo. Este último término es más apropiado porque es el riesgo quese toma de rechazar una hipótesis verdadera.No hay un nivel de significancia para todos los estudios, se puede utilizarcualquier valor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de .05 esaplicado a proyectos de investigación, el nivel .01 a control de calidad, y .10 asondeos políticos. Tú como investigador debes decidir el nivel de significanciaantes de colectar la muestra de datos.El tipo de distribución se determinará dependiendo de la naturaleza de lahipótesis y del tamaño de la muestra. Cuando la hipótesis es relativa a mediaspoblacionales y las muestras son grandes (n>30) se utiliza la distribuciónnormal. Cuando es relativa a la media y la muestra es chica (n≤30) se utiliza ladistribución t de student.Los valores críticos son los valores de la variable de la distribución que limitanel área crítica, que es la parte de la curva que corresponde al nivel designificancia.En este ejemplo el nivel de significancia es de .05, se utiliza la distribución t destudent porque la muestra es pequeña, los valores críticos se encontraron de lasiguiente maneraEl área crítica cuando la hipótesis alterna tiene el símbolo ( ≠ ) se divide en dosy se dice que el problema es de dos colas, y cada cola vale α/2. Si la Ha tieneel signo (<) el problema es de la cola izquierda, si tiene el signo(>) es de la coladerecha, y en ambos casos la cola vale α. Este problema es de dos colas: 189
  • 191. Paso 3. Calcular el estadístico de pruebaEl estadístico de prueba es un valor obtenido de la información de la muestrapara compararlo con el criterio de contraste y rechazar o aceptar la hipótesis. Elestadístico de prueba cambia de acuerdo a la distribución que se utilice. Eneste problema el estadístico de prueba es t y se simboliza t*Supongamos que las colegiaturas de los estudiantes universitariosentrevistados son las siguientes:2821 3102 2398 2511 32222329 3109 2725 3627 29333822 3044 3125 2650 27413054 3281 2292 2952 2462La media y la desviación estándar de la muestra son 2910 y 411.95respectivamente, se procede enseguida a calcular el error estándar y la t*Paso 4. Tomar decisión y conclusiónUna regla de decisión es establecer las condiciones sobre las cuales lahipótesis nula es rechazada o no rechazada. Si el estadístico de prueba quedadentro de la zona crítica la hipótesis nula deberá ser rechazada. Si el 190
  • 192. estadístico de prueba queda fuera de la zona crítica la hipótesis nula nodeberá ser rechazada.En el ejemplo de las colegiaturas, como el estadístico de prueba quedó fuerade la zona crítica la hipótesis nula no puede ser rechazada. La conclusiónpodría ser la siguiente:“No hay evidencia suficiente para afirmar que la colegiatura que pagan enpromedio los estudiantes universitarios es diferente de 3000 pesos, en un nivelde significancia de .05” DISTRIBUCIÓN T-STUDENTEn probabilidad y estadística, la distribución t-Student es una distribución deprobabilidad que surge del problema de estimar la media de una poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño.Una variable aleatoria se distribuye según el modelo de t-Student con n gradosde libertad, donde n es un entero positivo, si su función de densidad es lasiguiente: n 1 ( ) 1 2 t2 2 ( n 1) (1 ) n n ( p) x p 1e x dx ( ) nf(t)= 2 , - t , 0 siendo p>0La gráfica de esta función de densidad es simétrica respecto del eje deordenadas, con independencia del valor de n, y de forma semejante a ladistribución normal. 191
  • 193. Propiedades: n 7. La media es 0 y su varianza n 2 , n>2. 8. La gráfica de la función de densidad es en forma de campana. 9. Los datos están más disperso que la curva normal estándar. 10. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1). 11. La gráfica es muy parecida a la de la normal estándar diferenciándose en que las colas de t están por encima de la normal, y el centro se encuentra por debajo del de la normal. 12. Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal. EJERCICIOS1.- El gerente de personal de la empresa P&C quiere estudiar la relación entreel ausentismo y la edad de sus trabajadores, tomó una muestra aleatoria de 10trabajadores de la empresa y encontró los siguientes datos. Ausentismo Edad (años) (días por año) 25 18 450 625 324 313,29 43,56 46 12 552 2116 144 10,89 0,36 58 8 464 3364 64 234,09 11,56 37 15 555 1369 225 32,49 12,96 55 10 550 3025 100 151,29 1,96 32 13 416 1024 169 114,49 2,56 41 7 287 1681 49 2,89 19,36 50 9 450 2500 81 53,29 5,76 23 16 368 529 256 388,09 21,16 60 6 360 3600 36 299,29 29,16 192
  • 194. PRIMER MÉTODO SEGUNDO MÉTODO193
  • 195. TERCER MÉTODO CUARTO MÉTODO QUINTO MÉTODO y Serie 1 50 f(x)=-0.25985876*x+22.495969; R²=0.7281 40 30 20 10 x-5 5 10 15 20 25 30 35 40 45 50 55 60 65 70 -10 -20194
  • 196. 2.- El banco de préstamos estudia la relación entre ingreso (X) y de ahorros (Y)mensuales de sus clientes. a) Determinar la ecuación lineal de las dos variables. b) Trace el diagrama de dispersión en el plano cartesiano 400 350 300 Axis Title 250 200 150 Y 100 Linear (Y) 50 0 0 200 400 600 800 1000 Axis Title c) Estime el ingreso que corresponde a un ahorro semanal de 90 dólares. d) Si el ahorro es de 200 dólares que gasto puede realizar el obrero en dicha semana. e) Si el ingreso es de 350 dólares cual es el salario. 195
  • 197. DesarrolloIngresos Ahorros x Y XY X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2 350 100 35000 122500 10000 -283,33 80275,89 -111,11 12345,43 400 110 44000 160000 12100 -233,33 54442,89 -101,11 10223,23 450 130 58500 202500 16900 -183,33 33609,89 -81,11 6578,83 500 160 80000 250000 25600 -133,33 17776,89 -51,11 2612,23 950 350 332500 902500 122500 316,67 100279,89 138,89 19290,43 850 350 297500 722500 122500 216,67 46945,89 138,89 19290,43 700 250 175000 490000 62500 66,67 4444,89 38,89 1512,43 900 320 288000 810000 102400 266,67 71112,89 108,89 11857,03 600 130 78000 360000 16900 -33,33 1110,89 -81,11 6578,83 5700 1900 1388500 4020000 491400 410000 90288,89 Primer caso X= Y= 196
  • 198. 3.- Un comerciante mayorista encargo un estudio para determinar la relaciónentre los gastos de publicidad semanal por radio y las ventas de sus productos.En el estudio se obtuvieron los siguientes resultados.Semana 2 3 4 5 6 7 8 9 10 11Gasto de Publicidad ($) 30 20 40 30 50 70 60 80 70 80Venta ($) 300 250 400 - 550 750 630 930 700 840En la quinta semana por diversos motivos no se pudo hacer el estudio a) Determine la ecuación de regresión de ventas sobre gastos de publicidad Semanas Ingresos Ahorros x Y xy 2 30 300 9000 900 90000 -25,6 652,80 -294,44 86694,91 3 20 250 5000 400 62500 -35,55 1263,80 -344,44 118638,91 4 40 400 16000 1600 160000 -15,55 241,80 -194,44 37806,91 6 50 550 27500 2500 302500 -5,55 30,80 -44,44 1974,91 7 70 750 52500 4900 562500 14,45 208,80 155,56 24198,91 8 60 630 37800 3600 396900 4,45 19,80 35,56 1264,51 9 80 930 74400 6400 864900 24,45 597,80 335,56 112600,51 10 70 700 49000 4900 490000 14,45 208,80 105,56 11142,91 11 80 840 67200 6400 705600 24,45 597,80 245,56 60299,71 500 5350 338400 31600 3634900 0,05 3822,22 454622,22X= 197
  • 199. Y= 198
  • 200. b. Estime la cosecha si se aplica 12 sacos de fertilizantes. 1000 800 Axis Title 600 400 Ahorros Y 200 0 Linear (Ahorros Y) 0 50 100 Axis Titlec. Determina el coeficiente de determinación. De su comentario sobre estevalores yr= -5,27 + 10,79(30) yr= 318,434.- Se obtuvieron los siguientes datos para determinar la relación entrecantidad de fertilizante y producción de papa por hectárea.Sacos de fertilizante por hectárea 3 4 5 6 7 8 9 10 11 12Rendimiento en quintales 45 48 52 55 60 65 68 70 74 76 a) Encuentre la ecuación de regresión de la cosecha sobre el fertilizante, por el método de mínimos cuadrados. 199
  • 201. b. Estime la cosecha si se aplica 12 sacos de fertilizantes ¿Cuánto es el error oresidual? -76=1.63 es el error.c. Determina el coeficiente de determinación. De su comentario sobre estevalores
  • 202. 5.- El número de horas de estudio invertidas y las calificaciones finales en un curso de matemáticas de una muestra 10 alumnos ha dado los siguientes resultados: Alumno Horas de estudio 14 16 22 20 18 16 18 22 10 8 Calificación 12 13 15 15 17 11 14 16 8 5 a) Determine la recta de regresión de la calificación sobre el número de horas de estudio invertidos. Interprete la ecuación de regresión. Horas de CalificaciónAlumno XY Estudio X YA1 14 12 168 196 -2,40 5,76A2 16 13 208 256 -0,40 0,16A3 22 15 330 484 5,60 31,36A4 20 15 300 400 3,60 12,96A5 18 17 306 324 1,60 2,56A6 16 11 176 256 -0,40 0,16A7 18 14 252 324 1,60 2,56 201
  • 203. A8 22 16 352 484 5,60 31,36A9 10 8 80 100 -6,40 40,96A10 8 5 40 64 -8,40 70,56 6.- Sobre la base de una muestra de tamaño 28 se encontró que la ecuación de regresión muestral de gastos mensuales (Y) sobre tamaño de la familia (X) es: Además la covarianza de Y con X es igual a 32, y la desviación estándar de Y es igual a 5, a) Determine el coeficiente de correlación y analizar la bondad del ajuste de la línea de regresión con el coeficiente de determinación. 202
  • 204. 7.- Una muestra de 60 de las 350 agencias de ventas de automóviles de unaimportadora registrada en un mes con X (autos vendidos por agencia), Y(ventas en miles de dólares) ha dado los siguientes resultados: a) Determine la ecuación de regresión:Ecuación b) Calcule el coeficiente de terminación ¿Qué porcentaje de la variación total es explicada por la regresión? 203
  • 205. 8.- Los contadores con frecuencia estiman los gastos generales basados en elnivel de producción. En la tabla que sigue se da la información recabada sobregastos generales y las unidades producidas en 10 plantas y se desea estimaruna ecuación de regresión para estimar gastos generales futuros.Gastos generales ($) 300 1000 1100 1200 600 800 900 500 400 200Unidades producidas 15 45 55 75 30 40 45 20 18 10 a) Determine la ecuación de regresión y haga un análisis del coeficiente de regresión. 204
  • 206. –205
  • 207. 9.- Las cantidades de un compuesto químico (Y) que se disuelven en 100gramos de agua a diferentes temperaturas (X) se registraron en la tabla quesigue: X (°C) Y gramos 0 10 8 10 9 11 11,8 15 15 12 14 16 18 15 30 27 23 25 24 26 25 45 33 30 32 35 34 32,8 60 46 40 43 42 45 43,2 75 50 52 53 54 55 52,8 225 180,6 X (°C) Y gramos 0 11,8 0 0 139,24 1406,25 139,24 15 15 225 225 225 225 225 30 25 750 900 625 900 625 45 32,8 1476 2025 1075,84 2025 1075,84 60 43,2 2592 3600 1866,24 3600 1866,24 75 52,8 3960 5625 2787,84 5625 2787,84 206
  • 208. PRIMER MÉTODOSEGUNDO MÉTODOTERCER MÉTODO 207
  • 209. 10.- Una muestra de 60 de las 350 agencias de ventas de automóviles de unaimportadora registrada en un mes con X (autos vendidos por agencia), Y(ventas en miles de dólares) ha dado los siguientes resultados:Determine la ecuación de regresión:Ecuación 208
  • 210. Calcule el coeficiente de terminación ¿Qué porcentaje de la variación totales explicada por la regresión?11.- Los contadores con frecuencia estiman los gastos generales basados en elnivel de producción. En la tabla que sigue se da la información recabada sobregastos generales y las unidades producidas en 10 plantas y se desea estimaruna ecuación de regresión para estimar gastos generales futuros.Gastos generales($) 300 1000 1100 1200 600 800 900 500 400 200Unidadesproducidas 15 45 55 75 30 40 45 20 18 10 209
  • 211. N x Y X2 Y2 XY (xi-x)2 (yi-y)21 300 15 90000 225 4500 160000,00 412,092 1000 45 1000000 2025 45000 90000,00 94,093 1100 55 1210000 3025 60500 160000,00 388,094 1200 75 1440000 5625 90000 250000,00 1576,095 600 30 360000 900 18000 10000,00 28,096 800 40 640000 1600 32000 10000,00 22,097 900 45 810000 2025 40500 40000,00 94,098 500 20 250000 400 10000 40000,00 234,099 400 18 160000 324 7200 90000,00 299,2910 200 10 40000 100 2000 250000.00 640.09sumatoria 7000 353 6000000 16249 309700 1100000,00 3788,10Determine la ecuación de regresión y haga un análisis del coeficiente deregresión. 210
  • 212. Diagrama de dispersión en el plano cartesiano 80 70 60 50 40 Series1 30 20 10 0 0 200 400 600 800 1000 1200 1400PASOS DE UNA PRUEBA DE HIPOTESISPrimer paso formular la hipótesis nula y la hipótesis alternativaHipótesis nulaHo = β=0La hipótesis alternativaHa= β<0; β>0Segundo paso determinar si la prueba es unilateral o bilateralBilateralTercer paso Asumir el nivel se significación de la prueba99% 2.58 211
  • 213. Cuarto paso determinar la distribución muestral que se usara en la pruebaQuinto paso elaborar el esquema de la prueba -2.58 +2.58Sexto paso calcular el estadístico de la prueba 3 212
  • 214. CONCLUSIONES:  Mediante el presente trabajo he podido conocer y aplicar sobre regresión, prueba de hipótesis y t-student, además he aprendido sobre las relaciones que existen entre las variables dentro de un problema.  Con el desarrollo de varios problemas con respecto al tema he podido practicar y aprender las relaciones existentes: relación infinita, positiva perfecta, negativa imperfecta, nula etc.RECOMENDACIONES:  Es de vital ayuda poner en práctica los conocimientos aprendidos ya que nos servirán dentro de nuestra carrera.  Es necesario identificar el coeficiente de correlación dentro de dos variables porque estas se aplican dentro del desarrollar un proyecto. 213
  • 215. CRONOGRAMA DE ACTIVIDADES DIAS Mayo Junio Julio M V S M M V S M V S M V S ACTIVIDAD 22 25 26 29 V1 S2 M5 V8 S9 12 15 16 18 22 23 26 29 30 M3 M4 J5 Responsable Msc. Jorge P. Recepción de Clases Copias del texto Tamara A. Desarrollo del marco teórico Tamara A. Desarrollo de los ejercicios Tamara A. Propuesta de ejercicios Tamara A. Entrega de Trabajo Tamara A.
  • 216. BIBLIOGRAFÍARodríguez, María Elene, ÁlvareZ, Sergio y Bravo, Ernesto. 2001. Coeficientes de Asociación.México : Plaza y Valdés S.A, 2001.Sabadías, Antonia Vargas. 1995. Estadística Descriptiva e Inferencial. Cuenca : CIDI, 1995.Williams, Thomas A. 2008. Estadística para Administración y Economía. México : CengageLearning Editores S.A, 2008. ANEXOSEjercicio # 1Dados los siguientes datos referentes a horas trabajadas en una maquila(X), y a unidades de cobijas producidas (Y), determinar la recta de regresiónel coeficiente de correlación lineal e interpretarlo y resolver por medio de los5 métodos. 215
  • 217. PRIMER MÉTODOSEGUNDO MÉTODO 216
  • 218. TERCER MÉTODOCUARTO MÉTODOQUINTO MÉTODO 217
  • 219. y Serie 1 500 f(x)=3.4734043*x+31.741135; R²=0.9101 450 400 350 300 250 200 150 100 50 x -150 -100 -50 50 100 150 200 250 300 350 400 -50 -100Ejercicio # 2Se exporta café ecuatoriano a Japón y según los datos obtenidos en elestudio de mercado, se puede evidenciar el año en el cual se exporto grancantidad de este grano en miles de toneladas. 218
  • 220. PRIMER MÉTODOSEGUNDO MÉTODO 219
  • 221. TERCER MÉTODOCUARTO MÉTODOQUINTO MÉTODO 220
  • 222. y Serie 1 250 f(x)=3.4734043*x+31.741135; R²=0.9101 200 150 100 50 x -80 -60 -40 -20 20 40 60 80 100 120 140 160 180 200 220 -50Ejercicio # 3De una población se toma una muestra de 40 observaciones. La mediamuestral es de 102 y la desviación estándar 5. De otra población se tomauna muestra de 50 observaciones. La media mustral es ahora 99 y ladesviación estándar es 6. Realice la siguiente prueba de hipótesis usandocomo nivel de significancia 0,04.Ho: u1 = u2Ho: u1 ≠ u2a) Es esta una prueba de una o de dos colas? Esta es una prueba de hipótesis de dos colasb ) Establezca la regla de decisión Si Z > que le valor crítico, se rechaza la hipótesis nula y se acepta lahipótesis alternativac) Calcule el valor del estadístico de pruebaSi Z > que el valor crítico, se rechaza la hipótesis nula y se acepta 221
  • 223. H1d) Cuál es su decisión respecto a la hipótesis nula? Como su valor calculado Z (2,59) > 2,05; se rechaza la hipótesis nula y seacepta la hipótesis alternativa Si Z tabulada es 0,5 - 0,02 = 0,48 este valor en la tabla es 2,05e) Cuál es el valor p? Z = 2,59 Area 0,4952 0,5 - 0,4952 = 0,0048 * 2 = 0,0096Ejercicio # 4Prueba la hipótesis H0 : p = 0.4 H1 : p ʯ0.4 Presuma que = 0.45, n = 200, y ʯ= .01.Solución: H0 : p = 0.4 H1 : p ʯ0.4 Usando ʯ = .01, el diagrama de la región de rechazo es: .005 .005 -2.575 2.575 Calculando el valor z para la proporción muestral p = 0.45), 222
  • 224. obtenemos: 0.4(1 0.4) p 0.0346 200 0.45 0.4 Z= 1.45 0.0346 Dibujando z = 1.45 en el diagrama de la región de rechazo (Paso 2) obtenemos: 1.45 .005 .005 -2.575 2.575 Como el valor z está fuera de la región de rechazo (sombreada), por lo tanto no rechazamos Ho. La proporción en la población es 0.4.Ejercicio # 5Suponer una variable aleatoria X para designar el peso de un pasajero deavión, que se interesa en conocer el peso promedio de todos los pasajeros.Como hay limitaciones de tiempo y dinero para pesarlos a todos, se tomauna muestra de 36 pasajeros de la cual se obtiene una media muestral X= 160 libras. Suponga además que la distribución de los pasajeros tenga unadistribución normal con desviación estándar = 30. Con un nivel designificancia de .05. ¿ Se puede concluir que el peso promedio de todos lospasajeros es menor que 170 libras?Datos n =36X = 160 libras = 30 = .051. Establecer la hipótesisHo: 170Ha: < 170 223
  • 225. 2. Establecer la estadística de prueba X Z= n3. Definir el nivel de significancia y la zona de rechazo -1.64 Nivel de significancia = .05 Zona de rechazo = { Z/ Z -1.64}4. Calcular la estadística de prueba X Z= n la media poblacional esta bajo la hipótesis nula 160 170 10 Z 2 30 5entonces tenemos 36Hacer liga con nivel de significancia y zona de rechazo5. Regla de decisión basada en la estadística de prueba Como -2 es menor que -1.64 la hipótesis nula se rechaza con un nivel designificancia de 0.05. 224
  • 226. 6. ConclusiónAsí podemos afirmar: que el peso promedio de todos los pasajeroscorresponde a un valor menor de 170 libras con .Ejercicio # 6La producción promedio de leche diaria por vaca en la provincia en losmeses de verano ha sido en los años anteriores de 10.1 litro. Este año enuna muestra simple aleatoria de 16 días de los meses de verano se obtuvouna producción media diaria por vaca de 9.8 litros con una varianza muestralde 1.21. ¿Hay razón para afirmar que ha variado la producción de lechediaria promedio por vaca?. Considere distribución normal y = 0.05Esta es una prueba paramétrica sobre media, ya que de lo que se trata esde verificar si ha tenido variación la producción diaria promedio de leche porvaca.La información que nos brinda el problema es la siguiente: = 10.1 σ² = ? n = 16 x = 9.8 S2 = 1.21 S = 1.1 2Estamos en el caso en que se desconoce la varianza poblacional ( ) y n30, luego tenemos que trabajar con la distribución tstudent, para el cálculode la R.C.1.- Formulación de las hipótesisHo: = 10.1H1: 10.1Aquí Ho nos expresa que la producción promedio de leche es de 10.1 y H 1que la producción promedio de leche varió, es decir puede ser mayor ómenor.2.- Nivel de significación = 0,05 225
  • 227. PRUEBA CHI - CUADRADOPruebas Paramétricas. Se llama así a las pruebas de hipótesis quecumplen tres requisitos fundamentales: 1. La variable de la prueba debe ser la variable cuantitativa. 2. Los datos se obtienen por muestreo estadístico. 3. Los datos deben ajustarse a determinadas distribuciones estadísticas.Ejemplos. 1. La prueba basada en la distribución normal de probabilidades. 2. La prueba de student.Pruebas No Paramétricas.- llamadas también pruebas de distribución libre.Son aquellas que: 1. La variable de la prueba puede ser cualitativa o cuantitativa. 2. Los datos se obtienen por muestreo estadístico. 3. Son independientes de cualquier distribución de probabilidad.Ejemplo.La prueba de Chi – Cuadrado (también llamada prueba Ji –Cuadrado).Las pruebas paramétricas son mas poderosas. Sin embargo cuando lavariable es cualitativa, sólo se puede usar las pruebas no paramétricas.El Estadístico Chi – CuadradoEn un estadístico que sirve de base para una prueba no paramétricadenominada prueba chi – cuadrado que se utiliza especialmente paravariables cualitativas, esto es, variables que carecen de unidad y por lo tantosus valores no pueden expresarse numéricamente. Los valores de estasvariables son categorías que sólo sirven para clasificar los elementos deluniverso del estudio. También puede utilizarse para variables cuantitativas,transformándolas, previamente, en variables cualitativas ordinales.El estadísticos chi- cuadrado se define por 226
  • 228. En donde:n= número de elementos de la muestra.n-1= número de grados de libertads2= varianza de la muestraa2= varianza de la poblaciónDesarrollaremos un ejemplo numérico con la finalidad de fijar el concepto deChi – cuadrado.Ejemplo:En un estudio de la capacidad de aprendizaje de matemáticas, en los niñosde una población, se tomó una muestra representativa de 40 niños. Se lesaplicó una prueba de diagnostico del aprendizaje en matemáticas y con losdatos obtenidos se calculó la varianza s2=8.4, conociendo que la varianzapoblacional es de α2= 12,37, calcular el valor del estadístico chi-cuadrados.Datos:n= 40 S2= 8,4 a2= 12,37Ahora vamos a elaborar el concepto de DISTRIBUCIÓN MUESTRAL DELESTADÍSTICO CHI- CUADRADO.Supongamos que se realiza los pasos siguientes: 1. De una población de N elementos se extrae todas las muestras posibles del mismo tamaño n. 227
  • 229. 2. Con los datos de cada muestra se calcula el estadístico chi – cuadrado. 3. Con todos los valores de Chi – cuadrado se forma una distribución de frecuencias; éstas se denomina distribución muestral del Chi- cuadrado.Esta distribución muestral se representa gráficamente en un sistema decoordenadas, colocando en el eje de abscisas los valores del estadísticoChi- cuadrado.Cuadrado en el eje vertical se colocan las frecuencias de cada valor del chi-cuadrado.El área encerrada bajo la curva y el eje horizontal es igual a uno yrepresentar la probabilidad de que Chi-cuadrado tome valores mayores que0.El área rayada situada a la derecha de la ordenada levantada en la abscisax2 (gl), representa la probabilidad de cometer el error tipo l en la prueba dechi-cuadrado. Esta probabilidad es el nivel de significación de la prueba.El valor x2 (gl) se llama valor crítico del chi-cuadrado y se determina pormedio de una tabla especial, que representa al final del libro el aprendizajede tablas.Antes de entrar en el manejo de la tabla debemos tener encuentra que parauna probabilidad dad, por ejemplo =0.05, al aumentar el número de gradosde libertada también aumenta el valor crítico de Chi-cuadrado; esto seilustra en las tres figuras siguientes: 228
  • 230. Este crecimiento del valor crítico se debe a que el aumentar el número degrados de libertad, la curva de la distribución muestral de Chi-cuadradotiende a tomar una forma más extendida y por tanto el punto crítico sedesplaza hacia la derecha.Descripción y manejo de la tabla.- La tabla de valores críticos de x2 seencuentra en el apéndice. En la línea horizontal superior encabezando encada columna se hayan los valores de .En la primera columna de la izquierda están los grados de libertad. Losejemplos siguientes el manejo de la tabla. 1. Ejemplo: =0.05 y gl= 4 g de l 229
  • 231. A partir de gl=4g de l, dirigimos una visual hacia la derecha hasta cortar a la visual que baja por =0.05; en la intersección se encuentra el valor crítico 2. Ejemplo: Si Hallamos x2 (6)=12.592 3. Ejemplo: Si Encontramos x2 (10) = 18.307Con estos 9 valores de la variable de estudio X, vamos a elaborar el cuadrode frecuencias observadas correspondientes a las 10 categoríasestablecidas.Cuadro 11. 3. 2 Intervalos Conteo Frecuencias Observadas Menos de 6,26 a 6, 26 IIII - I 6 6 , 26 a 11,62 IIII - I 6 11,62 a 15,51 III 3 15,51 a 18,80 IIII 5 18,80 a 21,96 IIII 4 21,96 a 25,12 IIII - IIII 10 25,12 a 28,41 III 3 28,41 a 32,30 IIII 4 32,30 a 37,66 IIII 4 37,66 a más. IIII 5A continuación debemos realizar la clasificación y conteo de los 50 datos, esdecir, colocar a cada uno de ellos dentro de su categoría representándolopor una tarja. La suma de las tarjas de cada clase da la frecuenciaobservada de esta clase. 230
  • 232. Para facilitar el cálculo del estadístico chi-cuadrado mediante la fórmulaindicadaAgregamos las frecuencias observadas y esperadas en celdas tal como sepresenta a continuación. Recordemos que se fijo la frecuencia esperada de5 en cada intervalo, luego:Frecuencia observada O, y frecuencia esperada E, en la Prueba Chi-cuadrado de Bondad de Ajuste. Ei 5 5 5 5 5 5 5 5 5 5 Oi 6 6 3 5 4 10 3 4 4 57) Toma de decisionesObservamos que este valor de Chi-cuadrado, en el esquema grafico (figura11.3.5) se ubica en la regresión de aceptación, luego aceptamos esto es,que la muestra se obtiene de una población distribuida normalmente.ProblemaDe una investigación demográfica se conoce que los habitantes de ciertospaíses se distribuyen en la forma siguiente: 0- 20 años, 25%; 21 – 40 años,35%; 41 -61 años, 25%; 61 -80 años, 10%; 81 – 100 años, 5%.Después de transcurridos varios años se quiso probar que la distribuciónpoblacional de las edades no ha cambiado para lo que se selecciono unamuestra respectiva de 1000 personas y se observo que las frecuencias de 231
  • 233. las 5 categorías fueron: 0- 20 años, 200; 21 – 40 años, 300; 41 -61 años,300; 61 -80 años, 100; 81 – 100 años, 100. 1) la distribución actual por edades es igual a la del año de ejecución del censo La distribución actual por edades no es igual a la del año de ejecución 2) La prueba es unilateral y de cola derecha 3) Nivel de significación a= 0.10 4) Se utiliza la distribución CHI – CUADRADOESQUEMA DE LA PRUEBA Existen k= 5 celdas, tenemos gl = K-1 = 5-1=4 grados de libertad a = 0.10 en la tabla de CHI – CUADRADO obtenemos 7.779 77.14 232
  • 234. 5) CALCULO DEL ESTADÍSTICO DE LA PRUEBA 250 350 250 100 50200 300 300 100 100Las frecuencias observadas nos las proporcionan con la muestra aleatoriade los 1.000 habitantes.CALCULO DE LAS FRECUENCIAS ESPERADAS = 1.000 X 25% = 250 = 1.000 X 35% = 350 = 1.000 X 25% = 250 = 1.000 X 105% = 100 = 1.000 X 5% = 50CALCULO DEL ESTADISTICO CHI – CUADRADO = + = 10+7.14+10+0+50 = 77.14 233
  • 235. 6) TOMA DE DECISIONES Vemos que el estadístico calculado CHI – CUADRADO (77.14) es mayor que el valor critico encontrado en la tabla (7.779) vemos que 77.14 cae en la región de rechazo por lo tanto rechazamos y aceptamos , es decir la distribución actual por edades no es igual a la de la investigación demográfica.CORRECCIÓN DE YATESCuando el número de grados de libertad es igual a la unidad, es necesariorealizar una corrección por continuidad durante el cálculo del estadístico dela prueba. Esta corrección se denomina de yates y consiste en disminuir en0.05 al valor absoluto de la diferencia entre las frecuenciasobservadas y as frecuencias esperadas.El ejemplo siguiente ilustra la aplicación de esta corrección.PROBLEMAEn el año de 1960, la proporción de hombres y mujeres de cierta instituciónde enseñanza superior, fue de 75% y 25%, respectivamente. Con la finalidadde verificar si el transcurso del tiempo había originado algún cambio en lasproporciones de estudiantes de ambos sexos, en el año de 1970 se tomóuna muestra aleatoria de 100 alumnos de 1º ciclo, obteniendo 60 hombres y40 mujeres. Con estos datos realizar la verificación por medio de la pruebade CHI – CUADRADO, asumiendo el nivel de significación de a= 5%. 1) la distribución de hombres y mujeres en el año de 1970 también es de 75% y de 25% respectivamente 234
  • 236. La distribución de hombres y mujeres en el año de 1970 no es del 75% ni del 25% respectivamente 2) La prueba es universal y de cola derecha 3) Nivel de significación a= 0.05 4) Emplearemos la distribución muestral de CHI – CUADRADO 3.841 11.21 5) ESQUEMA DE LA PRUEBA Existen 2 categorías entonces K= 2 y gl = K – 1 =2-1=1 a= 0.05 con estos datos vamos a la tabla de CHI – CUADRADO y obtenemos 3.841. 6) CALCULO DEL ESTADÍSTICO DE LA PRUEBA 75 25235
  • 237. 60 40 OBTENCIÓN DE LOS VALORES ESPERADOS Valor esperado para los hombres: 100 x 75% = 75 Valor esperado para las mujeres: 100 x 25% = 25 CACULO DEL ESTADÍSTICO DE LA PRUEBA Como gl = 1 utilizaremos la corrección de yates =2.8+8.41= 11.21 7) TOMA DE DESICIONES Como el valor de CHI – CUADRADO es de 11.21, mayor que el valor CHI – CUADRADO afirmamos que 11.21 cae en la región de rechazo, luego rechazamos la por lo tanto afirmamos que la distribución de hombres y mujeres no es del 75% ni del 25% respectivamente. 236
  • 238. En un estudio realizado en el departamento de investigación del ESANacerca del perjuicio étnico hacia el negro. En los universitarios de lima seaplicoUna encuesta a los universitarios según su lugar de procedencia,obteniendo los resultados que presenta la siguiente tabla Lugar de residencia Grado de Barriadas Barrios Barrios total perjuicio populares residenciales intermedios Alto 32 225 50 307 Bajo 28 290 79 397 Total 60 515 129 704Al nivel de significación Q=0.05, determinar que las variables perjuicio étnicohacia el negro y lugar de residencia son independientes 1. Ho: el perjuicio étnico y el lugar de residencia son independientes H1: existe dependencia entre las variables. 2. La prueba es unilateral y la cola derecha 3. Asumimos el nivel de significación de Q= 0.05 4. Utilizaremos la distribución muestral de chi-cuadrado porque las dos variables son cualitativas. 5. Esquema de la pruebaGl =(C-1) (F-1) 1.1.3.4Gl =(3-1) (2-1) = 2 11.3.4Gl= 2Q= 0.05X2 = (2) = 5.991C= # de columnasF= # de filas 6. Calculo del estadístico de la prueba x= 3.54 5.991 Formula 237
  • 239. 2 X2= 3.54Ya conocemos las frecuencias observadas para determinar las frecuenciasesperadas emplearemos la misma tabla, manteniendo invariables defrecuencias marginales de dos variables Lugar de Residencia Grado de Barriadas Barrios Barrios total perjuicio populares residenciales (intermedios) Alto E11 E12 E13 307 Bajo E21 E22 E23 397 Total 60 515 129 704Cuando las variables X y Y son independientes, las frecuencias de cadacelda son igual al productos de las frecuencias marginales correspondientesdividido por el tamaño de la muestra. 26.16 224.58 56.25 32 225 50 33.84 290.42 72.75 28 290 79 238
  • 240. Las frecuencias esperadas y las asociadas determinan las frecuenciasobservadas anteriormenteORGANIZADOR GRÁFICO SI SE EXTRAEN TODAS LAS MUESTRAS POSIBLES DE UNA POBLACIÓN NORMAL Y A CADA MUESTRA SE LE CALCULA SU VARIANZA EL ÁREA BAJO UNA CURVA CHI- CUADRADA Y SOBRE CHI - LOS VALORES DE X2 SON MAYORES O EL EJE HORIZONTAL ES 1. CUADRADO IGUALES QUE 0. FORMA DE UNA DISTRIBUCIÓN X2 DEPENDE DEL GL=N-1. EN CONSECUENCIA, HAY UN NÚMERO INFINITO DE DISTRIBUCIONES X2. 239

×