Your SlideShare is downloading. ×
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Portafolio Estadística Inferencial
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Portafolio Estadística Inferencial

1,140

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,140
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
21
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL PORTAFOLIO DE ESTADÍSTICA INFERENCIAL DOCENTE: MSC. JORGE POZO INTEGRANTES: 6° “B” – Comercio Exterior MARZO 2012- AGOSTO 2012 Tulcán – Ecuador
  • 2. INTRODUCCIONLa estadística inferencial es necesaria cuando queremos hacer algunaafirmación sobre más elementos de los que vamos a medir. La estadísticainferencial hace que ese salto de la parte al todo se haga de una manera“controlada”. Aunque nunca nos ofrecerá seguridad absoluta, sí nos ofreceráuna respuesta probabilística. Esto es importante: la estadística no decide;sólo ofrece elementos para que el investigador o el lector decidan. Enmuchos casos, distintas personas perciben diferentes conclusiones de losmismos datos.El proceso será siempre similar. La estadística dispone de multitud demodelos que están a nuestra disposición. Para poder usarlos hemos deformular, en primer lugar, una pregunta en términos estadísticos. Luegohemos de comprobar que nuestra situación se ajusta a algún modelo (si nose ajusta no tendría sentido usarlo). Pero si se ajusta, el modelo nosofrecerá una respuesta estadística a nuestra pregunta estadística. Es tareanuestra devolver a la psicología esa respuesta, llenándola de contenidopsicológico.La estadística descriptiva, como indica su nombre, tiene por finalidaddescribir. Así, si queremos estudiar diferentes aspectos de, por ejemplo, ungrupo de personas, la estadística descriptiva nos puede ayudar. Lo primeroserá tomar medidas, en todos los miembros del grupo, de esos aspectos ovariables para, posteriormente, indagar en lo que nos interese. Sólo conesos indicadores ya podemos hacernos una idea, podemos describir a eseconjunto de personas. 1
  • 3. OBJETIVO DE LA ESTADÍSTICALa estadística es el conjunto de técnicas que se emplean para larecolección, organización, análisis e interpretación de datos. Los datospueden ser cuantitativos, con valores expresados numéricamente, ocualitativos, en cuyo caso se tabulan las características de lasobservaciones. La estadística sirve en administración y economía para tomarmejores decisiones a partir de la comprensión de las fuentes de variación yde la detección de patrones y relaciones en datos económicos yadministrativos.JUSTIFICACIÓNEl presente portafolio tiene como justificación recolectar todo el trabajo dadoen clases como portafolio de apoyo del estudiante y además ampliar mas elcontenido con investigaciones bibliográficas de libros ya que esto nospermitirá analizar e indagar de los temas no entendidos para auto educarseel estudiante y así despejar los dudas que se tiene con la investigación y elanálisis de cada uno de los capítulos ya que la estadística inferencial esamplia y abarca problemas que estas relacionados con el entorno parapoder sacar nuestras propias decisiones ya que la estadística inferencial nosayudara a la carrera en la que estamos siguiendo como lo es comercioexterior ampliar mas nuestros conocimientos y utilizar más el razonamiento ysacar conclusiones adecuadas según el problema que se presente en elentorno ay que las matemáticas y la estadística nos servirá a futuro para asípoderlos emplear a futuro . 2
  • 4. CAPITULO I EL SISTEMA INTERNACIONAL DE UNIDADESLas unidades del sistema internacional de unidades se clasifican enfundamentales y derivadas. Las unidades fundamentales no se puedenreducir. Se citan las unidades fundamentales de interés en la asignatura deciencias e ingenierías de os materiales.Las unidades derivadas se expanden en función de las unidadesfundamentales utilizando signos matemáticos de multiplicación y de división.Por ejemplo las unidades de densidad del sí son el kilogramo por metrocubico algunas unidades derivadas tienen nombres y símbolos especiales.Unidad de masa El kilogramo (kg) es igual a la masa del prototipointernacional del kilogramo (Diaz, 2008)Unidad de tiempo El segundo (s) es la duración de 9 192 631 770 periodosde la radiación correspondiente a la transición entre los dos nivelesHIPERFINOS del estado fundamental del átomo de cesio 133. (Diaz, 2008)Unidad de intensidad de corriente eléctrica El ampere (A) es la intensidadde una corriente constante que manteniéndose en dos conductoresparalelos, rectilíneos, de longitud infinita, de sección circular despreciable y 3
  • 5. situados a una distancia de un metro uno de otro en el vacío, produciría unafuerza igual a 2·10-7 newton por metro de longitud. (Diaz, 2008)Unidad de temperatura termodinámica El kelvin (K), unidad detemperatura termodinámica, es la fracción 1/273,16 de la temperaturatermodinámica del punto triple del agua. (Diaz, 2008)Unidad de cantidad de sustancia El mol (mol) es la cantidad de sustanciade un sistema que contiene tantas entidades elementales como átomos hayen 0,012 kilogramos de carbono 12. (Diaz, 2008)Unidad de intensidad luminosa La candela (CD) es la unidad luminosa, enuna dirección dada, de una fuente que emite una radiación monocromáticade frecuencia 540·1012 HERTZ y cuya intensidad energética en dichadirección es 1/683 WATT por estereorradián. (Diaz, 2008)Peso: es una magnitud derivada se considera como una unidad vectorial.(Diaz, 2008)Escalar: aquel que indica el número y la unidad. (Diaz, 2008)Vector: indica número unidad dirección etc. (Diaz, 2008)Magnitud derivada: el peso de la unidad newton es una unidad de fuerza.(Diaz, 2008)Gravedad: es la que permite a los cuerpos caer en perpendiculares según lagravedad de la tierra (Diaz, 2008) MULTIPLOS Y SUBMULTIPLOSMúltiploUn múltiplo de un número es otro número que lo contiene un número enterode veces. En otras palabras, un múltiplo de n es un número tal que, divididopor n, da por resultado un número entero Los primeros múltiplos del uno aldiez suelen agruparse en las llamadas tablas de multiplicar. (Pineda, 2008) 4
  • 6. SubmúltiploUn número entero a es submúltiplo de otro número b si y sólo si b es múltiplode a, (Pineda, 2008).COMENTARIO:El Sistema Internacional de Unidades (SI) tiene la finalidad de: Estudiar elestablecimiento de un conjunto de reglas para las unidades de medida ycomo estudiantes de comercio exterior nos ayuda muchísimo porque con elpodemos obtener los resultados al almacenar una mercancía en elcontenedor sin perder el tiempo que es valioso en la carrera, y también siperder el espacio dentro de dicho contenedor.El sistema internacional de unidades es estudiado para obtener datos realesy a su vez poder dar nuestros resultados sacando conclusiones propias de lacarrera Para una comunicación científica apropiada y efectiva, es esencialque cada unidad fundamental de magnitudes de un sistema, seaespecificada y reproducible con la mayor precisión posible. 5
  • 7. ORGANIZADOR GRAFICO: Sistema Internacional de Medidas y Unidades Para resolver el problema que suponga la utilización de unidades diferentes en distintos lugares del mundo, en la XI Conferencia General de Pesos y Medidas (París, 1960) se estableció el Sistema Internacional de Unidades (SI). En el cuadro siguiente puedes ver las magnitudes fundamentales del SI, la unidad de cada una de ellas y la abreviatura que se emplea para representarla:Magnitudes fundamentales Magnitudes derivadas Múltiplos SubmúltiplosUna magnitud fundamental Son la que Un número es un Un múltiplo de n eses aquella que se define dependen de las submúltiplo si otro lo un número tal que, dividido por n, da porpor sí misma y es magnitudes contiene varias veces resultado un númeroindependiente de las fundamentales. exactamente. Ej.: 2 es enterodemás (masa, tiempo, un submúltiplo de 14,longitud, etc.). ya que 14 lo contiene 7 veces.= 14 = 2 • 7 6
  • 8. TRABAJO # 1 MÚLTIPLOS Y SUBMÚLTIPLOSMÚLTIPLOS.- Se pueden obtener múltiplos de cualquier número, sonaquellos que se obtiene al sumar el mismo número varias veces o almultiplicarlo por cualquier número. (son infinitos), (Aldape & Toral, 2005,pág. 94).Ejemplo:Múltiplos de 5:5-10-15-20-25-30-35-405-500-1000SUBMÚLTIPLOS.- Los submúltiplos son todo lo contrario, son las divisionesexactas de un número, (Aldape & Toral, 2005).Por ejemplo :Submúltiplos de 30:6, 10, 5, 2, 3, etc. 7
  • 9. MAGNITUDES FUNDAMENTALES Y DERIVADASLAS MAGNITUDES FUNDAMENTALES.- Una magnitud fundamental esaquella que se define por sí misma y es independiente de las demás (masa,tiempo, longitud, etc.).  LONGITUD: Es la medida del espacio o la distancia que hay entre dos puntos. La longitud de un objeto es la distancia entre sus extremos, su extensión lineal medida de principio a fin, (Serway & Faughn, 2006).  MASA: Es la magnitud que cuantifica la cantidad de materia de un cuerpo, (Serway & Faughn, 2006).  TIEMPO: Es la magnitud física que mide la duración o separación de acontecimientos sujetos a cambio, de los sistemas sujetos a observación, (Serway & Faughn, 2006).  INTENSIDAD DE CORRIENTE ELECTRICA: Se denomina intensidad de corriente eléctrica a la cantidad de electrones que pasa a través de una sección del conductor en la unidad de tiempo, (Serway & Faughn, 2006).  TEMPERATURA: Es una magnitud referida a las nociones comunes de calor o frío. Por lo general, un objeto más "caliente" tendrá una temperatura mayor, (Serway & Faughn, 2006).  INTENSIDAD LUMINOSA: En fotometría, la intensidad luminosa se define como la cantidad flujo luminoso, propagándose en una dirección dada, que emerge, atraviesa o incide sobre una superficie por unidad de ángulo solido, (Enríquez, 2002).  CANTIDAD DE SUSTANCIA: Su unidad es el mol. Surge de la necesidad de contar partículas o entidades elementales microscópicas indirectamente a partir de medidas macroscópicas (como la masa o el volumen). Se utiliza para contar partículas, (Enríquez, 2002). 8
  • 10. MAGNITUDES DERIVADAS.- Son la que dependen de las magnitudesfundamentales.  VELOCIDAD: Es la magnitud física que expresa la variación de posición de un objeto en función del tiempo, o distancia recorrida por un objeto en la unidad de tiempo, (Enríquez, 2002).  AREA: Área es la extensión o superficie comprendida dentro de una figura (de dos dimensiones), expresada en unidades de medida denominadas superficiales, (Enríquez, 2002).  VOLUMEN: Es una magnitud definida como el espacio ocupado por un cuerpo, (Enríquez, 2002).  FUERZA: se puede definir como una magnitud vectorial capaz de deformar los cuerpos (efecto estático), modificar su velocidad o vencer su inercia y ponerlos en movimiento si estaban inmóviles, (Enríquez, 2002).  TRABAJO: El trabajo, en mecánica clásica, es el producto de una fuerza por la distancia que recorre y por el coseno del ángulo que forman ambas magnitudes vectoriales entre sí, (Enríquez, 2002).  La unidad del trabajo es el JOULE.  ENERGIA: Es una magnitud física abstracta, ligada al estado dinámico de un sistema y que permanece invariable con el tiempo en los sistemas aislados. La unidad de la energía es el Joule, (Enríquez, 2002). 9
  • 11. Fórmulas de área y volumen de cuerpos geométricosFigura Esquema Área VolumenCilindroEsferaConoCubo A = 6 a2 V = a3 A = (perim. base •h) + 2 • V = área basePrisma area base •hPirámide 10
  • 12. CONCLUSIONES  El sistema internacional de unidades es muy importante porque se involucra en nuestra carrera permitiendo la relación económica con otros países mediante comercio internacional y su negociación entre ellos. como también la práctica de problemas del sistema internacional de unidades nos ayudan a ver la realidad de nuestro entorno de cómo podemos solucionar problemas al momento de exportar una mercancía, que cantidad de materia prima, electrodomésticos, enceres que actualmente se exporta en gran cantidad, puede alcanzar dentro de un contenedor.  El sistema internacional de unidades nos ayudan a vincularnos en los negocios, como realizar negociaciones en el exterior porque a través de este sistema podemos indicar el volumen, área, del tipo de trasporte el cual se va a exportar la mercancía, que cantidad de cajas por ejemplo podemos enviar al exterior este sistema es muy fundamental en la carrera de comercio exterior.Recomendaciones  Se recomienda saber todas las medidas del sistema internacional de unidades como también las magnitudes , longitud, masa y volumen de las figuras geométrica para que nuestro producto o mercancía pueda ser exportada al exterior, es necesario conocer debido a que nos permitirá realizar una buena negociación conociendo la cantidad de mercancía que puede introducirse en el transporte.  Es de mucha importancia, que como estudiantes de la carrera de comercio exterior conozcamos las unidades básicas más utilizadas que se encuentran presentes en el Sistema internacional para una correcta aplicación en los ejercicios propuestos. La utilización de las medidas del Sistema Internacional se presenta a nivel internacional y por ende son aplicadas en el los negocios de Comercio Internacional ya que permite una mejor movimiento e intercambio. 11
  • 13. 12
  • 14. BIBLIOGRAFÍAAldape, A., & Toral, C. (2005). Matemáticas 2. México: PROGRESO S.A.Altamirano, E. (2007).Anderson, D. R. (2005). Estadística para Administración y Economía.México: Cengage Learning.Diaz, R. G. (2008). Unidades fundamentales .Enríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA S.A.Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A.García, M. A. (2000). Estadística Avanzada con el Paquete Systat. Murcia:I.S.B.N.J.R, W. D. (20007). Ciencias e Ingenieria de las Materias . 13
  • 15. Pineda, L. (2008). matematicas.Rodrígues, M. E. (2001). Coeficientes de Asociación. México: Plaza yValdés.Sabadías, A. V. (2001). Estadística Descriptiva e Inferencial . Murcia:COMPOBELL.Serway, R. A., & Faughn, J. S. (2006). FÍSICA para bachillerato general.New York: THOMSON.Weiers, R. M. (2006). Introducción a la Estadística para Negocios. México:Learning Inc.Willliams, T. A. (2008). Estadística para Administración y Economía. México:Cengage Learning.LINKOGRAFIAhttp://www.sc.ehu.es/sbweb/fisica/unidades/unidades/unidades.htmfile:///K:/Tabla-de-Magnitudes-Unidades-Y-Equivalencias.htmfile:///K:/books.htmfile:///K:/volumenes/areas_f.htmlfile:///K:/cuerposgeoAreaVolum.htmANEXOS:1.- Convertir 2593 Pies a Yardas. 14
  • 16. 2.- Convertir 27,356 Metros a Millas3.- Convertir 386 Kilogramos a Libras.4.- Convertir 2,352 Segundos a Año.5.- Convertir 1.1 Millas/Hora a Metros/Segundo. 15
  • 17. TRANSFORMACIONESEn muchas situaciones tenemos que realizar operaciones con magnitudesque vienen expresadas en unidades que no son homogéneas. Para que loscálculos que realicemos sean correctos, debemos transformar las unidadesde forma que se cumpla el principio de homogeneidad, (Ledanois & Ramos,2002).Por ejemplo, si queremos calcular el espacio recorrido por un móvil que semueve a velocidad constante de 72 Km/h en un trayecto que le lleva 30segundos, debemos aplicar la sencilla ecuación S = v·t, pero tenemos elproblema de que la velocidad viene expresada en kilómetros/hora, mientrasque el tiempo viene en segundos. Esto nos obliga a transformar una de lasdos unidades, de forma que ambas sean la misma, para no violar el principiode homogeneidad y que el cálculo sea acertado, (Ledanois & Ramos, 2002).Para realizar la transformación utilizamos los factores de conversión.Llamamos factor de conversión a la relación de equivalencia entre dosunidades de la misma magnitud, es decir, un cociente que nos indica losvalores numéricos de equivalencia entre ambas unidades, (Ledanois &Ramos, 2002).EJERCICIOS REALIZADOS EN CLASEVolumen 300 transformar en pulgadas 3V= 100000 16
  • 18. V= 100000Q= 7200000Vol. Paralelepípedo L xaxhVol. CuboVol. EsferaVol. CilindroVol. PirámideÁrea cuadradaÁrea de un rectángulo BxhÁrea de un circuloÁrea de un trianguloEn una bodega tiene un largo de 60 m un ancho de 30 m cuantas cadjas demanzana puede ubicar en esta bodega en estas cajas tiene 60cm de lado y30 de ancho y 40 de altura.Vol. de p bodega = l x a h = 60 x 30 x3 = 5400Vol. De p caja = 60 x 30 x 40 = 72000 17
  • 19. TRANSFORMACIÓNX=Un tanquero tiene una longitud de 17 m y un radio del tanque de 1.50 m.¿Cuántos litros se puede almacenar en dicho tanque?.RESOLUCIONVOL. CILINDRO =VOL. CILINDRO= 3.1416 X (1.50 X (17)= 0 120.17TRANSFORMACIÓN120.17 18
  • 20. SISTEMA INTERNACIONAL DE UNIDADESLONGITUD1 Km 1000 m1m 100 cm1 cm 10 mm1 milla 1609 m1m 1000 mmMASA1qq 100 lbs.1 Kg 2.2 lbs.1 qq 45.45 Kg1 qq 1 arroba1 arroba 25 lbs.1 lb 454 g1 lb 16 onzas1 utm 14.8 Kg1 stug 9.61 Kg1m 10 Kg1 tonelada 907 KgÁREA 1001 100001 hectárea 100001 acre 40501 pie (30.48 cm1 pie 900.291 10.76 19
  • 21. COMENTARIO EN GRUPO:Como comentario en grupo podemos decir que las transformaciones nosservirá en la carrera del comercio exterior y además poder resolverproblemas que se presenten ya que al realizar ejercicios de cilindros ytanque etc., y otras formas geométricas nos servirá para determinar cuántascajas o bultos, etc. que pueden alcanzar en una almacenera o en cada unode los contenedores esto nos servirá al realizar prácticas o al momento deemprender nuestro conocimientos a futuro.ORGANIZADOR GRAFICO: 20
  • 22. LONGITUDObservamos que desde los submúltiplos, en la parte inferior, hasta losmúltiplos, en la parte superior, cada unidad vale 10 veces más que laanterior, (Riley & Sturges, 2004). LONGITUD 1 KM 100 M 1M 100M, 1000MM 1 MILLA 1609M 1 PIE 30,48CM, 0,3048M 1 PULGADA 2,54CM 1 AÑO LUZ 9,46X1015MTIEMPO.El tiempo es la magnitud física con la que medimos la duración o separaciónde acontecimientos sujetos a cambio, de los sistemas sujetos a observación,esto es, el período que transcurre entre el estado del sistema cuando ésteaparentaba un estado X y el instante en el que X registra una variaciónperceptible para un observador (o aparato de medida). El tiempo ha sidofrecuentemente concebido como un flujo sucesivo de situacionesatomizadas, (López, March, García, & Álvarez, 2004). MEDIDAS DEL TIEMPO 1 AÑO 365 DIAS 1 MES 30 DIAS 1SEMANA 7 DIAS 1 DIA 24 HR 1 HORA 60 MIN,3600SEG 1 MINUTO 60 SEG.MASA Y PESO.La masa es la única unidad que tiene este patrón, además de estar enSevres, hay copias en otros países que cada cierto tiempo se reúnen paraser regladas y ver si han perdido masa con respecto a la original. Elkilogramo (unidad de masa) tiene su patrón en: la masa de un cilindrofabricado en 1880, compuesto de una aleación de platino-iridio (90 % platino 21
  • 23. - 10 % iridio), creado y guardado en unas condiciones exactas, y que seguarda en la Oficina Internacional de Pesos y Medidas en Seres, cerca deParís, (Hewitt, 2004).PESODe nuevo, atención a lo siguiente: la masa (la cantidad de materia) de cadacuerpo es atraída por la fuerza de gravedad de la Tierra. Esa fuerza deatracción hace que el cuerpo (la masa) tenga un peso, que se cuantifica conuna unidad diferente: el Newton (N), (Torre, 2007). SISTEMA DE CONVERSION DE MASA 1 1000 KG TONELADA 1 QQ 4 ARROBAS, 100 L 1 ARROBA 25 L 1 KG 2,2 L 1 SLUG 14,58 KG 1 UTM 9,8 KG 1 KG 1000 GR 1L 454 GR, 16 ONZAS 22
  • 24. TRABAJO # 223
  • 25. 24
  • 26. 25
  • 27. 26
  • 28. 27
  • 29. 28
  • 30. 29
  • 31. 30
  • 32. 31
  • 33. CONCLUSIÓN:La conversión de unidades es la transformación de una cantidad, expresadaen una cierta unidad de medida, en otra equivalente. Este proceso suelerealizarse con el uso de los factores de conversión y las tablas deconversión del Sistema Internacional de Unidades.Frecuentemente basta multiplicar por un factor de conversión y el resultadoes otra medida equivalente, en la que han cambiado las unidades.Cuando el cambio de unidades implica la transformación de varias unidadesse pueden utilizar varios factores de conversión uno tras otro, de forma queel resultado final será la medida equivalente en las unidades que buscamos.Cuando se trabaja en la resolución de problemas, frecuentemente surge lanecesidad de convertir valores numéricos de un sistema de unidades a otro,por lo cual es indispensable tener conocimientos sobre las equivalencias delos diferentes sistemas de unidades que nos facilitan la conversión de unaunidad a otra, tomando en cuenta el país y la medida que se emplee en losdiferentes lugares.RECOMENDACIÓN:En toda actividad realizada por el ser humano, hay la necesidad de medir"algo"; ya sea el tiempo, distancia, velocidad, temperatura, volumen,ángulos, potencia, etc. Todo lo que sea medible, requiere de alguna unidadcon qué medirlo, ya que las personas necesitan saber qué tan lejos, qué tanrápido, qué cantidad, cuánto pesa, en términos que se entiendan, que seanreconocibles, y que se esté de acuerdo con ellos; debido a esto esnecesario tener conocimientos claros sobre el Sistema De Conversión DeUnidades pues mediante el entendimiento de este sistema o patrón dereferencia podremos entender y comprender con facilidad las unidades demedida las cuales las podremos aplicar en la solución de problemas denuestro contexto. 32
  • 34. CRONOGRAMA DE ACTIVIDADES: MES DE MARZO-ABRILACTIVIDADES M J V S D L MInvestigar sobre el Sistema Internacional de Unidades y la X XÁreas y volúmenes de diferentes figuras geométricasEjecución del Formato del Trabajo XResumen de los textos investigados X XFinalización del Proyecto XPresentación del Proyecto XBIBLIOGRAFIAEnríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA S.A.Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A.García, M. A. (2000). Estadística Avanzada con el Paquete Systat. Murcia:I.S.B.N.Hewitt, P. G. (2004). Física Conceptual. México: Pearson Educación S.A.J.R, W. D. (20007). Ciencias e Ingenieria de las Materias .Ledanois, J. M., & Ramos, A. L. (2002). Magnitudes, Dimensiones yConversiones de Unidades. Caracas: EQUINOCCIO.López, J. C., March, S. C., García, F. C., & Álvarez, J. M. (2004). Curso deIngeniería Química. Barcelona: REVERTÉ S.A.Pineda, L. (2008). matematicas.Riley, W. F., & Sturges, L. F. (2004). ESTÁTICA. Barcelona: REVERTÉ.LINKOGRAFIA: 33
  • 35. http://es.wikipedia.org/wiki/Magnitud_fundamental#Unidades_en_el_Siste ma_Internacional_de_Unidades_.28SI.29 http://es.wikipedia.org/wiki/Superficie_%28matem%C3%A1tica%29 http://www.quimicaweb.net/ciencia/paginas/magnitudes.html http://www.profesorenlinea.cl/geometria/VolumenCilindro.htm http://mimosa.pntic.mec.es/clobo/geoweb/volum1.htm http://www.sc.ehu.es/sbweb/fisica/unidades/unidades/unidades.htmANEXOS:1.- Investigar las medidas de un tráiler, de una mula y de un camión sencillo,además las medidas de las cajas de plátano, manzanas, quintales de papa yarroz. Con esa información calcular el número de cajas y quintales quealcanzan en cada uno de los vehículos. TRAILER MULA CAMION SENCILLO Largo 14.30m Largo 8.27m Largo 10.80m Ancho 2.45m Ancho 2.50m Ancho 2.60m Alto 2.6m Alto 1.44m. Alto 4.40mMedidas de las cajas: Medidas de las cajas de plátano LARGO ANCHO ALTO 20cm 51cm 34cm Medidas de las cajas de manzana 7.5cm 9.5cm 7.5cm 34
  • 36. Desarrollo: 35
  • 37. a.1 caja de plátano-----------------911*10-05m3 X 91.09m3 b.1 caja de manzana-----------------5.3*108m3 X 9.11*10-05m3 c. 36
  • 38. 1 qq de papa-----------------0.05m3 X 9.11*10-05m3 d.1 qq de arroz-----------------0.05m3 X 9.11*10-05m3 e.1 caja de plátano-----------------911*10-05m3 X 29.77m3 37
  • 39. f.1 caja de manzana-----------------5.3*108m3 X 29.77m3 g.1 qq de papa-----------------0.05m3 X 29.77m3 . h.1 qq de arroz-----------------0.05m3 X 9.11*10-05m3 38
  • 40. i.1 caja de plátano-----------------911*10-05m3 X 123.55m3 j.1 caja de manzana-----------------5.3*108m3 X 123.55m3 k.1 qq de papa-----------------0.05m3 X 123.55m3 39
  • 41. . l.1 qq de arroz-----------------0.05m3 X 123.55m3 . 40
  • 42. CRONOGRAMA DE ACTIVIDADES DEL PRIMER CAPÍTULO: Tiempo MARZO ABRIL MAYOActividades SEMANAS SEMANAS SEMANAS 1 2 3 4 1 2 3 4 1 2 3 4PRIMERA CLASECompetencia especifica X(27-Marzo-2012)Introducción de la Materia x(27-Marzo-2012)SEGUNDA CLASESistema Internacional deUnidades X(03-Abril-2012)Tarea Sistema Internacionalde Unidades.Entregar el 10 de abril del X2012TERCERA CLASEAplicación detransformaciones X(17 de abril del 2012)Tarea Ejercicios deaplicación acerca delSistema Internacional de Xunidades según lastransformaciones(24 de abril del 2012)CUARTA CLASEEvaluación primer capitulo x(03 de Mayo del 2012)41
  • 43. 42
  • 44. 43
  • 45. CAPITULO IIMARCO TEORICO: COEFICIENTE DE CORRELACIÓN Y REGRESIÓN LINEALLa correlación estadística determina la relación o dependencia que existe entre lasdos variables que intervienen en una distribución bidimensional. Es decir,determinar si los cambios en una de las variables influyen en los cambios de laotra. En caso de que suceda, diremos que las variables están correlacionadas oque hay correlación entre ellas.  Una medida estadística ampliamente utilizada que mide el grado de relación lineal entre dos variables aleatorias. El coeficiente de correlación debe situarse en la banda de -1 a +1. El coeficiente de correlación se calcula dividiendo la covarianza de las dos variables aleatorias por el producto de las desviaciones típicas individuales de las dos variables aleatorias. Las correlaciones desempeñan un papel vital en la creación de carteras y la gestión de riesgos, (Weiers, 2006).Comentario:  A una correlación se la puede apreciar con un grupo de técnicas estadísticas empleadas para medir la intensidad de dicha relación entre dos variables, en donde se deben identificar la variable dependiente y la independiente.DIAGRAMA DE DISPERSIÓNRepresentación gráfica del grado de relación entre dos variables cuantitativas. 44
  • 46. Características principalesA continuación se comentan una serie de características que ayudan acomprender la naturaleza de la herramienta.Impacto visualUn Diagrama de Dispersión muestra la posibilidad de la existencia de correlaciónentre dos variables de un vistazo.ComunicaciónSimplifica el análisis de situaciones numéricas complejas.Guía en la investigaciónEl análisis de datos mediante esta herramienta proporciona mayor información queel simple análisis matemático de correlación, sugiriendo posibilidades yalternativas de estudio, basadas en la necesidad de conjugar datos y procesos ensu utilización, (García, 2000).Comentario:  El diagrama de dispersión sirve para una representación gráfica más fácil y útil cuando se quiere describir el comportamiento de un conjunto de dos variables, en donde aparece representado como un punto en el plano cartesiano.COEFICIENTE DE CORRELACIÓN RECTILINEA DE PEARSONEn estadística, el coeficiente de correlación de Pearson es un índice que mide larelación lineal entre dos variables aleatorias cuantitativas. A diferencia de lacovarianza, la correlación de Pearson es independiente de la escala de medida delas variables. 45
  • 47. De manera menos formal, podemos definir el coeficiente de correlación dePearson como un índice que puede utilizarse para medir el grado de relación dedos variables siempre y cuando ambas sean cuantitativas.  El coeficiente de correlación es una medida de asociación entre dos variables y se simboliza con la literal r; los valores de la correlación van de + 1 a - 1, pasando por el cero, el cual corresponde a ausencia de correlación. Los primeros dan a entender que existe una correlación directamente proporcional e inversamente proporcional, respectivamente, (Willliams, 2008).Comentario:  El coeficiente de correlación de Pearson nos da una idea de que tan relacionadas están dos variables, este número varía entre 0 y 1; si el coeficiente es > 0.9, entonces es una buena correlación y cuando un coeficiente es < 0.3 indica que las variables no están correlacionadas entre ellas y por lo que el 1 representa una correlación perfecta.INTERPRETACIÓN DE UN COEFICIENTE DE CORRELACIÓNEl coeficiente de correlación como previamente se indicó oscila entre –1 y +1encontrándose en medio el valor 0 que indica que no existe asociación lineal entrelas dos variables a estudio. Un coeficiente de valor reducido no indicanecesariamente que no exista correlación ya que las variables pueden presentaruna relación no lineal como puede ser el peso del recién nacido y el tiempo degestación. En este caso el r infraestima la asociación al medirse linealmente. Losmétodos no paramétrico estarían mejor utilizados en este caso para mostrar si lasvariables tienden a elevarse conjuntamente o a moverse en direcciones diferentes.  Como ya se ha planteado el grado de correlación mide la intensidad de relación lineal, ya sea directa, inversa o inexistente entre dos variables, se 46
  • 48. dice que es directa si tiene signo positivo, inversa de signo negativo y nula cuando el valor sea aproximadamente igual a cero, (Anderson, 2005).Comentario:  El coeficiente de correlación mide solo la relación con una línea recta, dos variables pueden tener una relación curvilínea fuerte, a pesar de que su correlación sea pequeña; por lo tanto cuando analicemos las relaciones entre dos variables debemos representarlas gráficamente y posteriormente calcular el coeficiente de correlación para un mejor entendimiento.FORMULAREGRESIÓN LINEAL SIMPLEElegida una de las variables independientes y representadas los valores de lavariable bidimensional, si observamos que la función que mejor se adapta a laforma de la nube de puntos es una recta, tendremos un problema de regresiónlineal. Si hemos elegido el carácter X como variable independiente, tendremos a larecta de regresión de Y sobre X. Si elegimos Y como variable independiente, seobtendrá la recta de regresión de X sobre Y.Regresión Lineal Simple.- suponga que tenemos una única variable respuestacuantitativa Y, y una única variable predictora cuantitativa X. Para estudiar larelación entre estas dos variables examinaremos la distribución condicionales de Ydado X=x para ver si varían cuando varia x. (MORER, 2004) 47
  • 49. COMENTARIO:  Podemos concluir diciendo que una de las variables independientes y representadas los valores que mejor se adapta a la forma de la nube de puntos es una recta, tendremos un problema de regresión lineal. A demás el hecho de entender de que se trata una regresión lineal y saberla aplicar relacionando dos variables nos será de mucha ayuda en nuestro futuro ya que nos permitirá aplicar lo aprendido en problemas reales que se nos presenten en nuestra vida profesional como por ejemplo el saber que tan buena resulta una relación entre exportaciones e importaciones que el Ecuador ha realizado y así con esto poder tomar decisiones.CORRELACIÓN POR RANGOSCuando se obtienen datos en parejas, tales como observaciones de dos variablespara un mismo individuo, deseamos conocer si las dos variables estánrelacionadas o no y de estarlo, el grado de asociación entre ellas.Correlación Por Rangos.- Este coeficiente de Sperman, es muy utilizado eninvestigaciones de mercado, especialmente cuando no se deben aplicar medidascuantitativas para ciertas características cualitativas, en aquellos casos , en dondese pueden aplicar ambos coeficientes de correlación, encontraremos que susresultados son bastante aproximados. (BENCARDINO, 2006)COMENTARIO:  Son datos en pareja para poder conocer la relación que existe entre ellas para un solo individuo en común, y medir el grado de asociación entre ellas. Esto es muy interesante ya que en un futuro nos ayudara en lo que nos vamos a desarrollar que es un ambiente de negocios, ya que podemos aplicar esta técnica estadística aprendida, y así poder solucionar problemas que se nos presenten comúnmente y saber que tan buena es la relación 48
  • 50. entre las dos variables propuestas es decir nos ayudara mucho ya que nos dará una idea de que tan relacionadas linealmente están dos variables y si su relación es positiva o negativa.RANGOLa diferencia entre el menor y el mayor valor. En {4, 6, 9, 3, 7} el menor valor es 3,y el mayor es 9, entonces el rango es 9-3 igual a 6. Rango puede significartambién todos los valores de resultado de una función.Rango.- es una categoría que puede aplicarse a una persona en función de susituación profesional o de su status social. Por ejemplo: “Tenemos que respetar elrango del superior a la hora de realizar algún pedido”, “Diríjase a mi sin olvidar surango o será sancionado. (MORER, 2004)COMENTARIO:  Rango es el valor que se diferencia entre el menor y el mayor valor. Rango puede significar también todos los valores de resultado de una función, y se puede así relacionar y correlacionar a dos variables para obtener resultados que nos ayudan a la toma de decisiones. A demás un rango es importante ya que nos permite la obtención de datos más exactos y pues con esto nuestro trabajo se entonara de forma más real y sobre todo de forma más precisa, y por ende tomaremos decisiones más acertadas.COMENTARIO GENERAL:La correlación y regresión lineal están estrechamente relacionadas entre si lascuales nos ayudan a comprender el análisis de los datos muéstrales para saberqué es y cómo se relacionan entre sí dos o más variables en una población quedeseemos estudiar para así poder determinar posibles resultados que nos darán 49
  • 51. en un estudio de mercado por ejemplo ya que nuestra carrera de comercio exteriorestá muy relacionada con ese ámbito.La regresión lineal por otro lado nos permitirá graficar las dos variables a estudiardeterminando su situación y si es conveniente o no desarrollar lo propuesto oinvestigado. La finalidad de una ecuación de regresión seria estimar los valores deuna variable con base en los valores conocidos de la otra.Es decir en resumen que nos permitirá tomar decisiones acertadas dentro de unestudio ya sea en una población que determinara el éxito o fracaso entre dosvariables a estudiar, y facilitara la recolección de información.ORGANIZADOR GRAFICO: ayuda a la toma de decisiones segun lo resultante en la aplicacion de estos grupodetécnic herramienta basica asestadísticas para estudios y usadasparame analisis que pueden determinar el exito o dirlafuerzadel fracaso entre dos aasociaciónen opciones tredosvariable s CORRELACION Y REGRESION LINEAL se ocupa de establecer si existe una relación así como permite evaluar de determinar su magnitud decisiones que se y dirección mientras que la tomen en una regresión se encarga poblacion principalmente de utilizar a la relación para efectuar una predicción. determinar posibles resultados como por ejemplo del exito en un estudi de mercado 50
  • 52. TRABAJO #351
  • 53. 52
  • 54. 53
  • 55. 54
  • 56. 55
  • 57. 56
  • 58. 57
  • 59. 58
  • 60. 59
  • 61. 60
  • 62. 61
  • 63. 62
  • 64. 63
  • 65. 64
  • 66. 65
  • 67. 66
  • 68. 67
  • 69. 68
  • 70. 69
  • 71. 70
  • 72. 71
  • 73. 72
  • 74. 73
  • 75. 74
  • 76. 75
  • 77. 76
  • 78. 77
  • 79. 78
  • 80. 79
  • 81. 80
  • 82. CRONOGRAMA DE ACTIVIDADES: Días Actividad Responsable Mar, 08 Mié, 09 Jue, 10 Vie,11 Sáb,12 Dom,13 Lun,14 Mar,15 Mié,16 Jue,17Copias Tamara Apraez, Diana Coral, Diana García, Tania Herrera., Janeth ReinaIniciar con Tamaralos Apraez, Dianaejercicios Coral, Diana Garcia, Tania Herrera., Janeth ReinaTerminar los Tamaraejercicios Aprez, Diana Coral, Diana García, Tania Herrera., Janeth ReinaPrueba Tamara Aprez, Diana Coral, Diana Garcia, Tania Herrera., Janeth Reina 81
  • 83. ANEXOS:Ejemplo 1:La siguiente tabla representa las puntuaciones de 7 sujetos en dos variables X eY. X: 6 3 7 5 4 2 1 Y: 7 6 2 6 5 7 2Calcule: a. El coeficiente de correlación de Pearson entre X e Y b. La recta de regresión de Y sobre X en puntuaciones directas c. La varianza de Y ( ), la varianza de las puntuaciones pronosticadas ( ) y la varianza error ( a) X Y XY X2 Y2 6 7 42 36 49 3 6 18 9 36 7 2 14 49 4 5 6 30 25 36 4 5 20 16 25 2 7 14 4 49 1 2 2 1 4 28 35 140 140 203 82
  • 84. b)c)Ejemplo 2:Se tienen los datos conjuntos de dos variables, X e Y, con los valores que semuestran en la tabla:X: 1; 3; 5; 7; 9; 11; 13Y: 1; 4; 6; 6; 7; 8; 10 a. Si utilizamos la variable X como predictora de la variable Y, ¿qué porcentaje de variabilidad de Y no puede ser explicada por la variabilidad de X?. b. ¿Qué valor pronosticaríamos en la variable Y, si en la variable X obtenemos un valor de 10? c. Suponiendo que no dispusiéramos de la información relativa a la variable X, ¿qué valor pronosticaríamos para la variable Y? (Razone su respuesta). 83
  • 85. a) Completamos la siguiente tabla: X Y XY X2 Y2 1 1 1 1 1 3 4 12 9 16 5 6 30 25 36 7 6 42 49 36 9 7 63 81 49 11 8 88 121 64 13 10 130 169 100 49 42 366 455 302El cuadrado del coeficiente de correlación (coeficiente de determinación) seinterpreta como proporción de varianza de la variable Y que se explica por lasvariaciones de la variable X. Por tanto: es la proporción de varianza noexplicada. Esta proporción multiplicada por 100 es el tanto por ciento o porcentaje.b) Aplicamos la ecuación de regresión de Y sobre X: Y= b.X + a. Siendo b lapendiente y ala ordenada cuyas expresiones aparecen entre paréntesis. 84
  • 86. c) Le pronosticaríamos la media, porque no disponiendo información de la variableX es con el que cometemos menos error de pronóstico.Ejemplo 3:Elección de la prueba estadística para medir la asociación o correlación. Lasedades en días están en escala de tipo intervalo, tenemos dos variables, entoncesaplicamos esta prueba.Objetivo: Conocer qué grado de asociación existe entre la edad y peso corporal deniños de edades desde el nacimiento hasta los 6 meses.Hipótesis.Entre las observaciones de edad de los niños y peso corporal existe correlaciónsignificativa.Ho. Entre las observaciones de edad de los niños y pero corporal no existecorrelación significativa. 85
  • 87. Ejemplo 4:Se ha evaluado a 7 sujetos su inteligencia espacial (variable X) y suspuntuaciones fueron: 13, 9, 17, 25, 21, 33, 29. Además se les pidió a los sujetosque reconocieran un conjunto de figuras imposibles (variable Y). Después decalcular la ecuación de regresión para pronosticar Y a partir de X, se sabe que 86
  • 88. para una puntuación típica de 1,2 en X se pronosticaría una puntuación típica de0,888 en Y. También se sabe que la desviación típica de las puntuacionespronosticadas para Y es 11,1. Con estos datos calcular: a. El coeficiente de correlación de Pearson entre X e Y Sujeto Xi 1 13 169 2 9 81 3 17 289 4 25 625 5 21 441 6 33 1089 7 29 841 Sumatorio 147 3535 a. La ecuación de regresión en puntuaciones diferenciales para pronosticar Y a partir de X 87
  • 89. a. La varianza de los errores del pronóstico.Ejemplo 5:De dos variables X e Y, y para un grupo de 5 sujetos, se saben los siguientesdatos que se muestran en la tabla:Calcular:a) Recta de regresión de Y sobre X en puntuaciones directas. 88
  • 90. b) Coeficiente de correlación de Pearson entre X e Yc) La varianza de las puntuaciones pronosticadas.EJEMPLO 6:Se desea importar desde el país de Colombia transformadores eléctricos. ElEcuador tiene las cotizaciones de cinco empresa diferentes, y se hace el análisisde cual empresa es la más conveniente, y las unidades que se va a vender en elpaís de importación. Valor de los Unidades posiblesEmpresas transformadores a vender X2 Y2 XY x y 1 1800 100 3.240.000 10.000 180.000 2 1500 98 2.250.000 9.604 147.000 3 1200 80 1.440.000 6.400 96.000 4 900 62 810.000 3.844 55.800 5 850 58 722.500 3.364 49.300 2 2 ∑x = 6.250 ∑y = 398 ∑x =8.462.500 ∑y =33.212 ∑xy= 528.100Fórmula: 89
  • 91. Análisis: si se obtiene ese porcentaje se puede lograr una venta exitosa para laempresa importadora.EJEMPLO 7:Se desea importar desde el país de Colombia transformadores eléctricos. ElEcuador tiene las cotizaciones de cinco empresa diferentes, y se hace el análisisde cual empresa es la más conveniente, y las unidades que se va a vender en elpaís de importación. 90
  • 92. Valor de los Unidades posiblesEmpresas transformadores a vender X2 Y2 XY x y 1 1800 100 3.240.000 10.000 180.000 2 1500 98 2.250.000 9.604 147.000 3 1200 80 1.440.000 6.400 96.000 4 900 62 810.000 3.844 55.800 5 850 58 722.500 3.364 49.300 ∑x = 6.250 ∑y = 398 ∑x2=8.462.500 ∑y2=33.212 ∑xy= 528.100Fórmula:Análisis: si se obtiene ese porcentaje se puede lograr una venta exitosa para laempresa importadora. 91
  • 93. EJEMPLO 8:La empresa MIDECAR ha clasificado como mercancías de mayor responsabilidadlas mercancías peligrosas y frágiles obteniendo así los siguientes datosmensuales sobre las toneladas de mercancías que ingresan sobre este tipo:MESES Mercancías Mercancías Peligrosas Frágiles x y x^2 y^2 xyEnero 189 85 35721 7225 16065,00Febrero 105 96 11025 9216 10080,00Marzo 125 78 15625 6084 9750,00Abril 116 48 13456 2304 5568,00Mayo 124 98 15376 9604 12152,00 659 405 91203 34433 53615 92
  • 94. 93
  • 95. La relación que existe dentro de las mercancías frágiles y peligrosas tiende apositiva como lo demuestra el resultado numérico coma la formula y al graficarespecto al eje x y eje y.EJEMPLO 9:3. De una determinada empresa Exportadora de Plátano se conocen lossiguientes datos, referidos al volumen de ventas (en millones de dólares) y algasto en publicidad ( en miles de dólares) de los últimos 6 años:a) ¿Existe relación lineal entre las ventas de la empresa y sus gastos enpublicidad? 94
  • 96. ANALISIS: En este caso r es 0.304 por tanto existe correlación ordinal positiva yes imperfecta, es decir a mayor gasto en publicidad mayor volumen de ventas.EJEMPLO 10:La empresa FERRERO desea importar nueces desde Colombia por lo cual noestá seguro que empresa de transporte contratar para la mercancía de acuerdo aesto esta empresa decide verificar los rendimientos que han tenido estasempresas en el transporte por lo cual ha hecho una investigación de mercado y aobtenido los siguientes resultados. 95
  • 97. EMPRESAS DE CALIDAD DE RENDIMIENTO XYTRANSPORTE SERVICIO (X) (Y)TRANSCOMERINTER 19 46 361 2116 874TRANSURGIN 17 44 289 1936 748TRANSBOLIVARIANA 16 40 256 1600 640SERVICARGAS 14 30 196 900 420 66 160 1102 6552 2682 rr=r= 0,038Es una relación positiva pero se podría decir que la empresa no podrá dependerde las dos variables ya que no son muy dependientes el uno del otro. 96
  • 98. EJEMPLO 11:Se está efectuando un proyecto de investigación en una empresa para determinarsi existe relación entre los años de servicio y la eficiencia de un empleado. Elobjetivo de estudio fue predecir la eficiencia de un empleado con base en los añosde servicio. Los resultados de la muestra son: Empleados Años de Puntuación Servicio de “X” eficiencia “Y” XY X2 Y2 Y` A 1 6 6 1 36 3.23 B 20 5 100 400 25 4.64 C 6 3 18 36 9 3.61 D 8 5 40 64 25 3.77 E 2 2 4 4 4 3.31 F 1 2 2 1 4 3.23 G 15 4 60 225 16 4.30 H 8 3 24 64 9 3.77 61 30 254 795 128 7 6 5 4 3 2 1 0 0 5 10 15 20 25 97
  • 99. r = .3531DESVIACIÓN ESTÁNDARb = 202 = .07652639a = 3.75 - .0765 (7.625) = 3.16 ( y - y )2 ( y - y´ )2 5.0625 7.6729 1.5625 0.0961 0.5625 0.3721 1.5625 1.5129 3.0625 1.7161 3.0625 1.5129 98
  • 100. 0.0625 0.09 0.5625 0.5929 r2 = 15.5 - 13.5659 = 0.1247 = 0.1247EJEMPLO 12:Un analista de operaciones de comercio exterior realiza un estudio para analizar larelación entre la producción y costos de fabricación de la industria electrónica. Setoma una muestra de 10 empresas seleccionadas de la industria y se dan lossiguientes datos: MILES DE MILES DEEMPRESA XY X2 Y2 UNIDADES x $y A 40 150 6000 1600 22500 B 42 140 5880 1764 19600 C 48 160 7680 2304 25600 D 55 170 9350 3025 28900 E 65 150 9750 4225 22500 F 79 162 12798 6241 26244 G 88 185 16280 7744 34225 H 100 165 16500 10000 27225 I 120 190 22800 14400 36100 J 140 185 25900 19600 34225 2 2 Σx 777 Σy 1657 Fxy 132938 Σx 70903 Σy 277119 99
  • 101. 200 180 160 140 120 100 80 60 40 20 0 0 20 40 60 80 100 120 140 160r = 1´329,380 - 1´287,489 =[709030 - 603729][2771190 - 2745949]r = ___41891 = r= _41891__ = 0.8078(105301) (25541) 51860.32DESVIACION ESTANDAR 100
  • 102. Syx = (277119) - 134.7909 (1657) - (.3978) (132.938) 10 - 2Syx = 10.53MARCO TEORICO: CORRELACIÓN Y REGRESIÓN LINEALLa correlación y la regresión están muy relacionadas entre sí. Ambas implican larelación entre dos o más variables. La correlación se ocupa principalmente. Deestablecer si existe una relación, así como de determinar su magnitud y dirección,mientras que la regresión se encarga principalmente de utilizar a la relación. Eneste capítulo analizaremos la correlación y más adelante la regresión linealRelaciones;La correlación se ocupa de establecer la magnitud y la dirección de las relaciones.Analizaremos algunas características importantes generales de estas con las quecomprenderemos mejor este tema.Relaciones lineales:Veamos una relación lineal entre dos variable. La siguiente tabla nos muestra elsalario mensual que percibieron cinco agentes de ventas y el valor en dólares delas mercancías vendidas por cada uno de ellos en ese mes. 101
  • 103. Agente variable X mercancía vendida ($) Y variable salario ($) 1 0 500 2 1000 900 3 2000 1300 4 3000 1700 5 4000 2100Podemos analizar mejor la relación entre estas variables. Si trazamos una graficatrazamos los valores XyY, para cada agente de ventas, como los puntos de dichagrafica. Sería una grafica de dispersión o de dispersigrama.La grafica de dispersión para los datos de los agentes de ventas aparece en elcuadro.Una relación lineal.- entre dos variables, es aquella que puede representarse conla mejor exactitud mediante una línea recta.Problema de que ambos tienen escalas muy diferentes. Como mencionamosanteriormente podemos resolver esta dificultad al convertir cada calificación en suvalor Z transformado, lo cual colocaría a ambas variables en la misma escala, enla escala Z.Para apreciar la utilidad de los puntajes Z en la determinación de la correlación,consideremos el siguiente ejemplo. Supongamos que el supermercado de subarrio está vendiendo naranjas, las cuales ya están empacadas; cada bolsa tienemarcado el precio total. Ud. quiere saber si existe una relación entre el peso de lasnaranjas de cada bolsa y su costo. Como Ud. Es investigador nato, elige al azarseis bolsas y la pesa, de hecho están relacionadas estas variables. Existe unacorrelación positiva perfecta entre el costo y el peso de las naranjas. Asi elcoeficiente de correlación debe ser igual a + 1.Para utilizar esta ecuación primero hay que convertir cada puntaje en bruto en suvalor transformado. Esto puede tardar mucho tiempo y crear errores de redondeo 102
  • 104. con alguna algebra, esta ecuación se puede transformar en una ecuación decálculo que utilice datos en bruto:Ecuación para el cálculo de la r de pearson rDonde es la suma de los productos de cada pareja XyYtambién se llama la suma de los productos cruzados.Datos hipotéticos a partir de cinco sujetos: SUBJETIVO X Y X2 Y2 XY A 1 2 1 4 2 B 3 5 9 25 15 C 4 3 16 9 12 D 6 7 36 49 42 E 7 5 49 25 35 TOTAL 21 22 111 112 106 103
  • 105. r r PROBLEMA DE PRÁCTICA: Tenemos una relación lineal imperfecta y estamos interesados en calcular la magnitud y dirección de la magnitud y dirección de la relación mediante la r Pearson. # de IQ Promedio X2 Y2 XYestudiantes (promedio de de datos calificaciones) Y 1 110 1.0 12.100 1.00 110.0 2 112 1.6 12.544 2.56 179.2 3 118 1.2 13.924 1.44 141.6 4 119 2.1 14.161 4.41 249.9 5 122 2.6 14.884 6.76 317.2 6 125 1.8 15.625 3.24 225.0 7 127 2.6 16.129 6.76 330.2 8 130 2.0 16.900 4.00 260.0 9 132 3.2 17.424 10.24 422.4 10 134 2.6 17.956 6.76 384.4 11 136 3.0 18.496 9.00 408.0 12 138 3.6 19.044 12.96 496.8 TOTAL 1503 27.3 189.187 69.13 3488.0 104
  • 106. r rUna segunda interpretación de la r de pearson es que también se puedeinterpretar en términos de la variabilidad de Y explicada por medio de X. estepunto de vista produce más información importante acerca de r y la relación entreX y Y en este ejemplo la variable X representa una competencia de ortografía y lavariable Y la habilidad de la escritura de seis estudiantes de tercer grado. Supongaque queremos que queremos predecir la calificación de la escritura de Esteban, elestudiante cuya calificación en ortografía es de 88.Para calcular la r de Pearson para cada conjunto. Observe que en el conjunto B,donde la correlación es menor, a algunos de los valores r= Son positivos y otros son negativos. Estos tienden a cancelarse entre si, locual hace que r tenga una menor magnitud. Sin embargo, en los conjuntos A y Ctodos los productos tienen el mismo signo, haciendo que la magnitud de raumente. Cuando las parejas de datos ocupan las mismas u opuestas posiciones 105
  • 107. dentro de sus propias distribuciones, los productos tienen el mismo signo, lacual produce una mayor magnitud de rCalculando r utilizando para el conjunto B, utilizando la ecuación para los datos en bruto¿Qué quiere utilizar la ecuación de los datos en bruto o la los puntajes z?Sume la constante 5 de los datos X en el conjunto A y calcule r de nuevo, mediante laecuación de datos en bruto ¿ha cambiado el valor?Construya una grafica de dispersión para las parejas de datos.Sería justo decir que este es un examen confiableUn grupo de investigadores a diseñado un cuestionario sobre la tensión, consistente enquince sucesos. Ellos están interesados en determinar si existe una coincidencia entredos culturas acerca de la cantidad relativa de ajustes que acarrea cada suceso. Elcuestionario se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe utilizarel evento “matrimonio” como estándar y juzgar los demás eventos en relación con elajuste necesario para el matrimonio recibe un valor arbitrario de 50 puntos. Si seconsidera un evento requiere de más ajustes que el matrimonio, el evento debe recibirmás de 50 puntos. el número de puntos excedentes depende de la cantidad de ajustesrequeridos. Después de cada sujeto de cada cultura ha asignado de puntos a todos loseventos, se promedian los puntos de cada evento. Los resultados aparecen en lasiguiente tabla. EVENTOS ESTADOUNIDENSES ITALIANOS Muerte de la esposa 100 80 Divorcio 73 95 Separación de la pareja 65 85 Temporada en prisión 63 52 Lesiones personales 53 72 Matrimonio 50 50 106
  • 108. Despedido del trabajo 47 40 Jubilación 45 30 Embarazo 40 28 Dificultades sexuales 39 42 Reajustes económicos 39 36 Problemas con la 29 41 familia política Problemas con el jefe 23 35 Vacaciones 13 16 Navidad 12 10 a. Suponga que los datos tienen al menos una escala de intervalo y calcule la correlación entre los datos de los estadounidenses y la de los italianos b. Suponga que los datos solo tienen una escala ordinal y calcule la correlación entre los datos de ambas culturas INDIVIDUO EXAMEN CON PSIQUIATRA PSIQUIATRA LÁPIZ Y PAPEL A B 1 48 12 9 2 37 11 12 3 30 4 5 4 45 7 8 5 31 10 11 6 24 8 7 7 28 3 4107
  • 109. 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3un Psicólogo ha construido un examen lápiz-papel, a fin de medir la depresión. Paracomparar los datos de los exámenes con los datos de los expertos, 12 individuos “conperturbaciones emocionales” realizan el examen lápiz-papel. Los individuos soncalificados de manera independiente por los dos psiquiatras, de acuerdo con el grado dedepresión determinado para cada uno como resultado de las entrevistas detalladas. Losdatos aparecen a continuación.Los datos mayores corresponden a una mayor depresión. a. ¿Cuál es la correlación de los datos de los dos psiquiatras? b. ¿Cuál es la correlación sobre las calificaciones del examen de lápiz y papel de cada psiquiatra?Para este problema, suponga que Ud. Es un psicólogo que labora en el departamento derecursos humanos de una gran corporación. El presidente de la compañía acaba dehablar con Ud. Acerca de la importancia de contratar personal productivo en la sección demanufactura de la empresa y le ha pedido que ayude a mejorar la capacidad de lainstitución para hacer esto. Existen 300 empleados en esta sección y cada obrero fabricael mismo artículo. Hasta ahora la corporación solo ha recurrido a entrevistas para elegir aestos empleados. Ud. Busca bibliografía y descubre dos pruebas de desempeño lápiz ypapel, bien estandarizadas y piensa que podrían estar relacionadas con los requisitos dedesempeño de esta sección. Para determinar si alguna de ellas se puede usar comodispositivo de selección elige a 10 empleados representativos de la sección de lamanufactura, garantizando que una amplio rango de desempeño quede representado en 108
  • 110. la muestra y realiza las dos pruebas con cada empleado por semana, promediandodurante los últimos seis meses.Desempeño 1 2 3 4 5 6 7 8 9 10en eltrabajo 50 74 62 90 98 52 68 80 88 76Examen 1 10 19 20 20 21 14 10 24 16 14Examen 2 25 35 40 49 50 29 32 44 46 35 CORRELACIÓN4.1.1. TÉCNICAS DE CORRELACIÓNEn los capítulos anteriores, ustedes estudiaron las distribuciones de una solavariable. A continuación abordaremos el estudio de dos variables y no solamentede una. Particularmente estudiaremos qué sentido tiene afirmar que dos variablesestán relacionadas linealmente entre si y cómo podemos medir esta relaciónlineal.4.1.2. RELACIONES LINEALES ENTRE VARIABLESSupongamos que disponemos de dos pruebas siendo una de ellas una prueba dehabilidad mental y otra una prueba de ingreso a la Universidad. Seleccionemoscinco estudiantes y presentemos en la tabla Nº 4.1.1 los puntajes obtenidos enestas dos pruebas. 109
  • 111. Tabla Nº 4.1.1 Estudiantes X Y Prueba de habilidad Examen de Admisión mental María 18 82 Olga 15 68 Susana 12 60 Aldo 9 32 Juan 3 18La tabla nos dice que si podemos hacer tal suposición ya que los estudiantes conpuntajes altos en la prueba de habilidad mental tienen también un puntaje alto enel examen de admisión y los estudiantes con puntaje bajo en la prueba dehabilidad mental. Tienen también bajo puntajes en el examen de admisión. Encircunstancia como la presente (cuando los puntajes altos de una variable estánrelacionados con los puntajes altos de la otra variable y los puntajes) afirmaríamosque hay una relación lineal positiva entre las variables, entonces podemos definiruna relación lineal positiva entre ese conjunto de pares valores X y Y, tal lamuestra la tabla N º 4.1.1Supongamos que en lugar de los resultados de la tabla Nº 4.1.1, hubiéramosobtenido los puntajes que se muestran en la tabla Nº 4.1.2 ¿podríamos afirmarque en esta situación los puntajes de la prueba de habilidad mental pueden usarsepara pronosticar los puntajes del examen de admisión? También, aunque en estecaso mostramos una relación contraria a la que ocurre en la realidad ya que lossujetos con puntajes altos en el test de habilidad mental aparecen con puntajesbajos en el examen de admisión y los sujetos con puntajes bajos en el test dehabilidad mental presentan los puntajes altos en el examen de admisión, entonces 110
  • 112. podemos definir una relación lineal negativa entre un conjunto de pares valores Xy Y (tal como en la tabla Nº 4.1.2) es decir, los puntajes altos de X estánapareados con los puntajes bajos de Y y los puntajes bajos de X están apareadoscon los puntajes de Y. Tabla Nº 4.1.2 Estudiantes X Prueba de habilidad Y Examen de Admisión mental María 18 18 Olga 15 32 Susana 12 60 Aldo 9 68 Juan 3 82 Tabla Nº 4.1.3 Estudiantes X Prueba de habilidad Y Examen de Admisión mental María 18 18 Olga 15 82 Susana 12 68 Aldo 9 60 Juan 3 32Examinemos ahora la tabla Nº 4.1.3. En este casi ya no podemos afirmar que lospuntajes de la prueba de habilidad mental sirvan para pronosticar los puntajes delexamen de admisión, ya que unos puntajes bajos del examen de admisión yalgunos puntajes bajos del test de habilidad mental están apareados con otros 111
  • 113. puntajes altos del examen de admisión, entonces en este caso, decimos que noexiste una relación lineal entre las variables X y Y.4.1.3. DIAGRAMA DE DISPERSIÓNEn las situaciones que se presentan en la vida real no tenemos solamente cincoparejas de valores para ambas variables, sino muchísimas parejas. Otra formaalternativa de ver si existe o no relación lineal entre dos variables seria hacer unagrafica de los valores X y Y en un sistema de coordenadas rectangulares, este tipode gráfica es conocido con el nombre de diagrama de dispersión, gráfico dedispersión o nube de puntos. Dibujemos el diagrama que corresponde a la Tabla Nº 4.1.1. Lo haremos haciendo corresponder a cada valor de la variableindependiente X, un valor de la variable dependiente Y, es decir, para la alumnaSusana haremos corresponder du puntaje en la prueba de habilidad mental (12)con su puntaje de la prueba de admisión (60); al alumno Juan le hacemoscorresponder su puntaje del test de habilidad mental (3) con su puntaje delexamen de admisión (18). Luego ubicaremos los cinco pares de puntajes en elsistema de ejes rectangulares y obtendremos los gráficos Nº 4.1.1 y Nº 4.1.2Observemos en el gráfico Nª 4.1.1 que la tabla Nª 4.1.1. Es descrita por eldiagrama de dispersión. Vemos en este gráfico que los cinco puntos dan lasensación de ascender en línea recta de izquierda a derecha. Esto escaracterístico en datos en los que existe una relación lineal positiva. Aunque estoscinco datos no configuren una línea recta en forma perfecta. Se puede trazar unalínea recta que describa que estos puntos en forma bastante aproximadaconforme se ve en el gráfico Nª 4.1.2 y por esto decimos que la relación es lineal.Si ocurre que todos los puntos de la gráfica de dispersión están incluidos en unasola línea en forma exacta afirmamos que la relación lineal es perfecta. El gradoen que se separan los puntos de una sola línea recta nos da el grado en que larelación lineal no es perfecta. Así cuando menos puntos se encuentran en una 112
  • 114. sola línea decimos que la relación lineal no es perfecta. Así cuando menos puntosse encuentran en una sola línea decimos que la relación lineal entre las dosvariables es menos fuerte y cuando más puntos queden incluidos en una línearecta afirmamos que la relación lineal es más fuerte. GRÁFICO Nª 4.1.1. 113
  • 115. Usando los datos de una tabla Nº 4.1.2 y utilizando la misma forma de razonarempleada hasta ahora podemos construir el correspondiente gráfico de dispersión,tal como se muestra en el gráfico Nº 4.1.3.Podemos observar en el gráfico Nº 4.1.4. que la nube de puntos de la gráficapueden delinearse bien por una línea recta, lo que nos indica que hay una relaciónlineal entre las dos variables X y Y Vemos también que la línea desciende deizquierda a derecha (tienen pendiente negativa) por lo que decimos que la relaciónlineal entre las dos variables es negativa.Si tenemos en cuenta la tabla Nº 4.1.3 podemos obtener una figura como semuestra en la gráfica Nº 4.1.5 Notamos, en esta situación, que resultará inútilcualquier línea recta que trate describir adecuadamente este diagrama dedispersión. Y 80 70 60 50 40 30 20 10 2 4 6 8 10 12 14 16 18 20 X Diagrama de Dispersión 114
  • 116. GRÁFICO Nº 4.1.4. 80 70 60 50 40 30 20 10 2 4 6 8 10 12 14 16 18 20 XDiagrama de Dispersión aproximado por una línea recta4.1.4 COEFICIENTE DE CORRELACIONE RECTILINEA DE PEARSONCon ayuda de las gráficas nos podemos formar una idea si la nube de puntos, odiagrama de dispersión, representa una reacción lineal y si esta relación lineal espositiva o negativa, pero con la sola observación de la gráfica no podemoscuantificar la fuerza de la relación, lo que si conseguiremos haciendo uso delcoeficiente r de Pearson.El coeficiente de correlación r de Pearson, toma valores comprendidos entre 1 y +pasando por 0. El número -1 corresponde a una correlación negativa perfecta (lospuntos del diagrama de dispersión deben encontrarse formando perfectamenteuna línea recta). El numero +1 corresponde a una correlación positiva perfecta.(los puntos del diagrama de dispersión deben encontrarse formandoperfectamente una línea recta). El coeficiente de correlación r=0 se obtiene 115
  • 117. cuando no existe ninguna correlación entre las variables. Los valores negativosmayores que -1 indican una correlación negativa y los valores positivos menoresque 1 indican una correlación positiva.Referente a la magnitud de r podemos decir que independientemente del signo,cuando el valor absoluto de r esté más cercana de 1, mayor es la fuerza de lacorrelación, es así que -0,20 y +0.20 son iguales en fuerza (ambos son dosvalores débiles) los valores -0.93 y +0.93 también son iguales en fuerza (ambosson dos valores fuertes).Cálculo del Coeficiente r de Pearson utilizando una máquina calculadoracuando los datos no son muy numerosos.Dadas dos variables X y Y con sus respectivos valores. En la Tabla podemoscalcular el coeficiente de Pearson con una máquina calculadora mediante lasiguiente fórmula. Tabla Auxiliar 4.1.4. (1) (2) (3) (4) (5) x Y X^2 Y^2 XY 18 82 324 6724 1476 15 68 225 4624 1020 12 60 144 3600 720 9 32 81 1024 288 3 18 9 324 54 2 2 ∑X = 57 ∑Y = 260 ∑X =783 ∑Y =16296 ∑XY =3558En las columnas (1) y (2) se han escrito los valores de X y Y. En la columna (3) sehan elevado al cuadrado los valores de X. En la columna (4) se han elevado al 116
  • 118. cuadrado los valores de Y. En la columna (5) se ha efectuado el producto de cadapareja de valores X y Y. Aplicando los datos en la fórmula 4.1.1., se tiene: INTERPRETACIONES DE UN COEFICIENTE DE CORRELACIÓN¿Qué tan elevado es un coeficiente de correlación dado? Tofo coeficiente decorrelación que no sea cero indica cierto grado de relación entre dos variables.Pero es necesario examinar más esta materia, porque el grado de intensidad derelación se puede considerar desde varios puntos de vista. No se puede decir queun r de 0,50 indique una relación dos veces más fuerte que la indicada por un r de0, 25. Ni se puede decir tampoco que un aumento en la correlación de r = 0,40 a r= 0,60 equivalga a un aumento de r = 0,70 a r = 0,90. Es de observar que unacorrelación de 0,60 indica una relación tan estrecha como una correlación de +0,60. La relación difiere solamente en la dirección.Siempre que éste establecido fuera de toda duda razonable una relación entre dosvariables, el que el coeficiente de correlación sea pequeño puede significarúnicamente que la situación medida está contaminada por algún factor o factoresno controlados. Es fácil concebir una situación experimental en la cual, si se hanmantenido constantes todos los factores que o sean pertinentes, el r podría habersido 1 en lugar de 0,20. Por ejemplos: generalmente la correlación entre la 117
  • 119. puntuación de aptitud y el aprovechamiento académico es 0,50 puesto que ambosse miden en una población cuyo aprovechamiento académico también esinfluenciable por el esfuerzo, las actitudes, las peculiaridades de calificación de losprofesores, etc. Si se mantuvieran constantes todos os demás factoresdeterminantes del aprovechamiento y se midieran exactamente la aptitud y lasnotas, el r seria 1 en vez de 0,50.Una conclusión práctica respecto a la correlación es que ésta es siempre relativa ala situación dentro de la cual se obtiene y su magnitud no representa ningúnhecho natural absoluto. El coeficiente de correlación es siempre algo puramenterelativo a las circunstancias en que se ha obtenido y se ha de interpretar a la luzde esas circunstancias y sólo muy rara vez en algún sentido absoluto.Además podemos agregar que la interpretación de un coeficiente de correlacióncomo de medida del grado de relación lineal entre dos variables es unainterpretación matemática pura y está completamente desprovista deimplicaciones de causa y efecto. El hecho de que dos variables tiendan aaumentar o disminuir al mismo tiempo no implica que obligadamente una tengaalgún efecto directo o indirecto sobre la otra.A continuación calcularemos con la fórmula antes indicada el coeficiente dePEARSON de la relación presentada en la tabla. Cuadro Auxiliar 4.1.5. (1) (2) (3) (4) (5) x Y X^2 Y^2 XY 18 18 324 324 324 15 32 225 1024 480 12 60 144 3600 720 9 68 81 4624 612 3 82 9 6724 246 2 2 ∑X = 57 ∑Y = 260 ∑X =783 ∑Y =16296 ∑XY =2382 118
  • 120. Vemos que la correlación es fuerte y negativa.Ahora calculemos con la misma fórmula de Pearson Nº 4.1.1. El Coeficiente deCorrelación lineal con los datos de la tabla nº 4.1.3. Cuadro Auxiliar Nº 4.1.6 (1) (2) (3) (4) (5) x Y X^2 Y^2 XY 18 18 324 324 324 15 82 225 6724 1230 12 68 144 4624 816 9 60 81 3600 540 3 32 9 1024 96 2 ∑X=57 ∑Y=260 ∑X =783 ∑Y2=16296 ∑XY=3006 La correlación es muy débil y positiva. 119
  • 121. CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN CLASESEl presente tema nos conduce a calcular el coeficiente de correlación r, que nosproporciona información de la fuerza de la relación que existe entre dosconjuntos.Ejemplo: calcular el grado de correlación entre las puntuaciones obtenidas eninventario de hábitos de estudio y los puntajes obtenidos de un examenmatemático, aplicados a un total de 134 alumnos de un colegio de la localidad. ^-^X Hábitos de Y ^esiudio 20 - 30 30 - 40 40 - 50 50 - 60 Total fy Matemáticas^ 3 2 2 7 70 -* 80 60 -> 70 1 0 4 5 10 50 ~» 60 2 6 16 3 27 40 50 4 14 19 10 47 30 >-■» 40 7 15 6 0 28 20 M 30 8 2 0 1 t1 10 20 1 1 2 4 Total f. 23 40 48 23 134Podemos notar que el problema no es tan simple, como el casa anterior, dado,que ahora los datos se han clasificado en una tabla de doble entrada N" 4.1.7.Este): cuadro muestra, en la primera columna del lado izquierdo los intervalos declase 0» la variable Y, los que cubren todos los posibles datos acerca de laspuntuaciones! alcanzadas por los estudiantes en la prueba de Matemática.Nótese que los i n t e r v a l o s los crecen de abajo hacia arriba. En la fila superiorse presentan les intervalos <% 120
  • 122. Dentro del cuadro en los casilleros interiores o celdas de la tabla, se encuentranlas frecuencias de celda que correspondan a puntajes que pertenecen tanto a unintervalo de la variable Y como un intervalo de la variable X.La fórmula que utilizaremos es la siguientePara obtener los datos que deben aplicarse en la formula vamos a construir elcuadro auxiliar al mismo tiempo que se explica el significado de los símbolos deesa formulaLo primero que hacemos es reemplazar los intervalos horizontales y verticales porsus respectivas marcas de clase a continuación adicionalmente al cuadro N4.1.7cinco columnas por el lado derecho, cuyos encabezamientos son : f para laprimera. 1) Para determinar las frecuencias marginales que se deben colocar en la columna f sumamos las frecuencias de las celdas que están en la misma fila de la marca de clase 75, obtenemos 3+2+2=7, numero que se escribe en el primer casillero o celda de la columna f. en la fila de la marca de clase 65 sumamos 1+4+5=10 numero que se escribe debajo del 7. 2) Ahora vamos a determinar las frecuencias marginales de la variable x: en la columna encabezada con la marca de clase 25 sumemos verticalmente las frecuencias 1+2+4+7+8+1=23 3) Centremos nuestra atención en la columna encabezada u, este signo significa desviación estándar y procedemos a la misma forma en las tablas. Recuerden que las desviaciones unitarias positivas: +1+2 y negativas : -1-2 y -3 corresponden a los intervalos menores. 4) Luego vamos a determinar las desviaciones unitarias horizontales de la variable X. el origen de trabajo es la marca de clase 45 que se halla en la fila superior del cuadro , por esa razón , escribimos cero debajo de la frecuencia marginal 48. 121
  • 123. 5) A continuación vamos a determinar los valores que deben colocarse en la columna encabezada. Para obtener los valores de la cuarta columna encabezada debemos tomar en cuenta que por lo tanto basta multiplicar cada valor de la segunda columna por su correspondiente valor de la tercera columna así se obtiene el respectivo valor de la cuarta columna. En efecto: (3)(21)=63 (20)(20)=40(+1)(27)=27; 00*00=0; (-1)(-28)=28; (-2)(-22)=44 y (- 3)(-12)=36 La suma 63+40+27+28+44+36=238 Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que (f)(u)=fu por consiguiente basta multiplicar verticalmente un valor de la primera fila por su correspondiente valor de la primera fila por su correspondiente valor de la segunda fila para obtener el respectivo valor de la tercera fila. (23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23 Sumando horizontalmente: (-46)+ (-40)+ (23)=-86+23=-63 Vamos por la cuarta fila vemos que u (fu)= Fu2 luego basta multiplicar cada elemento de la segunda fila por su correspondiente elemento de la tercera fila por su correspondiente elemento de la tercera fila para obtener el respectivo elemento de la cuarta fila así: (-2)(-46)=9; (-1)(-40)=40; 0*0=0y (+1)(23)=23 Para obtener valores de la quinta columna observamos que hay tres factores el 1 es la frecuencia f de la celda o casillero que se está considerando el segundo factor es la desviación unitaria u, el tercer factor es la desviación unitaria, por lo tanto el procedimiento será el siguiente: tomemos el número 3 que es la frecuencia de la celda determinada por el cruce de los intervalos que tienen la marcha de la clase 75 horizontalmente y 35 verticalmente.122
  • 124. Para ubicar el tercer factor corremos la vista del numero 3 hacia su derecha hasta llegar a la columna de las desviaciones unitarias u y ubicamos el numero +3 formemos el producto de estos tres números: (3)(--1)(+3)=-9 encerrado de un semicírculo lo escribimos en la celda elegida En la misma fila tomamos la celda siguiente: (2) (0)(+) Continuando hacia la derecha (2) (+1)(+3)=6X hábitosestudio suma de losY # enmatemática 25 35 45 55 Fy Uy FyUy FyU^2y semicírculos 75 2 3 2 2 7 3 21 63 -3 65 1 0 4 5 10 2 20 40 6 55 2 6 16 3 27 1 27 27 -7 45 4 14 19 10 47 0 0 0 0 35 7 15 6 0 28 -1 -28 23 29 25 8 2 0 1 11 -2 -22 44 34 15 1 0 1 2 4 -3 -12 36 0 ∑FxUx = ∑FxUx^2= ∑FxyUxUy= 6 238 59Fx 23 40 48 23 134Ux -2 -1 0 1FxUx -46 -40 0 23 ∑FxUx=-63FxUx^2 92 40 0 23 ∑FxUx^2=155La fórmula del paso (9) lleva el signo ∑para indicar que se deben sumarhorizontalmente los números que están encerrados en los semicírculos de esaprimera fila elegida así: -9+0+6. Este número se escribe en la quita columna.Trabajemos con la segunda fila: (1) (-2)(+2)= -4 se encierra en un semicírculo.(0)(-1)(+2)= 0(4)(0)(+2)= 0(5)(+1)(+2)= 10 123
  • 125. Sumando 0 + 0 + 10 = 10Ahora con la tercera fila:(2)(-2)(+1)= -4(6)(-1)(+1)= -6(16)(0)(+1)= 0(0)(+1)(+1)= 3Sumando: (-4) + (-6) + 0 + 3 = -7Cuarta fila(-4) + (-2) + 0 = 0 todos los productos vales cero, luego la suma = 0Quinta fila(7)(-2)(-1)= 14(15)(-1)(-1)= 15(6)(0)(-1)= 0(0)(+1)(-1)= 0La suma es: 14+15= 29(8)(-2)(-2)= 32(2)(-1)(-2)= 4(0)(0)(-2)= 0(1)(+1)(-2)= -2La suma es: 32 + 4 -2 = 34Séptima fila: 124
  • 126. (1)(-2)(-3)= 6(1)(0)(-3)= 0(2)(1)(-3)= -6Sumando: 6 + 0 – 6 = 0Sumando los valores de la columna quinta.Reuniendo los resultados anteriores, se tienen los datos para aplicar en la formulan= 134∑ = 59∑ = -63∑ =6∑ = 155∑ = 238r=r=r= 0,358 125
  • 127. Ejercicio Resuelto N° 2 de Cálculo de Coeficiente de Correlación Entre Conjuntos de Datos AgrupadosCalcular el coeficiente de correlación lineal de las puntuaciones en matemáticas yfísicas de 100 estudiantes de la Facultad de Ciencias de la Universidad MN X Puntuación matemáticas Y Puntuación fisica 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 TOTAL 90 - 100 0 0 0 2 5 5 12 80 - 90 0 0 1 3 6 5 15 70 - 80 0 1 2 11 9 2 25 60 - 70 2 3 10 3 1 0 19 50 - 60 4 7 6 1 0 0 18 40 - 50 4 4 4 0 0 0 11 TOTAL 10 15 22 20 21 12 100 126
  • 128. SUMA DE LOS NÚMEROS ENCERRADOS EN SEMICÍRCULOS EN PUNTACIÓN EN MATEMÁTICA CADA FILA 45 55 65 75 85 95 Fy Uy Fy Uy Fy U2y 95 2 5 5 12 2 24 48 54PUNTUACION ENFISISCA Y 85 1 3 6 5 15 1 15 15 30 75 1 2 11 9 2 25 0 0 0 0 65 2 3 10 3 1 19 -1 -19 19 2 55 4 7 6 1 18 -2 -36 72 28 45 4 4 3 11 -3 -33 99 36 fx 10 15 22 20 21 12 100 -3 -49 253 150 Ux -2 -1 0 1 2 3 3 Σfy Uy Σfy U2y Σ fxy Ux Uy FxUx -20 -15 0 20 42 36 63 Σfx Ux Fx U2x 40 15 0 20 84 10 267 Σfx U2x 8 127
  • 129. En este problema tenemos que calcular el confidente de correlación lineal r parados conjuntos de datos constituidos por los calificativos en una escala de 0 a 100,en matemáticas y en física para 100 estudiantes de la facultad de Ciencias decierta universidadLos datos se muestran en el cuadro N° 4.1.9 Notemos que a lo largo de la líneahorizontal superior se encuentran los intervalos que contienen los calificativos dematemáticas desde 40 hasta 100.Igualmente en la primera columna vertical izquierda, se encuentran los calificativospara física de los mismos estudiantes, desde el calificativo 40 hasta 100. Noteseque en la columna de los calificativos de física los datos crecen de abajo haciaarriba y para la fila horizontal superior vemos que los calificativos en matemáticascrecen izquierda a derecha.A continuación procederemos a calcular el confidente de correlación r para estosdatos aplicando el mismo método que utilizaremos en el problema anterior. 1) Traslademos los datos del cuadro N° 4.1.9. Llamaremos xy a cualquiera de las frecuencias de los casilleros interiores del cuadro N° 4.1.9. En el cuadro N° 4.1.10. podemos observar que se han agregado cinco columnas por el lado derecho y cuatro filas por la parte interiorObservemos en el cuadro N° 4.1.10 que los intervalos para la puntuación enmatemáticas y para la puntación en física se han remplazado por las marcas declase correspondientes. Así en la fila horizontal superior se han remplazado elprimer intervalo 40 50 por su marca de clase45, el segundo intervalo 50 60por su marca de clase 55 y de esta manera se han remplazado los demásintervalos por sus marcas de clases en el cuadro N° 4.1.10.De igual forma para la columna primera de la izquierda vemos que los intervalosse han remplazado por sus respectivas marcas de clase así para la puntuación enfísica el primer intervalo superior 90 100 se han remplazado por su marca declase 95, el segundo intervalo superior 80 90 se ha remplazado por su marca 128
  • 130. de clase 85 y así sucesivamente hasta llegar al intervalo inferior 40 50 que seha remplazado por su marca de clase 45.Ahora vamos a realizar los pasos siguientes 1) Para las frecuencia marginales fy sumemos todos los valores fxy de la primera fila que tiene la marca de clase 95. De esta forma tenemos: 2+5+5= 12 Para la segunda fila que corresponde a la marca de clase 85 obtenemos: 1+3+6+5= 15 que escribimos en el segundo casillero de f y. 2) Dediquemos nuestra atención a las frecuencias marginales f x. el primer resultado de fx lo obtenemos sumando las frecuencias fxy para la colunia que tiene la marca de clase 45, de esta forma tenemos: 2+4= 10 que se escribe en el primer casillero de fx para el segundo casillero tenemos el número 15 que se obtiene verticalmente de las frecuencias fxy de la columna que tiene de marca de clase 55. Continuando con las sumas de las f de las demás columnas llenamos las frecuencias marginales f x. 3) Atendamos la columna Uy la columna Uy tiene en total 6 casilleros arbitrariamente escogemos uno de estos casilleros como origen de trabajo y le asignamos el numero 0. Aquí hemos escogido el tercer casillero contando de arriba hacia abajo. Observamos ahora la primera columna de la izquierda en donde están las marcas de clase de los puntajes de física. Aquí observamos que las marcas de clase crecen de abajo hacia arriba entonces las desviaciones unitarias en la columna Uy crecerán de abajo hacia arriba entonces del 0 hacia abajo, las desviaciones unitarias son números negativos que van decreciendo hacia abajo. Desde el 0 hacia arriba las desviaciones serán positivas y crecientes. De manera que podemos observar que la columna Uy está conformada por los siguientes números que crecen del 0 hacia arriba: 1,2 y desde el 0 hacia abajo decrece: -1,-2,-3. 4) Veamos la fila Ux 129
  • 131. Notamos que el fila horizontal superior las marcas de clase crecen de izquierda a derecha de igual forma las desviaciones unitarias crecerán de izquierda a derecha. Elegiremos como origen de trabajo arbitrariamente uno del casillero Ux el tercero contando de izquierda a derecha, y vamos asignando números positivos crecientes hacia la derecha del 0, así tenemos 1, 2,3 ya hacia la izquierda, a partir del cero, tendremos:-1y-2. 5) Expliquemos la columna fy Uy. Multipliquemos cada valor de f y por su correspondiente valor de Uy y se obtiene un valor Fy Uy. Por ejemplo el numero 24 se obtiene multiplicando la frecuencia marginal f y = 12 por su correspondiente desviación unitaria Uy = 2esto es, 12*2= 24. Para el segundo casillero multiplicamos 15*1=15; para el tercero 25*0=, así hasta terminar con 11*(-3)= -33. 6) Observemos la columna Fy U2y. L primera celda de esta columna tiene el número 48 que se obtiene de multiplicando el valor Uy =2 de la segunda columna por su correspondiente valor Fy Uy = 24 de la tercera columna, es decir, 2*24= 48. Para el segundo casillero de la columna f y U2y , tenemos 15 que es igual a 1 por 15. De esta forma continuamos llenando los demás valores de la columna Fy U2y. 7) Veamos ahora la fila fx ux. El número -20 del primer casillero de esta fila se obtiene multiplicando la frecuencia marginal f x = 10 por su correspondiente desviación unitaria Ux = -2 es decir: 10 (-2)= -20. Para el segundo casillero de FX UX, multiplicamos (-1)*(-15)= 15 y así sucesivamente 12*3= 36. 8) Veamos Fx U2x. El primer casillero de esta fila es 40 y es el resultado de multiplicar -2 del primer casillero de la fila Fx Ux por menos 20 de su correspondiente primer casillero de la fila Ux esto es, (-2)* (-20)= 40. Para el segundo casillero de fx U2x multiplicamos -1 del segundo casillero de Ux por -15 de su correspondiente segundo casillero de FX UX, luego obtenemos (-1) *(-15)=15 .Así continuamos multiplicando los valores de los casilleros130
  • 132. Ux por sus correspondientes valores de la fila Fx Ux hasta llegar a (3) (36)= 108. 9) Interesa ahora obtener los números encerrados en semicírculo, por ejemplo ahora, el numero 4, que corresponde a la marca de clase 75 para la puntuación en matemáticas y a la marca de clase 95 de la puntuación en física. 10) Para saber cómo se obtiene este numero 4, corramos nuestra vista hacia la derecha dirigiéndonos hacia la columna UY y obtenemos el numero 2. Del numero 4, encerrado en semicírculo, bajemos la vista con dirección a la fila Ux y obtenemos 1. La frecuencia del casillero donde esta el 4, encerrado en semicírculo, es fxy = 2. Multiplicando estos 3 factores tendremos f xy Ux Uy = (2) (1) (2) = 4.Podemos anunciar la siguiente regla:Para obtener los valores encerrados en semicírculos en los casilleros interiores delcuadro N°4..1.10 multiplicamos el valor de la frecuencia f xy del casillero para elcual estamos haciendo el cálculo, por los valores de las desviaciones unitarias U y yUx , obtenidas corriendo la vista hacia la derecha hasta columna U y y tambiénhacia abajo hasta legar a la fila Ux.Así por ejemplo, para el casillero que corresponde a las marcas de clase 75 enmatemática y 85 en física, tenemos la frecuencia de la celda F xy = 3, los otros dosfactores son: Uy =1 y Ux = 1.Luego (3) x (1) x (1) = 3 que es el valor encerrado en semicírculo.Para el casillero correspondiente a la marca de clase 55 en matemáticas marca declase 45 en física, tenemos: 131
  • 133. fxy = 4, Uy = -3, Ux = -1fxy Ux Uy = (4) (-3) (-1) = 12 que es el valor encerrado en semicírculo. Así podemosproceder para obtener todos los demás valores encerrados en semicírculos.Sumando las frecuencias marginales de la columna f y, se tiene ∑ fy =100.Sumando los valores de la tercera columna se obtiene ∑fy Uy = - 49. Sumando losvalores de la cuarta columna, tenemos ∑f y U^2y = 253. La suma de los valores dela quinta columna:∑fxy Ux Uy = 150Para todas las filas, en el último casillero de la derecha se tiene la suma de losvalores de la fila. Así, por ejemplo, ∑fx = 100; ∑fy = 100.Para la tercera fila: ∑fx Ux = 63Para la cuarta fila: ∑fx U^2x = 267Estos totales de filas y columnas reemplazaremos en la fórmula. Vemos que el coeficiente de correlación en este caso es 0.79. 132
  • 134. Ejercicio Propuesto Nº 1 del Cálculo del Coeficiente de Correlación entre dosConjuntos Agrupados de Datos.Supongamos que tenemos 30 sujetos a los que hemos aplicado una prueba deconocimientos de Psicología General (variable x) y un test de inteligencia (variabley).Aplicando los datos tomados del Cuadro Auxiliar en la fórmula tenemos:Resultado:Ejemplo propuesto N°2 del cálculo del coeficiente de correlación entre dosconjunto de datos agrupados. Supongamos que se tienen 50 vendedores de ciertacompañía. Estos vendedores durante un año 1985 han realizado ventas tal comolo muestra el cuadro N°4.1.13, el que también muestra el número de años deexperiencia que tiene como vendedores.Para dicho cuando, se pide calcular el coeficiente de correlación lineal r. 133
  • 135. Años de experiencia X Monto de 0 2 2 4 4 6 6 8 8 10 TOTAL ventas Y15 18 1 112 15 2 3 4 9 9 12 7 3 2 12 6 9 6 9 4 19 3 6 5 2 7 1 3 2 2TOTAL 2 11 18 12 7 50Tomando los datos obtenidos n el cuadro Auxiliar N°4.1.14 apliquemos en laformula N° 4.1.12, se tiene. 134
  • 136. 135
  • 137. Progresiones lineales simples4.2.1. Regresión lineal simpleAl comenzar a estudiar las técnicas de correlación afirmamos queestudiaríamos dos variables y no solamente una. Llamamos a esa ocasión X auna de las variables Y a la otra. En el tema que nos ocuparemos ahora,estudiaremos la forma de predecir v valores de Y conociendo primero losvalores de X. Es así que viendo la tabla N 4.2.1, similar a la que utilizamoscuando estudiamos correlación, conociendo el puntaje en la prueba dehabilidad mental (variable X) para un alumno determinado, podemos anticiparel puntaje del examen de admisión (variable Y) del mismo alumno.Consideraremos la relación lineal expresada por el cuadro N4.2.1 si dibujamosesa relación, obtenemos el grafico N4.2.1. Como podemos observar todos lospuntos se alinean exactamente. En una sola línea recta, la que recibe elnombre de línea de regresión. Teniendo en cuenta esta línea, podemospredecir cualquiera d los valores de Y conociendo el valor de X; para X=25,según la recta, correspondiente de Y=35, para X=20 corresponde Y=30. Etc.En este caso se trata de una correlación positiva perfecta cuyo coeficiente decorrelación es +1. Prueba de habilidad Examen de Admisión mental X YSUSANA 5 15IVAN 10 20LOURDES 15 25ALDO 20 30JUAN 25 35MARIA 30 40 136
  • 138. CESAR 35 45OLGA 40 50Recordemos ahora el grafico N 4.1.2 que dibujamos cuando estudiamoscorrelación, en este grafico observamos el diagrama de dispersión aproximadopor una línea recta, la recta que mejor se ajuste a los puntos del diagrama dedispersión, es decir, en la mejor medida procure dejar igual número de puntosdel diagrama de dispersión por encima de ella que igual número de puntosdebajo, se llama línea de regresión.ECUACION DE LA REGRESION RECTILINEALa ecuación que describe la línea de regresión es:GRÁFICO y 45 40 Serie 1 f(x)=1*x+10; R²=1 35 30 25 20 15 10 r = 1,00 5 x -5 5 10 15 20 25 30 35 40 45 -5 137
  • 139. = media de la variable X en la muestra.X = un valor de la variable Xr = coeficiente de Pearson, de la correlación lineal entre las variables X y Y.SY = desviación estándar de Y en la muestra.SX = desviación estándar de X en la muestra.Yr = Valor Y resultado del cálculo de la fórmula.Veamos cómo podemos predecir los valore de Y a partir de los valores de X.como el gráfico de este cuadro es una línea recta ascendente sabemos que sucoeficiente de correlación de Pearson r = +1. Además tenemos los siguientesresultados:X = 22,5 SX = 11,46 Y= 32,5 SY = 11,46Estos resultados se pueden calcular a partir de los datos del cuadro.Apliquemos estos datos a la fórmula, obtenemos la siguiente expresión:Simplificando términos obtenemos:Escojamos cualquier valor de X, por ejemplo para María x = 30, reemplazandoeste valor en (b).Vemos en le cuadro el valor que corresponde a María efectivamente es 40, esdecir podemos usar la ecuación para predecir los valores de Y conociendo losvalores de X. 138
  • 140. Esta fórmula de regresión se puede aplicar par dos variables X y Y, entre lascuales no es obligatorio que exista una correlación lineal perfecta, es decir, noes obligatorio que el r para la correlación entre X y Y sea siempre igual a 1.Este valor de r para otras aplicaciones de la regresión, puede tomar cualquiervalor distinto de 1. Ejercicios Resueltos de Regresión Lineal SimpleAl aplicar un test de inteligencia a una muestra representativa constituida por800 alumnos, se obtuvo la puntuación media de 30,4 puntos, con la desviaciónestándar de 12,6 puntos.La edad media de la muestra fue de 14,5 años, con la desviación estándar de3,2 años.El coeficiente de correlación lineal de Pearson entre la variable Y, edad de lossujetos estudiados y la variable X, rendimiento mental de los mismos sujetos,fue r = 0,89.Con estos datos se pide determinar la ecuación de regresión rectilínea de edaden base del puntaje del rendimiento mental.¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de:X1 = 18 Puntos X4 = 50 PuntosX2 = 25 Puntos X5 = 60 PuntosX3 = 45 Puntos X6 = 80 PuntosDatos: = 14,5 SY = 3,2 r = 0, 89 = 30,4 SX = 12,6Aplicando estos datos en la fórmula se tiene: 139
  • 141. Es la ecuación de regresión buscada.Respuesta de la 1ra. PreguntaX1 = 18YR = 7,63 + 0,226 (18) = 7,63 + 4,07YR = 11,7 añosSegunda preguntaX2 = 25YR = 7,63 + 0,226 (25) = 7,63 + 5,65YR = 13,28 añosTercera preguntaX3 = 45YR = 7,63 + 0,226 (45) = 7,63 + 10,17YR = 17,8 añosCuarta preguntaX4 = 50YR = 7,63 + 0,226 (50) = 7,63 + 11,3YR = 18,93 añosQuinta preguntaX5 = 60YR = 7,63 + 0,226 (60) = 7,63 + 13,56YR = 21,19 años 140
  • 142. Sexta preguntaX6 = 80YR = 7,63 + 0,226 (80) = 7,63 + 18,08YR = 25,71 añosEste cuadro contiene la primera columna los nombres de los alumnos, en lasegunda están los rangos de esos alumnos en la variable, en la tercera sehallan los rangos de los alumnos en la variable Y. En la cuarta columna estánlas diferencias de los rangos correspondientes de las variables X y Y. en laquinta columna se colocan las cuadros de las diferencias, ya calculadas. CUADRO AUXILIAR Nº 4.3.4ALUMNOS RENGO DE RANGO DE D= X Y DIFERENCIARodríguez 3 3 0 0Fernández 4 5 -1 1Córdova 2 1 1 1Flores 1 2 -1 1Lema 5 4 1 1APLICANDO LOS DATOS EN LA FORMULA Nº 4.3.1, SE TIENEP= 0.08Es una correlación positiva. Su valor es muy alto y poco común puesto que lapráctica enseña que en la correlación de la inteligencia con el rendimientoescolar en las asignaturas, casi siempre se alcanza un valor próximo a 0.5.EJEMPLO 2 141
  • 143. Supongamos el siguiente cuadro nº 4.3.5. Queremos calcular el coeficiente decorrelación por rangos. CUADRO Nº 4.3.5EXAMINADOS PRUEBA DE APTITUD ACADÉMICA HABILIDAD MENTAL Y XSusana 49 55Iván 46 50Lourdes 45 53Aldo 42 35Juan 39 48maría 37 46cesar 20 29Olga 15 32Observamos que los examinados están ordenados con respecto a la prueba dehabilidad mental de mayor a menor; podemos afirmar que la posición o rangoque se podría asignar a Susana es el primero, a Iván le correspondería elsegundo, para Lourdes el tercero tal como se muestra en el cuadro Nº4.3.6.De igual forma podríamos ordenar la posición o rango de los postulantes segúnlos resultados de la prueba de aptitud académica Y del examen de admisión, loque se muestra en el cuadro Nº4.3.6 es así como Susana también ocupa elnúmero de orden o rango primero y Lourdes ocupa el segundo lugar o rangodos en esa prueba, así podemos continuar ordenando los alumnos según surango en la pruebe de aptitud académica y terminaremos con cesar que ocupael rango 8 en tal prueba.CORRELACIÓN POR RANGOS 142
  • 144. Es el orden que posee o se asignan a cada miembro de un conjunto de deelementos de acuerdo a una escala ordinal dada. El rango ubica el elemento enun punto de esa escala.Por ejemplo: podemos establecer un ordenamiento de los alumnos de acuerdoa los puntajes alcanzados en un examen. Así tenemos en el cuadro Nº 4.3.1que sigue: CUADRO Nº 4.3.1ALUMNOS García león Pérez Ruíz Lazo LoraPUNTAJES 40 65 52 70 76 56Ordenándolos de acuerdo a la magnitud del puntaje, establecemos los rangossiguientes en el cuadro Nº 4.3.1. CUADRO Nº 4.3.2ALUMNOS García león Pérez Ruíz Lazo LoraRANGOS 6 3 5 2 1 44.3.2 COEFICIENTE DE CORRELACIÓN POR RANGOSLa correlación por rangos se refiere a la correspondencia en el ordenamientode los elementos de dos conjuntos dados. La fuerza de la correlación se midepor medio del coeficiente por rangos de spearman, cuya fórmula es:En donde.P= letra griega rho, designa el coeficiente de correlación por rangos. 143
  • 145. D= diferencias de rangos correspondientes entre si pertenecientes a dosvariables X y Y. Por ejemplo d=n= numero de pares correspondientes.EJEMPLOS Nº 1En la primera columna de la izquierda del cuadro Nº 4.3.3 se presenta un grupode 5 estudiantes; en la segunda columna están sus niveles mentales que seconsideran como categorías de la variable X, en la tercera columna se indicanlos resultados de una prueba de matemáticas aplicadas al grupo, cuyaspuntuaciones son valores de la variable Y. CUADRO Nº 4.3.3ALUMNOS NIVEL MENTAL MATEMÁTICAS X YRodríguez medio 35Fernández interior al promedio 17Córdova superior al promedio 48flores muy superior al 42 promediolema muy inferior al promedio 20Calcular el coeficiente de correlación por rangos.ESTUDIANTES CLASIFICACION CLASIFICACION DE D= DIF D2 DE LOS RANGOS LOS RANGOS RANGO X RANGO Y 144
  • 146. SUSANA 1 1 0 0 ESTEBAN 2 3 -1 1 LOURDES 3 2 1 1 ALDO 4 6 -2 4 JUAN 5 4 1 1 MARIA 6 5 1 1 CESAR 7 8 -1 1 OLGA 8 7 1 1∑D2 = 10En la descripción de este cuadro la columna X corresponde a los rangos en laspruebas de habilidad mental, la columna Y corresponde a los rangos de laspruebas de los estudiantes de actitud académica. La columna D corresponde ala diferencia del rango de un elemento de la columna X menos el rango de sucorrespondiente elemento en la columna Y. en la columna D2 se halla elcuadrado de la diferencia anotada en la columna D.Ahora para medir la correlación entre los resultados de la prueba de habilidadmental y del examen de admisión, tomamos los datos del cuadro anterior en elque los datos están transformados en rangos.Conforme ya mencionamos en el ejemplo 1 la fuerza de la correlación en estetipo de problemas, se determina por el coeficiente p (rho) de correlación derangos de spearman. Aplicamos la formula N° 4,3,1 en dondeN= 8 pares∑D2 = 10, este número es el resultado de la suma de los números D elevadosal cuadrado que figuran la columna D2. 145
  • 147. Vemos que existe una correlación positiva fuerte entre las puntuaciones de laprueba de la habilidad mental y los puntajes de la actitud académica delexamen de admisión. Caso de rangos empatados o repetidosExaminemos el caso N° 4.3.7 y supongamos que en el examen de admisión deSusana y Esteban obtuvieron el mismo puntaje 55 y por lo tanto a cualquierade los dos le corresponde los rangos primero o segundo para romper estaindeterminación, convenimos en asignar a cada uno de ellos el promedio deambosRangos, o sea = 1.5 entonces tanto Susana como esteban tendrán elrangoTratemos ahora los rangos del VI Ciclo vemos que los profesores L Y P estánempleados o igualados en puntaje por lo que a cualquiera de los dos lecorresponde el rango 5 o el rango 6.el rango que le asignemos serán elresultado de promedio 5 y 6 que son los dos rangos empatados, luego (5+6) / 2=5.5 será el número que le asignamos como rango.Los profesores Fy Z tienen en el VI ciclo los rangos 3 y 4 a cualquiera de estosdos les corresponde el tercer o cuarto lugar. El número que les asignaremosserá (3+4) /2 = 3.5.Luego elaboramos una columna para los nuevos rangos Y en donde a losprofesores L y P les asignaremos el rango 5.5 y a los profesores F Y Z lesasignaremos el rango 3 Y 5. los profesores J Y K seguirán con los rangos 1 y 2respectivamente.En La Columna D se colocan las diferencias X – YNos ocuparemos ahora de la columna D2. En esta columna se encuentranvalores de la columna D elevados al cuadrado, luego sumamos los valores dela columna D2 y obtenemos = 17.Ahora aplicaremos la formula número 4.3.1. 146
  • 148. Aquí = 17.N= 6P= 1- 6 (17) = 0.5 6 (36 -1) 6 (36 – 1)Luego la correlación entre los puntajes asignados a los 6 pro0fesores por el Vciclo y los puntajes asignados por el VI ciclo es positiva, pero su magnitud noes ni muy fuerte ni muy débil.2º EJERCICIOCinco niños se someten a una pruebe de habilidad mental y los resultados deestas se ordenan por rangos en la columna X. también se muestran en lacolumna Y los rangos de estos mismos 5 niños respecto al tiempo que gastanal mirar la tv.? (Ver cuadro Nº 4.3.1)¿Existe correlación entre el rendimiento mental de los niños y el tiempo quegastan mirando tv.?Calculando los nuevos rangos para la columna Y teniendo en cuenta rangosigualados obtenemos: ALUMNOS x Y A 1 4o5 B 2 4o5 C 3 2o3 D 4 1 E 5 2o3¿Existe correlación entre el rendimiento mental de los niños y el tiempo quegastan mirando tv.? 147
  • 149. Calculando los nuevos rangos para la columna Y. teniendo en cuenta losrangos iguales obtenemos: X Y D D2 X-Y A 1 4.5 -3.5 12.25 B 2 4.5 -2.5 6.25 C 3 2.5 0.5 0.25 D 4 1 3 9 E 5 2.5 2.5 6.25 2 = 34.00Para Obtener Los Rangos Correspondientes A Los Niños A Y B HemosSumado Los Lugares Que Podrían Ocupar Cualquiera De Los Dos Y Que Son5 Y 4 Y Luego Esta Suma La Dividimos Entre El Numero De Rango IgualadosQue Son Dos, Esto Es: (4+5)/ 2= 4.5 Luego Rango Que Les Corresponda A AY B Es 4.5DE IGUAL FORMA PROCEDEMOS PARA LOS RANGO C Y E obteniendopara ellos como nuevo rango 2.5.Ahora añadiremos una nueva columna D, en esta columna escribiremosdiferencia entre uno de los rangos de x menos el correspondiente rango de Y.Elevamos al cuadrado cada valor de y y escribimos cada resultado en lacolumna del cuadrado. Luego sumamos los valores de la columna de D 2 y 2obtenemos =34.00 P= 1 – 1.7=+0.7 Luego obtenemos una correlación negativa cuya magnitud es 0.7 que es un valor fuerte para este tipo de situación.EJERCICIO PROPUESTO DE CÁLCULO DE COEFICIENTE DE SPEARMAN 148
  • 150. La tabla muestra siete estudiantes que ordenados alfabéticamente obtuvieronsu número de orden según sus calificaciones en teoría y práctica académica enun curso de lenguaje. Calcular el coeficiente de correlación de SPEARMAN. ALUMNOS PRACTICA X TEORIA Y A 7 6 B 4 7 C 6 5 D 3 2 E 5 1 F 2 4 G 1 32º EJERCICIOEl cuadro muestra las correspondientes alturas en centímetros de grupo depadres y de sus hijos primogénitos.1) calcular el coeficiente de correlación de espermas2) calcular también el coeficiente de Pearson3) son parecidos? ALTURA PADRE X ALTURA HIJOS Y 172 178 164 154 180 180 190 184 164 166 164 166 165 166 180 175RESPUESTA 1 p= 0.893º EJERCICIOEn la tabla los cinco siguientes individuos se han colocado por rangos de 1 a 5sobre X e Y. calcular el coeficiente de correlación. X Y 149
  • 151. A 2 3 B 1 2 C 3 1 D 5 5 E 4 4 RESPUESTA 1 p= 0.7 EJERCICIO El gerente del personal una empresa agroindustrial estudia la relación entre la variable dependiente Y y la variable independiente X de su personal obrero. Recoge una muestra aleatoria de 10 trabajadores y se obtuvieron los datos en dólares por semana. a) Determinar el diagrama de dispersión b) De su comentario sobre el valor de la pendiente La relación es positiva e imperfecta porque al pasar la recta no cruza por todos los puntos, sin embargo el valor de la pendiente se aproxima a uno. c) Estime el gasto que correspondería a un salario semanal de 90USD. 2 2Salario Gasto X Y XY (xi -Ẋ) (xi - Ẋ)^2 (Yi -Ῡ) (Yi -Ῡ)^2 (x) (y) 28 25 784 625 700 -17,8 316,84 -13,4 179,56 150
  • 152. 25 20 625 400 500 25 625 20 400 35 32 1225 1024 1120 35 1225 32 1024 40 37 1600 1369 1480 40 1600 37 1369 45 40 2025 1600 1800 45 2025 40 1600 50 40 2500 1600 2000 50 2500 40 1600 50 45 2500 2025 2250 50 2500 45 2025 35 30 1225 900 1050 35 1225 30 900 70 55 4900 3025 3850 70 4900 55 3025 80 60 6400 3600 4800 80 6400 60 3600 2 2ƩX=458 ƩY=384 ƩX =23784 ƩY =16168 ƩXY=19550 Ʃ(xi -Ẋ) Ʃ(xi - Ʃ(Yi -Ῡ) Ʃ(Yi-Ῡ)^2= =412,2 Ẋ)^2= =345,6 15722,56 23316,84 Desviación Estándar (X) Sx = Sx = = 48,28 Ẋ= Sy = = 39, 65 151
  • 153. Ῡ= + + + + + = 73, 54 gasto de un salario semanalr = -0.005 152
  • 154. COMENTARIO.- Vemos que los vehículos de 20 toneladas no tienen relación con los de40 toneladas, ya que a los de 20 se los utiliza más para las importaciones que los de 40debido a que son más ligeros al transportar las mercancías. 153
  • 155. 154
  • 156. 155
  • 157. 156
  • 158. 157
  • 159. PRUEBA DE HIPÓTESISHipótesis EstadísticaSe llama hipótesis, a una suposición o conjetura; que se formula, con elpropósito de ser verificada. Cuando se establece la veracidad de una hipótesis,se adquiere el compromiso de verificada en base a los datos de la muestraobtenida. La hipótesis estadística es fundamentalmente distinta de unaproposición matemática, debido que al decidir sobre su certeza podemos tomardecisiones equivocadas, mientras que en la proposición matemática podemosafirmar categóricamente si es verdadera o falsa.Hipótesis NulaEs una hipótesis que afirma lo contrario de lo que se quiere probar. En ella sesupone que el parámetro de la población que se está estudiando, tienedeterminado valor. A la hipótesis nula, se le representa con el símbolo Ho, y seformula con la intención de rechazarla.Ejemplo: Para decidir que una moneda está cargada, suponemos lo contrario,es decir, que la moneda es legal, esto es, que tiene igual probabilidad oproporción de salir cara, que de salir sello. Llamamos P (proporción poblacionalde cara) y Q (proporción poblacional de sello), P +Q = 1 (proporción del total o100% de los casos); pero la moneda es legal, entonces esperamos que P = Q,reemplazando P por Q, P + P = 1, 2P = 1 y P = 0.5, es decir, la proporciónpoblacional de éxito (cara), para todas las monedas legales es 0.5. Sobre estabase, durante la ejecución del experimento, aceptamos que actúan únicamentelas leyes del azar, descartando la influencia de cualquier otro factor.Hipótesis AlternativaEs una hipótesis diferente de la hipótesis nula. Expresa lo que realmentecreemos es factible, es decir, constituye la hipótesis de investigación. Se ledesigna por el símbolo . En el ejemplo citado, la hipótesis alternativa sería: : P ≠ 0.5, es decir, P > 0.5 o P < 0.5, si es que queremos realmenteaveriguar que la moneda no es legal.Concepto de significación en una Prueba EstadísticaSuponiendo que está formulada una hipótesis y que al realizar un experimentopara someterla a prueba encontramos que el estadístico de la muestra, difieremarcadamente del valor del parámetro que establece la hipótesis nula , enese caso, decimos que la diferencias encontradas son significativas y estamos 158
  • 160. en condiciones de rechazar la hipótesis nula o, al menos no aceptarla enbase a la muestra obtenida.En realidad estamos determinando, si la diferencia, entre el valor del parámetroestablecido en y el valor del estadístico obtenido en la muestra, se debe tansolo al error de muestreo (en este caso aceptamos ); o si la diferencia es tangrande que el valor obtenido por el estadístico de la muestra, no es fruto delerror de muestreo, en este caso rechazamos .Prueba de HipótesisSe le llama también ensayo de hipótesis o dócima de hipótesis. Sonprocedimientos que se usan para determinar, se es razonable o correcto,aceptar que el estadístico obtenido en la muestra, puede provenir de lapoblación que tiene parámetro, el formulado en .Como resultado de la prueba de hipótesis, aceptamos o rechazamos . Siaceptamos , convenimos en que el error de muestreo (el azar), por sí solo,puede dar lugar al valor al estadístico que origina la diferencia entre éste y elparámetro. Si rechazamos , convenimos que la diferencia es tan grande, queno es fruto del error de muestreo (al azar) y concluimos que el estadístico de lamuestra no proviene de una población que tenga el parámetro estudiado.El mecanismo para rechazar la hipótesis , es el siguiente: suponemos comoválida la hipótesis nula , la que afirma que el parámetro tiene cierto valor(supongamos el caso de la media poblacional entonces : ʯ = . Tomamosuna muestra y calculamos el estadístico de la muestra (para el caso de lamedia el estadístico es la media muestral x). Como suponemos que escierta, podemos suponer que la muestra proviene de la población que tienecomo parámetro el de (es decir, no serán muy diferentes) y laprobabilidad de que dicha diferencia muestral pequeña aparezca, será grande.Si en cambio tomamos una muestra de una población que no tiene comoparámetro , en dicho caso el valor de x - , será grande, (x será muydistinto que ), es decir, dicha diferencia será significativa, y la probabilidad deobtener dicha diferencia muestral al muestrear, será peque a. ecesitamos unestándar, es decir, un valor tal que, al comparar con l la probabilidad deobtener una diferencia entre x y , nos permita aceptar o rechazar .Llamemos a este valor el nivel de significación. ste será tal que, si laprobabilidad de la diferencia entre x y es muy peque a (menor que ),rechazaremos y la muestra aleatoria no proviene de la población conparámetro ; si la probabilidad de la diferencia entre x - es grande (mayorque ) aceptamos y la muestra aleatoria proviene de la población conparámetro . 159
  • 161. Cuando se toma la decisión de rechazar o aceptar la hipótesis , se corre elriesgo de equivocarse (recuerde que nos hemos referido a la probabilidad deobtener una diferencia entre x y y no de un hecho establecido), es decir, decometer errores.Estos posibles errores son:Error tipo IConsiste en rechazar la hipótesis , cuando en realidad no debería serrechazada, por ser verdadera. La probabilidad de cometer el error tipo I, sellama alfa ( ).Error tipo IIConsiste en no rechazar a hipótesis Ho, cuando debería ser rechazada por serfalsa. La probabilidad de cometer el error tipo II, se llama beta (β).Se debe procurar que la probabilidad de los errores tipo I y tipo II, sean las máspequeñas posibles, sin embrago, para un tamaño de muestra dado, el quererdisminuir un tipo de error, trae consigo, incrementar el otro tipo de error. Laúnica forma de disminuir ambos errores, es aumentar el tamaño de la muestra.Nivel de significación de una Prueba Estadística.En relación a la comprobación de una hipótesis dada, se llama nivel designificación, a la probabilidad a de cometer el error tipo I, al rechazar lahipótesis nula Ho.Los niveles de significación más usados en la práctica son: de 0.05 (5%) y de0.01 (1%).El nivel de significación de 5% se interpreta de la siguiente manera: en 100casos, cabe esperar, que en 5 de ellos se cometa una decisión equivocada, alrechazar la hipótesis Ho, cometiendo, en consecuencia, un error de tipo I.Pasos de una Prueba de Hipótesis1o Formular la Ho y la H1 160
  • 162. 2o Determinar si la prueba es unilateral o bilateral.3o Asumir el nivel de significación de la prueba.4oDeterminar la distribución muestral que se usara en la prueba.5o Elaborar el esquema de la prueba.6o Calcular el estadístico de la prueba.7o Tomar la decisión, para esto, se comparan el esquema de la parte. 5o, con el estadístico del paso 6o.Ejemplo de una prueba de hipótesis utilizando los pasos anteriores.Se realiza el experimento aleatorio de lanzar 50 veces una moneda,obteniéndose 34 veces el resultado cara. Al nivel de significación de 5%, sequiere averiguar si la moneda está cargada. 1) Ho: P= 0.5, la moneda no está cargada. H1: P≠ 0.5 la moneda está cargada (P>0.5 ó P<0.5). 2) La prueba debe ser bilateral o de dos colas, porque hay dos posibilidades en la H1: a) Si se obtiene muchas veces cara, entonces la moneda está cargada de un lado (P>0.5). b) Si se obtiene pocas veces cara, entonces la moneda está cargada del otro lado (P<0.5). 3) Asumimos el nivel de significación de 5%, con lo que estamos aceptando de que con la probabilidad de 0.05, puede ocurrir que se rechace Ho, a pesar de ser verdadera; cometiendo por lo tanto el error de tipo I. la probabilidad de no rechazar Ho, será de 0.95. 4) Determinar la distribución muestral que se utilizara en la prueba. Tenemos por dato muestral la proporción , el parámetro de Ho, es la proporción poblacional P; entonces utilizaremos la distribución muestral de proporciones para describir la variación de las muestras por el error d 161
  • 163. muestreo. Tamaño de muestra n= 50> 30. (Muestra grande) aproximaremos la distribución muestral de proporciones, mediante la distribución normal, porque n=50> 30. 5) Esquema de la prueba: En la distribución normal de probabilidades estandarizadas, para el nivel de significación de 5%, el nivel de confianza será de 95%, entonces los coeficientes críticos o coeficientes de confianza para la prueba bilateral serán: -1.96 1.96, es decir -1.96 ≤ z ≤ 1.96. El esquema correspondiente es:162
  • 164. Si al realizar el experimento y calcular el puntaje estandarizado Z, encontramosque Z cae fuera del intervalo -195 ≤ z ≥ 1.96, esto indicara que se deberechazar H˳Si por el contrario Z cae dentro del intervalo ya mencionado, eso indicara queno debemos rechazar H˳Vemos que hay dos regiones e rechazo, por eso la prueba se llama pruebabilateral o de dos colas.6) Cálculo de Z. utilizando la fórmula 5.3.2Donde Xi corresponde en este caso a la producción de la muestra: p` : es la medida de la distribución muestral de proporciones, igual a laproporción poblacional P de H˳ : es la desviación estándar de la distribución muestral de proporciones,llamada también error estándar de la proporción: p` 163
  • 165. Ejemplo de Prueba de una Cola o Unilateral.Un laboratorio afirma que uno de sus productos tiene 905 de efectividad paracurar una enfermedad. En una muestra de 200 persona de aliviaron 160.Determinar que a afirmación no es cierta, es decir, la medicina cura meno del90% de los casos. Sea el nivel de significación 0.05. 1) .- H˳: P = 0.90 P, proporción poblacional de éxito. H1: P < 0.90 Es lo que queremos probar. 2) .- Habrá una sola región de rechazo o región crítica y es aquella en la que la proporción de personas curadas por la medicina es menor que 0.90; luego se trata de una prueba unilateral, o de una sea cola; en esta 164
  • 166. caso de cola izquierda, que es la dirección a la que apunta la desigualdad de H1. 3) Asumiendo el nivel de significación de 5% (0.05), en la distribución normal de probabilidades estandarizada se tiene el coeficiente critico de Z= -1.65. 4) Como el dato es una proporción muestral, y en H o hay una proporción poblacional, usaremos la distribución muestral de proporciones. 5) El esquema de la prueba es:165
  • 167. ´P = Proporción de la muestra =P = Proporción de la población P = 0.9Grados de libertad: el termino libertad se refiere a libertad para variar y recogerdatos de la muestra. Analicemos la fórmula para la desviación estándarcorregidaPara calcular la desviación estándar es necesario estimar la media poblacionalû mediante x= u, es decir se eta estimando un parámetro poblacional por lotanto por grados de libertad serán n-1. Al querer calcular la desviación estándarha disminuido en uno la libertad de escoger los datos, por haber estimado unparámetro, la media poblacional.En la prueba de student de diferencia de medidas, se estimaran dos mediaspoblacionales de cada una de las dos poblaciones de las cuales se toman losdatos, para calcular las dos medias. Los grados de libertad serán n1+n2-2donde n1 es el tamaño de la muestra 1, tomada de la población 1 y n2 es eltamaño de la muestra tomada de la población 2.Los grados de libertad están representados por la siguiente formulaGl=n-kN: numero de observaciones independientesK: numero de parámetros estimadosDistribución de StudentCuando:i) el tamaño de la muestra es pequeño y este es menor que 30ii) la población de donde se obtienen los datos está distribuida normalmente 166
  • 168. iii) se desconoce la desviación estándar de la población entonces haremos uso de la distribución de Student La distribución de Student está representada por el estadístico t: El estadístico z de la distribución normal era En el denominador de t tenemos s, que varía de muestra en muestra. En el denominador de z tenemos o , la desviación estándar de la población que es una constante; t sigue una distribución de Student con n-1 grados de libertad, los valores de t se pueden encontrar en la tabla correspondiente en el apéndice de este libro. Existe un valor específico para cada grado de libertad asociado con un determinado nivel de significación. La grafica de la distribución de Student es mas aplanada que la distribución normal Z.Distribución normal Distribución de student Ejemplo de prueba de una media utilizando la distribución de student Se aplico un test de inteligencia a una muestra de 15 alumnos de un salón de clase de cierto Colegio y se determino un CI promedio de 105.4 con una desviación estándar de 5.3. Se saber que al estandarizar el mencionado test en los colegios secundarios de la localidad, se hallo un CI medio de 101. Asumiendo un nivel de significación de 1% probar que el rendimiento mental 167
  • 169. del grupo de 15 alumnos, es más alto que el promedio de estandarización deltest.U= rendimiento mental medio de estandarización = 101X= rendimiento mental medio de la muestra = 105,41) formulación de la hipótesisH0:µ = 101, no existe diferencias significativas en el rendimiento mental, de lamuestra X y de la poblaciónH1: µ= >1012) prueba unilateral de cola derecha, de acuerdo con H1,3) Nivel De Significación Asumido: 1% = 0.014) Distribución aplicable para la pruebaConsiderando que los datos son la media de la muestra X y la mediapoblacional µ, se debe reutilizar la distribución maestral de medias, ademáscomo n <30 (muestra pequeña) y se desconoce 0 (desviación estándar de lapoblación) se empleara la distribución de student, ya que ese sabe los valoresde CI siguen una distribución normal.5) Esquema grafico de la pruebaEl nivel de significación es a = 0.01Los grados de libertad son:Gi= n-1 = 15 – 1=14g. de libEn la tabla de distribución de student, con 14gl, a = 0.01 y prueba de 1 cola,encontramos el t crítica: tc =2.624 168
  • 170. 6) Cálculo del estadístico de la pruebaDatosX= 105.4 ; µ = 101 ; s= 5.3 ; n= 15 169
  • 171. 7) toma de decisionesObservamos que t=3.11 se ubica en la región de rechazo por tanto se descartaque µ = 101 y se acepta la alternativa µ > 101 es decir el grupo de 15 alumnostiene rendimiento mental mayor que el promedio de estandarización.Ejemplo:Una tableteadora de un laboratorio farmacéutico produce comprimidos de ciertomedicamento, con un peso medio de 2grs. Por comprimido. Para determinar sila maquina sigue en buenas condiciones de producción, se tomó una muestrade 10 tabletas cuyos pesos en gramos son: 2.04; 1.96; 2.00; 1.98: 2.02; 2.01;1.97; 1.94; 2.03; 2.01, asumiendo un nivel de significación de 0.01, verificar quela maquina no está enBuenas condiciones de producción.Llamemos:µ: el peso medio de las tabletas producidas por la máquina. 1) Formulación de hipótesis H0: µ= 2, la maquinas se halla en buenas condiciones. 170
  • 172. H1: µ ≠ 2, la maquina no se halla en buenas condiciones 2) Prueba bilateral porque en H1 hay dos posibilidad µ>2 o µ< 2 3) Nivel de significación , s4e asume el 1% = 0.01 4) Distribución de probabilidad apropiada para la prueba. Considerando que las hipótesis se refieren a medios poblacionales, que se da como dato el valor de la media población µ= 2grs, y que se puede calcular la media de la muestra, utilizaremos la distribución muestral de las medias para efectuar la prueba. Siendo la muestra pequeña (n= 10) y la desviación de student o de la población desconocida, no es aplicable la distribución normal y por tanto recurridos a la distribución de student, asumiendo que la población.171
  • 173. 172
  • 174. Ejercicio.Un laboratorio afirma que uno de sus productos tiene el 90% de efectividadpara curar una enfermedad. En una muestra de 200 personas se aliviaron 160.Determinar que la afirmación no es cierta, es decir que la medicina cura menosdel 90% de los casos. Si el nivel de significancia (error de estimación) es del0,051.- HALLAR H0 Y HA2.- DETERMINAR LA CAMPANA DE GAUSSEs unilateral de una cola3.- DETERMINAR EL VALOR DE CONFIANZA4.- DETERMINAR EL VALOR DE n5.- GRAFICAR LA CAMPANA DE GAUSS 173
  • 175. 6.- CALCULAR EL VALOR DE Z = 0,80 174
  • 176. 7.- rechazo de la hipótesis nula y aceptación de la hipótesis alternativa, porquelos medicamentos curan menos del 90% a los pacientes.Ejercicio.Una muestra de 80 alambres de acero producidos por la Fábrica A, da unaresistencia media a la rotura de 1230lobras con una desviación estándar de120 libras. Una muestra de 100 alambres de acero producidos por la Fábrica Bda una resistencia media a la rotura de 1190 libras con una desviaciónestándar de 90 libras. ¿Hay una diferencia real en la resistencia media de lasdos marcas de alambre de acero, si el nivel de confianza es el 95%?1.- DETERMINAR LA HO Y LA HA. Ho: U1 = U2 Ha: U1  U22.- DETERMINAR LA CAMPANA DE GAUSSLa campana de gauss es bilateral de 2 colas3.- DETERMINAR EL VALOR DE CONFIANZA Nivel de significancia o E.E. = 0,05 Z =1,96 valor estandarizado 175
  • 177. 4.- DETERMINAR QUÉ TIPO DE MUESTRA SE UTILIZA n 1 = 80 n > 30 n 2 = 100 n > 30 Prueba de Hipótesis5.- CONSTRUIR LA CAMPANA DE GAUSS6.- CALCULAR EL PUNTAJE Z 1 = 1230 S1 = 120 2 = 1190 S2 = 90 176
  • 178. 7.- Rechazo la hipótesis nula y acepto la hipótesis alternativa. La rotura de losalambres de la Fábrica A es diferente a la rotura de los alambres de la FábricaB.Ejercicio.Los salarios diarios de una industria particular tiene una distribución normal conmedia de 23,20 dólares y una desviación estándar de 4,50 dólares. Si unacompañía de esta industria emplea 40 trabajadores, les paga un promedio de21,20 dólares. ¿Puede se acusada esta compañía de pagar salarios inferiorescon un nivel de significancia del 1%?1.- DETERMINAR LA HO Y LA HA. Ho: U = 23,20 Ha: U > 23,202.- DETERMINAR LA CAMPANA DE GAUSS La campana de gauss es de una cola3.- NIVEL DE CONFIANZA = 99% 177
  • 179. 4.- DETERMINAR QUÉ TIPO DE MUESTRA SE UTILIZA5.- CONSTRUIR LA CAMPANA DE GAUSS6.- CALCULAR EL PUNTAJE Z7.- Rechazo la hipótesis nula y acepto la hipótesis alternativa. No está pagandoa los trabajadores lo que les corresponde entonces debe entrar a un juicio pararesolver este inconveniente. 178
  • 180. Ejercicio.Según una encuesta realizada se afirma que la exportación de petróleo crudotiene el 95% de efectividad para comercializarse en el mercado internacional.En una muestra de 45 países a los que se envía el petróleo ecuatoriano, sereflejaron que 35 países los más grandes importadores de petróleo tienenventas elevadas. Determinar que la afirmación no es cierta, es decir que laexportación de petróleo se comercializa en menos del 95%. Si se tiene un nivelde significancia del 0,05. 1. Ho: U = 95% Ha: U < 95% 2. La campana de Gauss es de una cola 3. α = 95% Error de Estimación: 0,05 Z = -1,65 4. n = 45 n > 30 Prueba de Hipótesis 5. Construir Campana de Gauss 6. 179
  • 181. 7. Rechazo la hipótesis nula y acepto la hipótesis alternativa. Las exportaciones de petróleo que el Ecuador realiza a diferentes países se comercializan en más del 95%, por lo que el país puede continuar realizando sus exportaciones al exterior.ORGANIZADOR GRTÁFICO Es una suposición o conjetura respecto a una característica Proposición sobre los parámetros de una PRUEBA Al aceptar o rechazar la hipótesis nula debe población o sobre la distribución de DE asumirse un determinado error al probabilidad de una variable aleatoria HIPÓTESIS tomar una decisión Procedimiento de toma de decisión que conduce a la aceptación o rechazo de hipótesisestadísticas 180
  • 182. DISTRIBUCIÓN T-STUDENTEn probabilidad y estadística, la distribución t-Student es una distribución deprobabilidad que surge del problema de estimar la media de una poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño.Una variable aleatoria se distribuye según el modelo de t-Student con n gradosde libertad, donde n es un entero positivo, si su función de densidad es lasiguiente: n 1 ( ) 1 2 t 2  2 ( n 1) (1  )  n ( ) n n ( p)   x p 1e  x dxf(t)= 2 , -   t   , 0 siendo p>0La gráfica de esta función de densidad es simétrica respecto del eje deordenadas, con independencia del valor de n, y de forma semejante a ladistribución normal.Propiedades: n 1. La media es 0 y su varianza n  2 , n>2. 2. La gráfica de la función de densidad es en forma de campana. 3. Los datos están más disperso que la curva normal estándar. 4. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1). 5. La gráfica es muy parecida a la de la normal estándar diferenciándose en que las colas de t están por encima de la normal, y el centro se encuentra por debajo del de la normal. 6. Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal.Ejercicio:La empresa de transporte pesado TRANSURGIR de la ciudad de Tulcánadquirió camines nuevos que cargan un peso aproximado a 15 toneladascada uno para determinar si esta afirmación es verdad se tomo una muestra de7 camiones con repletos de carga cuya carga pesaba; 15,04tonn, 14,96tonn,15tonn, 14,98tonn, 15,2tonn, 15,1tonn y 14,96tonn. Asumiendo un nivel de 181
  • 183. significancia de 0,01 verificar que los camiones si cumplen con el pesoestablecido.Ho: u=15tonn Ha: u≠2 u es diferente de dos 1) Bilateral 2) 99% 0,01 gl=n-1 gl= 10-1= 9 t=±3,250 3) n˂30 T-student 4) GRAFICA 2Xi (Xi-X) (Xi-X) 15,04 0,006 0,000032653 14,96 -0,074 0,005518367 15 -0,034 0,00117551 14,98 -0,054 0,002946939 15,2 0,166 0,027461224 15,1 0,066 0,004318367 14,96 -0,074 0,005518367 - 105,24 0,000000000000008881784197 0,046971429 – – 5) 182
  • 184. 6) Aceptamos la hipótesis nula y rechazamos la hipótesis alternativa ya que el peso que puede transportar cada camión se encuentra en la zona de aceptación.ORGANIZADOR GRÁFICO LAS TABLAS DE LA DISTRIBUCIÓN T DE STUDENT DAN VALORES ACUMULADOS DE IZQUIERDA A DERECHA. ES UNA PRUEBA SURGE DE ESTIMAR LA ESTADISTICA PARA MEDIA DE UNA EVALUAR SI DOS DISTRIIBUCIÓN POBLACIÓN GRUPOS DIFIEREN NORMALMENTE ENTRE SI DE MANERA T - STUDENT DISTRIBUIDA CUANDO SIGNIFICATIVA EL TAMAÑO DE LA RESPECTO DE SUS MUESTRA ES PEQUEÑA. MEDIAS SIRVE PARA LA DETERMINACIÓN DE LAS DIFERENCIAS ENTRE LAS DOS MEDIAS MAESTRALES Y PARA LA CONSTRUCCIÓN DEL INTERVALO DE CONFIANZA 183
  • 185. TAREA REGRESIÓN SIMPLE Y CORRELACIÓNLa Regresión y la correlación son dos técnicas estadísticas que se puedenutilizar para solucionar problemas comunes en los negocios.Muchos estudios se basan en la creencia de que es posible identificar ycuantificar alguna Relación Funcional entre dos o más variables, donde unavariable depende de la otra variable.Se puede decir que Y depende de X, en donde Y y X son dos variablescualquiera en un modelo de Regresión Simple."Y es una función de X"Y = f(X)Como Y depende de X,Y es la variable dependiente, yX es la variable independiente.En el Modelo de Regresión es muy importante identificar cuál es la variabledependiente y cuál es la variable independiente.En el Modelo de Regresión Simple se establece que Y es una función de sólouna variable independiente, razón por la cual se le denomina tambiénRegresión Divariada porque sólo hay dos variables, una dependiente y otraindependiente y se representa así:Y = f (X)"Y está regresando por X"La variable dependiente es la variable que se desea explicar, predecir.También se le llama REGRESANDO ó VARIABLE DE RESPUESTA.La variable Independiente X se le denomina VARIABLE EXPLICATIVA óREGRESOR y se le utiliza para EXPLICAR Y. 184
  • 186. REGRESIÓN LINEAL SIMPLEEn el estudio de la relación funcional entre dos variables poblacionales, unavariable X, llamada independiente, explicativa o de predicción y una variable Y,llamada dependiente o variable respuesta, presenta la siguiente notación:Y=a+bX+eDonde:a: es el valor de la ordenada donde la línea de regresión se intercepta con eleje Y.b: es el coeficiente de regresión poblacional (pendiente de la línea recta)e: es el errorSUPOSICIONES DE LA REGRESIÓN LINEAL 1. Los valores de la variable independiente X son fijos, medidos sin error. 2. La variable Y es aleatoria 3. Para cada valor de X, existe una distribución normal de valores de Y (subpoblaciones Y) 4. Las variancias de las subpoblaciones Y son todas iguales. 5. Todas las medias de las subpoblaciones de Y están sobre la recta. 6. Los valores de Y están normalmente distribuidos y son estadísticamente independientes.ESTIMACIÓN DE LA ECUACIÓN DE REGRESIÓN MUESTRALConsiste en determinar los valores de "a" y "b " a partir de la muestra, es decir,encontrar los valores de a y b con los datos observados de la muestra. Elmétodo de estimación es el de Mínimos Cuadrados, mediante el cual seobtiene: 185
  • 187. Luego, la ecuación de regresión muestral estimada esQue se interpreta como:a es el estimador de aEs el valor estimado de la variable Y cuando la variable X = 0b es el estimador de b , es el coeficiente de regresiónEstá expresado en las mismas unidades de Y por cada unidad de X. Indica elnúmero de unidades en que varía Y cuando se produce un cambio, en unaunidad, en X (pendiente de la recta de regresión).Un valor negativo de b sería interpretado como la magnitud del decremento enY por cada unidad de aumento en X. PRUEBA DE HIPÓTESISA partir de esta unidad estudiaremos lo relacionado a probar diferentes tipos dehipótesis, empezando por definir que es una hipótesis y una prueba dehipótesis, enlistaremos los pasos para probar una hipótesis, y realizaremospruebas de hipótesis relativas a la media de una población y a las medias dedos poblaciones.¿Qué es una hipótesis?Hipótesis es una afirmación o suposición respecto al valor de un parámetropoblacionalSon ejemplos de hipótesis, o afirmaciones hechas sobre un parámetropoblacional las siguientes: El ingreso mensual promedio de todos los ciudadanos es $4500.00 El 20% de los delincuentes capturados son sentenciados a prisión 186
  • 188. El 90% de las formas fiscales son llenadas correctamenteTodas estas hipótesis tienen algo en común, las poblaciones de interés son tangrandes que no es factible estudiar todos sus elementos. Como ya sabemos,una alternativa a estudiar la población entera es tomar una muestra de lapoblación de interés. De esta manera podemos probar una afirmación paradeterminar si la evidencia soporta o no la afirmación.¿Qué es una prueba de hipótesis?Una prueba de hipótesis comienza con una afirmación o suposición acerca deun parámetro poblacional, tal como la media poblacional. Una hipótesis podríaser que la colegiatura que pagan los estudiantes universitarios de la RepúblicaMexicana es en promedio de 3000 pesos. Para comprobar esta hipótesis nopodríamos contactar a todos los estudiantes universitarios de la república, elcosto sería exorbitante. Para probar la validez de esta afirmación podríamosseleccionar una muestra de la población de estudiantes y basados en ciertasreglas de decisión, aceptar o rechazar la hipótesis. Si la media muestral fuerade 1000 pesos ciertamente tendríamos que rechazar la hipótesis, pero si lamedia muestral fuera 2990 pesos ¿podríamos asumir que la media poblacionalsi es de 3000 pesos?, ¿podemos atribuir al error de muestreo la diferencia de10 pesos entre las dos medias, o es una diferencia significativa?Prueba de hipótesis es un procedimiento basado en una evidencia muestral yla teoría de la probabilidad, usado para determinar si la hipótesis es unaafirmación razonable para no ser rechazada, o es una afirmación pocorazonable y ser rechazada.Procedimiento de 4 pasos para probar una hipótesisHay un procedimiento de cuatro pasos que sistematizan la prueba de hipótesis.Para ilustrar el procedimiento, completemos el ejemplo anterior. Supongamosque la muestra es de 20 estudiantes y el nivel de significancia es de .05. Loscuatro pasos son los siguientes:Paso 1. Establecer las hipótesis nula y alternaEl primer paso es establecer la hipótesis a ser probada. Esta es llamada lahipótesis nula, simbolizada por H0, el subíndice cero implica “cero diferencia”.Usualmente el t rmino “no” es encontrado en la hipótesis nula significando “nocambio”. La hipótesis nula de la introducción podría ser “la colegiatura mensual 187
  • 189. promedio de los estudiantes universitarios no es diferente de 3000 pesos”. stoes lo mismo que decir “…es igual a 3000 pesos”. La hipótesis nula se puedesimbolizar H0: µ = 3000.La hipótesis nula es una afirmación que será aceptada si los datos de lamuestra no nos proveen de evidencia convincente de que es falsa, es decir, sise acepta la hipótesis nula decimos que la evidencia no es suficiente pararechazarla pero no podemos afirmar que es verdadera.La hipótesis alterna es la afirmación que se acepta si se rechaza la hipótesisnula. Esta hipótesis, también llamada hipótesis de investigación, se simbolizacon Ha. La hipótesis alterna es aceptada si la evidencia proporcionada por lamuestra es suficiente para afirmar que la Ho es falsa.En este ejemplo las hipótesis serían las siguientes:Ho: La colegiatura promedio de los estudiantes no es diferente de 3000 pesosHo: µ = 3000Ha: La colegiatura promedio de los estudiantes es diferente de 3000 pesosHa: µ ≠ 3000Paso 2. Determinar el criterio de contrasteDeterminar el criterio de contraste consiste en especificar el nivel designificancia, el tipo de distribución, y los valores críticos.Existen cuatro posibilidades al tomar una decisión respecto a una hipótesis: Aceptar Ho Rechazar Ho Decisión Error Ho verdadera correcta Tipo I Error Decisión Ho falsa Tipo II correctaNivel de significancia es la probabilidad de rechazar una hipótesis nulaverdadera 188
  • 190. El nivel de significancia es simbolizado por α, y también es conocido comonivel de riesgo. Este último término es más apropiado porque es el riesgo quese toma de rechazar una hipótesis verdadera.No hay un nivel de significancia para todos los estudios, se puede utilizarcualquier valor de probabilidad entre 0 y 1. Tradicionalmente, el nivel de .05 esaplicado a proyectos de investigación, el nivel .01 a control de calidad, y .10 asondeos políticos. Tú como investigador debes decidir el nivel de significanciaantes de colectar la muestra de datos.El tipo de distribución se determinará dependiendo de la naturaleza de lahipótesis y del tamaño de la muestra. Cuando la hipótesis es relativa a mediaspoblacionales y las muestras son grandes (n>30) se utiliza la distribuciónnormal. Cuando es relativa a la media y la muestra es chica (n≤30) se utiliza ladistribución t de student.Los valores críticos son los valores de la variable de la distribución que limitanel área crítica, que es la parte de la curva que corresponde al nivel designificancia.En este ejemplo el nivel de significancia es de .05, se utiliza la distribución t destudent porque la muestra es pequeña, los valores críticos se encontraron de lasiguiente manera l área crítica cuando la hipótesis alterna tiene el símbolo ( ≠ ) se divide en dosy se dice que el problema es de dos colas, y cada cola vale /2. Si la Ha tieneel signo (<) el problema es de la cola izquierda, si tiene el signo(>) es de la coladerecha, y en ambos casos la cola vale . ste problema es de dos colas: 189
  • 191. Paso 3. Calcular el estadístico de pruebaEl estadístico de prueba es un valor obtenido de la información de la muestrapara compararlo con el criterio de contraste y rechazar o aceptar la hipótesis. Elestadístico de prueba cambia de acuerdo a la distribución que se utilice. Eneste problema el estadístico de prueba es t y se simboliza t*Supongamos que las colegiaturas de los estudiantes universitariosentrevistados son las siguientes:2821 3102 2398 2511 32222329 3109 2725 3627 29333822 3044 3125 2650 27413054 3281 2292 2952 2462La media y la desviación estándar de la muestra son 2910 y 411.95respectivamente, se procede enseguida a calcular el error estándar y la t*Paso 4. Tomar decisión y conclusiónUna regla de decisión es establecer las condiciones sobre las cuales lahipótesis nula es rechazada o no rechazada. Si el estadístico de prueba quedadentro de la zona crítica la hipótesis nula deberá ser rechazada. Si el 190
  • 192. estadístico de prueba queda fuera de la zona crítica la hipótesis nula nodeberá ser rechazada.En el ejemplo de las colegiaturas, como el estadístico de prueba quedó fuerade la zona crítica la hipótesis nula no puede ser rechazada. La conclusiónpodría ser la siguiente:“ o hay evidencia suficiente para afirmar que la colegiatura que pagan enpromedio los estudiantes universitarios es diferente de 3000 pesos, en un nivelde significancia de .05” DISTRIBUCIÓN T-STUDENTEn probabilidad y estadística, la distribución t-Student es una distribución deprobabilidad que surge del problema de estimar la media de una poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño.Una variable aleatoria se distribuye según el modelo de t-Student con n gradosde libertad, donde n es un entero positivo, si su función de densidad es lasiguiente: n 1 ( ) 1 2 t 2  ( n 1) (1  ) 2  n ( ) n n ( p)   x p 1e  x dxf(t)= 2 , -   t   , 0 siendo p>0La gráfica de esta función de densidad es simétrica respecto del eje deordenadas, con independencia del valor de n, y de forma semejante a ladistribución normal. 191
  • 193. Propiedades: n 7. La media es 0 y su varianza n  2 , n>2. 8. La gráfica de la función de densidad es en forma de campana. 9. Los datos están más disperso que la curva normal estándar. 10. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1). 11. La gráfica es muy parecida a la de la normal estándar diferenciándose en que las colas de t están por encima de la normal, y el centro se encuentra por debajo del de la normal. 12. Cuando los grados de libertad son altos, los valores de t coinciden con los de la normal. EJERCICIOS1.- El gerente de personal de la empresa P&C quiere estudiar la relación entreel ausentismo y la edad de sus trabajadores, tomó una muestra aleatoria de 10trabajadores de la empresa y encontró los siguientes datos. Ausentismo Edad (años) (días por año) 25 18 450 625 324 313,29 43,56 46 12 552 2116 144 10,89 0,36 58 8 464 3364 64 234,09 11,56 37 15 555 1369 225 32,49 12,96 55 10 550 3025 100 151,29 1,96 32 13 416 1024 169 114,49 2,56 41 7 287 1681 49 2,89 19,36 50 9 450 2500 81 53,29 5,76 23 16 368 529 256 388,09 21,16 60 6 360 3600 36 299,29 29,16 192
  • 194. PRIMER MÉTODO SEGUNDO MÉTODO193
  • 195. TERCER MÉTODO CUARTO MÉTODO QUINTO MÉTODO y Serie 1 50 f(x)=-0.25985876*x+22.495969; R²=0.7281 40 30 20 10 x-5 5 10 15 20 25 30 35 40 45 50 55 60 65 70 -10 -20194
  • 196. 2.- El banco de préstamos estudia la relación entre ingreso (X) y de ahorros (Y)mensuales de sus clientes. a) Determinar la ecuación lineal de las dos variables. b) Trace el diagrama de dispersión en el plano cartesiano 400 350 300 Título del eje 250 200 Y 150 100 Lineal (Y) 50 0 0 200 400 600 800 1000 Título del eje c) Estime el ingreso que corresponde a un ahorro semanal de 90 dólares. d) Si el ahorro es de 200 dólares que gasto puede realizar el obrero en dicha semana. e) Si el ingreso es de 350 dólares cual es el salario. 195
  • 197. DesarrolloIngresos Ahorros x Y XY X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2 350 100 35000 122500 10000 -283,33 80275,89 -111,11 12345,43 400 110 44000 160000 12100 -233,33 54442,89 -101,11 10223,23 450 130 58500 202500 16900 -183,33 33609,89 -81,11 6578,83 500 160 80000 250000 25600 -133,33 17776,89 -51,11 2612,23 950 350 332500 902500 122500 316,67 100279,89 138,89 19290,43 850 350 297500 722500 122500 216,67 46945,89 138,89 19290,43 700 250 175000 490000 62500 66,67 4444,89 38,89 1512,43 900 320 288000 810000 102400 266,67 71112,89 108,89 11857,03 600 130 78000 360000 16900 -33,33 1110,89 -81,11 6578,83 5700 1900 1388500 4020000 491400 410000 90288,89 Primer caso X= Y= 196
  • 198. 3.- Un comerciante mayorista encargo un estudio para determinar la relaciónentre los gastos de publicidad semanal por radio y las ventas de sus productos.En el estudio se obtuvieron los siguientes resultados.Semana 2 3 4 5 6 7 8 9 10 11Gasto de Publicidad ($) 30 20 40 30 50 70 60 80 70 80Venta ($) 300 250 400 - 550 750 630 930 700 840En la quinta semana por diversos motivos no se pudo hacer el estudio a) Determine la ecuación de regresión de ventas sobre gastos de publicidad Semanas Ingresos Ahorros x Y xy 2 30 300 9000 900 90000 -25,6 652,80 -294,44 86694,91 3 20 250 5000 400 62500 -35,55 1263,80 -344,44 118638,91 4 40 400 16000 1600 160000 -15,55 241,80 -194,44 37806,91 6 50 550 27500 2500 302500 -5,55 30,80 -44,44 1974,91 7 70 750 52500 4900 562500 14,45 208,80 155,56 24198,91 8 60 630 37800 3600 396900 4,45 19,80 35,56 1264,51 9 80 930 74400 6400 864900 24,45 597,80 335,56 112600,51 10 70 700 49000 4900 490000 14,45 208,80 105,56 11142,91 11 80 840 67200 6400 705600 24,45 597,80 245,56 60299,71 500 5350 338400 31600 3634900 0,05 3822,22 454622,22X= 197
  • 199. Y= 198
  • 200. b. Estime la cosecha si se aplica 12 sacos de fertilizantes. 1000 Título del eje 800 600 400 Ahorros Y 200 Lineal (Ahorros Y) 0 0 50 100 Título del ejec. Determina el coeficiente de determinación. De su comentario sobre estevalores yr= -5,27 + 10,79(30) yr= 318,434.- Se obtuvieron los siguientes datos para determinar la relación entrecantidad de fertilizante y producción de papa por hectárea.Sacos de fertilizante por hectárea 3 4 5 6 7 8 9 10 11 12Rendimiento en quintales 45 48 52 55 60 65 68 70 74 76 a) Encuentre la ecuación de regresión de la cosecha sobre el fertilizante, por el método de mínimos cuadrados. 199
  • 201. b. Estime la cosecha si se aplica 12 sacos de fertilizantes ¿Cuánto es el error oresidual? -76=1.63 es el error.c. Determina el coeficiente de determinación. De su comentario sobre estevalores
  • 202. 5.- El número de horas de estudio invertidas y las calificaciones finales en un curso de matemáticas de una muestra 10 alumnos ha dado los siguientes resultados: Alumno Horas de estudio 14 16 22 20 18 16 18 22 10 8 Calificación 12 13 15 15 17 11 14 16 8 5 a) Determine la recta de regresión de la calificación sobre el número de horas de estudio invertidos. Interprete la ecuación de regresión. Horas de CalificaciónAlumno XY Estudio X YA1 14 12 168 196 -2,40 5,76A2 16 13 208 256 -0,40 0,16A3 22 15 330 484 5,60 31,36A4 20 15 300 400 3,60 12,96A5 18 17 306 324 1,60 2,56A6 16 11 176 256 -0,40 0,16A7 18 14 252 324 1,60 2,56 201
  • 203. A8 22 16 352 484 5,60 31,36A9 10 8 80 100 -6,40 40,96A10 8 5 40 64 -8,40 70,56 – 6.- Sobre la base de una muestra de tamaño 28 se encontró que la ecuación de regresión muestral de gastos mensuales (Y) sobre tamaño de la familia (X) es: Además la covarianza de Y con X es igual a 32, y la desviación estándar de Y es igual a 5, a) Determine el coeficiente de correlación y analizar la bondad del ajuste de la línea de regresión con el coeficiente de determinación. 202
  • 204. 7.- Una muestra de 60 de las 350 agencias de ventas de automóviles de unaimportadora registrada en un mes con X (autos vendidos por agencia), Y(ventas en miles de dólares) ha dado los siguientes resultados: a) Determine la ecuación de regresión:Ecuación b) Calcule el coeficiente de terminación ¿Qué porcentaje de la variación total es explicada por la regresión? 203
  • 205. 8.- Los contadores con frecuencia estiman los gastos generales basados en elnivel de producción. En la tabla que sigue se da la información recabada sobregastos generales y las unidades producidas en 10 plantas y se desea estimaruna ecuación de regresión para estimar gastos generales futuros.Gastos generales ($) 300 1000 1100 1200 600 800 900 500 400 200Unidades producidas 15 45 55 75 30 40 45 20 18 10 a) Determine la ecuación de regresión y haga un análisis del coeficiente de regresión. 204
  • 206. –205
  • 207. 9.- Las cantidades de un compuesto químico (Y) que se disuelven en 100gramos de agua a diferentes temperaturas (X) se registraron en la tabla quesigue: X (°C) Y gramos 0 10 8 10 9 11 11,8 15 15 12 14 16 18 15 30 27 23 25 24 26 25 45 33 30 32 35 34 32,8 60 46 40 43 42 45 43,2 75 50 52 53 54 55 52,8 225 180,6 X (°C) Y gramos 0 11,8 0 0 139,24 1406,25 139,24 15 15 225 225 225 225 225 30 25 750 900 625 900 625 45 32,8 1476 2025 1075,84 2025 1075,84 60 43,2 2592 3600 1866,24 3600 1866,24 75 52,8 3960 5625 2787,84 5625 2787,84 206
  • 208. PRIMER MÉTODOSEGUNDO MÉTODOTERCER MÉTODO 207
  • 209. 10.- Una muestra de 60 de las 350 agencias de ventas de automóviles de unaimportadora registrada en un mes con X (autos vendidos por agencia), Y(ventas en miles de dólares) ha dado los siguientes resultados:Determine la ecuación de regresión:Ecuación 208
  • 210. Calcule el coeficiente de terminación ¿Qué porcentaje de la variación totales explicada por la regresión?11.- Los contadores con frecuencia estiman los gastos generales basados en elnivel de producción. En la tabla que sigue se da la información recabada sobregastos generales y las unidades producidas en 10 plantas y se desea estimaruna ecuación de regresión para estimar gastos generales futuros.Gastos generales($) 300 1000 1100 1200 600 800 900 500 400 200Unidadesproducidas 15 45 55 75 30 40 45 20 18 10 209
  • 211. N x Y X2 Y2 XY (xi-x)2 (yi-y)21 300 15 90000 225 4500 160000,00 412,092 1000 45 1000000 2025 45000 90000,00 94,093 1100 55 1210000 3025 60500 160000,00 388,094 1200 75 1440000 5625 90000 250000,00 1576,095 600 30 360000 900 18000 10000,00 28,096 800 40 640000 1600 32000 10000,00 22,097 900 45 810000 2025 40500 40000,00 94,098 500 20 250000 400 10000 40000,00 234,099 400 18 160000 324 7200 90000,00 299,2910 200 10 40000 100 2000 250000.00 640.09sumatoria 7000 353 6000000 16249 309700 1100000,00 3788,10Determine la ecuación de regresión y haga un análisis del coeficiente deregresión. – 210
  • 212. Diagrama de dispersión en el plano cartesiano 80 70 60 50 40 Series1 30 20 10 0 0 200 400 600 800 1000 1200 1400PASOS DE UNA PRUEBA DE HIPOTESISPrimer paso formular la hipótesis nula y la hipótesis alternativaHipótesis nulaHo = β=0La hipótesis alternativaHa= β<0; β>0Segundo paso determinar si la prueba es unilateral o bilateralBilateralTercer paso Asumir el nivel se significación de la prueba99% 2.58 211
  • 213. Cuarto paso determinar la distribución muestral que se usara en la pruebaQuinto paso elaborar el esquema de la prueba -2.58 +2.58Sexto paso calcular el estadístico de la prueba 3 212
  • 214. CONCLUSIONES:  Mediante el presente trabajo he podido conocer y aplicar sobre regresión, prueba de hipótesis y t-student, además he aprendido sobre las relaciones que existen entre las variables dentro de un problema.  Con el desarrollo de varios problemas con respecto al tema he podido practicar y aprender las relaciones existentes: relación infinita, positiva perfecta, negativa imperfecta, nula etc.RECOMENDACIONES:  Es de vital ayuda poner en práctica los conocimientos aprendidos ya que nos servirán dentro de nuestra carrera.  Es necesario identificar el coeficiente de correlación dentro de dos variables porque estas se aplican dentro del desarrollar un proyecto. 213
  • 215. CRONOGRAMA DE ACTIVIDADES DIAS Mayo Junio Julio M V S M M V S M V S M V S ACTIVIDAD 22 25 26 29 V1 S2 M5 V8 S9 12 15 16 18 22 23 26 29 30 M3 M4 J5 Responsable Msc. Jorge P. Recepción de Clases Copias del texto Tamara A. Desarrollo del marco teórico Tamara A. Desarrollo de los ejercicios Tamara A. Propuesta de ejercicios Tamara A. Entrega de Trabajo Tamara A.
  • 216. BIBLIOGRAFÍARodríguez, María Elene, ÁlvareZ, Sergio y Bravo, Ernesto. 2001. Coeficientes de Asociación.México : Plaza y Valdés S.A, 2001.Sabadías, Antonia Vargas. 1995. Estadística Descriptiva e Inferencial. Cuenca : CIDI, 1995.Williams, Thomas A. 2008. Estadística para Administración y Economía. México : CengageLearning Editores S.A, 2008. ANEXOSEjercicio # 1Dados los siguientes datos referentes a horas trabajadas en una maquila (X), ya unidades de cobijas producidas (Y), determinar la recta de regresión elcoeficiente de correlación lineal e interpretarlo y resolver por medio de los 5métodos. 215
  • 217. PRIMER MÉTODOSEGUNDO MÉTODO 216
  • 218. TERCER MÉTODOCUARTO MÉTODOQUINTO MÉTODO 217
  • 219. y Serie 1 500 f(x)=3.4734043*x+31.741135; R²=0.9101 450 400 350 300 250 200 150 100 50 x -150 -100 -50 50 100 150 200 250 300 350 400 -50 -100Ejercicio # 2Se exporta café ecuatoriano a Japón y según los datos obtenidos en el estudiode mercado, se puede evidenciar el año en el cual se exporto gran cantidad deeste grano en miles de toneladas. 218
  • 220. PRIMER MÉTODOSEGUNDO MÉTODO 219
  • 221. TERCER MÉTODOCUARTO MÉTODOQUINTO MÉTODO 220
  • 222. y Serie 1 250 f(x)=3.4734043*x+31.741135; R²=0.9101 200 150 100 50 x -80 -60 -40 -20 20 40 60 80 100 120 140 160 180 200 220 -50Ejercicio # 3De una población se toma una muestra de 40 observaciones. La mediamuestral es de 102 y la desviación estándar 5. De otra población se toma unamuestra de 50 observaciones. La media mustral es ahora 99 y la desviaciónestándar es 6. Realice la siguiente prueba de hipótesis usando como nivel designificancia 0,04.Ho: u1 = u2Ho: u1 ≠ u2a) Es esta una prueba de una o de dos colas? Esta es una prueba de hipótesis de dos colasb ) Establezca la regla de decisión Si Z > que le valor crítico, se rechaza la hipótesis nula y se acepta lahipótesis alternativac) Calcule el valor del estadístico de pruebaSi Z > que el valor crítico, se rechaza la hipótesis nula y se aceptaH1 221
  • 223. d) Cuál es su decisión respecto a la hipótesis nula? Como su valor calculado Z (2,59) > 2,05; se rechaza la hipótesis nula y seacepta la hipótesis alternativa Si Z tabulada es 0,5 - 0,02 = 0,48 este valor en la tabla es 2,05e) Cuál es el valor p? Z = 2,59 Area 0,4952 0,5 - 0,4952 = 0,0048 * 2 = 0,0096Ejercicio # 4Prueba la hipótesis H0 : p = 0.4 H1 : p 0.4 Presuma que = 0.45, n = 200, y = .01.Solución: H0 : p = 0.4 H1 : p 0.4 Usando = .01, el diagrama de la región de rechazo es: .005 .005 -2.575 2.575 Calculando el valor z para la proporción muestral p = 0.45), obtenemos: 222
  • 224. 0.4(1  0.4) p   0.0346 200 0.45  0.4 Z=  1.45 0.0346 Dibujando z = 1.45 en el diagrama de la región de rechazo (Paso 2) obtenemos: 1.45 .005 .005 -2.575 2.575 Como el valor z está fuera de la región de rechazo (sombreada), por lo tanto no rechazamos Ho. La proporción en la población es 0.4.Ejercicio # 5Suponer una variable aleatoria X para designar el peso de un pasajero deavión, que se interesa en conocer el peso promedio de todos los pasajeros.Como hay limitaciones de tiempo y dinero para pesarlos a todos, se toma unamuestra de 36 pasajeros de la cual se obtiene una media muestral X = 160libras. Suponga además que la distribución de los pasajeros tenga unadistribución normal con desviación estándar  = 30. Con un nivel designificancia de .05. ¿ Se puede concluir que el peso promedio de todos lospasajeros es menor que 170 libras?Datos n =36X = 160 libras  = 30 = .051. Establecer la hipótesisHo:   170Ha:  < 170 223
  • 225. 2. Establecer la estadística de prueba X  Z= n3. Definir el nivel de significancia y la zona de rechazo -1.64 Nivel de significancia = .05 Zona de rechazo = { Z/ Z  -1.64}4. Calcular la estadística de prueba X  Z= n la media poblacional esta bajo la hipótesis nula 160 170  10 Z   2 30 5entonces tenemos 36Hacer liga con nivel de significancia y zona de rechazo5. Regla de decisión basada en la estadística de prueba Como -2 es menor que -1.64 la hipótesis nula se rechaza con un nivel designificancia de 0.05.6. Conclusión 224
  • 226. Así podemos afirmar: que el peso promedio de todos los pasajeroscorresponde a un valor menor de 170 libras con .Ejercicio # 6La producción promedio de leche diaria por vaca en la provincia en los mesesde verano ha sido en los años anteriores de 10.1 litro. Este año en una muestrasimple aleatoria de 16 días de los meses de verano se obtuvo una producciónmedia diaria por vaca de 9.8 litros con una varianza muestral de 1.21. ¿Hayrazón para afirmar que ha variado la producción de leche diaria promedio porvaca?. Considere distribución normal y = 0.05Esta es una prueba paramétrica sobre media, ya que de lo que se trata es deverificar si ha tenido variación la producción diaria promedio de leche por vaca.La información que nos brinda el problema es la siguiente:  = 10.1 σ² = ? n = 16 x = 9.8 S2 = 1.21  S = 1.1Estamos en el caso en que se desconoce la varianza poblacional (  ) y n  230, luego tenemos que trabajar con la distribución tstudent, para el cálculo dela R.C.1.- Formulación de las hipótesisHo:  = 10.1H1:   10.1Aquí Ho nos expresa que la producción promedio de leche es de 10.1 y H 1 quela producción promedio de leche varió, es decir puede ser mayor ó menor.2.- Nivel de significación = 0,05 PRUEBA CHI - CUADRADOPruebas Paramétricas. Se llama así a las pruebas de hipótesis que cumplentres requisitos fundamentales: 1. La variable de la prueba debe ser la variable cuantitativa. 225
  • 227. 2. Los datos se obtienen por muestreo estadístico. 3. Los datos deben ajustarse a determinadas distribuciones estadísticas.Ejemplos. 1. La prueba basada en la distribución normal de probabilidades. 2. La prueba de student.Pruebas No Paramétricas.- llamadas también pruebas de distribución libre.Son aquellas que: 1. La variable de la prueba puede ser cualitativa o cuantitativa. 2. Los datos se obtienen por muestreo estadístico. 3. Son independientes de cualquier distribución de probabilidad.Ejemplo.La prueba de Chi – Cuadrado (también llamada prueba Ji –Cuadrado).Las pruebas paramétricas son mas poderosas. Sin embargo cuando la variablees cualitativa, sólo se puede usar las pruebas no paramétricas.El Estadístico Chi – CuadradoEn un estadístico que sirve de base para una prueba no paramétricadenominada prueba chi – cuadrado que se utiliza especialmente para variablescualitativas, esto es, variables que carecen de unidad y por lo tanto sus valoresno pueden expresarse numéricamente. Los valores de estas variables soncategorías que sólo sirven para clasificar los elementos del universo delestudio. También puede utilizarse para variables cuantitativas,transformándolas, previamente, en variables cualitativas ordinales.El estadísticos chi- cuadrado se define porEn donde:n= número de elementos de la muestra. 226
  • 228. n-1= número de grados de libertads2= varianza de la muestraa2= varianza de la poblaciónDesarrollaremos un ejemplo numérico con la finalidad de fijar el concepto deChi – cuadrado.Ejemplo:En un estudio de la capacidad de aprendizaje de matemáticas, en los niños deuna población, se tomó una muestra representativa de 40 niños. Se les aplicóuna prueba de diagnostico del aprendizaje en matemáticas y con los datosobtenidos se calculó la varianza s2=8.4, conociendo que la varianza poblacional 2es de = 12,37, calcular el valor del estadístico chi-cuadrados.Datos:n= 40 S2= 8,4 a2= 12,37Ahora vamos a elaborar el concepto de DISTRIBUCIÓN MUESTRAL DELESTADÍSTICO CHI- CUADRADO.Supongamos que se realiza los pasos siguientes: 1. De una población de N elementos se extrae todas las muestras posibles del mismo tamaño n. 2. Con los datos de cada muestra se calcula el estadístico chi – cuadrado. 3. Con todos los valores de Chi – cuadrado se forma una distribución de frecuencias; éstas se denomina distribución muestral del Chi-cuadrado.Esta distribución muestral se representa gráficamente en un sistema decoordenadas, colocando en el eje de abscisas los valores del estadístico Chi-cuadrado. 227
  • 229. Cuadrado en el eje vertical se colocan las frecuencias de cada valor del chi-cuadrado.El área encerrada bajo la curva y el eje horizontal es igual a uno y representarla probabilidad de que Chi-cuadrado tome valores mayores que 0.El área rayada situada a la derecha de la ordenada levantada en la abscisa x 2(gl), representa la probabilidad de cometer el error tipo l en la prueba de chi-cuadrado. Esta probabilidad es el nivel de significación de la prueba. El valorx2 (gl) se llama valor crítico del chi-cuadrado y se determina por medio de unatabla especial, que representa al final del libro el aprendizaje de tablas.Antes de entrar en el manejo de la tabla debemos tener encuentra que parauna probabilidad dad, por ejemplo =0.05, al aumentar el número de grados delibertada también aumenta el valor crítico de Chi-cuadrado; esto se ilustra enlas tres figuras siguientes: 228
  • 230. Este crecimiento del valor crítico se debe a que el aumentar el número degrados de libertad, la curva de la distribución muestral de Chi-cuadrado tiendea tomar una forma más extendida y por tanto el punto crítico se desplaza haciala derecha.Descripción y manejo de la tabla.- La tabla de valores críticos de x2 seencuentra en el apéndice. En la línea horizontal superior encabezando en cadacolumna se hayan los valores de .En la primera columna de la izquierda están los grados de libertad. Losejemplos siguientes el manejo de la tabla. 1. Ejemplo: =0.05 y gl= 4 g de l A partir de gl=4g de l, dirigimos una visual hacia la derecha hasta cortar a la visual que baja por =0.05; en la intersección se encuentra el valor crítico 2. Ejemplo: Si Hallamos x2 (6)=12.592 3. Ejemplo: Si Encontramos x2 (10) = 18.307 229
  • 231. Con estos 9 valores de la variable de estudio X, vamos a elaborar el cuadro defrecuencias observadas correspondientes a las 10 categorías establecidas.Cuadro 11. 3. 2 Intervalos Conteo Frecuencias Observadas Menos de 6,26 a 6, 26 IIII - I 6 6 , 26 a 11,62 IIII - I 6 11,62 a 15,51 III 3 15,51 a 18,80 IIII 5 18,80 a 21,96 IIII 4 21,96 a 25,12 IIII - IIII 10 25,12 a 28,41 III 3 28,41 a 32,30 IIII 4 32,30 a 37,66 IIII 4 37,66 a más. IIII 5A continuación debemos realizar la clasificación y conteo de los 50 datos, esdecir, colocar a cada uno de ellos dentro de su categoría representándolo poruna tarja. La suma de las tarjas de cada clase da la frecuencia observada deesta clase.Para facilitar el cálculo del estadístico chi-cuadrado mediante la fórmulaindicadaAgregamos las frecuencias observadas y esperadas en celdas tal como sepresenta a continuación. Recordemos que se fijo la frecuencia esperada de 5en cada intervalo, luego: 230
  • 232. Frecuencia observada O, y frecuencia esperada E, en la Prueba Chi-cuadradode Bondad de Ajuste. Ei 5 5 5 5 5 5 5 5 5 5 Oi 6 6 3 5 4 10 3 4 4 57) Toma de decisionesObservamos que este valor de Chi-cuadrado, en el esquema grafico (figura11.3.5) se ubica en la regresión de aceptación, luego aceptamos esto es,que la muestra se obtiene de una población distribuida normalmente.ProblemaDe una investigación demográfica se conoce que los habitantes de ciertospaíses se distribuyen en la forma siguiente: 0- 20 años, 25%; 21 – 40 años,35%; 41 -61 años, 25%; 61 -80 años, 10%; 81 – 100 años, 5%.Después de transcurridos varios años se quiso probar que la distribuciónpoblacional de las edades no ha cambiado para lo que se selecciono unamuestra respectiva de 1000 personas y se observo que las frecuencias de las 5categorías fueron: 0- 20 años, 200; 21 – 40 años, 300; 41 -61 años, 300; 61 -80años, 100; 81 – 100 años, 100. 1) la distribución actual por edades es igual a la del año de ejecución del censo La distribución actual por edades no es igual a la del año de ejecución 2) La prueba es unilateral y de cola derecha 3) Nivel de significación a= 0.10 4) Se utiliza la distribución CHI – CUADRADO 231
  • 233. ESQUEMA DE LA PRUEBA Existen k= 5 celdas, tenemos gl = K-1 = 5-1=4 grados de libertad a = 0.10 en la tabla de CHI – CUADRADO obtenemos 7.779 77.14 5) CALCULO DEL ESTADÍSTICO DE LA PRUEBA 250 350 250 100 50200 300 300 100 100Las frecuencias observadas nos las proporcionan con la muestra aleatoria delos 1.000 habitantes.CALCULO DE LAS FRECUENCIAS ESPERADAS = 1.000 X 25% = 250 = 1.000 X 35% = 350 232
  • 234. = 1.000 X 25% = 250 = 1.000 X 105% = 100 = 1.000 X 5% = 50CALCULO DEL ESTADISTICO CHI – CUADRADO = + = 10+7.14+10+0+50 = 77.14 6) TOMA DE DECISIONES Vemos que el estadístico calculado CHI – CUADRADO (77.14) es mayor que el valor critico encontrado en la tabla (7.779) vemos que 77.14 cae en la región de rechazo por lo tanto rechazamos y aceptamos , es decir la distribución actual por edades no es igual a la de la investigación demográfica.CORRECCIÓN DE YATESCuando el número de grados de libertad es igual a la unidad, es necesariorealizar una corrección por continuidad durante el cálculo del estadístico de la 233
  • 235. prueba. Esta corrección se denomina de yates y consiste en disminuir en 0.05al valor absoluto de la diferencia entre las frecuencias observadas y asfrecuencias esperadas.El ejemplo siguiente ilustra la aplicación de esta corrección.PROBLEMAEn el año de 1960, la proporción de hombres y mujeres de cierta institución deenseñanza superior, fue de 75% y 25%, respectivamente. Con la finalidad deverificar si el transcurso del tiempo había originado algún cambio en lasproporciones de estudiantes de ambos sexos, en el año de 1970 se tomó unamuestra aleatoria de 100 alumnos de 1º ciclo, obteniendo 60 hombres y 40mujeres. Con estos datos realizar la verificación por medio de la prueba de CHI– CUADRADO, asumiendo el nivel de significación de a= 5%. 1) la distribución de hombres y mujeres en el año de 1970 también es de 75% y de 25% respectivamente La distribución de hombres y mujeres en el año de 1970 no es del 75% ni del 25% respectivamente 2) La prueba es universal y de cola derecha 3) Nivel de significación a= 0.05 4) Emplearemos la distribución muestral de CHI – CUADRADO 234
  • 236. 3.841 11.21 5) ESQUEMA DE LA PRUEBA Existen 2 categorías entonces K= 2 y gl = K – 1 =2-1=1 a= 0.05 con estos datos vamos a la tabla de CHI – CUADRADO y obtenemos 3.841. 6) CALCULO DEL ESTADÍSTICO DE LA PRUEBA 75 2560 40 OBTENCIÓN DE LOS VALORES ESPERADOS Valor esperado para los hombres: 100 x 75% = 75 235
  • 237. Valor esperado para las mujeres: 100 x 25% = 25 CACULO DEL ESTADÍSTICO DE LA PRUEBA Como gl = 1 utilizaremos la corrección de yates =2.8+8.41= 11.21 7) TOMA DE DESICIONES Como el valor de CHI – CUADRADO es de 11.21, mayor que el valor CHI – CUADRADO afirmamos que 11.21 cae en la región de rechazo, luego rechazamos la por lo tanto afirmamos que la distribución de hombres y mujeres no es del 75% ni del 25% respectivamente.En un estudio realizado en el departamento de investigación del ESAN acercadel perjuicio étnico hacia el negro. En los universitarios de lima se aplico Lugar de residencia Grado de Barriadas Barrios Barrios total perjuicio populares residenciales 236
  • 238. intermedios Alto 32 225 50 307 Bajo 28 290 79 397 Total 60 515 129 704Una encuesta a los universitarios según su lugar de procedencia, obteniendolos resultados que presenta la siguiente tablaAl nivel de significación Q=0.05, determinar que las variables perjuicio étnicohacia el negro y lugar de residencia son independientes 1. Ho: el perjuicio étnico y el lugar de residencia son independientes H1: existe dependencia entre las variables. 2. La prueba es unilateral y la cola derecha 3. Asumimos el nivel de significación de Q= 0.05 4. Utilizaremos la distribución muestral de chi-cuadrado porque las dos variables son cualitativas. 5. Esquema de la pruebaGl =(C-1) (F-1) 1.1.3.4Gl =(3-1) (2-1) = 2 11.3.4Gl= 2Q= 0.05X2 = (2) = 5.991C= # de columnasF= # de filas 6. Calculo del estadístico de la prueba x= 3.54 5.991 Formula 2 X2= 3.54Ya conocemos las frecuencias observadas para determinar las frecuenciasesperadas emplearemos la misma tabla, manteniendo invariables defrecuencias marginales de dos variables 237
  • 239. Lugar de Residencia Grado de Barriadas Barrios Barrios total perjuicio populares residenciales (intermedios) Alto E11 E12 E13 307 Bajo E21 E22 E23 397 Total 60 515 129 704Cuando las variables X y Y son independientes, las frecuencias de cada celdason igual al productos de las frecuencias marginales correspondientes divididopor el tamaño de la muestra. 26.16 224.58 56.25 32 225 50 33.84 290.42 72.75 28 290 79 238
  • 240. Las frecuencias esperadas y las asociadas determinan las frecuenciasobservadas anteriormenteORGANIZADOR GRÁFICO SI SE EXTRAEN TODAS LAS MUESTRAS POSIBLES DE UNA POBLACIÓN NORMAL Y A CADA MUESTRA SE LE CALCULA SU VARIANZA EL ÁREA BAJO UNA CURVA CHI- CUADRADA Y SOBRE CHI - LOS VALORES DE X2 SON MAYORES O EL EJE HORIZONTAL ES 1. CUADRADO IGUALES QUE 0. FORMA DE UNA DISTRIBUCIÓN X2 DEPENDE DEL GL=N-1. EN CONSECUENCIA, HAY UN NÚMERO INFINITO DE DISTRIBUCIONES X2. UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI 239
  • 241. ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL PROYECTO DE ESTADÍSTICA INFERENCIAL DOCENTE: MSC. JORGE POZO INTEGRANTES: Tamara Liceth Apráez Lima MARZO 2012- AGOSTO 2012 Tulcán – Ecuador240
  • 242. TEMA:  Sistemas informáticos y métodos estadísticos aplicados al comercio exterior.PROBLEMA:  La falta de conocimiento de la utilización de los programas spss y Excel no nos ha permitido aplicar los métodos estadísticos en el contexto del comercio exterior en cuanto a correlación y regresión lineal, varianza, prueba de hipótesis, t student, chi cuadradoOBJETIVOS:General:  Investigar sobre el correcto manejo de los programas spss y Excel en la aplicación de problemas relacionados al comercio exteriorEspecíficos:  Investigar bibliográficamente acerca de SPSS y EXCEL.  Practicar el manejo del SPSS y EXCEL con ejercicios estadísticos aplicados al comercio exterior.  Analizar los pasos a seguir a través de los programas spss y Excel para los métodos estadísticosJUSTIFICACIÓN: 241
  • 243. El presente trabajo tiene la finalidad de conocer el correcto manejo de losprogramas spss y Excel mediante los métodos estadísticos que sonCorrelación y Regresión Lineal, Varianza, Prueba de Hipótesis, T - Student,Chi Cuadrado para dar solución a la problemática del contexto del comercioexterior.Al aplicar y utilizar estos programas podremos adquirir más practica en lainformática y en un futuro resolver casos reales del comercio que se puedenpresentar en nuestra vida laboral esto también nos permitirá optimizar el tiempoempleado en la resolución de los mismos.Al conocer e investigar acerca de este importante tema comprendemos comose operan estos programas que son esenciales para enriquecer elconocimiento estadístico aplicado en la informática y lo cual ha permito que sedetermine la varias interrogantes, a través de formulas matemáticas y tambiéncon la utilización de sistemas informáticos los cuales realizan de manera ágil yrápida las diferentes operaciones planteadas es por eso que este trabajo es degran relevancia ya que se podrá determinar a través de un problema delcontexto de comercio exterior como se aplica al programa informático SPSS ycomo está compuesto y cuáles son sus usos en la estadística inferencial.INTRODUCCION 242
  • 244. La estadística inferencial es necesaria cuando queremos hacer algunaafirmación sobre más elementos de los que vamos a medir. La estadísticainferencial hace que ese salto de la parte al todo se haga de una manera“controlada”. Aunque nunca nos ofrecerá seguridad absoluta, sí nos ofreceráuna respuesta probabilística. Esto es importante: la estadística no decide; sóloofrece elementos para que el investigador o el lector decidan. En muchoscasos, distintas personas perciben diferentes conclusiones de los mismosdatos.El proceso será siempre similar. La estadística dispone de multitud de modelosque están a nuestra disposición. Para poder usarlos hemos de formular, enprimer lugar, una pregunta en términos estadísticos. Luego hemos decomprobar que nuestra situación se ajusta a algún modelo (si no se ajusta notendría sentido usarlo). Pero si se ajusta, el modelo nos ofrecerá una respuestaestadística a nuestra pregunta estadística. Es tarea nuestra devolver a lapsicología esa respuesta, llenándola de contenido psicológico.La estadística descriptiva, como indica su nombre, tiene por finalidad describir.Así, si queremos estudiar diferentes aspectos de, por ejemplo, un grupo depersonas, la estadística descriptiva nos puede ayudar. Lo primero será tomarmedidas, en todos los miembros del grupo, de esos aspectos o variables para,posteriormente, indagar en lo que nos interese. Sólo con esos indicadores yapodemos hacernos una idea, podemos describir a ese conjunto de personas. MARCO TEORICOEstadística Inferencial 243
  • 245. La Estadística inferencial o Inferencia estadística estudia cómo sacarconclusiones generales para toda la población a partir del estudio de unamuestra, y el grado de fiabilidad o significación de los resultados obtenidos,(ditutor, 2010).CORRELACIONESEl concepto de relación o correlación entre dos variables se refiere al grado deparecido o variación conjunta existente entre las mismas. En este apartadovamos a estudiar un tipo particular de relación llamada lineal y se limita aconsiderar únicamente el caso de dos variables cuantitativas (correlaciónsimple).Una relación lineal positiva entre dos variables X e Y significa que los valoresde las dos variables varían de forma parecida: los sujetos que puntúan alto enX tienden a puntuar alto en Y y los que puntúan bajo en X tienden a puntuarbajo en Y. Una relación lineal negativa significa que los valores de ambasvariables varían justamente el revés.Para poder cuantificar el grado de relación lineal existente entre dos variablescuantitativas, así como medir el grado de ajuste de la nube de puntos a unarecta, vamos a estudiar coeficientes de correlación.En el procedimiento de Tablas de Contingencia ya se puede obtener elcoeficiente de correlación de Pearson, en este apartado estudiaremos elprocedimiento Correlaciones que incluye tres opciones (1) Bivariadas, para elestudio de la relación entre dos variables cuantitativas, (2) Parciales, para elestudio de la relación entre dos variables cuantitativas cuando se controla oelimina el efecto de terceras variables y (3) Distancias, para el estudio de larelación entre dos variables cualquiera que sea su nivel de medida.Correlaciones Bivariadas 244
  • 246. El procedimiento Correlaciones divariadas ofrece tres tipos de coeficientes: rxyde Pearson, tau-b de Kendall y rho de Spearman. Para acceder a esteprocedimiento, elegir:  Analizar  Correlaciones  Divariadas.La lista de variables sólo muestra las variables que poseen formato numérico.Es necesario trasladar al menos dos variables.Coeficientes de Correlación, pueden seleccionarse uno o más de los tressiguientes coeficientes:  Pearson: Es una medida de la asociación lineal entre dos variables. Los valores del coeficiente de correlación van de -1 a 1. El signo del coeficiente indica la dirección de la relación y su valor absoluto indica la fuerza. Los valores mayores indican que la relación es más estrecha.  Tau-b de Kendall: Es una medida no paramétrica de asociación para variables ordinales o de rangos que tiene en consideración los empates. El signo del coeficiente indica la dirección de la relación y su valor absoluto indica la magnitud de la misma, de tal modo que los mayores valores absolutos indican relaciones más fuertes. Los valores posibles van de -1 a 1, pero un valor de -1 o +1 sólo se puede obtener a partir de tablas cuadradas.  Spearman: Versión no paramétrica del coeficiente de correlación de Pearson, que se basa en los rangos de los datos en lugar de hacerlo en los valores reales. Resulta apropiada para datos ordinales, o los de intervalo que no satisfagan el supuesto de normalidad. Los valores del coeficiente van de -1 a +1. El signo del coeficiente indica la dirección de la relación y el valor absoluto del coeficiente de correlación indica la fuerza de la relación entre las variables. Los valores absolutos mayores indican que la relación es mayor.Prueba de significación. Junto con cada coeficiente de correlación, el Visorofrece la información necesaria para contrastar la hipótesis nula de que el 245
  • 247. valor poblacional del coeficiente es cero. El SPSS permite seleccionar el nivelcrítico deseado:  Bilateral: Probabilidad de obtener resultados tan extremos como el obtenido, y en cualquier dirección, cuando la hipótesis nula es cierta. Un nivel de significación bilateral (de dos colas) contrasta una hipótesis nula en la que la dirección del efecto no se especifica de antemano.  Unilateral: Probabilidad de obtener un resultado tan extremo como el observado, y en la misma dirección, cuando la hipótesis nula es cierta. Contrasta la hipótesis nula en la que se especifica con antelación la dirección del efecto.REGRESIÓN LINEALEn estadística la regresión lineal o ajuste lineal es un método matemático quemodela la relación entre una variable dependiente Y, las variablesindependientes Xi y un t rmino aleatorio εLa regresión y la correlación están íntimamente ligados, ambos implican larelación entre 2 variables y utilizan el mismo conjunto de datos básicos.La regresión se centra en el uso de la relación para determinar una predicción,cuando la relación es perfecta, esto es cuando todos los puntos están sobre larecta y se utilizan para señalar la predicción, la situación se hace más complejacuando la relación es imperfecta.Esta recta es la línea de regresión por los mínimos cuadrados. La distanciavertical en cada punto y la recta representan el error de la predicción, parecieraque el error total seria la suma algebraica y- y^.El error total de predicción presentado por , es menor para la líneade regresión por mínimos cuadrados.FORMULA DE LA REGRESIÓN 246
  • 248. PRUEBA DE HIPÓTESISAl realizar pruebas de hipótesis, se parte de un valor supuesto (hipotético) enparámetro poblacional. Después de recolectar una muestra aleatoria, secompara la estadística muestral, así como la media (x), con el parámetrohipotético, se compara con una supuesta media poblacional (). Después seacepta o se rechaza el valor hipotético, según proceda. se rechaza el valorhipotético sólo si el resultado muestral resulta muy poco probable cuando lahipótesis es cierta.Etapas de la prueba de hipótesisETAPA 1.- planear la hipótesis nula y la hipótesis alternativa. la hipótesis nula(h0) es el valor hipotético del parámetro que se compra con el resultadomuestral resulta muy poco probable cuando la hipótesis es cierta.ETAPA 2.- especificar el nivel de significancia que se va a utilizar. el nivel designificancia del 5%, entonces se rechaza la hipótesis nula solamente si elresultado muestral es tan diferente del valor hipotético que una diferencia deesa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de1.05 o menos.ETAPA 3.- elegir la estadística de prueba. la estadística de prueba puede ser laestadística muestral (el estimador no segado del parámetro que se prueba) ouna versión transformada de esa estadística muestral. Por ejemplo, para probarel valor hipotético de una media poblacional, se toma la media de una muestraaleatoria de esa distribución normal, entonces es común que se transforme lamedia en un valor z el cual, a su vez, sirve como estadística de prueba.Consecuencias de las decisiones en pruebas de hipótesis.ETAPA 4.- establecer el valor o valores críticos de la estadística de prueba.Habiendo especificado la hipótesis nula, el nivel de significancia y la estadísticade prueba que se van a utilizar, se produce a establecer el o los valores críticosde estadística de prueba. puede haber uno o más de esos valores,dependiendo de si se va a realizar una prueba de uno o dos extremos. 247
  • 249. ETAPA 5.- determinar el valor real de la estadística de prueba. por ejemplo, alprobar un valor hipotético de la media poblacional, se toma una muestraaleatoria y se determina el valor de la media muestral. si el valor crítico que seestablece es un valor de z, entonces se transforma la media muestral en unvalor de z.ETAPA 6.- tomar la decisión. se compara el valor observado de la estadísticamuestral con el valor (o valores) críticos de la estadística de prueba. Despuésse acepta o se rechaza la hipótesis nula. si se rechaza ésta, se acepta laalternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de losadministradores operativos, como por ejemplo, mantener o no un estándarde desempeño o cuál de dos estrategias de mercadotecnia utilizar.La distribución apropiada de la prueba estadística se divide en dos regiones:una región de rechazo y una de no rechazo. si la prueba estadística cae enesta última región no se puede rechazar la hipótesis nula y se llega a laconclusión de que el proceso funciona correctamente.Al tomar la decisión con respecto a la hipótesis nula, se debe determinar elvalor crítico en la distribución estadística que divide la región del rechazo (en lacual la hipótesis nula no se puede rechazar) de la región de rechazo. a horabien el valor crítico depende del tamaño de la región de rechazo.Pasos de la prueba de hipótesis 1. expresar la hipótesis nula 2. expresar la hipótesis alternativa 3. especificar el nivel de significancia 4. determinar el tamaño de la muestra 5. establecer los valores críticos que establecen las regiones de rechazo de las de no rechazo. 6. determinar la prueba estadística. 7. coleccionar los datos y calcular el valor de la muestra de la prueba estadística apropiada. 8. determinar si la prueba estadística ha sido en la zona de rechazo a una de no rechazo. 9. determinar la decisión estadística. 248
  • 250. 10. expresar la decisión estadística en términos del problema.Conceptos básicos para el procedimiento de pruebas de hipótesis.HIPÓTESIS ESTADÍSTICA:Al intentar alcanzar una decisión, es útil hacer hipótesis (o conjeturas) sobre lapoblación aplicada.Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas.Son, en general, enunciados acerca de las distribuciones de probabilidad de laspoblaciones.HIPÓTESIS NULA.En muchos casos formulamos una hipótesis estadística con el único propósitode rechazarla o invalidarla. así, si queremos decidir si una moneda estátrucada, formulamos la hipótesis de que la moneda es buena (o sea p = 0,5,donde p es la probabilidad de cara).Analógicamente, si deseamos decidir si un procedimiento es mejor que otro,formulamos la hipótesis de que no hay diferencia entre ellos (o sea. quecualquier diferencia observada se debe simplemente a fluctuaciones enel muestreo de la misma población). tales hipótesis se suelen llamar hipótesisnula y se denotan por ho.Para todo tipo de investigación en la que tenemos dos o más grupos, seestablecerá una hipótesis nula.La hipótesis nula es aquella que nos dice que no existen diferenciassignificativas entre los grupos.Una hipótesis nula es importante por varias razones:Es una hipótesis que se acepta o se rechaza según el resultado de lainvestigación.El hecho de contar con una hipótesis nula ayuda a determinar si existe unadiferencia entre los grupos, si esta diferencia es significativa, y si no se debió alazar. 249
  • 251. No toda investigación precisa de formular hipótesis nula. Recordemos que lahipótesis nula es aquella por la cual indicamos que la información a obtener escontraria a la hipótesis de trabajo.Al formular esta hipótesis, se pretende negar la variable independiente. esdecir, se enuncia que la causa determinada como origen del problema fluctúa,por tanto, debe rechazarse como tal.HIPÓTESIS ALTERNATIVA.Toda hipótesis que difiere de una dada se llamará una hipótesis alternativa. porejemplo: si una hipótesis es p = 0,5, hipótesis alternativa podrían ser p = 0,7, p" 0,5 ó p > 0,5.Una hipótesis alternativa a la hipótesis nula se denotará por h1. al responder a un problema, es muy conveniente proponer otras hipótesis en que aparezcan variables independientes distintas de las primeras que formulamos. por tanto, para no perder tiempo en búsquedas inútiles, es necesario hallar diferentes hipótesis alternativas como respuesta a un mismo problema y elegir entre ellas cuáles y en qué orden vamos a tratar su comprobación.Las hipótesis, naturalmente, serán diferentes según el tipo de investigación quese esté realizando. en los estudios exploratorios, a veces, el objetivo de lainvestigación podrá ser simplemente el de obtener los mínimos conocimientosque permitan formular una hipótesis. también es aceptable que, en este caso,resulten poco precisas, como cuando afirmamos que "existe algún tipo deproblema social en tal grupo", o que los planetas poseen algún tipode atmósfera, sin especificar de qué elementos está compuesto.ERRORES DE TIPO I Y DE TIPO II.Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se hacometido un error de tipo i.Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremosque se cometió un error de tipo ii.En ambos casos, se ha producido un juicio erróneo. 250
  • 252. Para que las reglas de decisión (o no contraste de hipótesis) sean buenos,deben diseñarse de modo que minimicen los errores de la decisión; y no es unaCuestión sencilla, porque para cualquier tamaño de la muestra, un intento dedisminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo.En la práctica, un tipo de error puede ser más grave que el otro, y debealcanzarse un compromiso que disminuya el error más grave.La única forma de disminuir ambos a la vez es aumentar el tamaño de lamuestra que no siempre es posible.NIVELES DE SIGNIFICACIÓN.Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamosdispuesto a correr el riesgo de cometerán error de tipo i, se llama nivel designificación.Esta probabilidad, denota a menudo por se, suele especificar antes de tomar lamuestra, de manera que los resultados obtenidos no influyan en nuestraelección.En la práctica, es frecuente un nivel de significación de 0,05 ó 0,01, si bien seune otros valores. si por ejemplo se escoge el nivel de significación 0,05 (ó 5%)al diseñar una regla de decisión, entonces hay unas cinco (05) oportunidadesentre 100 de rechazar la hipótesis cuando debiera haberse aceptado; es decir,tenemos un 95% de confianza de que hemos adoptado la decisión correcta. ental caso decimos que la hipótesis ha sido rechazada al nivel de significación0,05, lo cual quiere decir que tal hipótesis tiene una probabilidad 0,05 de serfalsa. 251
  • 253. Como en general estas pruebas se aplican a dos muestras, se denominarán ay b para referirse a ellas, así entenderemos por: na al número de elementos de la muestra a nb al número de elementos de la muestra b xb al promedio de la muestra b s2a la varianza de la muestra a y así sucesivamenteEntonces se pueden distinguir 6 casos a saber: 1. caso de muestras grandes (n>30) 2. caso de na = nb y s2a = s2b 3. caso de na = nb y s2a <> s2b 4. caso de na <> nb y s2a = s2b 5. caso de na <> nb y s2a <> s2b 6. caso de variables dependientesCuando las muestras a probar involucran a más de 30 observaciones.DISTRIBUCIÓN T-STUDENTEn probabilidad y estadística, la distribución t (de Student) es una distribuciónde probabilidad que surge del problema de estimar la media de una poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño.Aparece de manera natural al realizar la prueba t de Student para ladeterminación de las diferencias entre dos medias muestrales y para laconstrucción del intervalo de confianza para la diferencia entre las medias dedos poblaciones cuando se desconoce la desviación típica de una población yésta debe ser estimada a partir de los datos de una muestra. 252
  • 254. Función de densidad de probabilidadUsosEntre los usos más frecuentes de las pruebas t se encuentran:• El test de locación de muestra única por el cual se comprueba si lamedia de una población distribuida normalmente tiene un valor especificado enun hipótesis nula.• El test de locación para dos muestras, por el cual se comprueba si lasmedias de dos poblaciones distribuidas en forma normal son iguales. Todosestos test son usualmente llamados test t de Student, a pesar de queestrictamente hablando, tal nombre sólo debería ser utilizado si las varianzasde las dos poblaciones estudiadas pueden ser asumidas como iguales; laforma de los test que se utiliza cuando esta asunción se deja de lado suele serllamada a veces como Prueba t de Welch. Estas pruebas suelen sercomúnmente nombradas como pruebas t desapareadas o de muestrasindependientes, debido a que tienen su aplicación más típica cuando lasunidades estadísticas que definen a ambas muestras que están siendocomparadas no se superponen.5• El test de hipótesis nula por el cual se demuestra que la diferencia entredos respuestas medidas en las mismas unidades estadísticas es cero. Porejemplo, supóngase que se mide el tamaño del tumor de un paciente concáncer. Si el tratamiento resulta efectivo, lo esperable seria que el tumor demuchos pacientes disminuyera de tamaño luego de seguir el tratamiento. Estocon frecuencia es referido como prueba t de mediciones apareadas orepetidas.5 6 253
  • 255. • El test para comprobar si la pendiente de una regresión lineal difiereestadísticamente de cero.CHI CUADRADOLa prueba o test chi-cuadrado es considerada como una prueba no paramétricaque mide la discrepancia entre una distribución observada y una observaciónteórica (bondad de ajuste), indicando en qué medida las diferencias existentesentre ambas, de haberlas, se deben al azar en el contraste de hipótesis.También se utiliza el test chi-cuadrado para probar la homogeneidad entre dospoblaciones o independencia de dos variables entre sí, mediante lapresentación de datos dados en tablas de contingencia.Es decir: a) Chi-cuadrado de bondad de ajuste o significancia: para comprobar si los datos se ajustan a una distribución concreta. b) Chi-cuadrado de homogeneidad: para ver si dos muestras provienen de una misma población o una población con una misma familia de distribución (los datos vienen dado en una tabla de contingencia). c) Chi cuadrado de independencia: para comprobar si dos muestras son independientes (los datos vienen en una tabla de contingencia). 254
  • 256. PROGRAMA SPSS STADISTCINSTALAR EL PROGRAMA SPSSAntes de realizar la instalación del programa, es necesario revisar que nuestroequipo cumpla con todos los requisitos para la ejecución del paquete, demanera que no se presenten conflictos en el equipo durante la instalación o enla ejecución del programa. El Hardware y el Software mínimos necesarios paraejecutar SPSS 12.0 para Windows son los siguientes:  Microsoft® Windows Me, Windows 98, Windows XP, Windows 2000, o Windows NT® 4.0 Service Pack.  Procesador Pentium o de tipo Pentium.  128 MB o más de memoria de acceso aleatorio.  220 MB de espacio libre en disco duro.  Unidad de CD ROM.  Adaptador gráfico con una resolución mínima de 800 X 600 (SVGA). 255
  • 257.  Para la conexión con un servidor SPSS, es necesario un adaptador de red que ejecute el protocolo de red TCP/IP.Además de estos requisitos técnicos, también necesitaremos el número deserie y los códigos de licencia para cada uno de los módulos del paquete, loscuales deben ser proporcionados por el proveedor local del programa. Despuésde comprobar que se cumplen todos los requisitos podemos iniciar lainstalación. Para instalar el programa SPSS 12.0 para Windows, debemossituarnos en el escritorio (Vista inicial del sistema operativo) e ingresar en launidad de CD ROM del ordenador el CD que nos proporciona el proveedor delpaquete. El programa de instalación de SPSS cuenta con una rutina deAUTORUN, por lo que de forma automática emerge en la pantalla delordenador la ventana de instalación. Figuras 1-0 y 1-1En esta ventana aparecen todas las opciones de instalación del paquete, entrelas que encontramos Instalar SPSS, Instalar SmartViewer (nos permite abrir losresultados generados por SPSS en los ordenadores que no cuentan con elprograma), Data Access Pack (Instala los controladores ODBC para una grangama de programas de bases de datos), Internet Explorer 6.0 (Necesario paranavegar en Internet) y Adobe Acrobat Reader 5.0 (Necesario para acceder alas ayudas o los manuales del programa que aparecen en formato PDF).Si por algún motivo no aparece de forma automática la ventana de instalación,debemos abrirla mediante el Explorador de Windows, por lo que hacemosdoble clic sobre el icono Mi PC en el escritorio; al aparecer la ventana deexploración, seleccionamos la unidad de CD-ROM de manera que aparezca en 256
  • 258. la ventana el contenido del CD [Fig.1-2]. Para iniciar la instalación hacemosdoble clic sobre el archivo Setup con lo que aparece la ventana de la figuraanterior. Figuras 1-2Es importante resaltar, que antes de iniciar la copia de los archivos delprograma, es necesario cerrar todas las aplicaciones que se encuentrenabiertas o de lo contrario podría presentarse algunos inconvenientes en lainstalación. Para instalar el programa debemos seleccionar en el menúprincipal la opción Instalar SPSS, de modo que el programa comienza lospreparativos activando el asistente InstallShield® [Fig.1-4], el cual nos guiarádurante todo el proceso de instalación, a través de una serie de múltiplespantallas y cuadros de diálogo. Al terminar de cargar el asistente aparece laventana de Bienvenida. 257
  • 259. Figuras 1-3 y 1-4Para continuar con la instalación debemos hacer clic en el botón Siguiente, conlo que aparece la ventana del Contrato de licencia [Fig.1-6]; en esta ventana seencuentra el contrato que se establece entre la compañía y el usuario almomento de instalar el programa en el ordenador.A través de este contrato se reconoce los derechos de autor de la compañía yse aceptan los términos legales que conlleva la instalación del programa. Parapoder continuar es necesario seleccionar la opción “Acepto los términos delcontrato de licencia” y hacer sucesivamente clic en Siguiente con lo queaparece la ventana Información Léeme [Fig.1-7]. En esta ventana encontramostoda la información del paquete, incluyendo las instrucciones de instalación, laslimitaciones del programa y los posibles problemas que se pueden presentardurante la ejecución del programa. Figuras 1-5 y 1-6El SPSS es un programa de análisis estadístico fácil de utilizar y con grancapacidad operativa. Permite analizar datos almacenados en diversos formatosy generar documentos con alta calidad de presentación.EDITOR DE DATOSAl instalar el programa se crean, automáticamente, los siguientes iconos queaparecen en la barra Programas de Windows. 258
  • 260. El icono SPSS 10.0 para Windows da acceso al programa. Seleccionándolocon el cursor se entra en el programa y aparece la ventana Editor de datos. Figuras 1-7La ventana Editor de datos permite gestionar la entrada, lectura,transformación, importación y almacenaje de ficheros de datos.El editor está formado por un conjunto de filas y columnas en las que sevisualizan los datos del archivo activo. Las columnas recogen las variables delarchivo, las filas los individuos o elementos observados y las celdas los valores.Además el editor presenta las siguientes barras:1. Barra de menú del editor. 259
  • 261. • Archivo: presenta los procedimientos relacionados con la lectura, impresión yalmacenaje de archivos.• Edición: contiene las opciones de copiar, mover y pegar del entorno Windows.• Ver: modifica la visualización de las barras y pantalla.• Datos: permite definir variables y modificarlas bien temporalmente o bien demanera definitiva; en este caso se deberá salvar el archivo antes de finalizar lasesión.• Tranformar: permite definir, temporalmente o de manera definitiva, nuevasvariables a partir de las existentes.• Analizar: recoge los procedimientos estadísticos.• Gráficos: permite la creación, modificación y edición de una amplia gama degráficos.• Utilidades: informa sobre las características de los archivos de datos.• Ventana: presenta las opciones de ventana del entorno Windows.• ?: Permite consultar la ayuda o el tutorial.2. Barra de herramientas. Contiene un conjunto de iconos que dan accesodirecto a algunos procedimientos.• Los tres primeros iconos activan las opciones abrir, guardar e imprimir,respectivamente, del menú Archivo y permiten, tal como indican sus nombres,abrir, almacenar e imprimir el archivo de datos.• Da acceso a los últimos cuadros de diálogo utilizados.• Deshace la última modificación.• Permite ir a un gráfico determinado.• Desplazan el cursor a la fila (ncirc de individuo o elemento muestral) oa la columna (variable) indicada, respectivamente.• Busca, en la variable seleccionada, un dato. 260
  • 262. • Añaden una fila (elemento) o una columna (variable), respectivamente.• El primero segmenta el archivo, el segundo permite activar uncriterio de ponderación y el tercero selecciona casos a analizar.• Muestra u oculta las etiquetas de los valores de las variables.• Permite usar conjuntos de variables previamente definidos.3. Barra de estado. Se encuentra en la parte inferior de la pantalla e indica elestado actual del proceso, el número de elementos que se están procesando,las iteraciones realizadas y los filtrados, ponderaciones o segmentacionesactivados.Para continuar hacemos clic en Siguiente surgiendo la ventana Información delcliente [Fig.1-8]. A través de esta ventana se define el nombre del usuario y/o laempresa a la que corresponde la licencia. En las versiones anteriores deSPSS, se incluye una tercera casilla en la que se debe ingresar el número deserie del CD-ROM.Una vez se ingresan los datos en cada una de las respectivas casillas,hacemos clic en Siguiente con lo que aparece la ventana Carpeta destino[Fig.1-9]; en esta ventana podemos especificar la unidad y la carpeta en la quedeseamos que se instalen los componentes del programa. Por defecto elprograma define la unidad C: y la carpeta Archivos de programa como laubicación ideal para la instalación de los componentes, si se desea definir otraubicación, debemos hacer clic en el botón Cambiar y emplear la ventana denavegación para definir el destino. Figuras 1-8 y 1-9 261
  • 263. Para continuar hacemos clic en Siguiente de manera que surge la ventanaInformación de licencia [Fig.1-10]. En esta ventana debemos ingresar loscódigos de licencia para cada uno de los módulos del paquete (Básico,Estadísticas Profesionales, Tablas, Tendencias, Categorías, Conjoint, PruebasExactas, Estadísticas Avanzadas, Valores Perdidos, Mapas y ComplexSimples). Cada uno de los códigos de licencia debe ser introducido en la casillaCódigo y sucesivamente hacer clic en Actualizar.A medida que se actualizan los códigos, aparece en la casilla de selecciónsituada en la parte inferior de la ventana, la confirmación de los módulos queserán instalados en el ordenador. Una vez se han ingresado los códigos delicenciamiento para los módulos y aparece en la casilla la confirmación de lalicencia, hacemos clic en Siguiente con lo que aparece la ventana Tipo deInstalación [Fig.1-11]. Figuras 1-10 y 1-11En esta ventana podemos seleccionar el tipo de instalación que deseamosrealizar (Completa o Personalizada). Al contrario de las versiones anteriores delprograma, el tipo de instalación personalizada nos permite omitir algunos de loscomponentes del programa, mientras la instalación completa instala la totalidadde los componentes, por lo que requiere de una mayor capacidad de disco; esdecir, los 220 MB expuestos en las especificaciones.Una vez seleccionado el tipo de instalación Completa, hacemos clic enSiguiente emergiendo la ventana Preparado para instalar el programa [Fig.1-12]. Esta ventana nos informa que se ha definido satisfactoriamente todos losparámetros de licenciamiento y a su vez nos advierte que si deseamosrectificar alguno de los datos definidos en los pasos anteriores, debemosrealizarlo haciendo clic en el botón Atrás. Si estamos seguros de los datos 262
  • 264. definidos, hacemos clic en Instalar dando inicio a la copia de archivos [Fig.1-13]. El proceso de instalación puede durar varios minutos y depende de lacantidad de módulos que se hayan definido. Figuras 1-12 y 1-13Una vez se terminan de instalar todos los componentes (archivos) de losdiferentes módulos, aparece la ventana de confirmación de la instalación [Fig.1-14]. En esta ventana aparece la opción de registro en línea, por medio de lacual se envía un mensaje de instalación a la compañía fabricante del Software.Si no deseamos realizar el registro del producto o simplemente lo queremoshacer más tarde, debemos desactivar la casilla que aparece al costadoizquierdo de la opción, haciendo clic sobre ella de manera que desaparezca elvisto bueno. Para dar por terminada la instalación del programa hacemos clicen el botón Finalizar, cerrando el asistente de instalación y apareciendo elmensaje de la figura [1-15]. Este mensaje nos informa que debemos reiniciar elsistema operativo para que se actualice la configuración de los archivos delsistema. Figura 1-14 263
  • 265. Figura 1-15Para finalizar la instalación hacemos clic en el botón Si, de manera que sereinicia el sistema y se actualiza la configuración. Una vez se carganuevamente el sistema operativo, estamos listos para iniciar a trabajar con elpaquete estadístico SPSS 12.0.INTRODUCCIÓN AL SPSSPara ingresar al programa, tenemos dos opciones; la primera es mediante elacceso directo ubicado en el Escritorio (Si lo hay) y la segunda es mediante laruta Inicio.. Programas.. SPSS para Windows.. SPSS 12.0 para Windows[Fig.1-16]. Figura 1-16Al iniciar el programa se abre automáticamente el Asistente de inicio [Fig.1-17];a través de este asistente podemos comenzar a trabajar con SPSS de seisdiferentes maneras; entre las que encontramos Ejecutar el tutorial, Introducirdatos (Crear nuevo archivo), Ejecutar una consulta creada anteriormente(Importar los datos de una archivo de base de datos), Crear una nuevaconsulta mediante el asistente de base de datos (Definir los parámetros deubicación y nombre de un archivo de Base de datos), Abrir una fuente de datos 264
  • 266. existente (Esta opción cuenta con una casilla en su parte inferior, en dondeaparecen todos los archivos de datos que se hayan utilizado con anterioridaden el programa; si es la primera vez que se abre el programa desde suinstalación sólo aparece la opción Más archivos, la cual al ser elegida abre unaventana de navegación para la ubicación del archivo).La última opción que aparece en el asistente corresponde a Abrir otro tipo dearchivo; a través de esta opción podemos ubicar y abrir cualquier tipo dearchivo de SPSS distinto al de datos. Para seleccionar alguna de las opcionesbasta con hacer clic sobre ella de manera que aparezca un punto en la casillade activación ( ). A pesar de la utilidad que nos brinda el asistente, elprograma nos da la posibilidad de decidir si queremos que aparezca elasistente cada vez que se ejecute el programa o no. Para desactivar elasistente debemos activar la opción No volver a mostrar este cuadro dediálogo, ubicada en la parte inferior del asistente. Figuras 1-17Antes de continuar es necesario aclarar los tipos de archivos que generaSPSS, los cuales son:  Archivos de Datos: son los archivos generados por el sistema (SPSS), en los cuales se almacena la información (casos y variables) que se haya creado en el editor o se haya importado de otras fuentes. Este tipo de archivo se genera con la extensión (*.sav). 265
  • 267.  Archivos de resultados: son los archivos generados por el sistema, en los cuales se plasman todos los resultados de los procesos que se han realizado con el paquete (Tablas, Gráficos, Estadísticos, etc). Este tipo de archivo se identifica con la extensión (*.spo).  Archivos de sintaxis: este tipo de archivos contienen las líneas de código o palabras clave de cada uno de los procedimientos que se hayan realizado con el paquete (Frecuencias, Gráficos, etc.). Este tipo de archivo se identifica con la extensión (*.sps).Desde luego SPSS nos permite trabajar con un gran número de formatos dearchivo, provenientes de diferentes programas de bases de datos, hojas decálculo, procesadores de palabras e incluso generadores de gráficos.Para continuar seleccionamos la opción Abrir una fuente de datos existente ysucesivamente hacemos clic en Aceptar, surgiendo la ventana de exploraciónde Windows [Fig.1-18]. A través de esta ventana, podemos ubicar de formarápida y sencilla un archivo dentro del ordenador o la red. Por defecto laventana de exploración se ubica en la carpeta SPSS ubicada en la unidad [C:];en esta carpeta se encuentran todos los archivos de muestra que se incluyencon el programa, los cuales son nombrados en la mayoría de los tutoriales delpaquete. Figuras 1-18 y 1-19En nuestro caso vamos a ubicar el archivo Cap1.sav, el cual se encuentra en lacarpeta Capítulo 1 del CD adjunto al libro. Si aun no has ingresado el CD, esnecesario que lo insertes en la unidad de CD-ROM del ordenador antes deiniciar la ubicación del archivo. Una vez se ingresa el CD adjunto, ubicamos através de la casilla Buscar en la unidad de CD-ROM (Libro de SPSS [E:]); al 266
  • 268. seleccionar la unidad, aparecen en la ventana todas las carpetas de contenidoque se incluyen en el CD adjunto. En la ventana localizamos la carpetaCapítulo 1 y hacemos doble clic sobre ella de manera que aparezca en laventana el archivo Cap1 [Fig.1-19]. Para finalizar seleccionamos el archivo ysucesivamente hacemos clic en Abrir, de manera que la información contenidaen el archivo es representada en el Editor de datos [Fig.1-20]. Figuras 1-20EDITOR DE DATOS DE SPSSEsta es la ventana principal del programa, en ella se encuentra la mayoría delos procedimientos que se pueden realizar con el paquete, así como losaccesos directos a las opciones de los diferentes módulos. Además esta es laúnica ventana del programa en la que podemos apreciar la información (Casosy Variables) en su estado original (Desagrupado). El Editor de datos estacompuesto por cinco secciones, cada una de las cuales nos ofrece opciones einformación diferente. Los componentes del editor de datos son:Barra de Menús 267
  • 269. Como la mayoría de los programas basados en el sistema operativo Windows,el Editor de datos de SPSS cuenta con una barra de menús desplegables, endonde se encuentran las diferentes opciones, procedimientos y aplicacionesque se pueden ejecutar con el programa. En SPSS se cuenta con diezdiferentes menús desplegables [Fig.1-21]; dentro de los que encontramosArchivo, Edición, Ver, Datos, Transformar, Analizar, Gráficos, Utilidades,Ventana y Ayuda (?). Figuras 1-17Las opciones y procedimientos de los menús Archivo, Edición y Ver, estánorientados a las propiedades de Editor de datos. Las opciones yprocedimientos de los menús Datos y Transformar se enfocan a laspropiedades y modificación de los datos (Casos o variables) del archivo que seencuentre abierto. Los procedimientos de los menús Analizar y Gráficos seencaminan en la descripción y análisis de los datos a través de pruebasestadísticas o gráficos representativos. El menú Utilidades en cambio seorienta a la generación y ejecución de los procesos automáticos; es decir, susopciones y procedimientos se emplean en la utilidad de producción. Por últimoaparecen los menús Ventana y Ayuda (?), los cuales como su nombre lo indicase orientan a las opciones de ventana y las ayudas del paquete. El contenidode cada uno de estos menús se irá explorando a través de los capítulos dellibro.Barra de HerramientasEn esta barra se encuentran los botones de acceso directo a losprocedimientos más comúnmente utilizados del programa. Los procedimientosde esta barra pueden ser modificados por el usuario de acuerdo a su criterio ynecesidades; permitiéndole personalizar su contenido. Por defecto el programaincluye dentro de la barra de herramientas los procedimientos:Abrir Archivo ( ), Guardar archivo ( ) e Imprimir ( ): Al seleccionar(Hacer clic) el botón Abrir archivo, aparece la ventana de exploración de 268
  • 270. Windows por medio de la cual podemos ubicar un archivo en el ordenador(Sólo admite algunos tipos de formato [Ver Tipos de archivo en la ventana deexploración]). Al seleccionar Guardar archivo, los cambios que se hayanrealizado en el editor de datos al archivo activo (Abierto), son guardados. Alseleccionar Imprimir, se abre la ventana de impresión de Windows; a través deesta opción se imprime el contenido del archivo de datos; es decir, los casos ylas variables. Esta opción sólo es útil si el número de datos es muy pequeño.Recuperar cuadro de diálogo ( ): Este botón nos permite acceder de formarápida a los últimos procedimientos que hayamos efectuado en SPSS; es decir,nos muestra los diferentes cuadros de diálogo (ventanas) que se hayanejecutado (Empleado) con anterioridad en el programa, como frecuencias,gráficos, tablas, etc. Al seleccionar esta opción se despliega una lista con elnombre de los procedimientos que se han realizado [Fig.1-22]; si elegimosalguna de ellas (Hacer clic), aparecerá el cuadro de diálogo del procedimiento. Figuras 1-22Deshacer ( ) y Rehacer ( ): Este par de iconos también son comunes enla mayoría de los programas de Windows, con la diferencia que en SPSS, sólonos permite deshacer o rehacer la última acción y solamente una. Para que seactiven estos botones, se debe realizar alguna operación en el Editor de datos(Cortar, copiar, eliminar, etc.).Ir a gráfico ( ): Este icono nos permite ir rápidamente al último gráficorealizado durante la sesión actual de SPSS; al seleccionarlo aparece laventana de resultados y nos enseña el gráfico.Ir a caso ( ): Como su nombre lo indica nos permite ir a un caso específicodentro del archivo de datos activo; es decir, nos ubica en la posición donde seencuentra el caso. Al seleccionar esta opción aparece la ventana 269
  • 271. correspondiente [Fig.1-23]; en este cuadro debemos ingresar el número delcaso que nos interesa ubicar. Figuras 1-23Variables ( ): a través de esta opción podemos obtener la información(Propiedades) que se haya definido para cada una de las variables del archivoactivo. Cuando seleccionamos este icono se abre un nuevo cuadro de diálogo[Fig. 1-24], en el cual nos muestra toda la información de cada una de lasvariables (el nombre, la etiqueta, si hay o no valores perdidos, el nivel demedida, los valores y las etiquetas de cada valor). Figura 1-24Si se desea observar la información de otra variable, basta con señalarla en lalista de variables (Hacer clic) y la información de ella aparece dentro de lacasilla del cuadro de diálogo. Este botón es de bastante utilidad cuando sedesconoce el contenido de los datos o sencillamente se nos olvida el contenidoy estamos realizando análisis con los procedimientos del programa.BARRA DE HERRAMIENTAS DE SPSS 270
  • 272. Buscar ( ): A través de este icono podemos ubicar un valor dentro de unavariable; es decir, nos permite encontrar un número o una combinación decaracteres dentro de los registros de una variable. Dado que generalmente seutilizan números para representar las categorías de las variables (Por ejemplo:hombre = 0 y mujer =1) y las bases de datos poseen múltiples variables, seríailógico esperar que la búsqueda se realice en todo el archivo.Al seleccionar el procedimiento Buscar, aparece un nuevo cuadro de diálogo[Fig.1-25]; para identificar la variable en la que se realizará la búsqueda, elcuadro adiciona en la parte superior la frase “Buscar datos en la variable ***”(donde *** = nombre de la variable). Para seleccionar una variable se debehacer clic sobre ella directamente en el editor de datos, de manera que elnombre de la variable en la frase cambie por el de la variable seleccionada. Figuras 1-25Si nos fijamos en el cuadro de diálogo Buscar datos, notaremos que apareceen la parte inferior del cuadro la opción Coincidir mayúsculas y minúsculas;esta opción nos permite especificarle al programa que realice la búsqueda deforma más exacta; desde luego esta opción sólo es aplicable a las variables 271
  • 273. que tengan caracteres alfanuméricos (Letras). Por último encontramos el botónBuscar siguiente; a través de este botón podemos pasar de un caso o registroencontrado, que coincida con las condiciones de búsqueda, al siguiente.Insertar caso ( ) e Insertar variable ( ): Como su nombre lo indica, estasdos opciones nos permiten ingresar un nuevo Caso o Variable. Al seleccionarla opción Ingresar caso, el programa nos permite ingresar los valores del casopara cada una de las variables del archivo. Si por el contrario seleccionamos laopción Insertar variable, el programa nos permite ingresar una nueva variable opregunta para los casos del archivo de datos activo.Segmentar archivo ( ): Este icono nos permite dividir nuestra base dedatos (Archivo activo) en distintos grupos de acuerdo a la variable queutilicemos para la segmentación. Al seleccionar esta opción, se abre un nuevocuadro de diálogo [Fig.1-26]; en el que encontramos tres diferentes opcionesde segmentación. La primera opción del cuadro es Analizar todos los casos, nocrear los grupos; esta opción nos permite trabajar con todos los casos de labase y calcular los resultados de los estadísticos empleando la totalidad de loscasos u observaciones.La segunda opción corresponde a Comparar los grupos; esta opción nospermite comparar los resultados de los procedimientos que se realicen con elprograma para las categorías de la variable de agrupación; para realizar lacomparación el programa realiza los cálculos solamente con los datos de cadacategoría y presenta los resultados de forma comparativa; es decir ubica deforma jerárquica los resultados de cada categoría (por ejemplo: tabla categoría1, tabla categoría 2, gráfico categoría 1, gráfico categoría 2, estadísticocategoría 1, estadístico categoría 2).La tercera opción corresponde a Organizar los resultados por grupos; estaopción es muy similar a la opción anterior, con la diferencia que los resultadosde los procedimientos que se realicen con el programa se representan enforma organizada (Por ejemplo: Tabla Cat1, Gráfico Cat1, Estadístico Cat1,Tabla Cat2, Gráfico Cat2, Estadístico Cat2). Esta opción es bastante útil sinosotros deseamos hacer un análisis separado de la muestra por algún tipo de“rangos”, como por ejemplo el g nero, la región, la fecha, etc. 272
  • 274. Figuras 1-26Para realizar la segmentación de archivo debemos seleccionar una de las dosúltimas opciones, de manera que se active la casilla “Grupos basados en”; unavez se activa se ingresa en ella la variable o las variables que deseamos utilizarcomo rango y finalmente hacemos clic en Aceptar. Después de segmentar elarchivo, cada procedimiento (tablas, gráficos o estadísticos) que se realice conel programa, mostrará los resultados de acuerdo a la segmentación. Encapítulos posteriores emplearemos este procedimiento para comprender losresultados que ocasiona.Ponderar ( ): A través de esta opción, podemos asignarle un peso o valordiferente a cada uno de los casos; es decir, darle mayor importancia a unosvalores de registro que a otros, esto se hace con el fin de poder sacar algúnresultado representativo de la población y no de la muestra. Para poder realizareste procedimiento, es necesario tener una variable de ponderación en la cualse encuentran los valores (Pesos) de cada registro; en capítulos posterioresemplearemos esta opción para comprender los resultados que ocasiona.Seleccionar casos ( ): A través de esta opción, podemos seleccionarsolamente los casos que cumplan con los criterios que el investigador imponga;por ejemplo, las personas del género femenino. A su vez, este procedimientonos brinda la oportunidad de pedirle al programa que tome un fragmento de loscasos de forma aleatoria. Al activar la selección de casos el programa realizalos cálculos de los procedimientos sólo con los casos que hayan sidoseleccionados. 273
  • 275. Etiquetas de valor ( ): Esta opción nos permite observar en el editor dedatos, los valores de los datos o la categoría a la que corresponde. Al activaresta opción aparecen en el editor de datos las categorías (palabras) de cadauna de las variables [Fig.1-27]. Si por el contrario desactivamos esta opción,aparecen en el editor de datos los números (Valores) de cada variable [Fig.1-28]. La utilidad de esta opción radica en la capacidad de darnos informaciónsobre los datos que contiene cada una de las variables categóricas. Figuras 1-27Usar conjuntos ( ): Este procedimiento nos permite generar o utilizarconjuntos de variables, para restringir el número de variables mostradas en laslistas de origen de los cuadros de diálogo. Los conjuntos de variablespequeños hacen que la búsqueda y la selección de variables para los análisissea más fácil y pueden incluso mejorar el rendimiento. Si el archivo de datoscontiene un elevado número de variables y los cuadros de diálogo se abren conlentitud, es necesario restringir las listas de origen de los cuadros consubconjuntos de variables más pequeños, lo que reduce la cantidad de tiempoempleado en abrirlos.PERSONALIZAR LA BARRA DE HERRAMIENTAS DE SPSSLos procedimientos que se incluyen en la barra de herramientas pueden sermodificados, extrayendo o ingresando los procedimientos que deseemos. Pararealizar la personalización de la barra de herramientas, debemos ubicar elpuntero del ratón sobre la barra de herramientas y hacer clic derecho sobre ellade manera que aparezca el menú desplegable [Fig.1-29]. 274
  • 276. Figuras 1-29Una vez aparece el menú, seleccionamos la opción personalizar con lo queaparece el cuadro de diálogo correspondiente [Fig.1-30]. A través de estecuadro podemos personalizar las barras de herramientas existentes e inclusocrear nuevas barras. En las barras de herramientas se puede incluir cualquierprocedimiento disponible, o cualquier acción del menú.Para personalizar una barra de herramientas, debemos seleccionar en la listade Categorías (Menús y opciones), la categoría en que se encuentre elprocedimiento que deseamos incluir. Una vez se selecciona la Categoría, seactualizan en la lista de elementos los procedimientos que se incluyen dentrode ella. Para seleccionar el procedimiento basta con hacer clic sobre el ymanteniendo oprimido el botón del ratón, arrastrarlo hasta la ubicación de labarra donde deseamos ingresarlo. Al soltar el botón del ratón, aparece en labarra el icono representativo del procedimiento seleccionado. Figuras 1-30 275
  • 277. A manera de ejemplo ingresaremos en la barra de herramientas elprocedimiento Frecuencias. Para realizarlo debemos seleccionar en la lista decategorías la opción Analizar, de manera que aparezca en la lista de elementoslos procedimientos típicos de este menú. Una vez se actualiza el contenido,nos dirigimos a la barra de desplazamiento horizontal ubicada en la parteinferior del cuadro (Personalización de la barra Editor de datos) y laarrastramos hacia la derecha de manera que aparezca el extremo derecho dela barra de herramientas.Después de aparecer el extremo de la barra, ubicamos en la lista de elementosla opción Separador ( ) en la parte superior de la lista de elementos; loseleccionamos (Hacer clic) y manteniendo el botón del ratón oprimido loarrastramos hacia el costado derecho de la barra del editor de datos, en dondelo soltamos. Una vez se suelta el separador, aparece en la barra un segmentosin icono; el objetivo de ingresar este separador, consiste en crear un espacioentre los botones usar conjuntos y Frecuencias que vamos a infiltrar. Despuésde ingresar el separador, introducimos el procedimiento Frecuencias,ubicándolo en la lista de elementos y llevándolo hasta el costado derecho de labarra de herramientas, en donde soltamos el botón de ratón y aparece el botón123 [Fig.1-31]. Figuras 1-31 276
  • 278. Una vez se ingresa el procedimiento a la barra de herramientas, hacemos clicen Aceptar con lo que se cierra el cuadro de diálogo y volvemos al editor dedatos. Si nos fijamos en la barra de herramientas del editor de datos,notaremos que ahora aparece en ella el icono ( ), el cual representa elprocedimiento Frecuencias; si hacemos clic en él se abrirá el cuadro de diálogocorrespondiente. Este mismo procedimiento debe ser empleado para ingresarnuevas aplicaciones a la barra de herramientas.Barra de PosiciónLa barra de posición esta ubicada debajo de la barra de herramientas en eleditor de datos y nos permite identificar de forma rápida y sencilla el númerodel caso (Fila), la variable (Columna) y el valor de la casilla de registro quehemos seleccionado [Fig.1-32]. Para activar la barra, debemos hacer clic sobrecualquiera de las casillas del editor de datos, con lo que aparecerá de formaautomática la información de la casilla. La utilidad de esta casilla se pone enevidencia cuando trabajamos con archivos que cuenten con un número elevadode registros. Figura 1-32VISTAS DEL EDITOR DE DATOS DE SPSSEl editor de datos cuenta con dos diferentes tipos de vistas (Datos y Variables),a través de las cuales podemos modificar o definir parámetros específicos de lainformación contenida en el archivo. La primera de estas vistas corresponde ala Vista de datos [Fig.1-33]. Esta es la vista que aparece por defecto en eleditor de datos y mediante ella podemos ingresar, modificar o eliminar loscasos y registros (valores) del archivo. La estructura de la vista de datos estadiseñada de manera, que las variables (Preguntas) se ubiquen en las columnasy los casos, registros u observaciones se ubiquen en las filas. 277
  • 279. Figuras 1-33A través de la Vista de datos podemos observar, modificar o eliminar cada unode los valores de los casos que componen el archivo de datos. Además cuandocreamos un archivo nuevo, es en esta vista donde se ingresan los datos; pararealizarlo debemos ingresar la información en cada una de las casillas. Esnecesario resaltar que se denomina Caso a las repuestas que un individuoproporciona a la totalidad de las preguntas o variables del archivo.La segunda vista del editor de datos corresponde a la Vista de Variables [Fig.1-34]. A través de la vista de variables se definen los parámetros informativos delas preguntas o variables del archivo; esta vista es sin ninguna duda la partemás importante del paquete, ya que de la correcta definición de nuestrasvariables depende la efectividad de nuestro análisis y los procedimientos quepodamos realizar con ellas. Para seleccionar esta vista basta con hacer clicsobre la pestaña Vista de variables ubicada en la parte inferior de la ventana. 278
  • 280. Figuras 1-34Al seleccionar la vista de variables, aparece en la parte superior del área dedatos una serie de propiedades preestablecidas por el programa entre las queencontramos Nombre, Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos,Columna, Alineación y Medida. Cada una de estas propiedades tiene unpropósito específico y es necesario antes de generar algún tipo de análisis,comprobar que estén correctamente diligenciados cada uno de los campos. Sinos fijamos en las casillas de la vista notaremos que ahora las filascorresponden a cada una de las variables de nuestra base o archivo; esto sedebe a que en la vista de variables la estructura esta diseñada para que lasPropiedades de las variables se ubiquen en las columnas y las variables seubiquen en las filas.Es importante hacer notar la diferencia estructural entre la Vista de Variables yla Vista de Datos [Fig.1-35]; esta diferencia se produce debido a que en la Vistade variables definimos las características de las variables; es decir, suspropiedades. Lo único que se realiza en esta vista, es ingresar informacióncomplementaria de las variables, la cual determina los procedimientos quepueden ser empleados en el análisis, de acuerdo a las características de lavariable. Mientras la Vista de datos nos permite ingresar, modificar o eliminarlos datos (registros o variables) del archivo. 279
  • 281. Figuras 1-35Si nos fijamos en las estructuras de las vistas del Editor de datos, notaremosque para la vista de datos, las variables se ubican en las columnas y los casoso registros se ubican en las filas, mientras que para la vista de variables, laspropiedades (Definición) se ubican en las columnas y las variables se ubicanen las filas. Una vez aclaradas las diferencias estructurales de las vistas,continuaremos describiendo cada una de las propiedades de las variables, lascuales determinan en gran medida los diferentes procedimientos que sepueden realizar con los datos.PROPIEDADES DE LAS VARIABLES EN SPSSLas variables en SPSS cuentan con una serie de propiedades que deben serdefinidas por el investigador o usuario antes de realizar cualquier tipo deanálisis con ella. De la correcta definición de las propiedades, depende en granmedida la calidad de los análisis que se realicen y por lo tanto la veracidad delos resultados o conclusiones que se generen. SPSS ha estipulado diezpropiedades informativas de las variables entre las que encontramos:I. Nombre:Este parámetro nos permite identificar y diferenciar las variables que componenel archivo; para cada una de las variables se debe definir un nombre específico.El programa establece una serie de normas para los nombres de variables,entre las que encontramos: 280
  • 282.  Cada nombre de variable debe ser único; no se permiten duplicados.  La longitud del nombre no debe exceder los 64 bytes. Sesenta y cuatro bytes suelen equivaler a 64 caracteres en idiomas de un sólo byte (por ejemplo, inglés, francés, alemán, español, italiano, hebreo, ruso, griego, árabe, tailandés) y 32 caracteres en los idiomas de dos bytes (por ejemplo, japonés, chino, coreano).  El nombre debe comenzar por una letra. Los demás caracteres pueden ser letras, dígitos, puntos o los símbolos @, #, _ o $.  Los nombres de variable no pueden terminar en punto.  Se deben evitar los nombres de variable que terminan con subrayado (para evitar conflictos con las variables creadas automáticamente por algunos procedimientos).  No se pueden utilizar espacios en blanco ni caracteres especiales (por ejemplo, !, ?, y *).  Las palabras reservadas (ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH) no se pueden utilizar como nombres de variable.  Los nombres de variable se pueden definir combinando de cualquier manera caracteres en mayúsculas y en minúsculas, esta distinción entre mayúsculas y minúsculas se conserva en lo que se refiere a la visualización.Para las versiones anteriores de SPSS (11.5, 11.0, 10.0, etc.) la longitud de lasvariables es de sólo ocho Bytes, lo cual generalmente no es suficiente paraidentificar una variable, por lo que es recomendable utilizar las tres primerasletras de cada palabra de la frase; es decir,Estado Civil = estcivNivel de confianza = nivdeconNo necesariamente se debe seguir esta regla, lo realmente importante es queel nombre de la variable le permita identificar al usuario o investigador, elcontenido a que se hace referencia; es decir, permitirle al usuario hacerse unaidea del tema que abarca los datos de esa variable.II. Tipo:La propiedad Tipo, nos permite especificarle al programa la naturaleza de losdatos que se incluyen dentro de la variable; es decir, nos permite definir la 281
  • 283. forma y el significado de los caracteres que se encuentran en los registros de lavariable. SPSS nos permite elegir entre ocho diferentes tipos de variables pararepresentar Números (Magnitudes), Fechas (Tiempo), Monedas (Dinero) yLetras (Cadena). Desde luego es aconsejable trabajar las variables de formanumérica ya que el análisis estadístico es una ciencia matemática y para sucorrecto funcionamiento es necesario realizar las operaciones con números; yaque en algunos casos no es posible tener los datos de forma numérica, elpaquete nos permite trabajarlos como una cadena de caracteres (Letras yNúmeros).Para definir el Tipo, debemos hacer clic en la casilla de la variable de interés,de manera que aparezca en el costado derecho de la casilla un pequeñocuadrado con puntos suspensivos ( ). Al seleccionar el botón (Hacer clic),aparece el cuadro de diálogo Tipo de variable [Fig.1-36], en donde aparecenlos diferentes Tipos de variable que se pueden elegir para la variableseleccionada. Figura 1-36Numérico: Se emplea en una variable numérica cuyos valores representanmagnitudes o cantidades y se asocian de forma estándar; es decir, asume la 282
  • 284. notación por defecto de Windows para la separación decimal (Enteros (,)Decimales) “1000,00”; este suele ser el tipo mas usado.Coma y/o Punto: Estos dos tipos de variables se emplean en una variablenumérica cuyos valores representan magnitudes o cantidades. Al seleccionar laopción Coma los valores se asocian con comas que delimitan cada tresposiciones y con el punto como delimitador decimal “1,000.00”. Cuando seselecciona el Punto los valores se asocian con puntos que delimitan cada tresposiciones y con la coma como delimitador decimal “1.000,00”.Notación científica: Se utiliza en una variable numérica cuyos valores sondemasiado grandes o pequeños, por lo cual se emplea un exponente con signoque representa una potencia en base diez. 1’000.000.00 = 1.0E+6 ó 0.000001= 1.0E(-6). SPSS nos permite representarlo de varias formas como 1000000,1.0E6, 1.0D6, 1.0E+6, 1.0+6. La notación es útil cuando manejamos cifrasextremas de lo contrario es mejor manejarlo de forma numérica.ANCHURA, DECIMALES Y ETIQUETAS EN SPSSFecha: Este tipo de variable se emplea cuando los valores de la variablerepresentan fechas de calendario u horas de reloj; al seleccionarla aparece enel cuadro de diálogo una casilla con el listado de los diferentes formatos que elprograma reconoce [Fig.1-37]. Para elegir alguno de ellos basta con hacer clicsobre el formato y sucesivamente en Aceptar. Figura 1-37Dólar: se emplea en una variable numérica cuyos valores representan sumasde dinero en dólares. Al seleccionar este tipo de variable aparece en el cuadro 283
  • 285. de diálogo un listado de formatos monetarios [Fig.1-38], en donde debemosseleccionar el formato que más se acomode a los datos. Figuras 1-38 y 1-39Moneda personalizada: Este tipo de variable se emplea cuando los valores deuna variable representan sumas de dinero diferentes al dólar (Pesos, pesetas,Euros, etc.); al seleccionar esta opción aparece un nuevo listado [Fig.1-39], enel cual debemos seleccionar uno de los formatos existentes. Estos formatos norepresentan monedas especificas, si no que por el contrario el programa asumeque la moneda es de origen distinto al dólar. La diferencia con el tipo dólar esque nos permite trabajar con cinco (5) diferentes tipos de moneda.Cadena: Este tipo de variable se emplea cuando los valores no son numéricoso sencillamente no representan magnitudes o cantidades; estas variables noson utilizadas en los cálculos de los estadísticos. Las variables de cadenapueden contener cualquier tipo de caracteres siempre que no exceda lalongitud máxima de 255; las mayúsculas y las minúsculas se considerandiferentes ya que el programa trabaja bajo el código ASCII. A este tipo devariables, también se le suele denominar como variable alfanumérica. Paradefinir alguno de los tipos de variable, basta con hacer clic sobre la opción quese desee y sucesivamente hacer clic en el botón Aceptar, con lo que se cierrala ventana y el tipo elegido aparece en la casilla seleccionada.III. Anchura:Por medio de esta propiedad podemos definir el máximo de dígitos quecontienen los registros de una variable; para el cálculo del ancho se incluyenlos dígitos enteros y los decimales. Por ejemplo;Anchura 5 = xxx.xx ó x,xxx.x ó xx,xxx donde x representa un número aleatorio. 284
  • 286. No debemos cometer el error de pensar que una vez establecida la anchura, yano podremos encontrar una cifra con mayor cantidad de números dentro de losregistros. La opción Anchura se emplea para darle una idea al investigador, delas cifras que encontrará cuando le pida al paquete información de lasvariables, es decir, no restringe la cantidad de números sino que es unparámetro informativo, el cual le brinda a la persona que opere el programa unaidea de los rangos máximos que puede tomar esta variable, pero no impide quese ingresen valores que sobrepasen esta longitud.IV. DecimalesA través de este parámetro se define el número de dígitos decimales quepueden contener los registros de la variable. Las cifras que superen estalongitud serán aproximadas por el programa. Cuando una cifra supera lalongitud, el programa aproxima hacia arriba los dígitos que sobrepasen lalongitud si el valor del último de ellos es igual o mayor que cinco, de lo contrario(menor que 5) se aproxima hacia abajo; es decir:1.07X si X < 5 entonces se aproxima a 0 es decir = 1.071.07X si X => 5 entonces se aproxima a 10 es decir = 1.08Las propiedades Anchura y Decimales pueden ser editadas directamentedesde la ventana de Tipo de variable cuando se eligen los tipos numéricos devariables Numérica, Coma, Punto, Notación científica, Dólar o Monedapersonalizada [Fig.1-40], ya que al seleccionar estas opciones se habilita en elcuadro de diálogo las casillas Anchura y Decimales. Figuara 1-40 285
  • 287. Hay que notar que cuando seleccionamos los Tipos de variables como laFecha y Cadena estas propiedades se desactivan; esto se debe a que para eltipo de formato Fecha el programa ha predefinido estos parámetros y nopodemos alterarlo, la única opción que tenemos es escoger otro formato defecha; mientras que para el tipo cadena no se puede tener números decimales.V. EtiquetaDado que generalmente los sesenta y cuatro (64) caracteres del nombre(Versiones anteriores ocho [8]) y las normas que se deben cumplir, no permitendescribir de forma clara la variable y el contenido de ella; SPSS nos brinda laposibilidad de utilizar una etiqueta por medio de la cual podemos describir lavariable mediante la utilización de un máximo de 255 caracteres.El uso de la etiqueta es bastante útil para facilitar la interpretación de losresultados (Tablas, Gráficos o estadísticos), para las personas que no hanparticipado en la generación de los procedimientos y desconocen el significadodel nombre de la variable. El uso de la etiqueta es opcional, el programa encaso de no existir una etiqueta utiliza el nombre de la variable para generar losresultados. Para saber si una variable tiene estipulada una etiqueta debemosubicar el cursor del ratón sobre el nombre de la variable en la vista de datos, demanera que aparezca una leyenda informativa. Para comprender el valorpráctico del uso de etiquetas, debemos observar las tablas de la figura [1-41]. Figura 1-41Estas tablas contienen la frecuencia y el porcentaje de las categorías de lavariable Estado civil (Casado y Soltero); la primera tabla cuenta con etiquetas 286
  • 288. para el nombre de la variable y para las categorías de la variable, mientras quela segunda tabla no cuenta con etiquetas. Si nos fijamos en la tablas notaremosque para interpretar la segunda tabla encontramos dificultades ya que nopodemos determinar que categoría representan los números cero (0) y uno (1).Esta misma dificultad puede presentarse cuando nosotros realizamos unanálisis de datos y entregamos los resultados a una persona que no hayaparticipado en los procedimientos; para evitar estos inconvenientes se sugieredefinir las etiquetas de variable y de valores.Antes de definir la propiedad Valores debemos ver primero las propiedadesPerdidos y Medida, ya que la utilización de la etiquetas de valor estádeterminado por estos dos parámetros y en este momento no seria muy clarasu definición.VALORES PERDIDOS Y ETIQUETAS DE VALOR EN SPSSVI. Valores perdidosLos valores perdidos son razones por las cuales no obtenemos una respuestacoherente de algún entrevistado; es decir, es una razón que nos indica la causapor la que no me aporta información el entrevistado. Dentro de los valoresperdidos podemos encontrar:  No sabe  No responde o se niega a responder  No aplica o sencillamente la pregunta no lo afecta EJ: preguntarle a una persona soltera la edad a la que se caso por primera vez, si no se ha casado nunca esta pregunta no lo afecta.Debemos tener claro que los valores perdidos son razones y no errores,generalmente tendemos a confundir un valor perdido con un valor que no estadentro de nuestro rango. Por ejemplo, si en la variable género (sexo), tenemoslos valores (1 = mujeres y 2 = hombres) y después de revisar el archivo nosdamos cuenta que tenemos en algunos registros el valor 3, generalmentecometemos el error de pensar que este es un valor perdido, pero no lo es, estetipo de valores los debemos considerar como errores ya sea de digitación o decaptura y la forma de corregirlos es ir hasta la fuente (entrevistas) y determinar 287
  • 289. a que grupo pertenecía el individuo. Si no podemos determinar el grupo y losvalores son muy pocos es recomendable prescindir de estos casos.SPSS maneja dos tipos de valores perdidos; el primero es perdido por elsistema, el cual se identifica por la ausencia total de datos; es decir, casillasvacías y el segundo corresponde a los datos perdidos definidos por el usuario(No sabe, No responde o No aplica). El programa detecta automáticamente losvalores perdidos por el sistema y los omite, mientras que los valores perdidospor el usuario deben ser definidos al programa o de lo contrario los cálculos serealizarán contando con estos valores, lo cual puede afectar severamente losresultados. Figuras 1-42Para definir un valor perdido por el usuario debemos activar la casillacorrespondiente a Perdidos de la variable de interés, de manera que aparezcaal costado derecho de la casilla un cuadrado con puntos suspensivos ( ). Alseleccionar el cuadrado (Hacer clic) aparece la ventana de Valores Perdidos[Fig.1-42]. En este cuadro encontramos tres diferentes posibilidades. Laprimera corresponde a No hay valores perdidos (Los cálculos se realizan con latotalidad de los registros). La segunda corresponde a Valores perdidosdiscretos (son un máximo de tres valores perdidos en la variable; se puedeemplear los valores (números) que se deseen.Para este tipo de valores se recomienda que exista una distancia considerableentre los valores representativos y los perdidos con el fin de facilitar suidentificación). La tercera y última opción corresponde a Rango más un valordiscreto opcional (se utiliza cuando tenemos varios parámetros de valoresperdidos, los cuales se encuentran dentro de un rango. Para seleccionar esta 288
  • 290. opción es necesario que no existan valores representativos de grupos dentrodel rango de lo contrario serán omitidos de los cálculos. Además esta opciónnos permite ingresar un valor discreto adicional). Para seleccionar cualquierade las opciones basta con hacer clic sobre la opción de manera que aparezcaen la casilla de activación ( ) un punto negro y sucesivamente ingresar losvalores.VII. Columnas y AlineaciónEstos dos parámetros son netamente de formato (es decir de presentación) ysus efectos son apreciables únicamente en la vista de datos. La primerapropiedad (columnas) nos indica el ancho de la columna, mientras que lasegunda (Alineación) determina la alineación de los datos dentro de la casilla.El parámetro columna, al igual que en una hoja de cálculo, podemos alterarlode forma directa en la vista de datos colocando el cursor al lado de la columnahasta que aparezca el indicador, hacemos clic y lo sostenemos arrastrandohasta obtener el ancho deseado.VIII. MedidasEste es el parámetro más importante de las variables, de su definición dependeel tipo de análisis que podemos realizar con el programa. Dentro de laestadística se han catalogado cuatro diferentes escalas de medida, pero paraSPSS estas escalas se resumen en sólo tres:  Nominal: son variables numéricas cuyos valores (Números) indican una categoría de pertenencia. Para este tipo de medida, las categorías no cuentan con un orden lógico que nos permita establecer una comparación de superioridad entre ellas. Un ejemplo de variable nominal puede ser el género, la raza, el estado civil, etc.  Ordinal: son variables numéricas cuyos valores indican una categoría de pertenencia y a su vez las categorías poseen un orden lógico que nos indica una superioridad o prelación. Un ejemplo de variable ordinal puede ser el nivel de ingresos, categoría del vehículo, nivel educativo, etc.  Escala: son variables numéricas cuyos valores representan una magnitud o cantidad y no una categoría; los valores de este tipo de 289
  • 291. medida pueden ser empleados en operaciones aritméticas como la suma, la resta, la multiplicación y la división ya que los intervalos (Distancia entre los números) cuentan con la misma longitud. Un ejemplo de variable de escala puede ser la edad, las ventas, la distancia en metros, la altura, etc.Para los archivos de datos con formato SPSS creados en versiones anterioresse aplican las siguientes reglas.  Las variables de cadena (alfanuméricas) se establecen en nominales.  Las variables de cadena y numéricas con etiquetas de valor definidas se establecen en ordinales.  Las variables numéricas sin etiquetas de valor definidas que no superen un número específico de valores únicos (24), se establecen como ordinales, mientras que si el número de valores supera los 24 se definen como de Escala.IX. ValoresLos valores o Etiquetas de valor nos permiten generar una leyenda que facilitela interpretación de los números representativos de cada categoría de unavariable, ya sea en los resultados o en la vista de datos. Debido a que seutilizan números para representar cada categoría es necesario crear unapequeña leyenda que nos permita ver en letras la categoría a la quecorresponde cada número. Las etiquetas de valor no pueden exceder los 60caracteres y se deben emplear solamente si se cumplen los siguientesrequisitos:  La variable es categórica, es decir Nominal u Ordinal.  Se tienen valores perdidos por el usuario.Para definir las etiquetas de valor debemos activar la casilla de valorcorrespondiente a la variable de interés de tal manera que aparezca al costadoderecho un cuadrado con puntos suspensivos en su interior. Al hacer clic sobreel cuadrado aparece la ventana Etiquetas de valor [Fig.1-43]; en esta ventanaencontramos tres casillas. 290
  • 292. Figura 1-43La primera corresponde al Valor o número, en ella debemos digitar el númeroal que deseamos dar la etiqueta. La segunda casilla corresponde a la Etiquetade valor, en ella digitamos la categoría a la que corresponde ese valor (máximo60 caracteres) y la tercera casilla corresponde a las etiquetas añadidas; esdecir, las categorías que ya se han definido. Para ingresar una etiqueta devalor, debemos primero ingresar el valor en la casilla Valor, sucesivamenteingresar la leyenda en la casilla Etiqueta y finalizar haciendo clic en el botónAñadir, con lo que aparece en la casilla el número y la leyendacorrespondiente.Si deseamos cambiar una etiqueta que ya haya sido añadida, debemosseleccionarla en la casilla (hacer clic sobre ella), editar ya sea el número o laetiqueta y hacer clic en Cambiar. Si por el contrario deseamos eliminarla,debemos seleccionarla y hacer clic en Eliminar. Para finalizar basta con hacerclic en Aceptar, con lo que la ventana se cerrara y las etiquetas quedarándefinidas. Es necesario Añadir antes de Aceptar o de lo contrario se perderácualquier operación de Añadir o Cambiar pendiente.ÁREA DEL PROCESADORLa última sección del editor de datos corresponde al área del procesador, lacual esta ubicada en la parte inferior de la ventana. A través de esta áreapodemos saber el estado del procesador de acuerdo al proceso que se esterealizando. Esta sección es de bastante utilidad cuando le pedimos al programaun procedimiento y se cuenta con un elevado número de registros; en algunoscasos la base es tan extensa que puede tardar bastante tiempo la ejecución del 291
  • 293. resultado, en estos casos generalmente se tiende a pensar que el programa sebloqueo, antes de determinarlo es importante saber cual es el estado delprocesador ya que el retardo puede ser ocasionado por la extensión de losdatos. Además, cuando la licencia caduca, en esta área encontramos elmensaje el procesador no esta disponible.GENERANDO TABLAS DE FRECUENCIA EN SPSSAdemás de la ventana editor de datos, SPSS cuenta con otras ventanas comola de Resultados o la de Sintaxis. Para conocer la ventana de resultados,vamos a generar una tabla de frecuencias con las variables Género y Estadocivil. Para realizarlo debemos ir al menú Analizar.. Estadísticos descriptivos..Frecuencias [Fig.1-44]. Al seleccionar la opción frecuencias, aparece el cuadrode diálogo correspondiente [Fig.1-45]. A través de esta ventana se debendefinir las variables a las que queremos realizar la tabla de frecuencias. Figuras 1-44 y 1-45Si observamos el listado de variables que aparece al costado izquierdo delcuadro, notaremos que las variables están por su etiqueta y no por el nombre,esto es útil si desconocemos el archivo y su contenido, pero si es un archivoque hemos creado o su contenido nos es familiar, seria más aconsejablemanejarlo por el nombre de las variables. Antes de continuar vamos a ver comose puede cambiar la forma de representar las variables en la lista. Pararealizarlo es necesario cerrar por un momento la ventana Frecuencias, luegovolveremos a ella. Para cerrarla basta con hacer clic en el botón cancelarubicado al costado derecho del cuadro. 292
  • 294. Una vez cerrada la ventana nos dispondremos a cambiar la forma derepresentar las variables en la lista, para esto debemos ir al menú Edición...opciones, al hacer clic en opciones se abre el cuadro de diálogocorrespondiente [Fig.1-46]. Figuras 1-46En este cuadro se manejan todas las opciones del paquete. Podemos observarque en la parte superior del cuadro hay una serie de pestañas; cada una deellas corresponde a un proceso específico del paquete. Dentro de estosprocesos encontramos (General, Visor, Visor de borrador, etiquetas de losresultados, gráficos, interactivos, tablas pivote, datos, moneda y procesos). Alseleccionar uno de ellos, el contenido de la ventana cambiará y nos mostrarálas opciones que cada pestaña maneja. Por el momento nos concentraremosen la pestaña General, en ella encontraremos la opción listas de variables, enla parte superior izquierda. Figura 1-47 293
  • 295. Esta sección nos permite manipular la forma como deseamos que serepresenten las listas de variables, en nuestro caso deseamos que las listas sedeterminen por el nombre de las variables y en orden alfabético. Para hacerlodebemos seleccionar las opciones Mostrar nombres y Alfabético haciendo clicen el circulo ( ) que se encuentra a la izquierda de ellas [Fig.1-47]. Despuésde seleccionar las opciones, hacemos clic en Aplicar y sucesivamente enAceptar, de manera que se cierra la ventana.Para comprobar el efecto realizado en las listas de variables, vamos acontinuar con la realización de la tabla de frecuencias. Para esto nuevamenteabrimos la opción frecuencias en el menú Analizar... Estadísticos descriptivos...Frecuencias; al seleccionar la opción, aparece nuevamente el cuadro dediálogo correspondiente [Fig.1-48]. Si nos fijamos en el listado de variables,notaremos que ahora aparecen los nombres de las variables y no la etiqueta. Figura 1-48Continuando con el ejemplo, debemos ubicar las variables Género y Estadocivil (Estciv) en la lista de variables e ingresarlas a la casilla de selección. Parahacerlo, debemos resaltar la variable deseada (Género) en la lista ysucesivamente hacer clic en el botón flecha, de manera que aparezca en lacasilla de selección. Una vez ingresamos las dos variables, hacemos clic en elbotón Aceptar, ejecutando las tablas de frecuencia y sus consecuencias sonpresentadas en la ventana Visor de resultados. Las demás partes de la ventanaFrecuencias, serán explicadas a profundidad en los capítulos posteriores.VISOR DE RESULTADOS DE SPSS 294
  • 296. En esta ventana se representan de forma gráfica todos los procedimientos(Tablas, Gráficos o Estadísticos) que se hayan ejecutado en el programa.SPSS cuenta con dos tipos diferentes de Ventanas de resultados, el primero esel Visor de Resultados [Fig.1-49] donde se muestra de forma interactiva losresultados de los procesos y los organiza en forma jerárquica de acuerdo conel orden que se hayan realizado.La segunda ventana corresponde al Visor de Borrador [Fig.1-50]; en estaventana los resultados se muestran en formato de texto, suprimiendo todas lascaracterísticas interactivas de los resultados. Este tipo de resultados puede serabierto con cualquiera de los programas lectores de texto. La principaldiferencia de estas dos ventanas, consiste en que el visor de Borrador nopuede modificar el formato de los resultados y además suprime laspropiedades interactivas de los objetos, mientras que en el visor de resultadospuede ordenar, editar o generar procedimientos de forma interactiva. Figuras 1-49 y 1-50La utilidad del visor de borrador radica en la posibilidad de compartir losresultados de los procedimientos en formato de texto con ordenadores que notengan instalado el paquete SPSS. Esta utilidad se ha visto afectada con lainclusión del programa SmartViewer en el CD de instalación de SPSS ya queeste programa nos permite observar los resultados del paquete en formainteractiva sin necesidad de instalar los módulos. Dado que el Visor deResultados es más completo y nos ofrece múltiples propiedades interactivas deedición, nos concentraremos en el estudio de esta ventana. 295
  • 297. Figuras 1-51El visor de resultados esta dividido en tres partes [Fig.1-51]. La primera de ellascorresponde al navegador de resultados; esta sección nos permite explorar losresultados que hemos obtenido a través de los diferentes análisis realizados.La segunda sección corresponde al visualizador de resultados en el cualobtenemos la imagen de los resultados de los procedimientos (Tablas yGráficos). La tercera sección corresponde a las opciones de ventana, en la cualencontramos los diferentes procedimientos de la ventana y algunos delpaquete.Navegador de ResultadosA través del navegador de resultados, podemos explorar todos los resultadosobtenidos mediante los distintos procedimientos del paquete, así como tambiénorganizarlos de acuerdo a nuestro criterio o las necesidades del reporte. SPSSha estructurado el navegador de forma jerárquica, con el fin de establecer unorden en los resultados. Para comprender la estructura básica del navegadorde resultados debemos observar la figura [1-52].Note como el programa ubica el resultado de cada procedimiento por separadoy dentro de cada uno de ellos se incluyen las diferentes propiedades con quecuentan; entre las diferentes propiedades de los procedimientos encontramosel Título, las notas, los estadísticos, los descriptivos, etc. Es necesario resaltarque en SPSS se denomina procedimiento a cualquier tipo de análisis querealicemos con el paquete; es decir, que consideraremos como procedimiento 296
  • 298. la generación de frecuencias, las tablas de contingencia, la generación degráficos, etc. Figura 1-52Para apreciar la estructura del navegador directamente en los resultados, seanexa la figura [1-53], la cual corresponde a una de las presentaciones típicasdel navegador; en ella podemos observar que para este caso existen dosprocedimientos; el primero de ellos corresponde al análisis de frecuencias y elsegundo a un análisis explorar (estos procedimientos serán examinados conmayor detenimiento en los capítulos posteriores). Debajo de cadaprocedimiento, aparece una serie de propiedades que nos permiten describirde forma más explicita el contenido y el objetivo del procedimiento. Laspropiedades varían de acuerdo al procedimiento elegido, pero hay dos queestán presentes en todas las aplicaciones del paquete, correspondientes alTítulo y las notas.Si nos fijamos en la parte inferior de la Figura [1-53], notaremos que algunos delos resultados tienen en su izquierda un icono parecido a un libro cerrado yotros a un libro abierto, esto se debe a que el programa nos brinda laposibilidad de ocultar o mostrar un resultado simplemente haciendo clic en elsigno que se encuentra a su izquierda ( ó ). Cuando el signo es positivo ( ),nos indica que ese resultado esta oculto y si el signo es negativo ( ) nos indicaque esta desplegado o abierto. Nosotros podemos ocultar una propiedad o unproceso, ya que su forma de ejecución es exactamente igual.Además de las opciones anteriormente enunciadas, el navegador también nospermite organizar los resultados a nuestro criterio o necesidades; para 297
  • 299. realizarlo sólo basta con seleccionar la propiedad o el procedimiento quedeseemos reubicar y arrastrarlo hasta la posición que se desee. A través delcurso utilizaremos constantemente esta ventana y podremos comprender deuna mejor manera su beneficio.VISUALIZADOR DE RESULTADOS DE SPSSLa segunda parte de la ventana Visor de Resultados corresponde alvisualizador de resultados, en ella se ven representados todos los resultadosde los procedimientos que se han realizado con el programa y a su vez, losefectos de las opciones de ocultar o mostrar del navegador se hacen notoriosen esta sección. Si se elige la opción ocultar, los resultados del procedimientodesaparecen del visualizador y sólo volverán a presentarse hasta que se elija laopción mostrar en el navegador [Fig.1-54]. En esta figura se incluye el estadodel visualizador antes y después de seleccionar la opción mostrar. Figuras 1-54Adicionalmente, en esta sección es donde se puede acceder a la edición de losobjetos (Tablas y Gráficos). Para poder activar la edición es necesario ubicar elpuntero del ratón sobre el objeto y hacer doble clic, con lo cual se abrirá eleditor correspondiente al objeto seleccionado (Editor de tablas pivote o Editorde Gráficos).por el momento no profundizaremos en estos temas ya que notiene sentido hablar de la edición de tablas o gráficos sin antes mencionar laforma de generarlos con SPSS. 298
  • 300. Opciones de VentanaLa tercera sección que compone la ventana Visor de resultados corresponde alas opciones de ventana, en ella se encuentran la barra de menús, la barra deherramientas y la barra de opciones del navegador; en estos componentesencontramos las funciones que nos permiten realizar los diferentesprocedimientos de la ventana e incluso algunos procedimientos del paquete. Sinos fijamos en la barra de menús, notaremos que los menús correspondientesa Datos y Transformar han desaparecido y en su lugar se encuentran losmenús Insertar y Formato.Este cambio se debe a que los menús Datos y Transformar sólo contienenopciones aplicables a los datos (Registros y variables) cuando se encuentrandesagrupados y por lo tanto deben ejecutarse en el editor de datos de SPSS.De igual manera los menús Insertar y Formato sólo contienen procedimientosque sólo pueden ser ejecutados en el visor de resultados ya que estánorientados a los resultados.Dentro del menú Insertar [Fig.1-55], se encuentran los procedimientos Salto depágina, Eliminar salto de página, Nuevo encabezado, Nuevo título, Nuevo títulode página, Nuevo texto, Gráfico 2-D interactivo, Gráfico 3-D interactivo, Gráficoantiguo, Nuevo mapa, Archivo de texto y Objeto. En el menú Formato [Fig.1-56], por el contrario encontramos sólo tres opciones correspondientes Alinear ala derecha, Centrar y Alinear a la izquierda, las cuales se utilizan de la mismaforma que en el editor de datos. 299
  • 301. Figura 1-55 Figura 1-56Ahora, si nos fijamos en la barra de herramientas de la ventana visor deresultados [Fig.1-57], notaremos que conserva algunos de los procedimientosque encontramos en el editor de datos y sólo incluye dos nuevosprocedimientos correspondientes a Seleccionar últimos resultados y Designarventana. Desde luego estos procedimientos sólo son aplicables para la ventanade resultados. 300
  • 302. Figura 1-57  Seleccionar últimos resultados ( ): Como su nombre lo indica, nos permite seleccionar los resultados del último procedimiento ejecutado. Al seleccionar esta opción, en el visualizador aparecen las tablas o gráficos correspondientes al último procedimiento. Es de bastante utilidad cuando tenemos un número considerable de resultados.  Designar ventana ( ): Este icono se utiliza cuando tenemos más de una ventana de resultados abierta. Lo que hace es comunicarle al programa que todos los resultados que generemos se deben representar en la ventana designada. Cuando tenemos más de una ventana abierta el programa adhiere los resultados nuevos a la última ventana que se haya abierto, lo cual puede ocasionar confusión y posiblemente pérdida de la información. Para evitarlo debemos activar el icono en la ventana que deseemos utilizar para los nuevos resultados. Para designar una ventana hacemos clic en el icono de manera que su color desaparezca. Figura 1-58La última sección que encontramos dentro de las opciones de ventanacorresponde a la barra de opciones de navegador [Fig.1-58]. En esta barraencontramos una serie de botones que nos permiten realizar tareas con elnavegador como Ascender, Degradar, Expandir, Contraer, Mostrar, Ocultar,Insertar Título,, Insertar encabezado e Insertar Texto. Desde luego, laactivación de estas opciones sólo tiene efectos en el navegador de resultadospor lo que dejamos su exploración al lector.EXPORTAR RESULTADOS DE SPSSUna de las alternativas más sobresalientes que se puede apreciar en el Visorde resultados corresponde a Exportar. A través de este procedimiento 301
  • 303. podemos enviar los resultados obtenidos mediante SPSS a una gran diversidadde formatos como Html (Paginas Web), de texto, Word/RTF y Excel. Estaopción nos permite compartir los resultados del paquete con nuestroscolaboradores o incluso subirlos a Internet, a través de la creación de archivosde resultados en otros formatos de mayor difusión.Para exportar resultados de SPSS, debemos ir al menú Archivo y escoger laopción Exportar, de modo que surja el cuadro de diálogo correspondiente[Fig.1-59]. A través de este cuadro se definen los parámetros que seránexportados, así como las propiedades del archivo resultante. Figuras 1-59Para exportar los resultados, es necesario elegir en la lista de exportación eltipo de elementos que van a ser exportados [Fig.1-60]. Se puede exportar losresultados y los gráficos, los resultados sin los gráficos ó sólo los gráficos. Unavez seleccionado el tipo de elementos, definimos el nombre del archivoresultante (Introduzca un nombre de archivo para los documentos deresultados o un nombre clave para los gráficos [si está seleccionada la opciónsólo gráficos]). Por lo general los resultados son guardados bajo el nombreOUTPUT. Si deseamos cambiar el nombre es necesario ingresar en la casillaExportar archivo una nueva ruta o un nuevo nombre para el archivo resultante. 302
  • 304. Figuras 1-60 y 1-61Después de definir el nombre del archivo, determinamos en la sección Exportarqué, los elementos que vamos a remitir. En esta sección encontramos lasopciones Todos los objetos (Tablas y gráficos), todos los objetos visibles y laopción objetos seleccionados. Cuando se ha señalado la opción Sólo gráficosen la lista de tipo de exportación, se exhibe en la sección Exportar qué lasopciones de la figura 1-61.Por último debemos definir el formato de exportación; para exportar losdocumentos de resultados con o sin gráficos el programa nos ofrece sólocuatro diferentes formatos Archivo Html (*.htm), Archivo de texto (*.txt), ArchivoWord/RTF (*.doc) o Archivo de Excel [Fig.1-62]. Si por el contrario se exportansólo los gráficos, el programa nos ofrece una gran variedad de formatos [Fig.1-63], entre los que encontramos metarchivo de Windows (WMF), mapa de bitsde Windows (BMP), PostScript encapsulado (EPS), JPEG, PNG y PICT deMacintosh. Figuras 1-62 y 1-63Para comprender mejor la forma de exportar los resultados, vamos atransportar a manera de ejemplo las tablas de frecuencia que hemos creado enlos apartados anteriores. Para realizarlo vamos a seleccionar en la lista deexportación la opción Documentos de resultados [sin gráficos]; luego de elegirla opción, nos dirigimos a la sección Exportar archivo y hacemos clic en elbotón Examinar de manera que aparezca la ventana de exploración [Fig.1-64].Por medio de esta ventana ubicamos en la casilla Guardar en, la carpetaEscritorio y sucesivamente hacemos clic en Guardar. Una vez volvemos alcuadro de exportación, escogemos en la sección Exportar qué, la opción Todos 303
  • 305. los objetos de manera que obtenemos los resultados de la figura [1-65].Inmediatamente se comprueba que coinciden las condiciones de exportación,hacemos clic en Aceptar con lo que el archivo es creado en el escritorio. Figuras 1-64 y 1-65Es aconsejable que antes de realizar una exportación de resultados se eliminenlos resultados que no vayan a ser enviados, para que no se presentendificultades durante o después de la exportación. Es necesario aclarar que laspropiedades interactivas de los resultados se perderán al momento de realizarla exportación, por lo que es fundamental realizar antes la edición de losresultados.GUARDAR ARCHIVOS O FICHEROS EN SPSSSPSS nos permite guardar los archivos que se generan en cada una de lasventanas del paquete (Datos, Resultados o Sintaxis). A pesar que elprocedimiento para guardar un archivo es similar en todas las ventanas, nosenfocaremos exclusivamente en la ventana Editor de datos, ya que el cuadrode diálogo empleado en esta ventana presenta algunas diferencias respecto alos cuadros obtenidos para la ventanas de Resultados y Sintaxis.Para guardar un archivo de datos, debemos dirigirnos al menú Archivo yseleccionar la opción Guardar como; al elegir esta opción aparece la ventanade navegación [Fig.1-66]. Si nos fijamos en el contenido de la ventana,notaremos que en la parte inferior aparecen tres opciones y a su vez en elcostado derecho se encuentra un botón denominado Variables.Estos elementos surgen, debido a que SPSS nos permite guardar los archivosde datos en una diversidad de formatos como Excel, dBASE, SAS, Archivos detexto, etc. Cuando se elige el formato Excel en la sección Guardar como, se 304
  • 306. habilitan las dos primeras opciones de la ventana (Escribir nombres devariables en hoja de cálculo y Guardar etiquetas de valores donde se hayandefinido en vez de los valores de datos). Si por el contrario se elige el formatoSAS, solamente se activa la última opción (Guardar etiquetas de valor en unarchivo .sas). La utilidad de estas opciones radica en la posibilidad de guardaraspectos informativos fundamentales de las variables, dentro de los archivosde otro tipo de formato. Figuras 1-66 y 1-67Por otro lado, el botón Variables nos permite definir las variables que seránincluidas dentro del archivo. Al activar este botón, surge un nuevo cuadro dediálogo [Fig.1-67], a través del cual se especifican las variables del archivoresultante. Por defecto el programa selecciona todas las variables; si se deseaexcluir algunas de ellas, es necesario hacer clic sobre la casilla de selecciónque se encuentra al costado izquierdo de la variable, de manera quedesaparezca la marca X. Por lo general, este procedimiento es empleadocuando deseamos guardar parte o la totalidad de las variables dentro de unarchivo de formato distinto al de SPSS. Por el momento no utilizaremos estaopción, por lo que hacemos clic en el botón Cancelar de esta nueva ventana.Si lo que deseamos es guardar el archivo en formato de SPSS (*.sav), sólo esnecesario ubicar el lugar del ordenador donde queremos guardarlo, asignarleun nombre al archivo y finalizar haciendo clic en el botón Guardar. Antes deguardar el archivo, vamos a conocer la ventana de sintaxis. Si nos fijamos enlos botones de la ventana de navegación [Fig.1-66], notaremos que aparece unbotón bajo el nombre de Pegar el cual se encuentra presente en la mayoría delos cuadros de diálogo del paquete. 305
  • 307. Por medio de este botón se le especifica al programa que agregue a la ventanade sintaxis, los comandos (Palabras clave) del procedimiento que estamosrealizando. A manera de ejemplo vamos a crear una nueva ventana de sintaxiscon el procedimiento Guardar; para lograrlo, ingresamos en la casilla Nombredel archivo de la ventana de navegación, la leyenda Ejemplo y sucesivamenteubicamos la unidad [C:] en la casilla Guardar en. Para finalizar hacemos clic enel botón Pegar con lo que el procedimiento es pegado en una nueva ventanade sintaxis.VENTANA DE SINTAXIS DE SPSSLa ventana de sintaxis nos permite trabajar los procedimientos del paquetemediante palabras de código, lo que es particularmente ventajoso cuandomanejamos análisis continuos; es decir, cada cierto tiempo tenemos querealizar el mismo análisis a una base de datos cuyos registros se actualizancon cierta regularidad.La utilización de la sintaxis reduce el tiempo que se invierte en elprocesamiento de los datos y la generación de los reportes o resultados. SPSSnos permite ir más allá y generar procesos que realicen todo el reporte deforma automática, agregándolo simplemente en las tareas programadas delPC.Para acceder a la ventana de sintaxis, contamos con dos posibilidades; laprimera consiste en ir al menú Archivo, seleccionar el procedimiento Nuevo yelegir la opción Sintaxis [Fig.1-68]. La segunda alternativa consiste en hacerclic sobre el botón Pegar, que aparece en la mayoría de los cuadro de diálogode los diferentes procedimientos del paquete, de manera que se active deforma automática la ventana de sintaxis [Fig.1-69]. Si nos fijamos en los menúsde esta ventana notaremos que cuenta con los mismos menús descritos para eleditor de datos a excepción de un nuevo menú denominado Ejecutar. 306
  • 308. Figuras 1-68 y 1-69Un archivo de sintaxis es simplemente un archivo de texto que contienecomandos o palabras claves. Aunque es posible abrir una ventana de sintaxis yescribir comandos, con frecuencia es más sencillo permitir que el programa nosayude a construir el archivo pegando la sintaxis de comandos directamente delos cuadros de diálogo. Para generar un archivo de sintaxis, se han establecidoalgunas normas básicas que se deben cumplir para garantizar el óptimofuncionamiento de los procedimientos. Las reglas de la sintaxis son:  Cada comando debe empezar en una línea nueva y terminar con un punto (.).  La mayoría de los subcomandos están separados por barras inclinadas (/). La barra inclinada que precede al primer subcomando de un comando, generalmente es opcional.  Los nombres de variable deben escribirse completos.  El texto incluido entre apóstrofos o comillas debe ir contenido en una sola línea.  Cada línea de la sintaxis de comando no puede exceder los 80 caracteres.  Debe utilizarse un punto (.) para indicar decimales, independientemente de la configuración regional de Windows.  Los nombres de variable que terminen en un punto pueden causar errores en los comandos creados por los cuadros de diálogo. No es posible crear nombres de variable de este tipo en los cuadros de diálogo y en general deben evitarse.Para comprender la forma de pegar y correr la sintaxis de un procedimiento,vamos a retomar la tabla de frecuencias que realizamos para las variables 307
  • 309. Género y Estados civil (estciv) en los apartados anteriores. Para realizarlo nosapoyaremos en uno de los botones de la barra de herramienta descritos conanterioridad correspondiente a Recuperar cuadros de diálogo ( ); al activarlose despliega la lista de procedimientos que se han generado con el programa;en ella elegimos la opción frecuencias, con lo que surge nuevamente el cuadrode diálogo correspondiente [Fig.1-70]. Una vez aparece el cuadro, ubicamos enla lista las variables Género y Estciv y las ingresamos en la casilla de selección.Después de ingresarlas hacemos clic en Pegar, de modo que se cierre elcuadro Frecuencias y a su vez aparece en la ventana de sintaxis los comandosdel procedimiento [Fig.1-71]. Figura 1-70 Figura 1-71 308
  • 310. Para correr (Ejecutar) los comandos de sintaxis, tenemos dos opciones; laprimera es seleccionar cualquiera de las opciones del menú Ejecutar (Todo,Selección, Actual o Hasta el final) y La segunda opción para correr loscomandos de sintaxis corresponde al botón ejecutar selección ( ) ubicado enla barra de herramientas.Al seleccionar la opción Todo del menú Ejecutar, el programa ejecuta todos loscomandos de sintaxis que se encuentren en el archivo; si por el contrarioelegimos la opción selección, el programa ejecuta solamente los comandosseleccionados por el usuario dentro del archivo. Si elegimos Actual, elprograma ejecuta la sintaxis del comando en el que se encuentre el cursor deratón. Por último si elegimos hasta el final, el programa ejecuta la sintaxis decomandos que se encuentren desde la ubicación del cursor del ratón hasta lasintaxis del fin del archivo.Sin importar que método empleemos para correr la sintaxis, una vez lacorramos aparecen en el visor de resultados las ilustraciones de losprocedimientos [Fig.1-72].La utilidad de la sintaxis radica en la posibilidad de guardar los comandos demúltiples procedimientos y ejecutarlos cuantas veces queramos, sin necesidadde volver a definir cada uno de los cuadros de diálogo. Adicionalmente, si poralgún motivo se alteran los datos del archivo, ya sea porque se adicionainformación, se reemplazan algunos valores o se eliminan casos, los cálculosde los procedimientos de la sintaxis serán realizados de acuerdo a lainformación que contenga el archivo al momento de ejecutar el archivo desintaxis. 309
  • 311. Figuras 1-72Es importante resaltar que el programa nos permite modificar los parámetrosde los diferentes procedimientos, directamente en la ventana de sintaxis,simplemente reemplazando las palabras clave o códigos. A manera deejemplo, vamos a modificar el procedimiento Frecuencias, de manera queaparezca en los resultados la tabla de la variable Región; para realizarlo,debemos volver a la ventana de sintaxis y ubicar en ella el procedimientoFREQUENCIES.A continuación reemplazamos la variable Género por la variable Región, por loque colocamos el cursor sobre la palabra Género y por medio del tecladoingresamos la frase región. Para finalizar hacemos clic en el botón Ejecutar ( )creando las tablas en el visor de resultados [Fig.1-73]. Al observar losresultados, notaremos que ha desaparecido la tabla de la variable Género y ensu lugar se encuentra la tabla de la variable Región. 310
  • 312. Figura 1-70En conclusión, la ventana de sintaxis nos permite guardar los comandos de losdiferentes procedimientos que se realicen con el programa, ofreciéndonos laposibilidad de ejecutarlos varias veces, sin importar los cambios que se leefectúen a los datos del archivo; adicionalmente, la sintaxis nos permitegenerar nuevos procedimientos a partir de los comandos de una aplicación,simplemente modificando las variables o las palabras clave, lo que representaun ahorro de tiempo en la generación del procesamiento.APLICACIÓN DE UN PROBLEMA DE COMERCIO EXTERIOR EN EL SPSS 311
  • 313. 1.- Abrimos el programa SPSS2.- Seleccionamos la opción: Introducir datos3.- Ingresamos las variables 312
  • 314. 4.- Ingresamos los datos en las variables CORRELACIÓN1.- Seleccionamos la opción: Correlaciones – Bivariadas 313
  • 315. 2.- Seleccionamos la opción: Seleccionamos las dos variables 314
  • 316. 3.- Seleccionamos la opción: Medidas y desviaciones típicas4.- Seleccionamos la opción: Analizar 315
  • 317. REGRESIÓN LINEAL1.- Seleccionamos la opción: Analizar – regresión - Lineales2.- Seleccionamos las variables independiente y dependiente 316
  • 318. 317
  • 319. 3.- Aceptamos para que el programa analice 318
  • 320. PRUEBA DE HIPOTESIS319
  • 321. 1.- Seleccionamos la opción comparar medias – Prueba T para una muestra2.- 320
  • 322. T STUDENT321
  • 323. 322
  • 324. CHI CUADRADO323
  • 325. 324
  • 326. ANÁLISISEsta aplicación explica cómo utilizar un programa informático para llevar a caboel tratamiento y análisis de información estadística. Se dirige a un conjunto muyamplio de lectores, tanto aquellos que se inicien en el aprendizaje de laEstadística como para los que ya tienen unos conocimientos previos sobre lamateria y quieren aplicarlos con la ayuda de un programa ampliamentedifundido en la actualidad como es el programa SPSS, versión 11.Se presupone que el usuario que utiliza esta aplicación quiere introducirse enlos conocimientos básicos de la Estadística mediante la utilización de unprograma informático para el tratamiento de datos, concretamente el programa 325
  • 327. SPSS, versión 11. Para el seguimiento del libro no se requiere ningúnconocimiento previo del funcionamiento de este programa. Este material hasido concebido como un instrumento aplicado al aprendizaje de la Estadística,ya que permite ver cómo se aplican los conocimientos y se obtienen losresultados con las herramientas informáticas disponibles.En cada uno de los apartados se consideran dos partes que permiten, enprimer lugar, familiarizarse con el entorno del programa SPSS, y seguidamentese procede a explicar las técnicas de análisis de datos: se incluyen unaexplicación teórica con definiciones, expresiones y fórmulas que permiteintroducir o recordar al lector la teoría estadística que se está utilizando.Al finalizar el trabajo de este material, el usuario habrá adquirido losconocimientos necesarios para utilizar el programa SPSS en los siguientesaspectos:- Introducción y lectura de los datos.- Análisis de estadística descriptiva básica univariante.- Tablas de frecuencias bivariantes.- Contraste de hipótesis paramétricas y no paramétricas.- Especificación, estimación y evaluación de un modelo de regresión linealsimple. - Identificación de modelos de series temporales y realización depredicciones.Este material tiene un enfoque eminentemente práctico dado que para cadauno de los procesos incluidos se presentan: instrucciones de los pasos aseguir, imágenes de las pantallas que se van obteniendo y ejemplos resueltosincluyendo los resultados obtenidos por el programa, así como todas las fasesintermedias que nos llevan a ellos, y las conclusiones que pueden extraerse delos mismos.CONCLUSIONES:  Mediante el presente trabajo hemos podido conocer y aplicar sobre los sistemas informáticos y métodos aplicados al comercio exterior, además hemos aprendido sobre las relaciones que existen entre las variables dentro de un problema. 326
  • 328.  Con el desarrollo de problemas relacionados al comercio exterior con respecto al tema hemos podido practicar y aprender el manejo del spss y Excel.  La aplicación de los programas informáticos nos ayuda en nuestra vida laboral para desempeñar nuestros conocimientos en comercio exterior.RECOMENDACIONES:  Es de vital ayuda poner en práctica los conocimientos aprendidos ya que nos servirán dentro de nuestra carrera y el desarrollo de la problemática que en ella se engloba.  Es necesario identificar los resultados porque estas se aplican para el desarrollo de proyectos.  Proponer ejercicios mediante la distribución del chi cuadrado en función a las actividades del comercio exterior y así lograr una mayor comprensión.CRONOGRAMA DE ACTIVIDADES ACTIVIDAD JULIO 2012 lunes 9 martes 10 Miercoles11 jueves 12 Sábado 14 Domingo 15Organización del Tema XInvestigación del Tema XAnálisis del Tema XDocumentación del Tema xFinalización del trabajo xEstudiar trabajo xBIBLIOGRAFÍAhttp://www.spssfree.com/spss/intro13.html 327
  • 329. ditutor. (2010). ditutor. Obtenido de http://www.ditutor.com/inferencia_estadistica/estadistica_inferencial.htmlhttp://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student. (s.f.). Obtenido de http://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student: http://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Studenthttp://es.wikipedia.org/wiki/Varianza. (s.f.). Obtenido de http://es.wikipedia.org/wiki/Varianza: http://es.wikipedia.org/wiki/Varianzahttp://nutriserver.com/Cursos/Bioestadistica/Correlacion_Regresion.html. (s.f.). Obtenido de http://nutriserver.com/Cursos/Bioestadistica/Correlacion_Regresion.html: http://nutriserver.com/Cursos/Bioestadistica/Correlacion_Regresion.htmlhttp://www.gestiopolis.com/economia/matematicas-correlacion-y-regresion-lineal.htm. (s.f.). Obtenido de http://www.gestiopolis.com/economia/matematicas-correlacion-y- regresion-lineal.htm: http://www.gestiopolis.com/economia/matematicas- correlacion-y-regresion-lineal.htmhttp://www.monografias.com/trabajos17/pruebas-de-hipotesis/pruebas-de-hipotesis.shtml. (s.f.). Obtenido de http://www.monografias.com/trabajos17/pruebas-de- hipotesis/pruebas-de-hipotesis.shtml: http://www.monografias.com/trabajos17/pruebas-de-hipotesis/pruebas-de- hipotesis.shtmlinei. (2012). 328
  • 330. EJERCICIO - CORRELACIÓNUna compañía de seguros de transporte, considera que el número devehículos Asaltos(Y) en una autopista a más de 120 km/h , puede ponerseen función del número de baches que existe en ella (x) por que se estimaríaque al bajar la velocidad estos asaltados. Durante 5 días obtuvo lossiguientes resultados: Baches (x) 5 7 2 1 9 Asaltos (Y) 15 18 10 8 20329
  • 331. a) Calcula el coeficiente de correlación lineal. 1. Ingresamos lo datos de las variables dependiente e independiente, en donde Baches es (X), y Asaltos es (Y). 330
  • 332. 2.- Pasar los datos de cada variable 2. Primero realizaremos la correlación Lineal a través de la grafica de dispersión para analizar si esta es positiva o negativa. 3. En la ventana de dispersión y puntos escogemos diagrama de dispersión simple y hacemos clic en definir. 331
  • 333. 4. Seleccionamos las variables dependiente e independiente y las pasamos al cuadro de dialogo y agregamos el titulo de la gráfica. 5. Hacemos clic en aceptar y nos aparecerá la gráfica, donde se diferencian los puntos de dispersión. 6.332
  • 334. 7. Para trazar la recta hacemos un clic en la grafica y nos aparecerá la ventana editor de gráficos 8. Hacemos clic en Añadir línea de ajuste total.333
  • 335. 9.- Aparece la ventana propiedades y hacemos clic lineal y cerrar. 10.- Ahora tendremos la gráfica, en donde nos muestra que la relación de la pendiente es positiva ya que es de forma ascendente por que tienen una relación muy fuerte entre la cantidad de baches que existe en la autopista para que se provoquen los asaltos a los transportistas. 334
  • 336. 335
  • 337. 11.- Para la relación numérica nos vamos a analizar, correlación y bivariadas. 12.- Escogemos en la siguiente ventana las variables, cantidad de asaltos y baches existentes en la utopista.336
  • 338. 13.- Nos vamos a opciones y escogemos desviación de medidas típicas, productos cruzados diferenciados y covarianza y hacemos clic en continuar, y aceptar. 14.- Y obtenemos como resultado que la variable337
  • 339. 15.- Para saber que tanto influye la cantidad existente de baches para que se ocasionen los asaltos hacemos la regresión lineal en donde obtenemos los siguientes resultados.338
  • 340. 16.- En esta gráfica vemos que existe el r de square que es el nivel de confianza que se tiene para decir que influye en un 99% la cantidad de baches en una autopista para que se realicen los asaltos a los automotores del transporte pesado y por consecuente la perdida de las mercancías por que al seguro les conviene que los importadores o exportadores contraten un seguro de mercancías. EJERCICIO – CORRELACIÓN339
  • 341. Pasos para calcular la “CORRELACION” en el SPSS 1. Escribir las variables a utilizar 2. Pasar los datos de cada variableCorrelación 1. Hacer clic en analizar 340
  • 342. 2. Dar clic en correlación 3. Dar clic en bivariadas341
  • 343. 4. En el cuadro que se despliega pasamos las variables a lado derecho 5. Damos clic en coeficiente de correlación Pearson y en la prueba de hipótesis unilateral.342
  • 344. 6. Damos clic en aceptar y automáticamente obtenemos los resultados de la correlación lineal. 7. Como crear la gráfica, hacemos clic en gráficos, cuadros de diálogos antiguos, y dispersión puntos.343
  • 345. 8. En la ventana de dispersión de puntos, escogemos dispersión simple y hacemos clic en definir.344
  • 346. 9.- Elegimos las variables independiente y dependiente, hacemos clic en titulo yponemos el titulo que llevara nuestra gráfica.10.- Y obtenemos nuestra grafica con los puntos de dispersión.11.- Para trazar la línea por los puntos hacemos clic sobre la grafica y nosaparece la ventana editor de gráficos. 345
  • 347. 12.- Luego hacemos clic en añadir línea de ajuste total, aparece la ventanapropiedades en donde escoges lineal y cerrar 346
  • 348. 13.- Y así obtendrás la grafica con la línea para saber por dónde se cruzan lospuntos y saber si es positiva o negativa. EJERCICIO – REGRESIÓN LINEAL 347
  • 349. Buscamos en Inicio el programa SPSSClic en aceptar en el programaClic en introducir datos y aceptar 348
  • 350. Introducimos el nombre de la variableEscribimos el nombre de la variable que es meses 349
  • 351. El nombre de la segunda variable es importacionesIntroducimos los datos en la variable meses que son 36 meses 350
  • 352. Introducimos los datos de las importaciones realizadas en los 36 mesesClic en analizar luego de introducir los datos 351
  • 353. Clic en analizar- regresionClic en analizar- regresión- lineales 352
  • 354. Luego se deplegará una tabla y verificamos que las variables sean dependientes oindependientesClic en estadísticos y luego en histograma y continuar 353
  • 355. A continuación se analizan los datos y aparecen los resultados 354
  • 356. 355
  • 357. EJERCICIO - PRUEBA DE HIPOTESIS356
  • 358. La camara de Comercio del Ecuador a sacado una muestra para analizar entrelas exportacion e importaciones con los siguientes datos con un nivel designificancia del 0.05. AÑO – MES Exportaciones x Importaciones y 2009-01 873 1224 2009-02 800 1031 2009-03 993 1119 2009-04 1018 1019 2009-05 1113 1120 2009-06 1167 1090 2009-07 1237 1143 2009-08 1359 1082 2009-09 1212 1265 2009-10 1369 1284 2009-11 1249 1271 2009-12 1467 14178 2010-01 1334 1429 2010-02 1286 1190 2010-03 1514 1428 2010-04 1576 1679 2010-05 1360 1501 2010-06 1469 1542 2010-07 1397 1699 2010-08 1328 1872 2010-09 1392 1564 2010-10 1613 1738 2010-11 1489 1857 2010-12 1726 1773 357
  • 359. 2011-01 1621 1619 2011-02 1690 1511 2011-03 2032 1888 2011-04 1831 1854 2011-05 2009 1942 2011-06 1863 1981 2011-07 1974 1803 2011-08 1772 2008 2011-09 1856 2075 2011-10 1827 2035 2011-11 1868 2135 2011-12 1975 2089 2012-01 2120 2011 2012-02 2021 1773 TOTAL GENERAL 76614 90367Pasos para calcular en el SPSS la Prueba de Hipótesis1. Escribir las variables a utilizar 358
  • 360. 2. Pasar los datos de cada variablePRUEBA DE HIPÓTESIS1. Hacer clic en analizar y luego damos clic en configuración de medidas y parael cálculo de la prueba de hipótesis damos clic en prueba t para una muestra. 359
  • 361. 2.- En el cuadro que se despliega pasamos las variables a lado derecho 360
  • 362. 3.- Damos clic en aceptar y automáticamente obtenemos los resultados de lacorrelación lineal. EJERCICO – T STUDENT 361
  • 363. El INEC ha obtenido muestra de datos para analizar entre las importacionescon los siguientes datos con un nivel de significancia del 0.05.1.- Ingresamos las variables en el programa2.- Ingresamos los datos en cada variable3.- Seleccionar: comparar medidas y prueba T para muestras relacionadas 362
  • 364. 4.- Seleccionar las variables dependiente e independiente en la Prueba T para muestrasrelacionadas 363
  • 365. 5.- Damos click en analizar 364
  • 366. EJERCICIO – CHI CUADRADO365
  • 367. Buscamos en Inicio el programa SPSSClic en aceptar en el programaClic en introducir datos y aceptar 366
  • 368. Introducimos el nombre de la variableEscribimos el nombre de la variable que es meses 367
  • 369. El nombre de la segunda variable es importacionesIntroducimos los datos en la variable meses que son 36 meses 368
  • 370. Introducimos los datos de las importaciones realizadas en los 36 mesesClic en analizar luego de introducir los datos 369
  • 371. Clic en estadísticos descriptivosClic en estadísticos descriptivos-tablas de contingencia 370
  • 372. Se desplega una pantalla y le damos clic en filas y columnas y estaditicosLuego clic en chi cuadrado-continuar y aceptar 371
  • 373. A continuación sale el análisis de los datos Resumen del procesamiento de los casos 372
  • 374. Casos Válidos Perdidos Total N Porcentaje N Porcentaje N PorcentajeMESES * 36 100.0% 0 .0% 36 100.0%IMPORTACIONES Pruebas de chi-cuadrado Sig. asintótica Valor gl (bilateral) aChi-cuadrado de Pearson 1260.000 1225 .238Razón de verosimilitudes 258.013 1225 1.000Asociación lineal por lineal .089 1 .765N de casos válidos 36a. 1296 casillas (100.0%) tienen una frecuencia esperada inferior a 5. Lafrecuencia mínima esperada es .03. 373
  • 375. UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL PROYECTO DE ESTADÍSTICA INFERENCIAL DOCENTE: MSC. JORGE POZO INTEGRANTES: Tamara Liceth Apráez Lima MARZO 2012- AGOSTO 2012 Tulcán – Ecuador374
  • 376. TEMA:La aplicación de los programas estadísticos en el Hospital Luis G. DávilaPROBLEMA:La falta de conocimiento del uso de programas estadísticos como lo es el SPSSno ha permitido conocer al Hospital Luis G. Dávila, la cantidad de pacientes queasistente en cada uno de sus departamentos, como el Departamento deCardiología.General:  Investigar sobre el uso del programa SPSS para así poder determinar el número de pacientes que ingresa al Hospital Luis G. Dávila por cada departamento.Específicos:  Investigar bibliográficamente acerca del programa SPSS para así poder aplicar en el hospital Luis G Dávila.  Analizar e investigar los pasos a seguir para ingresar datos y obtener resultados del número de pacientes que ingresan al Hospital según la edad de 30 a más de 90 años.  Interpretar los datos obtenidos en el programa SPSS sobre los pacientes que ingresan al hospital Luis G Dávila según su edad.
  • 377. JUSTIFICACIÓN:El presente trabajo tiene como finalidad la aplicación de los programasestadísticos en el Hospital Luis G. Dávila uno de los programas a aplicarse es elprograma spss donde nos detallaran cada uno de los estadísticos para poderanalizarlos e interpretarlos y buscar una solución adecuada para cada resultadodado además investigaremos bibliográficamente cada tema dado para ampliar losconocimientos de estudiante con esto analizar y para qué sirve cada uno de lostemas estadísticos aplicado en el programa spss. MARCO TEÓRICO ESTADÍSTICALa Estadística es la parte de las Matemáticas que se encarga del estudio de unadeterminada característica en una población, recogiendo los datos, organizándolosen tablas, representándolos gráficamente y analizándolos para sacar conclusionesde dicha población.Según se haga el estudio sobre todos los elementos de la población o sobre ungrupo de ella, vamos a diferenciar dos tipos de Estadística:Estadística descriptiva. Realiza el estudio sobre la población completa,observando una característica de la misma y calculando unos parámetros que deninformación global de toda la población.Estadística inferencial. Realiza el estudio descriptivo sobre un subconjunto de lapoblación llamado muestra y, posteriormente, extiende los resultados obtenidos atoda la población.TABLAS DE FRECUENCIA
  • 378. Este procedimiento es aconsejable para aquellos casos en los que queremosanalizar los resultados de una serie de variables, que tienen todas las mismascategorías de respuesta. Por defecto, las variables forman las columnas y lascategorías las filas. Cada casilla muestra el número de casos de esa categoría. Silo desea, puede seleccionar una o más variables de agrupamiento.Una tabla de frecuencias (también conocida como tabla de distribución defrecuencias) es una tabla en la que se organizan los datos en clases, es decir, engrupos de valores que escriben una característica de los datos y muestra elnúmero de observaciones del conjunto de datos que caen en cada una de lasclases.La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. Enprincipio, en la tabla de frecuencias se detalla cada uno de los valores diferentesen el conjunto de datos junto con el número de veces que aparece, es decir, sufrecuencia absoluta. Se puede complementar la frecuencia absoluta con ladenominada frecuencia relativa, que indica la frecuencia en porcentaje sobre eltotal de datos. En variables cuantitativas se distinguen por otra parte la frecuenciasimple y la frecuencia acumulada.La tabla de frecuencias puede representarse gráficamente en un histograma.Normalmente en el eje vertical se coloca las frecuencias y en el horizontal losintervalos de valores.MEDIAEs la medida de posición central más utilizada, la más conocida y la más sencillade calcular, debido principalmente a que sus ecuaciones se prestan para elmanejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radicaen su sensibilidad al cambio de uno de sus valores o a los valores extremosdemasiado grandes o pequeños. La media se define como la suma de todos losvalores observados, dividido por el número total de observaciones.
  • 379. Cuando los valores representan una población la ecuación se define como:MEDIANACon esta medida podemos identificar el valor que se encuentra en el centro de losdatos, es decir, nos permite conocer el valor que se encuentra exactamente en lamitad del conjunto de datos después que las observaciones se han ubicado enserie ordenada. Esta medida nos indica que la mitad de los datos se encuentranpor debajo de este valor y la otra mitad por encima del mismo. Para determinar laposición de la mediana se utiliza la fórmulaMODAEl valor de la observación que aparece con más frecuencia.Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervaloy de razón. No se ve afectada por valores muy altos o muy bajos. Al igual que lamediana, puede utilizarse como medida de tendencia central para distribucionescon clases de extremo abierto.Desventajas de la moda:  Para muchos conjuntos de datos no hay valor modal porque ningún valor aparece más de una vez.
  • 380.  Para algunos conjuntos de datos hay más de una moda (bimodal = que tiene dos modas).DESVIACIÓN ESTÁNDARLa desviación estándar o desviación típica es la raíz cuadrada dela varianza.Es decir, la raíz cuadrada de la media de los cuadrados de laspuntuaciones de desviación.La desviación estándar se representa por σ.Desviación estándar para datos agrupadosVARIANZALa varianza es la media aritmética del cuadrado de lasdesviaciones respecto a la media de una distribución estadística.La varianza se representa por .
  • 381. Varianza para datos agrupadosCOEFICIENTE DE CORRELACIÓNMide el grado de intensidad de esta posible relación entre las variables. Estecoeficiente se aplica cuando la relación que puede existir entre las variables eslineal (es decir, si representáramos en un gráfico los pares de valores de las dosvariables la nube de puntos se aproximaría a una recta).No obstante, puede que exista una relación que no sea lineal, sino exponencial,parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal laintensidad de la relación las variables, por lo que convendría utilizar otro tipo decoeficiente más apropiado.Para ver, por tanto, si se puede utilizar el coeficiente de correlación lineal, lo mejores representar los pares de valores en un gráfico y ver que forma describen.
  • 382. REGRESIÓN LINEALTiene como objeto estudiar cómo los cambios en una variable, no aleatoria,afectan a una variable aleatoria, en el caso de existir una relación funcional entreambas variables que puede ser establecida por una expresión lineal, es decir, surepresentación gráfica es una línea recta. Cuando la relación lineal concierne alvalor medio o esperado de la variable aleatoria, estamos ante un modelo deregresión lineal simple. La respuesta aleatoria al valor x de la variable controladase designa por Yx y, según lo establecido, se tendráDe manera equivalente, otra formulación del modelo de regresión lineal simplesería: si xi es un valor de la variable predictora e Yi la variable respuesta que lecorresponde, entoncesEi es el error o desviación aleatoria de YiPRUEBA DE HIPÓTESISLa estadística inferencial es el proceso de usar la información de una muestrapara describir el estado de una población. Sin embargo es frecuente que usemosla información de una muestra para probar un reclamo o conjetura sobre lapoblación. El reclamo o conjetura se refiere a una hipótesis. El proceso quecorrobora si la información de una muestra sostiene o refuta el reclamo se llamaprueba de hipótesis.
  • 383. A base de la información de una muestra nosotros podemos cometer dos tipos deerrores en nuestra decisión. 1. Podemos rechazar un H0 que es cierto. 2. Podemos aceptar un H0 que es falso. El primero se llama error Tipo 1Error Tipo 1: Cuando rechazamos una Hipótesis Nula que es cierta cometemoserror tipo 1.Y el segundo error se llama error Tipo 2.Error Tipo 2: Cuando aceptamos una Hipótesis Nula que es falsacometemos error tipo 2.DISTRIBUCIÓN T – STUDENTla distribución t (de Student) es una distribución de probabilidad que surge delproblema de estimar la media de una población normalmente distribuida cuando eltamaño de la muestra es pequeño. Surge, en la mayoría de los estudiosestadísticos prácticos, cuando la desviación típica de una población se desconocey debe ser estimada a partir de los datos de una muestra.Existen dos versiones de la prueba t-Student: una que supone que las varianzaspoblacionales son iguales y otra versión que no asume esto último. Para decidir sise puede suponer o no la igualdad de varianza en las dos poblaciones, se deberealizar previamente la prueba F-Snedecor de comparación de dos varianzas.La distribución t de Student es la distribución de probabilidad del cociente:
  • 384. Donde  Z tiene una distribución normal de media nula y varianza 1  V tiene una distribución chi-cuadrado con ν grados de libertad  Z y V son independientesSi μ es una constante no nula, el cociente es una variable aleatoria que sigue ladistribución t de Student no central con parámetro de no-centralidad μ.DISTRIBUCIÓN CHI CUADRADOEsta prueba puede utilizarse incluso con datos medibles en una escala nominal.La hipótesis nula de la prueba Chi-cuadrado postula una distribución deprobabilidad totalmente especificada como el modelo matemático de la poblaciónque ha generado la muestra.Para realizar este contraste se disponen los datos en una tabla de frecuencias.Para cada valor o intervalo de valores se indica la frecuencia absoluta observada oempírica (Oi). A continuación, y suponiendo que la hipótesis nula es cierta, secalculan para cada valor o intervalo de valores la frecuencia absoluta que cabríaesperar o frecuencia esperada (Ei=n·pi , donde n es el tamaño de la muestra y pila probabilidad del i-ésimo valor o intervalo de valores según la hipótesis nula). Elestadístico de prueba se basa en las diferencias entre la Oi y Ei y se define como:Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si nes suficientemente grande, es decir, si todas las frecuencias esperadas son
  • 385. mayores que 5. En la práctica se tolera un máximo del 20% de frecuenciasinferiores a 5.
  • 386. CRONOGRAMA: Días Actividad Mar, 08 Mié, Jue, Vie,11 Sáb,12 Dom,13 Lun,14 Mar,15 Mié,16 Jue,17 Responsable 09 10Copias Tamara Apraez, Diana Coral, Diana García, Tania Herrera., Janeth ReinaIniciar con Tamaralos Apraez,ejercicios Diana Coral, Diana Garcia, Tania Herrera., Janeth ReinaTerminar Tamaralos Aprez, Dianaejercicios Coral, Diana García, Tania Herrera., Janeth ReinaDefensa de Tamara Aprez, Dianaproyecto Coral, Diana Garcia, Tania Herrera., Janeth Reina
  • 387. CONCLUSIÓNComo conclusión podemos decir que tanto la estadística descriptiva como lainferencial es necesaria para poder analizar los resultados dados en el programaSPSS y por ende impartir los conocimientos del estudiante y sacar nuestraspropias conclusiones sabiendo que la estadística descriptiva e inferencial sonesenciales para resolver problemas de la comunidad como es el tema del Númerode pacientes en el Hospital Luis G Dávila en la ciudad de Tulcán para solucionarlos causas y efectos que trae este tema a un problema comunitario de la cuidad .RECOMENDACIONES:Como recomendación podemos indicar la aplicación de ejercicios que serelacionen con problemas de la comunidad y por ende del comercio exterior yanalizar cada uno de los resultados dados en clase dando una crítica constructivay aportando ideas para poder solucionar el problema del entorno en programasinformáticos con mayor veracidad dando como resultado datos viables para eltema dado.
  • 388. DATOS:En el departamento de cardiologia vamos a estudiara y relacionar a atraves de losprogramas estadisticos del SPSS la cantidad de pacientes que ingresan a estedepartamento de acuerdo a los dias ade la semana. DEPARTAMENTO DE CARDIOLOGIA CANTIDAD DIAS PACIENTES 1 LUNES 5 2 MARTES 8 3 MIERCOLES 6 4 JUEVES 5 5 VIERNES 4 6 SABADO 8 7 DOMINGO 3
  • 389. ESTADISTICA DESCRIPTIVA 1) ingresamos al programa donde nos sale una pantalla y hacemos clic en aceptar2.- hacemos clic en el documento donde esta los datos para aplicar la estadisticadescriptiva luego ponemos abrir el archivo
  • 390. 3.- luego nos sale esta pantallita en donde damos clic en aceptar4.- y nos aprece los datos automaticamente para realizar en el ejercicio
  • 391. 5.- luego damos clic en vista de variables y nos damos cuenta que ya estaningresado las variables6.- para realizar el ejercicio damos clic en analizar
  • 392. 7.- en analizar damos clic en la opcion estadistica descriptiva
  • 393. 8.- dentro de la estadistica descritiva damos clic en descritiva9.- luego nos aparece un cuadro en donde vamos a pasar cada una de lasvariables para poder aplicar el ejercicio
  • 394. 10.- luego damos clic en opciones del cuadro anterior y seleccionamos medidas ,desviacion tipica, variables ,maximo, minimo y lista de variables y damos clic enaceptar.11.- automaticamente ya nos dan los resultados de la estadistica descriptiva
  • 395. 12.- luego nos vamos a analizar clic en estadistica descriptiva destro de estadamos clic en frecuencias13.- luego nos da esta pantalla en donde vamos a volver a pasar cada una de lasvariables y damos clic en estadisticos
  • 396. 14.- no aparece esta pantalla en donde vamos a dar clic en las opciones cuartilesmedia, mediana y moda , en la parte de abajo hacemos clic en desviacion tipica ,minimos, maximos, variables y damos clic en continuar15.- luego damos clic en graficos
  • 397. 16.- nos ingresa esta pantalla en donde vamos hacer clic en graficos de sectoresen porcentajes y damos continuar17.- ya nos aparece automáticamente los resultados de las frecuencias de laestadística descriptiva junto con el grafico
  • 398. ANALISIS: Los resultado nos muestran que el mayor numero de pacientes queacueden al departamento de cardiologia es el dia viernes con un porcentaje de28.57% de afluencia de pacientes.
  • 399. ESTADISTICA INFERENCIAL CORRELACION1.- damos clic en analizar2.- dentro de analizar hacemos clic en correlaciones dentro de esta hacemos clicen bivariadas
  • 400. 3.- luego nos aprece esta pantalla en donde vamos a pasar cada una de lasvariables4.- una ves pasadas las variables damos en aceptar
  • 401. 5.- y los datos nos parece automaticamente6.- para realizar graficos damos clic en graficos
  • 402. 7.- dentro de graficos damos clic en cuadros de dialogos antiguos y dentro de estedamos clic en dispersion puntos8.- nos parece una pantalla en donde vamos a escoger el grafico que vamos autilizar y luego clic en difinir
  • 403. 9.- luego pasamos cada una de las varibles dependiente e independiente y damosclic en titulos10.- nos aparece esta pantalla donde vamos a poner el titulo del grafico
  • 404. 11.- y luego damos clic en aceptar12.- no aparece automaticamente el grafico que vamos a utilizar para poderanalizar los datos.
  • 405. 13.- luego damos clic en añadir linea de ajuste editar14.- nos parece una pantalla y dentro de esta damos clic en linea de ajustehacemos clic en lineal y damos clic en aplicar
  • 406. 15.- y nos parece atomaticamente la grafica lineal que escogimos
  • 407. REGRESIÓN LINEAL1-.- hacemos clic en archivo dentro de este damos clic en abrir y nos pareceesta pantallita en donde vamos a escoger la carpeta en donde se encuentrael documento de los datos2.- seleccionamos en archivo donde se encuentran los datos de regresión lineal damos clic enaceptar para que se ingresen los datos al programa spss
  • 408. 4.- luego nos aparece una pantallita en donde solo vamos a dar clic en la opción aceptar5.- automáticamente se nos ingresan las variables en el programa Spss en la opción vista devariables
  • 409. 6.- además se nos ingresa automáticamente los datos para realizar el ejercicio de regresión lineal7.- para realizar el ejercicio de regresión lineal damos clic en analizar
  • 410. 8.- dentro de analizar damos clic en regresión y dentro de este icono damos clic en lineales9.- luego nos parece esta pantalla en donde vamos a pasar la variable dependiente eindependiente
  • 411. 10.-luego damos clic en gráficos en donde nos parece esta pantalla y pasamos las variablesdependiente y la independiente dentro de esta pantalla hacemos clic en histograma y luego encontinuar y aceptar11.- y nos sale automáticamente los valores de la regresión lineal con todo grafico
  • 412. 12.- damos clic en el cuadrito amarillo
  • 413. 13.- Nos parece esta pantalla14.- damos clic en línea de ajuste en donde vamos a escoger lineal en ninguna y ponemos enaceptar
  • 414. 15.- y automáticamente nos parece el grafico de la regresión lineal PASOS PARA REALIZAR EL EJERCICIO DE LA PRUEBA DE HIPÓTESIS1.- prendemos el computador2.- esperamos que se prenda totalmente3.- damos clic en inicio
  • 415. 4.- seleccionamos el programa que se encuentra en la barra inicio imb spss ydamos clic
  • 416. 5.- esperamos que se instale el programa spss6.- nos sale esta pantallita para poder realizar el ejercicio
  • 417. 7.- damos clic en la parte inferior de la pantalla en vista de datos8.- en vista de datos debemos ingresar los datos para lo cual hacemos clic enarchivo9.- en archivo seleccionamos la opción abrir
  • 418. 10.- en la opción abrir seleccionamos la opción datos11.- a lo que hacemos clic en datos nos aparece esta pantallita para poderingresar los datos
  • 419. 12.- en la pantalla hacemos clic en archivo de tipo y se nos desglosaran losformatos en donde se encuentra el archivo
  • 420. 13.- de preferencia para que se realice de manera fácil los datos que vamosingresar estén en excel para lo cual en la barra que se desplaza de archivo de tipodamos clic en excel en donde se encuentran los datos14.- después de seleccionar el archivo nos vamos en la parte superior en dondevamos a seleccionar la carpeta en donde se encuentra los datos ya sea endocumentos, en escritorio o en la flash usb en mi caso doy clic en el nombre de laflash
  • 421. 15.- al hacer clic en la flash donde se encuentra los datos se nos despliegan todoslos archivos en excel en donde debemos hacer clic en el documento donde esténlos datos de prueba de hipótesis.16.- luego de seleccionar el archivo hacemos clic en abrir17.- luego nos saldara esta pantallita en donde hacemos clic aceptar
  • 422. 18.- automáticamente los datos saldrán19.- luego en la parte superior hacemos clic en vista de variables y nos saldrá estapantallita en donde ya están ingresados los datos para la prueba de hipótesis
  • 423. 20.- para realizar el ejercicio hacemos clic en la opción analizar que esta en laparte superior de la pantalla21.- en analizar seleccionamos la opción comparar medidas y se nos despliegaopciones
  • 424. 22.- luego en la opción comparar medidas damos clic en la opción prueba t parauna muestra que es la opción para realizar la prueba de hipótesis23.- luego nos aparece esta pantallita en donde vamos a pasar cada uno de lasvariables damos clic en la variable y clic en el botón del medio dondeautomáticamente se pasaran las variables
  • 425. 24.- aquí en la pantalla ya están pasadas cada una de las variables y damos clicen aceptar25.- la repuesta de la prueba de hipótesis nos saldrá automáticamente para poderanalizar la repuesta y los resultados de la prueba de hipótesis
  • 426. PASOS PARA REALIZAR LA T DE STUDENT1.- damos click en inicio y abrimos el programa spss desde su punto de ubicación
  • 427. 2.- en el recuadro damos click en la segunda opción “introducir datos” yposteriormente damos click en “aceptar”3.- desplazamos el cursor hacia la parte superior izquierda y damos click en“archivo”
  • 428. 4.- desplazamos el cursor hacia “abrir” y damos click en “datos”
  • 429. 5.- se abrirá un recuadro denominado “abrir datos” del cual seleccionaremos labase de datos para ingresarlos.6.- desplazamos el cursor hasta “archivos de tipo” y seleccionamos la opción“excel”
  • 430. 7.- una vez seleccionado el archivo necesario para ingresarlo desplazamos elcursor hacia la parte inferior y damos click en la opción “abrir”.8.- en el siguiente recuadro “apertura de origen de datos de excel” solamentedamos click en “aceptar”
  • 431. 9.- una vez abierto el documento, el programa spss asigna los datos en cadacelda.10.- desplazamos el cursor hacia la parte inferior izquierda y seleccionamos laopción “vista de variables” para comprobar que los datos han sido ingresadoscorrectamente
  • 432. 11.- desplazamos el cursor hacia la parte superior de la pantalla y seleccionamosla sexta pesta a denominada “analizar” y damos click en ella, despu sdesplazamos el cursor hacia la opción “compara medias” y damos click en lacuarta opción del recuadro “prueba t para muestras relacionadas”12.- en el recuadro “prueba t para muestras relacionadas” seleccionamos la primervariable y damos click en la flecha para ingresar la variable en el recuadro de“variables emparejadas” y repetimos la acción con la segunda variable.
  • 433. 13.- desplazamos el cursor hasta la pesta a “opciones” en donde damos click yautomáticamente aparece un recuadro en donde cambiamos el intervalo deconfianza según la veracidad de la información y finalmente damos click en“continuar”.
  • 434. 14.- una vez realizado los pasos anteriores se procede a dar click en “aceptar”para que el programa empiece a analizar los datos ingresados.15.- aparece otra pantalla en donde los datos han sido analizados por el programay respectivamente se obtienen las respuestas.
  • 435. ANALISIS: En la correlacion y regresion lineal nos muestra una relacion positivamuy fuerte ya que en el departamento de cardiologia.La prueba de hipotesis nos muestra que la hipotesis alternativa en la que no existeafluencia de pacientes en el departamento de cardiologia es de 7,84% dejando ala hipotesis nula, la cual no es convenciente por lo que el departamento deberiabuscar el porque no existe mucha aglomeración de pacientes en el departamentoantes mencionado.
  • 436. DATOS:TABLA DE CONTINGENCIA:Esta tabla representa la cantidad de pacientes que ingresan a los distintos departamentos , asi podiendo relacionar yanalizar la edad promedio de los pacientes que acuden al departamento.  Hipótesis nula de que el departamento de cardiología entre los 40 a 50 tiene más afluencia.  Hipótesis alternativa de que no existe mucha afluencia en la edad de 40 a 50 añosMESES EDAD CARDIOLOGIA GINECOLOGIA TRAUMATOLOGIA PSICOLOGIA TOTAL ENERO 30 a 40 10 9 1 11 31FEBRERO 40 a 50 5 8 8 15 36 MARZO 50 a 60 6 7 9 16 38 ABRIL 60 a 70 8 6 4 14 32 MAYO 70 a 80 6 5 6 15 32 JUNIO 80 a 90 7 4 9 14 34 AGOSTO 90 a mas 11 8 10 12 41 TOTAL 53 47 47 97 244
  • 437. APLICACIÓN DE UN PROBLEMA DE CHI CUADRADO1.- Abrimos el programa SPSS desde el escritorio2.- Seleccionamos la opción: Introducir datos3.- Ir a la pestaña vista de variables:
  • 438. En esta pestaña Vista de variables introducimos las mismas es decir cadasupuesto o pregunta en caso de tratarse de encuestas.4.- Ingresamos las variablesEn este caso hemos ingresado edad, cardiología, ginecología,traumatología, psicología, que serán las variables que usaremos en elejemplo.5.- luego de haber ingresado las variables procedemos a ingresar los datospara eso iremos a la pestaña vista de datos e ingresamos valorescorrespondientes.
  • 439. 6 luego de esto procedemos a calcular el chi cuadrado nos vamos a lapestaña analizar, luego estadísticos descriptivos, tablas de contingencia7.- pasamos las variables a filas y columnas respectivamente
  • 440. 8.- luego de haber pasado las variables vamos a la pestaña estadísticos yseleccionamos chi cuadrado9.- después a la pestaña casillas en donde seleccionamos esperadas y observadas
  • 441. Luego continuar….10.- pulsamos aceptar11.- luego se desplegara otra hoja de resultados en donde estará lo que deseamosobtener
  • 442. Análisis: podemos determinar que la edad promedio de personas queafluyen a los departamentos de cardiología, traumatología , ginecologíapsicología, son en una edad promedio de 40 a 50 años de edad en dondeexiste mayor personas que no padecen este tipo de enfermedades, por loque la hipótesis alternativa de que el departamento de cardiología queedad promedio tienen mas afluencia, es rechazada ya que la hipótesisalternativa de que no existe mucha afluencia es ya que en la edad de 40 a50 años padecen este tipo de enfermedades.

×