Estadística inferencial maricela ayala
Upcoming SlideShare
Loading in...5
×
 

Estadística inferencial maricela ayala

on

  • 635 views

 

Statistics

Views

Total Views
635
Views on SlideShare
635
Embed Views
0

Actions

Likes
0
Downloads
10
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft Word

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Estadística inferencial maricela ayala Estadística inferencial maricela ayala Document Transcript

  • UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHIESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL ESTADISTICA DESCRIPTIVA MCS : JORGE POZO PORTAFOLIO DEL DOCENTE MARICELA AYALA MARZO 2012 – AGOSTO 2012 Tulcán – Ecuador 2012
  • ´ CORRELACIÓNTÉCNICAS DE CORRELACIÓNEn los capítulos anteriores, ustedes estudiaron las distribuciones de una solavariable. A continuación abordaremos el estudio de dos variables y nosolamente de una. Particularmente estudiaremos qué sentido tiene afirmar quedos variables están relacionadas linealmente entre sí y cómo podemos mediresta relación lineal.RELACIONES LINEALES ENTRE VARIABLESSupongamos que disponemos de dos pruebas una de ellas una prueba dehabilidad mental y la otra una prueba de ingreso a la Universidad.Seleccionemos cinco estudiantes y presentamos en la tabla Nº4.1.1, lospuntajes obtenidos en estas dos pruebas. TABLA Nº4.1.1 X PRUEBA Y ESTUDIANTES DE EXAMEN DE ADMISIÓN HABILIDAD MENTAL María 18 82 Olga 15 68 Susana 12 60 Aldo 9 32 Juan 3 18Observamos las cinco parejas de puntajes de la tabla Nº4.1.1 ¿podemosafirmar que la prueba de habilidad mental se puede usar para pronosticar elpuntaje de examen de admisión?. La tabla nos dice que si podemos hacer talsuposición ya que los estudiantes con puntajes altos en la prueba de habilidadmental tienen también un puntaje alto en el examen de admisión y los
  • estudiantes con puntajes bajos en la prueba de habilidad mental, tienenpuntajes bajos en el examen de admisión. En circunstancias como la presente(cuando los puntajes altos de una variable están relacionados con los puntajesaltos de la otra variable y los puntajes bajos de una variable están relacionadoscon los puntajes bajos de la otra variable), afirmamos que hay una relaciónlineal positiva entre las dos variables, entonces podemos definir una relaciónlineal positiva entre ese conjunto de pares de valores X y Y, tal como semuestra en la tabla Nº4.1.1.Supongamos que en lugar de los resultados de la tabla Nº 4.1.1, hubiéramosobtenido los puntajes que se muestran en la tabla Nº 4.1.2 ¿Podríamos afirmarque en esta situación los puntajes de la prueba de habilidad mental puedenusarse para pronosticar los puntajes altos en el test de habilidad mentalaparecen con puntajes bajos en el examen de admisión y los sujetos conpuntajes altos en el examen de admisión, entonces podemos definir unarelación lineal negativa entre un conjunto de pares de valores X y Y (tal comoen la tabla Nº4.1.2), es decir, los puntajes altos de X están apareados con lospuntajes bajos de Y y los puntajes bajos de X están apareados con los puntajesaltos de Y. TABLA Nº4.1.2 X Y PRUEBA DE ESTUDIANTES EXAMEN DE ADMISIÓN HABILIDAD MENTAL María 18 18 Olga 15 32 Susana 12 60 Aldo 9 68 Juan 3 82 TABLA Nº4.1.3
  • X Y PRUEBA DE ESTUDIANTES EXAMEN DE ADMISIÓN HABILIDAD MENTAL María 18 18 Olga 15 82 Susana 12 68 Aldo 9 60 Juan 3 32Examinemos ahora la tabla Nº4.1.3. en este caso ya no podemos afirmar quelos puntajes de la prueba de habilidad mental sirvan para pronosticar lospuntajes del examen de admisión, ya que unos puntajes altos del test dehabilidad mental están aparejados con otros puntajes bajos del examen deadmisión y algunos puntajes bajos del test de habilidad mental están apareadoscon otros puntajes altos del examen de admisión, entonces, en este caso,decimos que no existe una relación lineal entre las variables X y Y.DIAGRAMA DE DISPERSIÓNEn las situaciones que se presentan en la vida real no tenemos solamente cincoparejas de valores para ambas variables, sino muchísimas parejas. Otra formaalternativa de ver si existe o no relación lineal entre dos variables sería haceruna gráfica de los valores X y Y en un sistema de coordenadas rectangulares,este tipo de gráfica es conocido con el nombre de diagrama de dispersión,gráfico de dispersión o nube de puntos. Dibujemos el diagrama quecorresponde a la tabla Nº4.1.1. lo haremos haciendo corresponder a cada valorde la variable independiente X, un valor de la variable dependiente Y, es decir,para la alumna Susana haremos corresponder su puntaje en la prueba dehabilidad mental (12) con su puntaje de la prueba de admisión (60); al alumnoJuan le hacemos corresponder su puntaje del test de habilidad mental (3) consu puntaje del examen de admisión (18). Luego ubicaremos los cinco pares de
  • puntajes en el sistema de ejes rectangulares y obtendremos los gráficos Nº4.1.1y Nº4.1.2.Observaremos en el gráfico Nº4.1.1, que tabla Nº4.1.1, es descrita por eldiagrama de dispersión. Vemos en este gráfico que los cinco puntos dan lasensación de ascender en línea recta de izquierda a derecha. Esto escaracterístico en datos en los que existe una relación lineal positiva. Aunqueestos cinco datos no configuren una línea recta en forma perfecta, se puedetrazar una línea recta que describa en estos puntos en forma bastanteaproximada, conforme se ve en el gráfico Nº4.1.2 y por esto decimos que larelación es lineal.Si ocurre que todos los puntos de la gráfica de dispersión están incluidos enuna sola línea en forma exacta afirmamos que la relación lineal es perfecta. Elgrado en que se separan los puntos de una sola línea recta nos da el grado enque la relación lineal no es perfecta. Así cuando menos puntos se encuentranen una sola línea decimos que la relación lineal entre las dos variables esmenos fuerte y cuando más puntos queden incluidos en una línea rectaafirmaremos que la relación lineal es más fuerte. GRÁFICO Nº4.1.1.
  • GRÁFICO Nº4.1.2Usando los datos de la tabla Nº4.1.2 y utilizando la misma forma de razonarempleada hasta ahora podemos construir el correspondiente gráfico dedispersión, tal como se muestra en el gráfico Nº4.1.3.Podemos observar en el gráfico Nº4.1.4 que la nube de puntos de la gráficapuede delinearse bien por una línea recta, lo que nos indica que hay unarelación lineal entre las dos variables X y Y. vemos también que la líneadesciende de izquierda a derecha (tienen pendiente negativa) por lo quedecimos que la relación lineal entre las dos variables es negativa.
  • Si tenemos en cuenta la tabla Nº4.1.3 podemos obtener una figura como semuestra en la gráfica Nº4.1.5. Notamos, en esta situación, que resultará inútilcualquier línea recta que trate describir adecuadamente este diagrama dedispersión. GRÁFICO Nº4.1.3 GRÁFICO Nº4.1.4
  • GRÁFICO Nº4.1.5COEFICIENTE DE CORRELACIÓN RECTILINEA DE PEARSONCon ayuda de las gráficas nos podemos formar una idea si la nube de puntos, odiagrama de dispersión, representa una relación lineal y si esta relación lineal
  • es positiva o negativa, pero con la sola observación de la gráfica no podemoscuantificar la fuerza de la relación, lo que si conseguiremos haciendo uso delcoeficiente r de Pearson.El coeficiente de correlación r de Pearson, forma valores comprendidos entre -1y +1 pasando por 0. El número -1 corresponde a una correlación negativaperfecta (los puntos del diagrama de dispersión deben encontrarse formandoperfectamente una línea recta). El coeficiente de correlación r=0 se obtienecuando no existe ninguna correlación entre las variables. Los valores negativosmayores que -1 indican una correlación negativa y los valores positivosmenores que 1 indican una correlación positiva. Referente a la magnitud de rpodemos decir que independientemente del signo, cuando el valor absoluto de resté más cerca de uno, mayor es la fuerza de la correlación, as así que -0.20 y+0.20 son iguales en fuerza (ambos son dos valores fuertes).CÁLCULO DEL COEFICIENTE r DE PEARSON UTILIZANDO UNA MÁQUINA CALCULADORA CUANDO LOS DATOS NO SON MUY NUMEROSOSDadas dos variables X y Y con sus respectivos valores. Tabla Nº4.1.4, podemoscalcular el coeficiente r de Pearson con una máquina calculadora mediana lasiguiente fórmula. TABLA AUXILIAR Nº4.1.4. (1) (2) (3) (4) (5) x Y x2 y² XY
  • 18 82 324 6724 1476 15 68 225 4624 1020 12 60 144 3600 7200 9 32 81 1024 288 3 18 9 324 54 ∑x = 57 ∑y= 260 ∑x² = 783 ∑y² = 16296 ∑xy = 3558Con los datos de la tabla Nº4.1.1, se ha elaborado la Tabla Auxiliar Nº4.1.4.En las columnas (1) y (2) se han escrito los valores de X y Y. en la columna (3),se han elevado al cuadrado los valores de X. en la columna (4) se han elevadoal cuadrado los valores de Y. en la columna (5) se ha efectuado el producto decada pareja de valores X y Y. aplicando los datos en la fórmula 4.1.1, se tiene:INTERPRETACIONES DE UN COEFICIENTE DE CORRELACIÓN
  • ¿Qué tan elevado es un coeficiente de correlación dado?. Todo coeficiente decorrelación que no sea cero indica cierto grado de relación entre dos variables.Pero es necesario examinar más esta materia, porque el grado de intensidad derelación se puede considerar desde varios puntos de vista. No se puede decirque un r de 0.50 indique una relación dos veces más fuerte que la indicada por rde 0.25. ni se puede decir tampoco que un aumento en la correlación de r=0.40a r=0.60 equivalga a un aumento de r=0.70 a r=0.90. es de observar que unacorrelación de -0.60 indica una relación tan estrecha como una correlación de+0.60, la relación difiere en la dirección.Siempre que esté establecida fuera de toda duda razonable una relación entredos variables, el que el coeficiente de correlación sea pequeño puede significarúnicamente que la situación medida está contaminada por algún factor ofactores no controlados. Es fácil concebir una situación experimental en la cual,si se han mantenido constantes todos los factores que no sean pertinentes, el rpodría haber sido 1 en lugar de 0.20. por ejemplo: generalmente la correlaciónentre la puntuación de aptitud y el aprovechamiento académico es 0.50 puestoque ambos se miden en una población cuyo aprovechamiento académicotambién es influenciable por el esfuerzo, las actitudes, las peculiaridades decalificación de los profesores, etc. Si se mantuvieran constantes todos losdemás factores determinantes del aprovechamiento y se midieran exactamentela aptitud y las notas, el r sería 1 en vez de 0.50.Una conclusión práctica a la correlación es que ésta es siempre relativa a lasituación dentro de la cual se obtiene y su magnitud no representa ningúnhecho natural absoluto. El coeficiente de correlación es siempre algo puramenterelativo a las circunstancias en que se ha obtenido y se ha de interpretar a la luzde esas circunstancias y sólo muy rara vez en algún sentido absoluto.
  • Además podemos agregar que la interpretación de un coeficiente de correlacióncomo medida del grado de relación lineal entre dos variables, es unainterpretación como medida del grado de relación lineal entre dos variables, esuna interpretación matemática pura y está completamente desprovista deimplicaciones de causa y efecto. El hecho de que dos variables tiendan aaumentar o disminuir al mismo tiempo no implica que obligadamente una tengaalgún efecto directo o indirecto sobre la otra.A continuación calcularemos con la fórmula Nº4.1.1, antes indicada coeficientede Pearson de la relación presentada en la tabla Nº4.1.2 CUADRO AUXILIAR 4.1.5 (1) (2) (3) (4) (5) x Y x2 y² XY 18 18 324 324 324 15 32 225 1024 480 12 60 144 3600 720 9 68 81 4624 612 3 82 9 6724 246 ∑xy = ∑x = 57 ∑y= 260 ∑x² = 783 ∑y² = 16296 2382
  • Vemos que la correlación es fuerte y negativa.Ahora calculemos con la misma fórmula de Pearson Nº4.1.1, el Coeficiente deCorrelación lineal con los datos de la tabla Nº4.1.3. CUADRO AUXILIAR 4.1.6 (1) (2) (3) (4) (5) x Y x2 y² XY 18 18 324 324 324 15 32 225 6724 1230 12 60 144 4624 816 9 68 81 3600 542 3 82 9 1024 96 ∑x = 57 ∑y= 260 ∑x² = 783 ∑y² = 16296 ∑xy = 3006
  • La correlación es muy débil y positiva.CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS ENCLASESEl presente tema nos conduce a calcular el coeficiente de correlación r, que nosproporciona información de la fuerza de la relación que existe entre dosconjuntos de datos que se encuentran agrupados, cada uno de ellos formandopor separados una distribución de frecuencias, mejor dicho teniendo porseparado sus intervalos de clase con sus respectivas frecuencias.Para realizar una exposición del tema en forma más entendible, presentamos elejemplo del Cuadro Nº 4.1.7.Ejemplo:Calcular el grado de correlación entre las puntaciones obtenidas en inventariode hábitos de estudio y los puntajes obtenidos en un examen de Matemática,aplicados a un total de 134 alumnos de un colegio de la localidad. CUADRO Nº 4.1.7 X Hábitos de estudio
  • 20 30 30 40 40 50 50 60 TotalY Matemática 70 80 3 2 2 7 60 70 1 0 4 5 10 50 60 2 6 16 3 27 40 50 4 14 19 10 47 30 40 7 15 6 0 28 20 30 8 2 0 1 11 10 20 1 1 2 4 Total 23 40 48 23 134Podemos notar que el problema no es tan simple, como el caso anterior, dadoque ahora los datos se han clasificado en una tabla de doble entrada Nº 4.1.7.Este cuadro muestra, en la primera columna del lado izquierdo los intervalos declase de la variable Y, los que cubren todos los posibles datos acerca de laspuntuaciones alcanzadas por los estudiantes en la prueba de Matemática.Nótese que los intervalos crecen de abajo hacia arriba. En la fila superior sepresentan los intervalos de clase todos los 134 posibles datos acerca de lospuntajes obtenidos por los estudiantes en la variable hábitos de estudiosrepresentados por la letra X.Dentro del Cuadro Nº 4.1.7 en los casilleros interiores o celdas de la tabla, seencuentran las frecuencias de celdas que corresponden a puntajes quepertenecen tanto a un intervalo de la variable Y como a un intervalo de lavariable X.En la fila interior del Cuadro se presentan los totales de los puntajes de lavariable X, hábitos de estudio. Esos totales se llaman frecuencias marginales dela variable X y se representan por .
  • En la última columna de la derecha se encuentran los totales de los puntajes dela variable rendimiento en matemática. Estos totales se denominan frecuenciasmarginales de la variable Y.Cuando los datos se presentan tal como el presente caso, formando tablas dedoble entrada, es conveniente usar el método clave que expondremos acontinuación porque con este procedimiento se evita manejar grandes números,como sería el caso si se emplearán las fórmulas para trabajar con lacalculadora de bolsillo.La fórmula que utilizaremos es la siguiente:Para obtener los datos que deben aplicarse en la fórmula Nº 4.1.2., vamos aconstruir el cuadro auxiliar Nº 4.1.8, al mismo tiempo que se explica elsignificado de los símbolos de esa fórmula.Lo primero que hacemos es reemplazar los intervalos horizontales y verticalespor sus respectivas marcas de clase; a continuación adicionaremos al CuadroNº 4.1.7, cinco columnas por el lado derecho; cuyos encabezamientos son: para la primera para la segunda, para la tercera, para la cuartay para la quinta columna.Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran:para la primera para la segunda fila que está debajo de la anterior, parala tercera fila y por último, para la cuarta fila que está debajo de todas; deesta manera se va elaborando el Cuadro Auxiliar Nº 4.1.8.1) Para determinar las frecuencias marginales que se deben colocar en la columna para la primera para la segunda, para la tercera,
  • sumamos las frecuencias de las celdas que están en la misma fila de la marca de clase 75, obtenemos: 3+2+2=7, número que se escribe en el primer casillero o celda de la columna para la primera para la segunda, para la tercera, En la fila de la marca de clase 65, sumamos 1+4+5=10, número que se escribe debajo del 7. Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27. Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47. En igual forma: 7+15+6=28. Lo mismo: 8+2+1=11 Y en la última fila: 1+1+2=4 A continuación sumamos estas frecuencias marginales de la variable Y: 7+10+27+47+28+11+4=134 es el total general.2) Ahora a determinar las frecuencias marginales de la variable X: En columna encabezada con la marca de clase 25 sumemos verticalmente las frecuencias: 1+2+4+7+8+1=23. En la columna encabezada con 35, tenemos: 3+6+14+15+2=40 En la siguiente: 2+4+16+19+6+1=48 En la última: 2+5+3+10+1+2=233) Centremos nuestra atención en la columna encabezada para la primera para la segunda, para la tercera, este signo significa desviación unitaria, y procedemos en la misma forma que en las Tablas Nº 2.1.2 y Nº 2.1.3 (b). recuerden que las desviaciones unitarias positivas: +1, +2, y +3 corresponden a los intervalos mayores y por el contrario las desviaciones unitarias negativas: -1, -2 y -3 corresponden a los intervalos menores. Como origen de trabajo se tomó la marca de clase 45 y por lo tanto su desviación unitaria es cero.4) Luego vamos a determinar las desviaciones unitarias horizontales de la variable X. el origen de trabajo es la marca de clase 45 que se halla en la fila
  • superior del cuadro, por esa razón, escribimos cero debajo de la frecuencia marginal 48. Las desviaciones unitarias negativas: -1 y -2 se escriben a la izquierda cero, porque se corresponden con los intervalos de clase que tienen menores marcas de clase y que están a la izquierda de 45. La desviación unitaria positiva, se corresponde con el intervalo de mayor marca de clase, 55 (en parte superior del Cuadro Nº 4.1.8.)5) A continuación vamos a determinar los valores que deben colocarse en la columna encabezada ; este símbolo indica que se debe multiplicar cada valor de por su correspondiente valor de , así: 7(+3)=21; 10(+2)=20; 27(+1)=27; 47(0)=0; 28(-1)=-28; 11(-2)=-22 y 4(-3)=-12. Sumando algebraicamente, tenemos: 21+20+27=68 los positivos: y (-28)+ (-22)+ (-12)=-62 los negativos. Por último: 68-62=6 total, que se coloca en la parte inferior de la columnaPara obtener los valores de la cuarta columna encabezada debemostener en cuenta que ( , por lo tanto basta multiplicar cada valorde la segunda columna por su correspondiente valor de la tercera columna asíse obtiene el respectivo valor de la cuarta columna. En efecto:(+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-3)(-12)=36La suma: 63+40+27+28+44+36=238Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que( = por consiguiente basta multiplicar verticalmente un valor de laprimera fila por su correspondiente valor de la segunda dila para obtener elrespectivo valor de la tercera fila.
  • (23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23Sumando horizontalmente:(-46)+ (-40)+ (23)=-86+23=-63Vamos por la cuarta fila; vemos que . Luego basta multiplicarcada elemento de la segunda fila por su correspondiente elemento de la tercerafila para obtener el respectivo elemento de la cuarta fila así:(-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23Para obtener los valores de la quinta columna observamos que haytres factores; el 1º es la frecuencia de la celda o casillero que se estáconsiderando, el segundo factor es la desviación unitaria , el tercer factor esla desviación unitaria . Por tanto el procedimiento será el siguiente: Tomemosel número 3 que es la frecuencia de la celda determinada por el cruce de losintervalos que tienen la marcha de clase 75 horizontalmente y 35 verticalmente.Bajemos la vista del número 3 hacia donde se halla el respectivo valor (-1) de ladesviación unitaria (ver la línea punteada).Para indicar el tercer factor corremos la vista del número 3 hacia su derechahasta llegar a la columna de las desviaciones unitarias y ubicamos el número+3 (ver la línea punteada) formemos el producto de estos tres números: (3) (-1)(+3)=-9. Este número -9 encerrado en un semicírculo lo escribimos en la celdaelegida.
  • En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0Continuando hacia la derecha: (2) (+1) (+3)=6 CUADRO AUXILIAR Nº 4.1.8
  • CUADRO CORREGIDO DEL CUADRO AUXILIAR Nº 4.1.8La fórmula del paso (9) lleva el signo para indicar que se deben sumarhorizontalmente los números que están encerrados en los semicírculos de esaprimera fila elegida, así: -9+0+6=-3. Este número se escribe en la quintacolumna.Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un semicírculo.(0)(-1)(+2)=0(4)(0)8+2)=0(5)(+1)(+2)=10
  • Sumando 0+0+10=10Ahora con la tercera fila:(2)(-2)(+1)=-4(6)(-1)(+1)=-6(16)(0)(+1)=0(3)(+1)(+1)=3Sumando: (-4)+(-6)+0+3=-7Cuarta fila:(7)(-2)(-1)=14(15)(-1)(-1)=15(6)(0)(-1)=0(0)(+1)(-1)=0La suma es: 14+15=29(8)(-2)(-2)=32(2)(-1)(-2)=4(0)(0)(-2)=0(1)(+1)(-2)=-2La suma es: 32+4-2=34Séptima fila:(1)(-2)(-3)=6(1)(0)(-3)=-6
  • (2)(1)(-3)=-6Sumando: 6+0-6=0Sumando los valores de la columna quinta. -3+6-7+0+29+34+0=69-10=59Reuniendo los resultados anteriores, se tienen los datos para aplicar en fórmulaNº 4.1.2.n=134
  • EJERCICIO RESUELTO Nº2 DE CÁLCULO DEL COEFICIENTE DECORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOSCalcular el coeficiente de correlación lineal de las puntuaciones en matemáticasde 100 estudiantes de la Facultad de Ciencias de la Universidad MN. CUADRO Nº4.1.9
  • CUADRO Nº4.1.10En este problema tenemos que calcular el coeficiente de correlación lineal rpara dos conjuntos de datos, constituidos por los calificativos en una escala de0 a 100, en matemáticas y en física para 100 estudiantes de la Facultad deCiencias de cierta Universidad.Los datos se muestran en el cuadro Nº4.1.9. Notemos que a lo largo de la líneahorizontal superior se encuentran los intervalos que contienen los calificativosde matemáticas desde 40 hasta 100.Igualmente en la primera columna vertical izquierda, se encuentran loscalificativos para física de los mismos estudiantes, desde el calificativo 40 hasta100. Nótese que en la columna de los calificativos de física los datos crecen de
  • abajo hacia arriba y para la fila horizontal superior vemos que los calificativos enmatemáticas crecen de izquierda a derecha.A continuación procedemos a calcular el coeficiente de correlación r para estosdatos aplicando el mismo método que utilizamos en el problema anterior.1) Traslademos los datos del cuadro Nº4.1.9 al cuadro Nº4.1.10. llamaremos fxy a cualquiera de las frecuencias de los casilleros interiores del cuadro Nº4.1.9. en el cuadro Nº4.1.10 podemos observar que se han agregado cinco columnas por el lado derecho y cuatro filas por la parte inferior.Observaremos en el cuadro Nº4.1.10 que los intervalos para la puntuación enmatemáticas y para la puntuación en física se han reemplazado por las marcasde clase correspondientes. Así en la fila horizontal superior se ha reemplazadoel primer intervalo 4050 por su marca de clase 45, el segundo intervalo5060 por su marca de clase 55 y de esta manera se han reemplazado losdemás intervalos por sus marcas de clases en el cuadro Nº4.1.10.De igual forma para la columna primera de la izquierda vemos que los intervalosse han reemplazado por sus respectivas marcas de clase así, para lapuntuación en física el primer intervalo superior 90 100 se han reemplazadopor su marca de clase 95, el segundo intervalo superior 8090 se hareemplazado por su marca de clase 85 y así sucesivamente hasta llegar elintervalo inferior 4050 que se ha reemplazado por su marca de clase 45.Ahora vamos a realizar los pasos siguientes:
  • 1) Para determinar las frecuencias marginales sumemos todos los valores de la primera fila que tiene la marca de clase 95. De esta forma tenemos: 2+5+5=12. Para la segunda fila que corresponde a la marca de clase 85, obtenemos: 1+3+6+5=15 que escribimos en el segundo casillero de . Continuando con la suma de los números, de las filas llenamos la columna ..2) Dediquemos nuestra atención a las frecuencias marginales . El primer resultado de lo obtenemos sumando las frecuencias para la columna que tiene la marca de clase 45, de esta forma tenemos: 2+4+4=10 que se escribe en el primer casillero de la fila . Para el segundo casillero tenemos el número 15 que se obtiene sumando verticalmente las frecuencias de la columna que tiene la marca de clase 55. Continuando con la suma de las de las demás columnas, llenamos las frecuencias marginales .3) Atendamos ahora la columna . La columna tiene en total 6 casilleros arbitrariamente escogemos uno de estos casilleros como origen de trabajo le asignamos el número. Observemos ahora la primera columna de la izquierda en donde están las marcas de clase de los puntajes de física. Aquí observamos que las marcas de clase crecen de abajo hacia arriba, entonces las desviaciones unitarias en la columna crecerán de abajo hacia arriba. Entonces del 0 hacia abajo, las desviaciones unitarias son números negativos que van decreciendo hacia abajo. Desde el 0 hacia arriba las desviaciones unitarias serán positivas y crecientes. De manera que podemos observar que la columna está conformada por los siguientes números que crecen del cero hacia arriba: 1,2 y desde el cero hacia abajo decrecen: -1, -2, -3.4) Veamos la fila
  • Notamos que en la fila horizontal superior las marcas de clase crecen de izquierda a derecha, de igual forma las desviaciones unitarias crecerán de izquierda a derecha. Elegimos como origen de trabajo arbitrariamente uno de los casilleros de , el tercero contando de izquierda a derecha, y vamos asignando números positivos crecientes hacia la derecha del 0, así tenemos 1, 2 y 3 y hacia la izquierda, a partir del cero, tendremos: -1 y -2.5) Expliquemos la columna multipliquemos cada valor de por su correspondiente valor de y se obtiene un valor . Por ejemplo el número 24 se obtiene multiplicando la frecuencia marginal por su correspondiente desviación unitaria esto es, 12x2=24. Para el segundo casillero multiplicamos 15x1=15; para el tercero 25x0=0, así hasta terminar con 11 x (-3)=-33.6) Observamos la columna . La primera celda de esta columna tiene el número 48 que se obtiene multiplicando el valor de la segunda columna por su correspondiente valor =24, de la tercera columna, es decir, 2 x 24 = 48. Para el segundo casillero de la columna , tenemos 15 que es igual a 1 x 15. De esta forma continuamos llenando los demás valores de la columna .7) Veamos ahora la fila . El número -20 del primer casillero de esta fila se obtiene multiplicando la frecuencia marginal por su correspondiente desviación unitaria , es decir: 10(-2)=-20. Para el segundo casillero de , multiplicamos (-1) x (-15) = 15 y así sucesivamente hasta 12 x 3 = 36.8) Veamos la fila . El primer casillero de esta fila es 40 y es el resultado de multiplicar -2 del primer casillero de la fila por -20 de su correspondiente primer casillero de la fila esto es. (-2) x (-20) = 40. Para el segundo casillero de multiplicamos -1 del segundo casillero por -
  • 15 de su correspondiente segundo casillero de , luego obtenemos (-1) x (-15) = 15. Así continuamos multiplicando los valores de los valores de los casilleros de la fila por sus correspondientes valores de la fila hasta llegar a (3) (36) =108.9) Interesa ahora obtener los números encerrados en semicírculos, por ejemplo, el número 4, que corresponde a la marca de clase 75 para la puntuación en matemáticas y a la marca de clase 95 de la puntuación en física.Para saber cómo se obtiene este número 4, corramos nuestra vista hacia laderecha dirigiéndose hacia la columna y obtenemos el número 2. Delnúmero 4, encerrado en semicírculo, bajemos la vista con dirección a la fila yobtenemos 1. La frecuencia del casillero donde está el 4, encerrado ensemicírculo, es . Multiplicando estos tres factorestendremos: .Podemos enunciar la siguiente regla:Para obtener los valores encerrados en semicírculos en los casilleros interioresdel cuadro Nº4.1.10, multiplicamos el valor de la frecuencia del casilleropara la cual estamos haciendo el cálculo, por los valores de las desviacionesunitarias y , obtenidas corriendo la vista hacia la derecha hasta columna y también hacia abajo hasta llegar a la fila .Así por ejemplo, para el casillero que corresponde a las marcas de clase 75 enmatemática y 85 en física, tenemos la frecuencia de la celda , los otrosdos factores son: y =1.Luego (3) x (1) x (1) = 3 que es el valor encerrado en semicírculo.
  • Para el casillero correspondiente a la marca de clase 55 en matemáticas marcade clase 45 en física, tenemos: , , que es el valor encerrado en semicírculo. Asípodemos proceder para obtener todos los demás valores encerrados ensemicírculos.Sumando las frecuencias marginales de la columna , se tiene .Sumando los valores de la tercera columna se obtiene . La sumade los valores de la quinta columna: =150Para todas las filas, en el último casillero de la derecha se tiene la suma de losvalores de la fila. Así por ejemplo. ; .Para la tercera fila: .Para la cuarta fila:Estos totales de filas y columnas reemplazamos en la fórmula Nº4.1.2.
  • Vemos que el coeficiente de correlación en este caso es 0,79EJERCICIO PROPUESTO Nº1 DEL CÁLCULO DEL COEFICIENTE DECORRELACIÓN ENTRE DOS CONJUNTOS AGRUPADOS DE DATOS.Supongamos que tenemos 30 sujetos a los que hemos aplicado una prueba deconocimientos de Psicología General (variable x) y un test de inteligencia(variable y). los datos se muestran en el Cuadro Nº4.1.11.Aplicando los datos tomados del Cuadro Auxiliar Nº4.1.12 en la fórmula Nº4.1.2,tenemos:Resultado:
  • REGRESIÓN LINEAL SIMPLEREGRESIÓN LINEAL SIMPLEAl comenzar a estudiar las técnicas de correlación afirmamos queestudiaríamos dos variables y no solamente una. Llamamos en esa ocasión x auna de las variables y a la otra. En el tema que nos ocuparemos ahora,estudiaremos la forma tabla Nº4.2.1, similar a lo que utilizamos correlación,conocimiento el puntaje en la prueba de habilidad mental (variable x) para unalumno determinado, podemos anticipar el puntaje del examen de admisión(variable y) del mismo alumno.Consideramos la relación lineal expresada por el cuadro Nº4.2.1. si dibujamosesa relación, obtenemos el gráfico Nº4.2.1. como podemos observar todos lospuntos se alinean “exactamente” en una sola línea recta lo que recibe el nombrede línea de regresión. Teniendo en cuenta esta línea, podemos predecircualquiera de los valores de y conociendo el valor de x: Para x = 25, según larecta, corresponde y = 35, para x =20, corresponde y=30, etc. En este caso setrata de una correlación positiva perfecta cuyo coeficiente de correlación es +1. CUADRO Nº4.2.1 PRUEBA DE EXAMEN DE HABILIDAD MENTAL ADMISIÓN X Y Susana 5 15 Iván 10 20 Lourdes 15 25 Aldo 20 30 Juan 25 35 María 30 40 César 35 45 Olga 40 50
  • Recordemos el gráfico Nº4.2.1 que dibujamos cuando estudiamos correlación,en este gráfico observamos el diagrama de dispersión “aproximado” por unalínea recta, la recta es mejor “ajuste”, a los puntos del diagrama de dispersión,es decir, en la mejor medida procure dejar igual números de puntos deldiagrama de dispersión por encima de ella que igual número de puntos deabajo, se llama línea de regresión.ECUACIÓN DE LA REGRESIÓN RECTILÍNEALa ecuación que describe la línea de regresión es. X-rEn donde: Media de variable y en la muestraEJEMPLO PROPUESTO Nº2 DEL CÁLCULO DEL COEFICIENTE DECORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOSSupongamos que se tienen 50 vendedores de cierta compañía. Estosvendedores durante un año 1985 han realizado ventas tal como lo muestra elcuadro Nº4.1.13, el que también muestra el número de años de experiencia quetienen como vendedores.Para dicho cuadro, se pide calcular el coeficiente de correlación lineal r.
  • CUADRO Nº4.1.13Tomando los datos obtenidos en el Cuadro Auxiliar Nº4,1,14 apliquemos en lafórmula Nº4.1.12, se tiene:Resultado:
  • CUADRO AUXILIAR Nº4.1.14
  • GRÁFICO Nº 4.2.1 = media de la variable X en la muestra.X = un valor de la variable Xr = coeficiente de Pearson, de la correlación lineal entre las variables X y Y desviación estándar de Y en la muestra desviación estándar de X en la muestra valor Y resultante del cálculo de la fórmula.Veamos cómo podemos predecir los valores de Y a partir de los valores de X.Estudiemos el Cuadro Nº 4.2.1. Cómo el gráfico de este cuadro es una línearecta ascendente sabemos que su coeficiente de correlación de Pearson r=+1.Además tenemos los siguientes resultados:
  • =22.5 11.46 11.46 =32.5Estos resultados se pueden calcular a partir de los datos del cuadro Nº4.2.1.Apliquemos estos datos a la fórmula Nº4.2.1, obtenemos la siguiente expresión: X-(1)Simplificando términos obtenemos:Escojamos cualquier valor de X del Cuadro Nº4.2.1 por ejemplo para MaríaX=30, reemplazando este valor en (b).Vemos en el Cuadro Nº4.2.1 el valor que corresponde a María efectivamente es40. Es decir, podemos usar la ecuación Nº4.2.1 para predecir los valores de Yconociendo los valores de X.Esta fórmula de regresión se puede para dos variables X y Y, entre las cualesno es obligatorio que exista una correlación lineal perfecta, es decir, no esobligatorio que r para la correlación entre X y Y sea siempre igual a 1. Estevalor de r para otras aplicaciones de la regresión, puede tomar cualquier valordistinto.
  • EJERCICIO RESUELTOS DE REGRESIÓN LÑINEAL SIMPLEAl aplicar un test de inteligencia a una muestra representativa constituida por800 alumnos, se obtuvo la puntuación media de 30,4 puntos, con la desviaciónestándar de 12.6 puntos.La edad media de la muestra fue de 14.5 años, con la desviación estándar de3.2 años.El coeficiente de correlación lineal de Pearson entre la variable Y, edad desujetos estudiados y la variables X, rendimiento mental de los mismos sujetos,fue r=0,89Con estos datos se pide determinar la ecuación de regresión rectilínea de edaden base del puntaje del rendimiento mental.¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de: 25 puntos ?Datos: = 14.5 3.2 12.6
  • Aplicando estos datos en la fórmula Nº 4.2.1 se tiene: X-0.89 . Es la ecuación de regresión buscadaRespuesta de la primera preguntaSegunda preguntaTercera preguntaCuarta pregunta
  • Quinta preguntaSexta pregunta RELACIONESLa correlación se ocupa de establecer la magnitud y la dirección de lasrelaciones. Antes de profundizar en estos aspectos particulares de lasrelaciones, analizaremos algunas características generales de éstas, con lascuales podemos comprender mejor el material específico acerca de lacorrelación. RELACIONES LINEALESPara iniciar nuestro análisis de las relaciones, veamos una relación entre dosvariables. La siguiente tabla muestra el salario mensual que percibieron cincoagentes ventas y el valor en dólares de la mercancía vendida por cada uno deellos en ese mes.
  • AGENTE VARIABLE X MERCANCÍA Y VARIABLE VENDIDA ($) SALARIO ($) 1 0 500 2 1000 900 3 2000 1300 4 3000 1700 5 4000 2100Podemos analizar mejor la relación entre estas variables si trazamos unagráfica utilizando los valores X y Y, para cada agente de ventas, como lospuntos de dicha gráfica. Él es una gráfica de dispersión o dispersigrama. Una gráfica de dispersión o dispersigrama es una gráfica de parejas de valores X y Y. La gráfica de dispersión para los datos de los agentes de ventas aparece en la figura 6.1. En relación con esta figura, vemos que todos los puntos caen sobre una línea recta. Cuando una línea recta describe la relación entre dos variables, se dice que esta relación lineal. Una relación lineal entre dos variables es aquella que puede representarse con la mejor exactitud mediante una línea recta. Observe que no todas las relaciones son lineales; algunas son curvilíneas. En este caso, al trazar una gráfica de dispersión para las variables X y Y, una línea curva ajusta mejor a los datos que una línea recta.
  • CÁLCULO DE LA (r) DE PEARSON
  • La ecuación para calcular la r de Pearson mediante datos:Donde es la suma de los productos de cada pareja de puntajes z.Para utilizar esta ecuación, primero hay que convertir cada dato en bruto en suvalor transformado. Esto puede tardar mucho tiempo y crear errores deredondeo. Con algún álgebra, esta ecuación se puede transformar en unaecuación de cálculo que utilice datos en bruto:ECUACIÓN PARA EL CÁLCULO DE LA (r) DE PEARSONDónde: es la suma de los productos de cada pareja X y Y, tambiénse llama la suma de productos cruzados.La tabla 6.4 contiene algunos de los datos hipotéticos reunidos a partir de cincosujetos.Datos hipotéticos para el cálculo de la r de Pearson
  • TABLA 6.4 SUBJETIVO X Y XY A 1 2 1 4 2 B 3 5 9 25 15 C 4 3 16 9 12 D 6 7 36 49 42 E 7 5 49 25 35 TOTAL 21 22 111 112 106Utilicemos estos datos para calcular la r de Pearson:
  • es la suma de los productos cruzados; se determina multiplicando losdatos X y Y para cada sujeto y luego sumando los productos resultantes. Elcálculo de y de los otros términos aparece en la tabla 6.4. Al sustituir estosvalores en la ecuación anterior, obtenemos. PROBLEMA DE PRÁCTICA 6.1Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para suconveniencia, hemos reproducido estos datos en las primeras tres columnas dela tabla 6.5. En este ejemplo tenemos una relación lineal imperfecta y estemosinteresados en calcular la magnitud y dirección de la relación mediante la r dePearson. La solución también aparece en la tabla 6.5.IQ y el promedio de las calificaciones: cálculo de la r de Pearson
  • TABLA 6.5ESTUDIANTE IQX PROMEDIO NÚMERO DE DATOS Y 1 110 1.0 12,100 1.00 110.0 2 112 1.6 12,544 2.56 179.2 3 118 1.2 13,924 1.44 141.6 4 119 2.1 14,161 4.41 249.9 5 122 2.6 14,884 6.76 317.2 6 125 1.8 15,625 3.24 225.0 7 127 2.6 16,129 6.76 330.2 8 130 2.0 16,900 4.00 260.0 9 132 3.2 17,424 10.24 422.4 10 134 2.6 17,956 6.76 384.4 11 136 3.0 18,496 9.00 408.0 12 138 3.6 19,044 12.96 496.8 TOTAL 1503 27.3 189,187 69.13 3488.7
  • PROBLEMA DE PRÁCTICA 6.2Tratemos de resolver otro problema. ¿Se ha puesto a reflexionar si es verdadque los opuestos se atraen? Todos hemos estado ante parejas en las que susmiembros parecen ser muy diferentes entre sí. ¿Pero esto es lo usual? ¿Quéfomenta la atracción: las diferencias o las similitudes? Un psicólogo socialabordó este problema pidiendo a 15 estudiantes que respondieran uncuestionario relacionado con un sus actitudes hacia una amplia gama de temas.Tiempo después les mostró las “actitudes” de un extraño hacia los mismostemas y les pidió que evaluaran su agrado o inclinación por el extraño y si,probablemente, disfrutarían el trabajar con él. En realidad, las “actitudes” delextraño fueron elaboradas por el experimentador y variaron de sujeto a sujeto,con respecto a la proporción de actitudes similares que hubo entre el extraño yel individuo que participó en el experimento. De esa manera, se obtuvierondatos, para cada sujeto a sus actitudes y la atracción que sintió hacia unextraño, basada en las actitudes de este último hacia los mismos temas. Si losiguales se atraen, entonces debería existir una relación directa entre laatracción hacia un extraño y la proporción de actitudes similares. Los datos sepresentan en la tabla 6.6. Entre mayor sea la atracción, más alto será elpuntaje. El puntaje de atracción máximo es de 14. Calcule el coeficiente decorrelación r de Pearson * para determinar si existe una relación directa entre lasimilitud de actitudes y el grado de atracción.
  • Datos y solución del problema de práctica 6.2 TABLA 6.6ESTUDIANTE PROPORCIÓN DE ATRACCIÓN Y NÚMERO ACTITUDES SIMILARES X 1 0.30 8.9 0.090 79.21 2.670 2 0.44 9.3 0.194 86.49 4.092 3 0.67 9.6 0.449 92.16 6.432 4 0.00 6.2 0.000 38.44 0.000 5 0.50 8.8 0.250 77.44 4.400 6 0.15 8.1 0.022 65.61 1.215 7 0.58 9.5 0.336 90.25 5.510 8 0.32 7.1 0.102 50.41 2.272 9 0.72 11.0 0.518 121.00 7.920 10 1.00 11.7 1.000 136.89 11.700 11 0.87 11.5 0.757 132.25 10.005 12 0.09 7.3 0.008 53.29 0.657 13 0.82 10.0 0.672 100.00 8.200 14 0.64 10.0 0.410 100.00 6.400 15 0.24 7.5 0.058 56.25 1.800 TOTAL 7.34 136.5 4.866 1279.69 73.273
  • Por lo tanto, con base en estos estudiantes, existe una relación muy fuerte entrelas similitudes y las atracciones.Una segunda interpretación de la r de Pearson. La r de Pearson también sepuede interpretar en términos de la variabilidad de Y explicada por medio de X.este punto de vista produce más información importante acerca de r y larelación entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se muestrauna relación imperfecta entre X y Y. En este ejemplo, la variable X representauna competencia de ortografía y la variable Y la habilidad en la escritura de seisestudiantes de tercer grado. Suponga que queremos predecir la calificación enla escritura de María, la estudiante cuya calificación en ortografía es de 88. Sino hubiese una relación entre la escritura y la ortografía. EJERCICIOS DE APLICACIÓN 1. En un largo curso de introducción a la sociología, un profesor hace dos exámenes. El profesor quiere determinar si las calificaciones de los estudiantes en el segundo examen correlacionadas con las calificaciones del primero. Para facilitar la los, se elige una muestra de ocho estudiar calificaciones aparecen en la siguiente tabla.
  • a. Construya una gráfica de dispersión para datos, utilizando la calificación del primer examen como la variable X. ¿Parece lineal la relación?b. Suponga que existe una relación lineal en calificaciones de los dos exámenes, calcule la r de Pearson.c. ¿Qué tan bien explican la relación, las calificaciones del segundo examen? 120 100 80 60 Series1 40 20 0 0 20 40 60 80 100
  • 0,629531757Se puede decir que es una relación Baja y positiva que los dos exámenestienen entre si 2. Un investigador realiza un estudio de la relación entre el consumo de cigarros y las enfermedades determinan la cantidad de cigarros fumados
  • diariamente y de días de ausencia en el trabajo dura último año debido auna enfermedad para 13 individuos en la compañía donde trabaja esteinvestigador. Los datos aparecen en la tabla anexa. SUJETO CIGARROS DÍAS DE CONSUMIDOS AUSENCIA 1 0 1 2 0 3 3 0 8 4 10 10 5 13 4 6 20 14 7 27 5 8 35 6 9 35 12 10 44 16 11 53 10 12 60 16 a. Construya una gráfica de dispersión para estos datos: ¿Se ve una relación lineal? b. Calcule el valor de la r de Pearson. c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto disminuye el rango de ambas variables. Vuelva a calcular r para los sujetos restantes. ¿Qué afecto tiene la disminución del rango sobre r? d. A utilizar todo el conjunto de datos, ¿qué porcentaje de la variabilidad en el número de días de ausencia es explicado por la cantidad de cigarros fumados diariamente? ¿De qué sirve ese valor?
  • 1816141210 8 Series1 6 4 2 0 0 20 40 60 80
  • 0,6753 16 14 12 10 8 6 Series1 4 2 0 0 10 20 30 40
  • 0,03183. Un educador ha construido un examen para las aptitudes mecánicas y desea determinar si éste es confiable, mediante dos administraciones con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10 estudiantes reciben dos administraciones del examen, donde la segunda administración ocurre un mes después que la primera. Los datos aparecen en la tabla.a. Construya una gráfica de dispersión para las parejas de datos.b. Determine el valor de r.c. ¿Sería justo decir que éste es un examen confiable? Explique esto al utilizar . SUJETO ADMINISTRACIÓN 1 ADMINISTRACIÓN 2 1 10 10 2 12 15 3 20 17 4 25 25 5 27 32 6 35 37 7 43 40 8 40 38 9 32 30 10 47 49
  • 60 50 40 30 Series1 20 10 0 0 20 40 600,9881
  • La investigación no es confiable por que los datos son tomados en dos fechatotalmente distintas 4. Un grupo de investigadores ha diseñado un cuestionario sobre la tensión, consistente en 15 sucesos. Ellos están interesados en determinar si existe una coincidencia entre dos culturas acerca de la cantidad relativa de ajustes que acarrea cada suceso. El cuestionario se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe utilizar el evento “matrimonio” como estándar y juzgar los demás eventos en relación con el ajuste necesario para el matrimonio. El matrimonio recibe un valor arbitrario de 50 puntos. Si se considera que un evento requiere de más ajustes que el matrimonio, el evento debe recibir más de 50 puntos. El número de puntos excedentes depende de la cantidad de ajustes requeridos. Después de que cada sujeto de cada cultura ha asignado puntos a todos los eventos, se promedian los puntos de cada evento. Los resultados aparecen en la siguiente tabla:
  • EVENTOS ESTADOUNIDENSES ITALIANOSMuerte de la esposa 100 80Divorcio 73 95Separación de la pareja 65 85Temporada en prisión 63 52Lesiones personales 53 72Matrimonio 50 50Despedido del trabajo 47 40Jubilación 45 30Embarazo 40 28Dificultades sexuales 39 42Reajustes económicos 39 36Problemas con la familiapolítica 29 41Problemas con el jefe 23 35Vacaciones 13 16Navidad 12 10 a. Suponga que los datos tienen al menos una escala de intervalo y calcule la correlación entre los datos estadounidenses y la de los italianos. b. Suponga que los datos sólo tienen una escala ordinal y calcule la correlación entre los datos de ambas culturas.
  • 100 80 60 40 Series1 20 0 0 50 100 150
  • 0,8519La r es alta y positiva es decir que los comportamiento de las dosnacionalidades son bastante similares INDIVIDUO EXÁMEN CON LÁPIZ SIQUIATRA SIQUIATRA Y PAPEL A B 1 48 12 9 2 37 11 12 3 30 4 5 4 45 7 8 5 31 10 11 6 24 8 7 7 28 3 4 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3 5. Un psicólogo ha construido un examen lápiz - papel, a fin de medir la depresión. Para comparar los datos del examen con los datos de los expertos, 12 individuos “con perturbaciones emocionales” realizan el
  • examen lápiz – papel. Los individuos también son calificados de maneraindependiente por dos siquiatras, de acuerdo con el grado de depresióndeterminado por cada uno como resultado de entrevistas detalladas. Losdatos aparecen a continuación. Los datos mayores corresponden a unamayor depresión. a. ¿Cuál es la correlación entre los datos de los dos siquiatras? b. ¿Cuál es la correlación entre las calificaciones del examen con lápiz y papel y los datos de cada siquiatra? 14 12 10 8 6 Series1 4 2 0 0 5 10 15
  • 0,8519La relación se da con un mismo criterio por los psiquiatras 14 12 10 8 6 Series1 4 2 0 0 20 40 60
  • 0,6973La relación entre las dos variables es baja y positiva
  • 14 12 10 8 6 Series1 4 2 0 0 20 40 600,697
  • 6. Para este problema, suponga que usted es un psicólogo que labora en el departamento de recursos humanos de una gran corporación. El presidente de la compañía acaba de hablar con usted acerca de la importancia de contratar personal productivo en la sección de manufactura de la empresa y le ha pedido que ayude a mejorar la capacidad de la institución para hacer esto. Existen 300 empleados en esta sección y cada obrero fabrica el mismo artículo. Hasta ahora, la corporación sólo ha recurrido a entrevistas para elegir a estos empleados. Usted busca bibliografía y descubre dos pruebas de desempeño, lápiz – papel, bien estandarizadas, y piensa que podrían estar relacionados con los requisitos desempeño de esta sección. Para determinar si alguna de ellas se puede utilizar como dispositivo de selección, elige 10 empleados representativos de la sección de manufactura, garantizando que un amplio rango de desempeño quede representado en la muestra, y realiza las dos pruebas con cada empleado. Los datos aparecen en la siguiente tabla. Mientras mayor sea la calificación, mejor será el desempeño. Las calificaciones de desempeño en el trabajo. Las calificaciones de desempeño fabricados por cada empleado por semana, promediados durante los últimos 6 meses. a. Construya una gráfica de dispersión del desempeño en el trabajo y la primera prueba, utilizando la prueba 1 como la variable X. ¿Parece lineal la relación? b. Suponga que la relación anterior es lineal y calcule el valor de la r de Pearson. c. Construya una gráfica de dispersión del desempeño en el trabajo y la segunda prueba, utilizando la prueba 2 como la variable X. ¿Parece lineal la relación? d. Suponga que la relación anterior es lineal, calcule el valor de la r de Pearson.
  • e. Si sólo pudiera utilizar una de las pruebas para la selección de los empleados, ¿utilizaría alguna de ellas? En tal caso, ¿cuál de ellas? Explique. EMPLEADO 1 2 3 4 5 6 7 8 9 10 Desempeño en el trabajo 50 74 62 90 98 52 68 80 88 76 Examen 1 10 19 20 20 21 14 10 24 16 14 Examen 2 25 35 40 49 50 29 32 44 46 35 120 100 80 60 Series1 40 20 0 0 10 20 30
  • 0,5917 120 100 80 60 Series1 40 20 0 0 20 40 60
  • 0,9076
  • ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL EVALUACIÓN SEXTO A NOCHECÁLCULO DEL COEFICIENTE r DE PEARSON Y REALICE LA GRÁFICA ESTUDIANTE PROPORCIÓN DE ATRACCIÓN Y NÚMERO ACTITUDES SIMILARES X 1 0.30 8.9 2 0.44 9.3 3 0.67 9.6 4 0.00 6.2 5 0.50 8.8 6 0.15 8.1 7 0.58 9.5 8 0.32 7.1 9 0.72 11.0 10 1.00 11.7 11 0.87 11.5 12 0.09 7.3 13 0.82 10.0 14 0.64 10.0 15 0.24 7.5
  • EJERCICIO RESUELTO Nº2 DE CÁLCULO DEL COEFICIENTE DECORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOSDETERMINANCDO EL CUADRO AUXILIAR Y REALICE LA GRÁFICA PRUEBA DE EXAMEN DE HABILIDAD MENTAL ADMISIÓN X Y Susana 5 15 Iván 10 20 Lourdes 15 25 Aldo 20 30 Juan 25 35 María 30 40 César 35 45 Olga 40 50
  • ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN INTERNACIONAL EVALUACIÓN SEXTO A NOCHEEJERCICIO RESUELTO Nº2 DE CÁLCULO DEL COEFICIENTE DECORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOSDETERMINANDO EL CUADRO AUXILIAR Y REALICE LA GRÁFICA ITALIANOS ESTADOUNIDENSES 100 80 73 95 65 85 63 52 53 72 50 50 47 40 45 30 40 28 39 42 39 36 29 41 23 35 13 16 12 10
  • c. Suponga que los datos tienen al menos una escala de intervalo y calcule la correlación entre los datos estadounidenses y la de los italianos. d. Suponga que los datos sólo tienen una escala ordinal y calcule la correlación entre los datos de ambas culturas.BIBLIOGRAFÍALegoas, L. A. (2008). Estadística Básica. En L. A. Legoas, Estadística Básica (págs. 177-211). Lima: San Marcos.Mendano, J. (2007). Estadística General. En J. Mendano, Estadística General. México: Majangrail.Zamora, M. C. (2006). Estadística Inferencial. En M. C. Zamora, Estadística Inferencial. Lima: Moshera.
  • Universidad Politécnica Estatal del CarchiComercio Internacional, Integración, Administración y Economía Empresarial.Escuela: Comercio Exterior y Negociación Comercial Internacional PORTAFOLIO DEL ALUMNO MARICELA AYALA ESTADISTICA INFERENCIAL II ING. JORGE POZO Nivel: sexto Paralelo: “a” Noche AÑO-LECTIVO 2012
  • CORRELACIÓNEn capítulos anteriores se estudiaron las distribuciones de una frecuencia,ordenaremos el estudio de 2 variables y qué sentido tiene afirmar que 2variables están relacionadas linealmente entre sí.En la correlación hasta ahora se a abordado en forma general problemasrelacionados únicamente con una solo variable es decir univariados sinembargo existen muchas situaciones en las cuales se trabaja con pares devariables, y donde se busca contestar la pregunta de si existe o no unaasociación entre ambas mediciones o variables. (Cortes, 2009)E l p ro b lem a ce rcan o de la co rre la ció n o gra d o d e in te rco n e xió ne n t re va ria b le s qu e in t e n ta n d e te rm in a r con qu e p re cisió nd e scrib e o e xp lica la re la ció n e n t re va ria b le s, u na e cu ació n lin e a lo d e cu a lqu ie r o tro t ip o , si t od o s lo s va lo re s d e la s va ria b le se st á n pe rf e ct am en t e co rre la cio na do s o qu e ha y co rre la ciónp e rf e cta en t re e llas. (S p ie ge l, 19 9 1 )COEFICIENTE DE CORRELACIÓN.- Expresa de una manera cuantitativa lamagnitud y dirección de una relación.Coeficiente de correlación se lo designa en la letra r puede variar entre +1 a -1el signo nos dice si la relación es positiva o negativa. Como +1 es el mayor número posible este representa una relación perfecta de una relación positiva. Si el coeficiente es -1 que la relación se perfecta que la relación es negativa. Cuando la correlación es cero (0) no existe una relación entre x y significa que x y no crece ni decrece la recta es horizontal.
  • COEFICIENTE DE CORRELACIÓNEl coeficiente de correlación de la r de Person toma valores comprendidos entre-1 y +1 pasando por (o) el numero -1 corresponde a una correlación negativaperfecta y la +1 a una correlación positiva perfecta el coeficiente de r es igual aO se obtiene cuando no existe ninguna correlación negativa y os valorespositivos menores que uno indica una correlación positiva.COEFICIENTE DE CORRELACIÓNEl coeficiente entre la variación explicada y la variación total se llamancoeficiente de determinación. Si la variación explicada es cero o sea toda lavariación es variación inexplicada, ese coeficiente es cero. Si la variacióninexplicada es cero o sea toda la variación es explicada, el coeficiente es uno.(Spiegel, 1991)COEFICIENTE DE CORRELACIÓNEl valor del coeficiente de correlación también llamado de Person ayuda acontestar la pregunta ¿existe correlación lineal entre las dos variables? Elcoeficiente de correlación de r siempre tiene un valor de -1 y +1 indica unacorrelación positiva o negativa. (Cortes, 2009)
  • RELACIÓN PERFECTA.- Es aquella que existe una relación positiva o negativapara lo cual todos los puntos caen sobre la recta.RELACIÓN IMPERFECTA.- Es aquella que existe una relación pero no todoslos puntos caen sobre una recta.Un plano cartesiano con una mejor exactitud mediante una línea recta por laecuación.Y= bx + ab=pendiente o m=a= OrdenadaEJEMPLO DE UNA RELACIÓN NEGATIVAEs una relación negativa perfecta, ya que los valores mayores se asocian conlos otros valores menores de la relación. Y 15 ∆X (8, 13) ∆Y (20,10) 10 5 X 5 10 15 20 25
  • COEFICIENTE DE CORRELACIÓN DE PEARSONTodo coeficiente de correlación que no sea cero indica cierto grado de relaciónentre 2 variables, lo que el grado de intensidad es fuerte o débil de unainterpretación matemática pura, el hecho de que 2 variables tienden a aumentaro disminución sobre una de ellas.La r de Pearson es una medida del grado en el cual las parejas de datosocupan posiciones iguales u opuestas dentro sus propias distribuciones.(PAGANO, Robert. Estadística para las ciencias del comportamiento. Enestadística inferencial. 7a.ed. Mexico. DF: 2006.pp 113 ISBN: 0534617670)En estadística, el coeficiente de correlación de Pearson es un índice que midela relación lineal entre dos variables aleatorias cuantitativas. A diferencia de lacovarianza, la correlación de Pearson es independiente de la escala de medidade las variables. De manera menos formal, podemos definir el coeficiente decorrelación de Pearson como un índice que puede utilizarse para medir el gradode relación de dos variables siempre y cuando ambas sean cuantitativas.(Cortes, 2009)MATEMARICAMENTE Entre 2 variables se lo interpreta como:INTERPRETACIÓN.- Que tan elevado es el coeficiente de correlación dadotodo r=0 indica cierto grado de relación entre 2 variables, que grado deIntensidad de relación se puede considerar, si la relación es fuerte o débil.
  • COEFICIENTE DE CORRELACIÓN DE RANGOS DE SPERMANEl coeficiente de correlación mide el grado de asociación entre dos cantidades,pero no mira el nivel de acuerdo oconcordancia.Esta prueba estadística permite medir lacorrelación o asociación de dos variables y es aplicable cuando las medicionesse realizan en una escala ordinal, aprovechando la clasificación por rangos.(Spiegel, 1991)Se utiliza cuando una o ambas variables corresponden solo a una escalaordinal Sperman es en realidad el coeficiente de correlación lineal r de Pearsonaplicado a los datos que satisfacen los requisitos de una escala ordinal.(PAGANO, Robert. Estadística para las ciencias del comportamiento. Enestadística inferencial. 7a.ed. Mexico. DF: 2006.pp 121ISBN: 0534617670)Cuando una o más variables son solo de escala ordinal.FORMULA MATEMÁTICA: rs = 1- Di= R(xi) – R(yi) EJERCICIO EN CLASE Nº 1Dados los siguientes conjuntos de parejas de datos muéstrales:
  • 1 1 4 2 1 5 4 2 5 4 4 4 7 3 8 5 7 3 10 4 9 1 10 2 13 5 10 4 13 1a) Utilice la ecuación para el valor de la r de Pearson para cada conjunto.Observe que en el conjunto B, donde la correlación es menor, algunos de losvalores;Zx Zy son positivos y otros son negativos. Éstos tienden a cancelarse entre sí,lo cual hace que r tenga una menor magnitud. Sin embargo, en los conjuntos AY C, todos los productos tienen el mismo signo, haciendo que la magnitud de raumente. Cuando las parejas de datos ocupan las mismas u opuestasposiciones dentro de sus propias distribuciones, los productos Zx Zy tienen elmismo signo, lo cual produce una mayor magnitud de r.Para A calculamos los valores de , y las sumatorias respectivas.b) Calcule r para el conjunto B, utilizando la ecuación para los datos en bruto.¿Qué prefiere, utilizar la ecuación de los datos en bruto o la de los puntajes z?C) Sume la constante 5 a los datos X en el conjunto A y calcule r de nuevo,mediante la ecuación de los datos en bruto. ¿Ha cambiado el valor?
  • d) Multiplique los datos X del conjunto A por 5 y calcule r de nuevo. ¿ hacambiado algún valor?e) generalice los resultados obtenidos en las partes c y d, restando y dividiendolos datos entre una constante. ¿Qué le dice esto sobre r ?
  • 2.- En un largo curso de introducción a la sociología, un profesor hace dosexámenes. El profesor quiere determinar si las calificaciones de los estudiantesen el segundo examen están correlacionadas con las calificaciones del primero.Para facilitar, se elige una muestra de ocho estudiantes con las calificacionesque aparecen en la siguiente tabla.a) Construya una grafica de dispersión para los datos, utilizando la calificacióndel primer examen como la variable X. ¿Parece lineal la ecuación?b) Suponga que existe una relación lineal en las calificaciones de los dosexámenes. Calcule el valor de la r de Pearson.c) ¿Qué tan bien explican, las calificaciones del segundo examen.?
  • Ejercicio 14: ejercicio 14 ESTUDIANTE EXAMEN1 EXAMEN 2 1 60 60 2 75 100 3 70 80 4 72 68 5 54 73 6 83 97 7 80 85 8 65 90 ESTUDIANTE EXAMEN1 EXAMEN 2 X2 Y2 1 60 60 3600 3600 2 75 100 5625 10000 3 70 80 4900 6400 4 72 68 5184 4624 5 54 73 2916 5329 6 83 97 6889 9409 7 80 85 6400 7225 8 65 90 4225 8100TOTAL 8 559 653 39739 54687 DATOS ∑XY 46239 7178,875 R= (∑X) 559 940835,891 (∑Y) 653 n 8 R= 0,00763032 ∑X2 39739 % 0,76303158 ∑Y2 54687
  • Se puede analizar que de una perspectiva los estudiante han tenido unincremento del 73% para la realización del segundo examen es decir laspolíticas adoptadas por estudiante docente han funcionado.La tabla muestra un salario mensual que perciben 5 agentes de ventas el valoren dólares. AGENTE VARIABLE X MERCANCIA VENDIDA Y VARIABLE SALARIOS EN EN $ $ 1 0 500 2 1000 900 3 2000 1300 4 3000 1700 5 4000 2100 2500 2000 1500 1000 500 0 0 1000 2000 3000 4000 5000m =m=a= 500y= ax + by=0.40x + 500
  • La ecuación y=0.40x + 500 nos indica la relación entre el salario y lamercadería vendida esto nos indica que y se incrementa 0.4 por cada unitariode xi, con esta relación podemos producir cualquier valor de y si solo se conoceel valor de xi.EJEMPLOX=1500Y`= 0,40 x + 500Y´= 0,40(1500) + 500Y´= 1100Así una agente vende $1500 de mercancía y su salario casi igual a $1100
  • EJERCICIO:ESTUDIANTE PRUEBA DE HABILIDAD EXAMEN DE ADMISIÓN MENTAL (X) (Y)María 18 82Jessica 15 68Carla 12 60Nancy 9 32Juan 3 18GRÁFICA: 90 80 70 60 50 40 30 20 10 0 0 5 10 15 20
  • EJEMPLO DEL COEFICIENTE DE SPERMANESTUDIANTE COEFICIENTE X´ PUNTAJE Y´ Di=x´-y´ INTELECTUAL X Y1 0.30 11 8.9 9 2 42 0.44 9 9.3 8 1 13 0.67 5 9.6 6 -1 14 0 15 6.2 15 0 05 0.50 8 8.8 10 -2 46 0.15 13 8.1 11 2 47 0.58 7 9.5 7 0 08 0.32 10 7.1 14 -4 169 0.72 4 11 3 1 110 1 1 11.7 1 0 011 0.87 3 11.5 2 1 112 0.09 14 7.3 13 1 113 0.89 2 10 4.5 -2.5 6.2514 0.64 6 10 4.5 1.5 2.2515 0.24 12 7.5 12 0 0 41.50r= 1 -r= 1 –r= 1 -r= 0.93
  • EJEMPLOS DE EJERCICIOS: X Y x.y María 18 82 324 6724 1476 Olga 15 68 225 4624 1020 Susana 12 60 144 3600 720 Aldo 9 32 81 1024 288 Juan 3 18 9 324 54 57 260 783 16296 3558 r= r= r= r= r= 0.98
  • EJERCICIO Nº2GRÁFICA 12 10 8 6 4 2 0 0 2 4 6 8 10 12 ECUACION
  • RESOLVER EL COEFICIENTE DE PEARSON X Y x.y 1 6 5 36 25 30 2 5 3 25 9 15 3 7 4 49 16 28 4 10 8 100 64 80 5 2.5 1 6.25 1 2.5 6 2.5 6 6.25 36 15 7 9 10 81 100 90 8 1 2 1 4 2 9 11 9 121 81 99 10 4 7 16 49 28 11 8 11 64 121 88 12 12 12 144 144 144 78 78 649.50 650 621.50 r= r=
  • r= r= r= 0.80 COEFICIENTE DE SPERMAN X X´ Y Y´ Di=x´-y´1 6 7 5 8 -1 12 5 8 3 10 -2 43 7 6 4 9 -3 94 10 3 8 5 -2 45 2.5 10.5 1 12 -1.5 2.256 2.5 10.5 6 7 3.5 12.257 9 4 10 3 1 18 1 12 2 11 1 19 11 2 9 4 -2 -410 4 9 7 6 3 911 8 5 11 2 3 912 12 1 12 1 0 0 48.5
  • r= 1 -r= 1 –r= 1 -r= 0.83EJERCICIO Nº3GRÁFICA 12 10 8 6 4 2 0 0 2 4 6 8 10 12 ECUACION
  • RESOLVER EL COEFICIENTE DE PEARSON X Y x.y 1 0.30 8.9 0.09 79.21 2.67 2 0.44 9.3 0.19 86.49 4.09 3 0.67 9.6 0.45 92.16 6.43 4 0 6.2 0 38.44 0 5 0.50 8.8 0.25 77.44 4.4 6 0.15 8.1 0.02 65.61 1.22 7 0.58 9.5 0.34 90.25 5.51 8 0.32 7.1 0.10 50.41 2.27 9 0.72 11 0.52 121 7.92
  • 10 1 11.7 1 136.89 11.7 11 0.87 11.5 0.76 132.25 10.01 12 0.09 7.3 0 53.29 0.66 13 0.89 10 0.79 100 8.9 14 0.64 10 0.41 100 6.4 15 0.24 7.5 0.06 56.25 1.8 7.41 136.50 4.98 1279.69 73.98 r= r= r= r= r= 0.93 COEFICIENTE DE SPERMANESTUDIANTE COEFICIENTE X´ PUNTAJE Y´ Di=x´-y´ INTELECTUAL X Y1 0.30 11 8.9 9 2 42 0.44 9 9.3 8 1 13 0.67 5 9.6 6 -1 1
  • 4 0 15 6.2 15 0 05 0.50 8 8.8 10 -2 46 0.15 13 8.1 11 2 47 0.58 7 9.5 7 0 08 0.32 10 7.1 14 -4 169 0.72 4 11 3 1 110 1 1 11.7 1 0 011 0.87 3 11.5 2 1 112 0.09 14 7.3 13 1 113 0.89 2 10 4.5 -2.5 6.2514 0.64 6 10 4.5 1.5 2.2515 0.24 12 7.5 12 0 0 41.50r= 1 -r= 1 –r= 1 -r= 0.93
  • EJERCICIO Nº4GRÁFICA ECUACION
  • RESOLVER EL COEFICIENTE DE PEARSON X Y x.y Maria 18 82 324 6724 1476 Olga 15 68 225 4624 1020 Susana 12 60 144 3600 720 Aldo 9 32 81 1024 288 Juan 3 18 9 324 54 57 260 783 16296 3558 r= r= r= r=
  • r= 0.98COEFICIENTE DE SPERMAN ESTUDIANTE COEFICIENTE X´ PUNTAJE Y´ Di=x´-y´ INTELECTUAL X YMaria 18 1 82 1 0 0Olga 15 2 68 2 0 0Susana 12 3 60 3 0 0Aldo 9 4 32 4 0 0Juan 3 5 18 5 0 0 0r= 1 -r= 1 –r= 1 -r= 1
  • EJERCICIO Nº5GRÁFICA EJERCICIO N º 5 90 80 70 60 50 40 30 20 10 0 0 5 10 15 20 ECUACION
  • RESOLVER EL COEFICIENTE DE PEARSON X Y x.y 1 18 18 324 324 324 2 15 22 225 6724 1230 3 12 68 144 4624 816 4 9 60 81 3600 540 5 3 32 9 1024 96 57 260 783 16296 3006 r= r= r= r= r= 0.07
  • COEFICIENTE DE SPERMAN X X´ Y Y´ Di=x´-y´ 1 18 1 18 5 -4 16 2 15 2 82 1 1 1 3 12 3 68 2 1 1 4 9 4 60 3 1 1 5 3 5 32 4 1 1 20r= 1 -r= 1 –r= 1 -r= 0
  • EJERCICIO Nº6GRÁFICO EJERCICIO Nº 6 80 70 60 50 40 30 20 10 0 0 5 10 15 20
  • RESOLVER EL COEFICIENTE DE PEARSON X Y x.y 1 18 18 324 324 324 2 15 32 225 1024 480 3 12 60 144 3600 720 4 9 68 81 4624 612 5 3 82 9 6724 246 57 260 783 16296 2382 r= r= r= r= r= -0.96
  • EL COEFICIENTE DE PEARSON: X Y x.y J 49 48 2401 2304 2352 K 47 45 2209 2025 2115 L 42 22 1764 484 924 P 39 22 1521 484 854 F 37 40 1369 1600 1480 Z 32 40 1024 1600 1280 6 246 217 10288 8497 9009 r= r= r=
  • r= r= 0.31 COEFICIENTE DE SPERMAN X X´ Y Y´ Di=x´-y´J 49 1 48 1 0 0K 47 2 45 2 0 0L 42 3 22 5.5 -2.5 6.25P 39 4 22 5.5 -1.5 2.25F 37 5 40 3.5 1.5 2.25Z 32 6 40 3.5 2.5 6.25 17 r= 1 - r= 1 – r= 1 - r= 0.51
  • EJERCICIO Nº9GRÁFICA
  • EJERCICIOS PROPUESTOSResolver los siguientes ejercicios: X Y 10 7 8 4 9 5 11 4 11 8 14 6 10 9 9 8 11 7 13 5 15 4 16 6 X Y 86 15 74 43 73 16 65 11 82 10 78 13 79 14 70 15 50 10 65 9
  • COEFICIENTE DE CORRELACION Expresa de una manera cuantitativa la magnitud y dirección de una relación, se lo designa en la letra r puede variar entre +1 a -1 el signo nos dice si la relación es positiva o negativa. Relación perfecta Relación Imperfecta Relación LinealEs aquella que existe una Es aquella que existe una Existe 2 variables esrelación positiva o negativa relación positiva o negativa aquella que puedepara lo cual todos los puntos para lo cual todos los representarse en un plano cartesiano concaen sobre la recta. puntos caen sobre la recta. una mejor exactitud mediante una línea recta por la ecuación. FORMULAS PEARSON r= SPERMAN rs= 1-
  • APRENDIZAJE MEDIADONIVEL TEÓRICO PRÁCTICO  Lectura comprensiva de los conceptos básicos de la correlación.  Analizar los conceptos de la correlación.NIVEL TEÓRICO AVANZADO  Elaborar un organizador grafico de la teoría de la correlación.  Realizar nuestros propios conceptos para mayor entendimiento.NIVEL TEÓRICO BÁSICO PRÁCTICO  Resolver ejercicios sobre pruebas de psicológicas realizada a estudiantes aplicando los coeficientes de correlación.  Establecer problemas y resolverlos aplicando los coeficientes de correlación.NIVEL TEÓRICO BÁSICO PRÁCTICO AVANZADO  Con datos de importaciones de productos aplicar los coeficientes de correlación.  Resolver ejercicios con datos de exportaciones con la aplicación de los coeficientes de correlación.
  • APRENDIZAJE AUTÓNOMONIVEL TEÓRICO PRÁCTICO  Investigar otros conceptos de la correlación en libros e internet.  Hacer un resumen de la investigación realizada.NIVEL TEÓRICO AVANZADO  Elaboración de un Mentefacto de la correlación.  Elaboración de ejemplos pequeños para una mayor comprensión de los conceptos de la correlación.NIVEL TEÓRICO BÁSICO PRÁCTICO  Realizar ejercicios sobre pruebas que se tomaron a estudiantes, coeficiente intelectual, psicológicas aplicando los coeficientes de correlación.  Resolver un problema de una investigación realizada sobre el nivel de herotina de los monos aplicando los coeficientes de correlación.NIVEL TEÓRICO BÁSICO PRÁCTICO AVANZADO  Investigar los datos de importaciones o exportaciones de la página del Banco Central del Ecuador en los años 2011- 2012 aplicar los coeficientes de correlación.  Con los datos de las exportaciones o importaciones de datos reales de la página del Banco Central recolectando datos del primer trimestre del año 2011 -2012 aplicar los coeficientes de correlación.
  • REGRESIÓN LINEALLa regresión y la correlación están íntimamente ligados, ambos implican larelación entre 2 variables y utilizan el mismo conjunto de datos básicos.La regresión se centra en el uso de la relación para determinar una predicción,cuando la relación es perfecta, esto es cuando todos los puntos están sobre larecta y se utilizan para señalar la predicción, la situación se hace más complejacuando la relación es imperfecta.Esta recta es la línea de regresión por los mínimos cuadrados. La distanciavertical en cada punto y la recta representan el error de la predicción, parecieraque el error total seria la suma algebraica .El error total de predicción presentado por , es menor para la líneade regresión por mínimos cuadrados.En estadística la regresión lineal o ajuste lineal es un método matemático quemodeliza la relación entre una variable dependiente Y, las variablesindependientes Xi y un término aleatorio (Cortes, 2009).La palabra regresión se emplea para denotar el proceso de estimar el valor deuna de las variables en función de otra, cuyo valor se considerado. (MARTINEZ, 2001)La ecuación por los mínimos cuadrados está dado por , ecuaciónde regresión lineal para predicción y dado por X. = Valor predichoby = Pendienteay = Ordenado al origen
  • FORMULA DE LA REGRESIÓNECUACIÓN PARA CALCULAR LA CONSTANTE DE REGRESIÓNEJERCICIO Nº 1El aprovechamiento de los estudiantes con relación al promedio decalificaciones para cada uno.ESTUDIANTES APROVECHAMIENTO PROMEDIO XY (X) (Y)1 110 1 110 121002 112 1.6 179.20 125443 118 1.2 141.60 139244 119 2.1 249.90 141615 122 2.6 317.20 148846 125 1.8 225 156257 127 2.6 330.20 161298 130 2 260 169009 132 3.2 422.40 1742410 134 2.6 384.40 1795611 136 3 408 1849612 138 3.6 496.80 19044 1503 27.30 3488.70 189187
  • Ejemplo de la grafica de acuerdo con los resultados propuesta de los ejercicios donde podemos observar una grafica positiva y unos puntos dispersos. Esta es un gráfica con una relación imperfecta positiva (m +).
  • DETERMINAR EL COEFICIENTE DE PEARSON Y SPERMANCOEFICIENTE DE PEARSONCOEFICIENTE DE SPERMAN
  • LA ECUACIÓN LINEAL A TRAVÉS DEL MÉTODO ESTADÍSTICO Y LA REGRESIÓN LINEALREGRESIÓN CONSISTENTE DE REGRESIÓN ECUACIÓN MÁTEMATICA
  • EJERCICIO PROPUESTOResolver los siguientes ejercicios: X Y X Y 63 56 159.2 167.15 60 60 206.3 95 57 61 188.07 197.5 58 60 196.7 215.3 79 65 143.9 145.7 55 62 324.5 154.9 57 58 248.3 153.5 58 61 199.2 156.6 65 56 110.2 178.2 73 65 169.7 210.9 66 69 174.5 215.3 63 59 70 66 65 60 61 67
  • REGRESIÓN LINEALEs una relación entre 2 variables y utiliza un conjunto de datosbásicos. La regresión se centra en el uso de la relación paradeterminar una predicción. FÓRMULA = Valor predicho by = Pendiente APRENDIZAJE MEDIDO ay = Ordenado al origen
  • NIVEL TEÓRICO PRÁCTICO  Lectura comprensiva de los conceptos básicos de la regresión lineal.  Interpretar los conceptos de la regresión lineal.NIVEL TEÓRICO AVANZADO  Elaborar un organizador grafico de la teoría de la regresión lineal.  Realizar nuestros propios conceptos para mayor entendimiento.NIVEL TEÓRICO BÁSICO PRÁCTICO  Resolver ejercicios sobre pruebas de psicológicas realizada a estudiantes para obtener la ecuación de la regresión lineal.  Establecer problemas y resolverlos calculando la ecuación de la regresión lineal.NIVEL TEÓRICO BÁSICO PRÁCTICO AVANZADO  Con datos de importaciones de productos aplicar la ecuación de la regresión lineal.  Resolver ejercicios con datos de exportaciones para calcular la ecuación de la regresión lineal.
  • APRENDIZAJE AUTÓNOMONIVEL TEÓRICO PRÁCTICO  Investigar otros conceptos de la regresión lineal en libros.  Sacar los conceptos de la investigación realizada.NIVEL TEÓRICO AVANZADO  Elaboración de un cuadro sinóptico de la regresión lineal.  Elaboración de ejemplos pequeños para una mayor comprensión de los conceptos de la regresión lineal.NIVEL TEÓRICO BÁSICO PRÁCTICO  Realizar ejercicios sobre pruebas que se tomaron a estudiantes, coeficiente intelectual, psicológicas aplicando la ecuación de la regresión lineal.  Resolver un problema de una investigación realizada sobre la altura de un individuo en distintas edades aplicando la ecuación de la regresión lineal.NIVEL TEÓRICO BÁSICO PRÁCTICO AVANZADO  Investigar los datos de importaciones o exportaciones de la página del Banco Central del Ecuador en los años 2011- 2012 aplicar los ejercicios propuestos.  Con los datos de las exportaciones o importaciones de datos reales de la página del Banco Central recolectando datos del primer trimestre del año 2011 -2012 aplicar a los ejercicios propuestos.