Your SlideShare is downloading. ×
Correlacion
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Correlacion

2,884
views

Published on


0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
2,884
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
134
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1.  La correlación trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.
  • 2.  1ºCorrelación directa 2º Correlación inversa 3º Correlación nula
  • 3.  La correlación directa se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribución es una recta creciente.
  • 4.  La correlación inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.
  • 5.  La correlación nula se da cuando no hay dependencia de ningún tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.
  • 6.  El grado de correlación indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos:
  • 7.  Lacorrelación será fuerte cuanto más cerca estén los puntos de la recta.
  • 8.  Lacorrelación será débil cuanto más separados estén los puntos de la recta.
  • 9. a. Correlación fuerte: cuanto más se aproximan los puntos a la recta. a. Positiva b. Negativab. Correlación débil: cuando los puntos se separan de la rectac. Correlación nula: No hay asociación
  • 10.  La correlación es la forma numérica en la que la estadística ha podido evaluar la relación de dos o más variables, es decir, mide la dependencia de una variable con respecto de otra variable independiente.
  • 11.  Para poder entender esta relación tendremos que analizarlo en forma gráfica: Si tenemos los datos que se presentan en la tabla y consideramos que la edad determina el peso de las personas entonces podremos observar la siguiente gráfica: Donde los puntos representan cada uno de los pares ordenados y la línea podría ser una recta que represente la tendencia de los datos, que en otras palabras podría decirse que se observa que a mayor edad mayor peso
  • 12.  La correlación se puede explicar con la pendiente de esa recta estimada y de esta forma nos podemos dar cuenta que también existe el caso en el que al crecer la variable independiente decrezca la variable dependiente. En aquellas rectas estimadas cuya pendiente sea cero entonces podremos decir que no existe correlación.
  • 13.  Asíen estadística podremos calcular la correlación para datos no agrupados con la siguiente formula.En donde:R = coeficiente de correlaciónN = número de pares ordenadosX = variable independienteY = variable independiente
  • 14. Edad (x) Peso (y) X2 Y2 X* Y 15 60 225 3600 900 30 75 900 5625 2250 18 67 324 4489 1206 42 80 1764 6400 3360 28 60 784 3600 1680 19 65 361 4225 1235 31 92 961 8464 2852 183 499 5319 36403 13483 Supóngase que deseamos obtener la correlación de los datos de la tabla anterior: Ahora podemos observar que:
  • 15. Se debe aclarar que el coeficiente de correlaciónsólo puede variar de la siguiente manera: y quepara entenderlo mejor se debe obtener elcoeficiente de determinación que se obtiene con “r “ cuadrada, ya que este representa el porcentajeque se explica “ y ” mediante los datos de “ x ”.En nuestro ejemplo decimos que la correlación escasi perfecta, ya que, esta muy cerca de 1 y que elporcentaje de datos que explican a “ y “ es(0.65638606)2= 0.430842 o sea el 43.08 %
  • 16.  En el caso de que fueran datos agrupados tendremos lo siguiente: Primero tendremos que pensar que se genera una matriz, ya que, ahora estamos juntando dos tablas de distribución de frecuencias y por ello nuestros cálculos serán más laboriosos, por lo que les recomiendo el uso de una hoja de calculo o al menos una calculadora con regresión para datos agrupados.
  • 17.  De cualquier forma aquí tambien estamos evaluando numéricamente si existe relación entre dos variables y lo haremos con la siguiente ecuación.
  • 18.  En donde podemos encontrar k como el número de clases para la variable "y" y l para el número de clases de "x". También podemos observar que hay varios tipos de "f" es decir, la que se encuentra sola (sin subíndice) que nos habla de las frecuencias celdares (cada una de las frecuencias que se encuentran en la intersección entre una columna y un renglón) y las "f" con subíndices que representan las frecuencias de cada una de las variables. Para entender el uso de esta formula usaremos un ejemplo: Los resultados que se presentan en la siguiente tabla representan los pesos y las estaturas de 48 alumnos entrevistados el "día anáhuac"
  • 19.  La sustitución de la fórmula es la siguiente:
  • 20.  Al interpretar nuestro resultado podemos concluir que si existe relación entre el peso y la estatura, es decir, que a mayor estatura mayor peso. En muchas ocasiones el resultado de la correlación es negativo y lo que debemos pensar es que la relación de las variables involucradas en el calculo es inverso es decir que en la medida que crece la variable independiente la variable dependiente decrece:
  • 21.  Si X y Y son las dos variables en cuestión, un diagrama de dispersión muestra la localización de los puntos (X,Y) sobre un sistema rectangular de coordenadas. Si todos los puntos del diagrama de dispersión parecen estar en una recta la correlación se llama lineal. En tales casos, una ecuación lineal es adecuada a efectos de regresión o estimación 6 4 2 0 0 1 2 3 4 a) Correlación lineal positiva
  • 22. 3.5 32.5 21.5 10.5 0 0 0.5 1 1.5 2 2.5 3 3.5 4 b) Correlación lineal negativa
  • 23.  El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables. El coeficiente de correlación lineal se expresa mediante la letra r.
  • 24.  El Coeficiente de Correlación es un valor cuantitativo de la relación entre dos o más variables.La coeficiente de correlación puede variar desde -1.00 hasta 1.00.La correlación de proporcionalidad directa opositiva se establece con los valores+1.00 y de proporcionalidad inversa onegativa, con -1.00. No existe relación entre lasvariables cuando el coeficiente es de 0.00.
  • 25.  1. El coeficiente de correlación no varía al hacerlo la escala de medición. Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación no varía. 2. El signo del coeficiente de correlación es el mismo que el de la covarianza. Si la covarianza es positiva, la correlación es directa. Si la covarianza es negativa, la correlación es inversa. Si la covarianza es nula, no existe correlación.
  • 26.  3. El coeficiente de correlación lineal es un número real comprendido entre −1 y 1. −1 ≤ r ≤1 4.Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1. 5.Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1.
  • 27.  6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil. 7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional. El siguiente diagrama resume el análisis del coeficiente de correlación entre dos variables
  • 28.  Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:Matemátic 2 3 4 4 5 6 6 7 7 8 10 10 asFísica 1 3 2 4 4 4 6 4 6 7 9 10
  • 29.  Hallar el coeficiente de correlación de la distribución e interpretarlo.xi yi x i ·y i xi2 y i22 1 2 4 13 3 9 9 94 2 8 16 44 4 16 16 165 4 20 25 166 4 24 36 166 6 36 36 367 4 28 49 167 6 42 49 368 7 56 64 4910 9 90 100 8110 10 100 100 100
  • 30.  1º Hallamos las medias aritméticas. 2º Calculamos la covarianza.
  • 31.  3º Calculamos las desviaciones típicas. 4º Aplicamos la fórmula del coeficiente de correlación lineal.
  • 32.  Al ser el coeficiente de correlación positivo, la correlación es directa. Como coeficiente de correlación está muy próximo a 1 la correlación es muy fuerte.
  • 33.  Los valores de dos variables y y x se distribuyen según la tabla siguiente: Y/X 0 2 4 1 2 1 3 2 1 4 2 3 2 5 0
  • 34.  Determinar el coeficiente de correlación. Convertimos la tabla de doble entrada en tabla simple. x i2 · y i2 · x i · y i xi yi fi xi · fi yi · fi fi fi · fi 0 1 2 0 0 2 2 0 0 2 1 0 0 2 4 0 0 3 2 0 0 6 18 0 2 1 1 2 4 1 1 2 2 2 4 8 16 8 16 16 2 3 5 10 20 15 45 30 4 1 3 12 48 3 3 12 4 2 2 8 32 4 8 16 20 40 120 41 97 76
  • 35. Al ser el coeficiente de correlación negativo, la correlación esinversa.Como coeficiente de correlación está muy próximo a 0 lacorrelación es muy débil