Analisis Factorial

22,919 views

Published on

Estadistica Avanzada

Analisis Factorial

  1. 1. ANÁLISIS FACTORIAL<br />JUAN G. VELEZ <br />JUAN FERREIRA<br />EstadísticaAvanzada<br />Dr. BabinoGarcía-Bernal<br />
  2. 2. ESTABLECE UNA RELACIÓN ENTRE VARIABLES Y ATRIBUTOS QUE A PRIMERA VISTA NO SON APARENTEMENTE RELACIONADOS.<br />PROPORCIONA LA ESTRUCTURA INTERNA , LAS CORRELACIÓNES SUBYACENTES , PERMITIENDO ESTABLECER CÓMO UNOS FACTORES AFECTAN A OTROS Y PERMITE CREAR UN MODELO MATEMÁTICO.<br />DEFINICIÓN<br />
  3. 3. TÉCNICA QUE PERMITE REDUCIR UN CONJUNTO DE VARIABLES ( CARACTERÍSTICAS ASOCIADAS A UN CIERTO ELEMENTO, FENÓMENO O INDIVIDUO) A UN NÚMERO DE FACTORES REPRESENTATIVOS.<br />DEFINICIÓN<br />
  4. 4. EXISTEN DOS CONDICIONES BÁSICAS AL UTILIZARSE: <br />QUE EL FENÓMENO SE PUEDA DESCRIBIR CON UN NÚMERO REDUCIDO DE FACTORES <br />QUE PUEDAN SER INTREPRETADOS CON SENCILLEZ <br />DEFINICIÓN<br />
  5. 5. CREAR UNA MATRIZ DE CORRELACIONES<br />EXTRACCIÓN DE FACTORES<br />ROTACIONES FACTORIALES<br />INTERPRETACIÓN DE LOS FACTORES<br />FASES PRINCIPALES<br />
  6. 6. EL PRIMER PASO ES EL ANÁLISIS DE LA MATRIZ DE CORRELACIÓN. ESTA SE ELABORA A PARTIR DE LA MATRIZ DE DATOS ORIGINALES Y ES UNA PRIMERA APROXIMACIÓN.<br />LA PODEMOS IDENTIFICAR CON UNA MATRIZ DE SIMILITUDES O PROXIMIDADES , YA QUE CUANTO MÁS ELEVADOS SEAN LOS COEFICIENTES DE CORRELACIÓN, MAYOR SERÁ LA RELACIÓN ENTRE LAS VARIABLES.<br />MATRIZ DE CORRELACIONES<br />
  7. 7. EL ANÁLISIS FACTORIAL ES UNA TÉCNICA QUE ANALIZA LA CORRELACIÓN LINEAL ENTRE LAS VARIABLES. SI LAS VARIABLES NO ESTUVIERAN ASOCIADAS LINEALMENTE, LAS CORRELACIONES ENTRE ELLAS SERÍAN NULAS.<br />SIN EMBARGO LA REALIDAD LATENTE MUESTRA QUE EXISTEN CORRELACIÓNES SUBYACENTES ENTRE FACTORES .<br />CORRELACIONES<br />
  8. 8. PARA MEDIR EL GRADO DE ASOCIACION ENTRE VARIABLES ,SE UTILIZA EL COEFICIENTE DE CORRELACIÓN MÚLTIPLE QUE ES EL MÁS IMPORTANTE.<br />CUANDO EL MISMO ES BAJO, SE PUEDEN ELIMINAR VARIABLES Y LUEGO SUSTITUIRLAS Y CUANDO ES ALTO LA MATRIZ SE PUEDE CONSIDERAR ADECUADA PARA UN ANÁLISIS FACTORIAL.<br />CORRELACIONES<br />
  9. 9. SIN EMBARGO, NO EN TODAS LAS OCASIONES SUCEDE QUE UN COEFICIENTE BAJO DE CORRELACIÓN NO IMPLIQUE CORRELACIÓN. SI ESTE ES EL CASO, EXISTEN OTRAS PRUEBAS, COMO EL DETERMINANTE DE LA MATRIZ, EL DE ESFERICIDAD DE BARTLETT O EL DE KAISER-MEYER-OLKIN. SI TALES VALORES SON SIGNIFICATIVOS , SE PROCEDE A CONTINUAR CON EL ANÁLISIS EN CURSO.<br />CORRELACIÓNES<br />
  10. 10. EXISTEN DIVERSAS TECNICAS PARA LOGRAR TAL IDENTIFICACION POR EJ : TÉCNICA DE COMPONENTES PRINCIPALES, MAXIMA VEROSIMILITUD Y LA DE MÍNIMOS CUADRADOS. <br />SIN DUDA LAS MAS USADA ES LA DE COMPONENTES PRINCIPALES, PUES PERMITE TRANSFORMAR UN CONJUNTO DE VARIABLES INTERCORRELACIÓNADAS EN OTRO CONJUNTO DE VARIABLES NO CORRELACIONADOS LLAMADOS FACTORES.<br />EXTRACCION DE FACTORES<br />
  11. 11. EL OBJETIVO DE ESTA TÉCNICA ES EXPLICAR LA MAYOR CANTIDAD DE VARIANZA DE LAS VARIABLES ORIGINALES A TRAVÉS DEL MENOR NÚMERO DE FACTORES O COMPONENTES.<br />SU BASE ES LA MATRIZ DE CORRELACIÓN DE LA CUAL SE VAN A OBTENER LAS ECUACIONES LINEALES QUE REPRESENTAN LA TRANSFORMACION LINEAL DE LAS VARIABLES ORIGINALES CON LOS COMPONENTES RESULTANTES. <br />EXTRACCION DE FACTORES<br />
  12. 12. AL CONSERVAR TODOS LOS COMPONENTES PRINCIPALES O FACTORES PARA EXPLICAR CADA UNA DE LAS VARIABLES, LA PROPORCIÓN DE VARIANZA COMÚN DE LA VARIABLE EXPLICADA POR LOS FACTORES SERÁ COMO MÁXIMO IGUAL A 1PARA TODAS LAS VARIABLES, ESTO SE LLAMA COMUNALIDAD. ES TAMBIEN LA VARIANZA QUE Xi TIENE EN COMÚN CON LAS OTRAS VARIABLES.<br />COMUNALIDAD<br />
  13. 13. UNA VEZ OBTENIDOS LOS FACTORES, CADA UNA DE LAS VARIABLES PODRÁ SER EXPRESADA COMO COMBINACIÓN LINEAL DE LOS MISMOS, LO QUE SE REFLEJA EN LA MATRIZ FACTORIAL. <br />LA MATRIZ FACTORIAL, (FACTOR MATRIX) NO ES MÁS QUE UNA REPRESENTACIÓN SENCILLA DE LA MATRIZ DE CORRELACIONES INICIAL EN DONDE CADA COLUMNA ES UN FACTOR SELECCIONADO.<br />EXTRACCION DE FACTORES<br />
  14. 14. LAS FILAS SON LAS VARIABLES Y LOS F i j SON LOS ÍNDICES DE LA CORRELACIÓN. <br />ESTOS COEFICIENTES RECIBEN EL NOMBRE DE PESOS, CARGAS, PONDERACIONES O SATURACIONES FACTORIALES E INDICAN EL PESO QUE CADA VARIABLE ASIGNA A CADA FACTOR. ENTONCES VISTO EN CONJUNTO EL ANÁLISIS FACTORIAL, ANALIZA LA CORRELACIÓN LINEAL ENTRE VARIABLES.<br />EXTRACCION DE FACTORES<br />
  15. 15. LA MATRIZ FACTORIAL RELACIONA FACTORES CON VARIABLES. CUANDO NO SUCEDE, SE PROCEDE A LA ROTACION FACTORIAL QUE NOS PERMITE TRANSFORMAR LA MATRIX INICIAL SIN ALTERAR SUS PROPIEDADES MATEMATICAS. <br />CONSISTE EN HACER GIRAR LOS EJES DE COORDENADAS HASTA QUE LAS VARIABLES PESEN MUCHO EN UN FACTOR Y POCO O NADA EN OTRO. <br />ROTACIONES FACTORIALES <br />
  16. 16. LA ROTACION FACTORIAL TRANSFORMA LA MATRIZ FACTORIAL INICIAL EN OTRA MATRIZ, LLAMADA MATRIZ FACTORIAL ROTADA.<br />EXISTEN MÉTODOS ANALÍTICOS Y GRÁFICOS. ENTRE LOS ANALITICOS ESTAN: <br />EL CRITERIO DE ROTACION ORTOGONAL (LOS FACTORES COMUNES NO ESTAN CORRELACIÓNADOS) Y EL DE ROTACIÓN OBLICUA (DONDE LOS FACTORES COMUNES ESTAN CORRELACIONADOS Y SON MAS REALISTAS). LA META ES MAXIMIZAR LA VARIANZA DENTRO DE LOS FACTORES.<br />ROTACIONES FACTORIALES <br />
  17. 17. TAMBIÉN EXISTEN OTROS MÉTODOS GRÁFICOS COMO LA ROTACIÓN VARIMAX QUE ES LA MAS UTILIZADA Y EL MÉTODO OBLIMIN QUE ES EL MAS RECOMENDADO. <br />SI EL INVESTIGADOR SOSPECHA QUE LOS <br /> FACTORES SON INDEPENDIENTES, SE PUEDE <br /> USAR VARIMAX, SINO ES ASI, UNA ROTACION <br /> OBLIMIN ES LA MEJOR. <br />ROTACIONES FACTORIALES <br />
  18. 18. SI LOS PESOS SON MAYORES DE .30, SE DEBE RETENER UNA VARIABLE EN UN FACTOR, AUNQUE ES DESEABLE NO OBTENER VALORES MAYORES DE .30 EN MAS DE UN FACTOR. <br />UNA GRÁFICA EN ORDEN DESCENDIENTE DE MAGNITUD DE LOS VALORES PROPIOS DE UNA MATRIZ DE CORRELACIÓN, AYUDA A VISUALIZAR LA IMPORTANCIA RELATIVA DE LOS FACTORES, UNA CAIDA AGUDA EN LA GRAFICA INDICA QUE FACTORES SUBSECUENTES SON IRRELEVANTES.<br />CRITERIOS SOBRE PESOS <br />
  19. 19. UNA VEZ QUE HEMOS SIMPLIFICADO LA MATRIZ FACTORIAL A PARTIR DE LA ROTACION DE LA MISMA Y CON ELLO CONCLUIDO EL PROCESO DE ANÁLISIS FACTORIAL, QUEDA INTERPRETAR LOS FACTORES OBTENIDOS EN FUNCIÓN DE LAS VARIABLES CON LAS QUE SE ENCUENTRAN ASOCIADOS. <br />INTERPRETACIÓN DE LOS FACTORES<br />
  20. 20. USUALMENTE SE HACE UNA GRÁFICA Y ASI RESULTARÁ MAS SENCILLO DESVELAR LA ESTRUCTURA LATENTE DE LOS FACTORES Y AL ORDENAR LAS VARIABLES EN FUNCIÓN DEL PESO DE LOS FACTORES SOBRE ÉSTAS, DE TAL MODO QUE EN LA MATRIZ FACTORIAL ROTADA APAREZCAN LAS VARIABLES CON PONDERACIONES ALTAS PARA EL MISMO FACTOR AGRUPADAS. <br />INTERPRETACIÓN DE LOS FACTORES<br />
  21. 21. EL MODELO ESTANDARIZADO SE EXPRESA EN LA FORMA:<br />X1 = A11F1 + … + A 1m Fm + e1<br />X2 = A21F1 + … + A 2m Fm + e2<br />…<br />Xp = Ap1F1 + … + A pm Fm + ep<br />EN ESTA REPRESENTACION SE ASUME QUE LOS FACTORES F Y LOS ERRORES e SON INDEPENDIENTES ENTRE SÍ. SIN EMBARGO, LAS VARIABLES Xi ESTÁN RELACIONADAS ENTRE SÍ..<br />EL MODELO DE ANÁLISIS FACTORIAL<br />
  22. 22. Xi SON LAS VARIABLES, Aij SON LOS FACTORES DE CARGA QUE SON VALORES NUMÉRICOS CUYO VALOR MÁXIMO ES UNO. <br />TAMBIÉN SE LE LLAMAN PESOS FACTORIALES, QUE PUEDEN INTERPRETARSE COMO CORRELACIONES ENTRE LAS VARIABLES Y LOS FACTORES. SIRVEN ASÍ PARA INDICARNOS CUÁNTO CADA PESO Y CADA F AFECTA UNA VARIABLE PARTICULAR Xi .<br />EL MODELO<br />
  23. 23. LA PUNTUACIONES TÍPICAS DE X ,F Y E TIENEN UNA MEDIA DE CERO Y UNA DESVIACIÓN TÍPICA DE 1.<br /> LOS PESOS Aij OSCILAN ENTRE -1.0 Y 1.0.<br />LOS VALORES DE Aij SE LOGRAN A TRAVÉS DEL ANÁLISIS FACTORIAL. ESA ES LA META PRINCIPAL DE ESTE TIPO DE TÉCNICA. <br />El MODELO <br />
  24. 24. SE TRATA DE m = 2 FACTORES F, DE p = 3 <br />VARIABLES Xi , DE m *p = 3*2= 6 <br />FACTORES DE CARGA, Aij. Y DE p ERRORES e.<br />LOS FACTORES DE CARGA, TAMBIÉN LLAMADOS CARGAS FACTORIALES, PUEDEN TENER COMO MÁXIMO VALOR A LA UNIDAD.<br />EJEMPLO <br />
  25. 25. TRES VARIABLES DOS FACTORES <br />
  26. 26. SEA I = INTELIGENCIA , PODEMOS CONSTRUIR UNA ECUACIÓN DE INTELIGENCIA EN TÉRMINOS DE 5 DIVERSOS FACTORES DE APTITUD TIPICOS TALES COMO: (V) APTITUD VERBAL; ( N) APTITUD NUMÉRICA; (M) MEMORIA; (R) RAZONAMIENTO Y (P) CAPACIDAD PERCEPTIVA.<br /> PARA DAR UN VALOR NUMÉRICO APROXIMADO A UN SUJETO EN PRUEBA CONSTRUIMOS UNA ECUACION<br />ECUACIÓN DE INTELIGENCIA<br />
  27. 27. I = A11 V + A12 N + A13 M + A14 R + A14 P <br />A11, A14 SON LOS VALORES NUMÉRICOS ASOCIADOS CON CADA TEST SEGUN EL SCORE PROMEDIO PARA CADA INDIVIDUO. DONDE A11, A14 VARIA ENTRE -1 Y 1. USUALMENTE SE LE ASOCIA UN FACTOR DE PESO SEGÚN SU IMPORTANCIA EN DETERMINAR I , POR EJ . V Y N PUEDEN SER .50 Y P PUEDE SER .25 <br />INTELIGENCIA<br />
  28. 28. LAS MEDICIONES DEBEN PERMITIR ENCONTRAR CORRELACIONES ENTRE LAS VARIABLES (ESTO ES, SE RECONOCE QUE HAY ALGO EN COMÚN ENTRE LAS VARIABLES, LO CUAL PERMITE ENCONTRAR UN NÚMERO MENOR DE FACTORES). ESTA MATRIZ R, DE MAGNITUD p x p, TIENE EL FORMATO SIGUIENTE, PARA SEIS VARIABLES POR EJEMPLO.<br /> LA MATRIZ DE CORRELACIÓNES R<br />
  29. 29. 1.00 0.05 0.04 0.12 0.14 0.16<br /> 0.78 1.00 0.06 0.11 0.12 0.11<br /> 0.65 0.88 1.00 0.13 0.14 0.12<br /> 0.08 0.03 0.11 1.00 0.15 0.14 <br /> 0.07 0.15 0.06 0.65 0.52 1.00 <br />DONDE POR EJ. LOS GRUPOS DE VALORES .78 .65 .88 .55 .65 .52 ESTAN INDICANDO QUE HAY MANIFESTACIONES COMUNES ENTRE TALES VARIABLES.<br />MATRIX R <br />
  30. 30. UN PUNTO CRÍTICO EN EL ANÁLISIS FACTORIAL LO CONSTITUYEN LOS ERRORES, e. DE ACUERDO A LA CONDICIÓN DE INDEPENDENCIA DE F Y e, SEGÚN ES ASUMIDO, ES POSIBLE DEMOSTRAR LAS SIGUIENTES RELACIONES ENTRE LA MATRIZ X = {Xi] DE MAGNITUD p X 1, LA MATRIZ A =[Aij ] DE MAGNITUD p X m, LA MATRIZ F = {FI] DE MAGNITUD m X 1, Y LA MATRIZ e = {ei} DE MAGNITUD P X 1.<br />ERRORES <br />
  31. 31. DONDE R = A* A^t + cov(e), R ES LA MATRIZ DE CORRELACIÓNES.<br /> DONDE 𝑉ar(𝑋𝑖) =𝑘=0𝑛 𝐴𝑖𝑗 =1+𝑉ar(𝑒𝑖)=𝐶𝑖^2+𝑉ar(𝑒𝑖)<br /> EL VALOR DE Ci^2, COMO LA SUMA DE LOS CUADRADOS <br /> DE LOS FACTORES DE CARGA DE Xi, SE CONOCE COMO <br /> COMUNALÍA ( COMMUNALITY, O COMUNALIDAD). NOTE <br /> QUE EL MÁXIMO VALOR QUE PUEDE ALCANZAR ES 1<br /> COMUNALIA ES LA VARIANZA QUE Xi TIENE EN COMÚN <br /> CON LAS OTRAS VARIABLES. MIENTRAS QUE VAR(ei) ES <br /> LA VARIANZA ESPECÍFICA PARA LA VARIABLE i.<br /> <br />X= A F+ e<br />
  32. 32. LOS DIFERENTES TIPOS DE ANÁLISIS QUE CONDUCEN AL CÁLCULO Y SELECCIÓN DE LOS FACTORES, TIENEN QUE VER CON LA ESTIMACIÓN DE LA COMUNALÍA INICIAL. AUNQUE EXISTEN VARIOS MÉTODOS, SON DOS LOS MAS USADOS , EL DE LOS COMPONENTES PRINCIPALES Y EL DE ANÁLISIS DE FACTORES.<br />AQUÍ SE ASUME QUE LAS COMUNALÍAS SON INICIALMENTE IGUALES A 1. LA TAREA ES ENCONTRAR LOS VALORES CARACTERÍSTICOS O EIGENVALORES O VALORES PROPIOS. DE ÉSTOS, LOS QUE TIENEN VALORES POSITIVOS, DETERMINAN EL NÚMERO DE FACTORES QUE SERÁN EXTRAÍDOS. DIFUNDIDOS<br />TIPO DE ANÁLISIS<br />
  33. 33. LAS COMUNALÍAS NO SON ASUMIDAS COMO LA UNIDAD. SE ADOPTAN INICIALMENTE A PARTIR DE VARIAS REGLAS, CONSIDERANDO POR EJEMPLO, LA CORRELACIÓN ENTRE VARIAS VARIABLES, O EL CUADRADO DE COEFICIENTES DE RELACIÓNES MÚLTIPLES. <br />SE CONTINÚA CON EL CÁLCULO DE VALORES PROPIOS PARA EXTRAER LOS FACTORES. <br />LOS PROCEDIMIENTOS ACEPTAN VARIAS ITERACIONES.<br />MÉTODO DE ANÁLISIS DE FACTORES<br />
  34. 34. EXISTEN DIFERENTES TIPOS DE SOFTWARE QUE AYUDA A DESARROLLAR ESTE TIPO DE APLICACIONES. <br />SPPS, XLSTAT, SOFASTASTS,R , BMDP (BIOMEDICAL), SAS, PSPP,STATA,STATISTICA.<br />, <br />SOFTWARE <br />
  35. 35. PSICOLOGIA (MUY EXTENSO) ; ECONOMÍA (MAXIMIZAR PRODUCCION, DISMINUIR COSTO Y LABOR) , MERCADEO, BIOMEDICINA, GEOQUÍMICA (ASOCIACIONES ENTRE MINERALES), ECOLOGÍA, HIDROQUÍMICA, DNA (ANÁLISIS), EDUCACIÓN.<br />USOS <br />
  36. 36. EL OBJETIVO FINAL ES DETERMINAR UN NIVEL DE CORRESPONDENCIA ENTRE EL MODELO DE FACTORES COMUNES Y EL MUNDO REAL. NUNCA SERA EXACTO, SERÁ TAN PRECISO COMO CUÁNTO ES POSIBLE IDENTIFICAR Y RELACIONAR LOS ATRIBUTOS ESCONDIDOS, LA VARIANZA Y LA COVARIANZA ENTRE FACTORES. <br />ESTA ES LA ESENCIA DEL PROCESO, ESTABLECER COMO UNA VARIABLE DEPENDE DE CIERTOS PESOS Y FACTORES.<br />MODELO Y MUNDO REAL <br />
  37. 37. http://www.unc.edu/~rcm/book/factor.pdf<br />http://www.spss.com/<br />http://www.scribd.com/doc/39123193/A-Beginners-Guide-to-Structural-Equation-Modeling<br />http://www.ats.ucla.edu/stat/sas/output/factor.html<br />http://support.sas.com/documentation/cdl/en/statugmultivariate/61757/PDF/default/statugmultivariate.pdf<br />BIBLIOGRAFIA<br />
  38. 38. GRACIAS POR SU ATENCIÓN<br />GRACIAS POR SU ATENCIÓN<br />

×