CONCEPTOS DE ESTADISTICA spss

11,228 views
10,784 views

Published on

CONCEPTOS DE ESTADÍSTICA spss

Published in: Education
2 Comments
1 Like
Statistics
Notes
No Downloads
Views
Total views
11,228
On SlideShare
0
From Embeds
0
Number of Embeds
571
Actions
Shares
0
Downloads
513
Comments
2
Likes
1
Embeds 0
No embeds

No notes for slide

CONCEPTOS DE ESTADISTICA spss

  1. 1. Lenin H. Cari Mogrovejo
  2. 2. PROCESO DE INVESTIGACIÓN 4 6 FORMULACIÓN DEL OPERACIONALIZACIÓN MARCO TEÓRICO (INDICADORES) 1 2 3 8 INSTRUMENTOS DE FORMULACIÓN DELIMITACIÓNÁREA TEMÁTICA RECOLECCIÓN DE DEL PROBLEMA DEL PROBLEMA DATOS 5 7 RESPUESTA TÉCNICAS DE DISEÑO CONCRETO RECOLECCIÓN DE DATOS SÍNTESIS Y ANÁLISIS DE LOS PROCESAMIENTO DATOS CONCLUSIONES DATOS DE DATOS 12 11 10 9
  3. 3. La propuesta de investigación Se inicia con una IDEA PRELIMINAR Debe ser PROPUESTAPermitirá estructurarla RELEVANTE Si es necesarioSITUACIÓN JUSTIFICAR LAPROBLEMÁTICA INVESTIGACIÓN PROGRAMA DE TRABAJOSe selecciona un Que permita Cuyo cumplimiento debe PROBLEMA establecerPor el cual se plantea un Evidencia para evaluar MÉTODO OBJETIVO Con base en ellos se Se someten a pruebas Construye el a través MARCO TEÓRICO CONTRIBUCIÓN PERSONAL HIPÓTESISQue permite articular Que es la Del cual emananConsistente con MODELO PARTICULAR
  4. 4. DEFINICIÓN Y MEDICIÓN DE VARIABLES
  5. 5. IDENTIFICACIÓN DE LAS VARIABLES La identificación de las variables comienza con la explicitación de las mismas en:  El problema,  Los objetivos y  Continúa cuando se trabaja el marco teórico, momento en el que:  Se identifican y conceptualizan las variables. Pero no tiene importancia si es que las variables no son definidas y precisadas; esto se hace con el fin de establecer como se va a entender cada término a fin de evitar confusiones o ambigüedades. La identificación de la variables es un elemento crucial, puesto que permite establecer como se van a medir.
  6. 6. IDENTIFICACIÓN DE LAS VARIABLESEjemplo: Factores económicos y culturales relacionados con el rendimiento académico de los estudiantes.  VI: factores económicos y culturales.  VD: rendimiento académico.  Otras variables: procedencia, disponibilidad económica, hábitos de estudio, otras. El marco teórico define y describe las variables, además probablemente aporte otras:  Ingreso económico de los padres, tipo de vivienda, servicios básicos, etc.  profesión de los padres, disponibilidad de textos de consulta, lugar para estudiar.  Si la revisión bibliográfica plantea la importancia de las mismas u otras variables en el rendimiento académico; estas deben considerarse.
  7. 7. OPERACIONALIZACIÓN DE VARIABLES  Definir y operacionalizar las variables es una de las tareas más difíciles del proceso de investigación.  Es un momento de gran importancia pues tendrá repercusiones en todos los momentos siguientes.  La operacionalización es el proceso de llevar una variable desde un nivel abstracto a un plano más concreto.  La función básica es precisar al máximo el significado que se le otorga a una variable en un determinado estudio.  También debemos entender el proceso como una forma de explicar cómo se miden las variables que se han seleccionado.
  8. 8. OPERACIONALIZACIÓN DE VARIABLES  Las variables deben ser claramente definidas, para que tanto el investigador como asesores, correctores y otros, puedan entender claramente el objetivo de la variable.  Algunas variables no ofrecen dificultad en su descripción, definición y medición, Ej: Edad, ingreso, años, genero, Nº de hijos, etc.  Algunas variables deben ser objetivadas y homogeneizadas en relación a su significado dentro del estudio, Ej: calidad de vida, trato humanizado al paciente, satisfacción usuaria, etc.  Los fenómenos en los que se interesa el investigador deben ser traducidos en fenómenos observables y medibles.
  9. 9. OPERACIONALIZACIÓN DE VARIABLES Las variables deben ser descompuestas en dimensiones y estas a su vez traducidas en indicadores que permitan la observación directa y la medición.Ej:Variable: EDAD.Definición conceptual: Cantidad de años, meses y díascumplidos a la fecha de aplicación del estudio.Dimensión: El numero de años cumplidos.Indicador: Cálculo a partir de fecha de nacimiento en sucédula de identidad.Instrumento: Encuesta.
  10. 10. PROCESO DE OPERACIONALIZACIÓNDE VARIABLES Concepto Variable Teórica Definición conceptual Dimensiones Definición operacional de cada dimensión Indicadores Variable Empírica Instrumento
  11. 11. PROCESO DE OPERACIONALIZACIÓNDE VARIABLES Variables Definición Dimensiones Indicadores Conceptual Accesibilidad a Mayor o menor Accesibilidad Tiempo medido en horas y los servicios de posibilidad de tomar Geográfica minutos que tarda una salud contacto con los SS persona en trasladarse para recibir asistencia desde su domicilio al centro de salud Accesibilidad Cantidad de dinero que Económica gasta para recibir atención Disponibilidad económica para cubrir ese gasto Accesibilidad Conocimientos sobre la Cultural atención que se da en centro de salud. Percepción del problema de salud
  12. 12. VARIABLE INDEPENDIENTECondiciones en el ambiente físico de trabajoVARIABLE DEPENDIENTERendimiento laboralVARIABLES INTERVINIENTESEl salarioEl horario de trabajoLa distribución de funciones
  13. 13. CUADRO DEMOSTRATIVO DE LA OPERACIONALIZACIÓN DE VARIABLESOBJETIVO VARIABLE Sub- Variable INDICADORES INSTRUMENTOESPECÍFICO *Condiciones -Variedad Tipo de equipo del equipo de trabajo -Actualización Años de uso -Funcionalidad Funcionamiento Cuestionario -Mantenimiento Frecuencia delEstudiar la mantenimientoinfluencia delascondicionesdel ambiente -Cantidad de Nº de asuntosfísico del *Rendimiento trabajo resueltos por díatrabajo en el laboralrendimiento -Calidad de Cantidad y tipo Cuestionariolaboral trabajo de fallas en las comunicaciones Cantidad y tipo de quejas de usuarios
  14. 14. TÉCNICAS DE ANÁLISISDE DATOS 14
  15. 15. Técnicas de análisis de datos La técnica de análisis se elige en función de los objetivos de la investigación, el número de variables y su medición. ESCALAS DE MEDICIÓN:  Nominal: asignación de un número a cada categoría Sexo: hombre (1), mujer (2)  Ordinal: existe un orden entre categorías Estudios: sin estudios (1), primarios (2), superiores (3)  Intervalo: existe un orden y la misma distancia entre categorías, el punto cero existe. Grados de temperatura, valoración del servicio en un hotel (-2, -1, 0, +1, +2)  Razón o proporción: similar al intervalo pero el punto cero o de origen indica ausencia. Edad en años, número anual de kilómetros recorridos, etc. 15
  16. 16. Técnicas de análisis de datos Según el número de variables y la escala de medición existen tres tipos de técnicas: univariables, bivariables y multivariables. TÉCNICAS UNIVARIABLES Se analiza cada variable de forma aislada. Descriptiva (medidas resumen), Inferencial (extrapola a la población). TÉCNICAS ESCALA DE MEDICIÓN DE LA VARIABLE UNIVARIABLES Nominal Ordinal Intervalo y Razón Moda Mediana Media, mediana, moda Estadística Frecuencias y Cuartiles Desviación típica descriptiva porcentajes Rango intercuartil Varianza Coef. de variación Estadística Prueba chi -cuadrado Prueba Komolgorov - Prueba z (n  30) Prueba binomial Smirnov Prueba t (n < 30) inferencial 16
  17. 17. Técnicas de análisis de datos TÉCNICAS BIVARIABLES Establece relación o asociación entre dos variables y mide su intensidad.  Relaciones descriptivas de asociación (sexo y categoría de comprador)  Relaciones causales (causa-efecto), experimentación. Las más utilizadas son X2 y el análisis de la varianza. 17
  18. 18. Técnicas de análisis de datos TÉCNICAS BIVARIABLES ESCALA DE MEDICIÓN DE LAS VARIABLES Nominal Ordinal Nominal u Ordinal (agrupación) Intervalo y Razón Razón o Intervalo (dependiente) Tablas de Tablas de contingencia Medias por grupos Coeficiente de correlaciónEstadística contingencia. y de correlación. Desviación típica. lineal. Coeficientes de Coef. correlación de Coeficiente eta. Tablas de correlación.descriptiva asociación: Phi, V rangos de Spearman. Regresión simple. de Cramer, Coeficiente Tau. Lambda. Coeficiente Gamma.Estadística Prueba Chi- Prueba Chi-cuadrado. Análisis de la varianza. Prueba t sobre coeficiente deInferencial cuadrado. Prueba de Mann-Whitney. regresión. Prueba de Komolgorov-Smirnov. Prueba z de diferencia de Prueba de Kruskal-Wallis medias.Muestras Test de la Mediana. Prueba t de diferencia deindependientes mediasMuestras Prueba de Test de Wilcoxon y derelacionadas McNemar. los signos. Test de Cochran. Test de Friedman. 18
  19. 19. TÉCNICAS MULTIVARIABLES Análisis simultáneo de más de dos variables. Dependencia: analizan una o más variables dependientes a través dos o más variables independientes, para explicar un fenómeno y/o realizar un análisis como base de una predicción.  Técnicas: regresión múltiple, análisis de varianza y conjunto. Interdependencia: estudian la interrelación entre todas las variables como un conjunto. Su objetivo puede ser organizar los datos reduciendo su dimensionalidad y haciéndolos más manejables para el investigador u ofrecer una mayor compresión global de su estructura subyacente.  Técnicas: métodos factoriales, análisis cluster, escalamiento multidimensional métrico y no métrico 19
  20. 20. Técnicas de análisis de datos TÉCNICAS MULTIVARIABLES DE DEPENDENCIA VARIABLES DEPENDIENTES VARIABLES Una variable dependiente Más de una variable dependiente INDEPENDIENTES Métrica No métrica Métrica No métrica Nominal OrdinalDe intervalo Regresión Análisis Transformación Correlación Correlación canónica Múltiple. discriminante. en nominal. canónica. con variables ficticias. Modelos de CHAID. Regresión ordinal. Modelos de ecuaciones Regresión logística ecuaciones estructurales y logística estructurales. multinomial. Modelos Probit.Nominales Análisis de la Análisis Análisis conjunto. Correlación Correlación canónica varianza. discriminante con canónica con con variables ficticias. Regresión variables ficticias. variables ficticias. múltiple con Modelos log- Análisis variables lineales. multivariado de la ficticias. Regresión logística varianza. AID. y multinomial. CHAID. 20
  21. 21. INTRODUCCIÓN A LOS MODELOS DECORRELACIÓN Y REGRESIÓN LINEAL PARA VARIABLES CUANTITATIVAS
  22. 22. CORRELACIÓN ENTRE VARIABLES CUANTITATIVASVELOCIDAD B TIEMPO A
  23. 23. CARA 0 1 2 3 4 5 6 7 8 9 10SELLA 10 9 8 7 6 5 4 3 2 1 0
  24. 24. CARA 0 1 2 3 4 5 6 7 8 9 10SELLA 10 9 8 7 6 5 4 3 2 1 0
  25. 25. PARA SONREÍR ¿QUÉ ES EL ÉXITO ?
  26. 26. CORRELACIÓN ENTRE VARIABLES CUANTITATIVASSe considera que dos variables cuantitativas estánrelacionadas entre sí cuando los valores de una de ellasvarían de forma sistemática con respecto a los valoreshomónimos de la otra. Dicho de otro modo, si tenemos dosvariables, A y B, existe relación entre ellas si al aumentarlos valores de A también lo hacen los de B, o por elcontrario si al aumentar los valores de A disminuyen los deB.• Para variables métricas, el gráfico de dispersión es lamanera más sencilla de comprobar la relación entre las dosvariables, pudiendo esta adoptar diferentes formas.• El método más usual para medir la intensidad de la relaciónlineal entre dos variables métricas es la correlaciónmomento-producto o correlación de Pearson.
  27. 27. CORRELACIÓN ENTRE VARIABLES CUANTITATIVASLos componentes fundamentales de una relación entredos variables cuantitativas son: La Fuerza El Sentido La Forma
  28. 28. CORRELACIÓN ENTRE VARIABLES CUANTITATIVAS• La fuerza mide el grado en que los pares deobservaciones quedan representados en una línea. Si lanube de observaciones es estrecha y alargada, una línearecta representará adecuadamente a la nube de puntos y ala relación y por tanto ésta será fuerte.• El sentido de la relación se refiere a cómo varían losvalores de B con respecto a A. Si al crecer los valores de lavariable A lo hacen los de B, será una relación positiva odirecta. Si al aumentar A, disminuye B, será una relaciónnegativa o inversa.• La forma establece el tipo de línea a emplear para definirel mejor ajuste. Se pueden emplear tres tipos de líneas: unalínea recta, una curva monotónica o una curva nomonotónica.
  29. 29. GRÁFICOS DE DISPERSIÓNDadas dos variables X y Y tomadas sobre el mismo elemento de la población,el diagrama de dispersión es simplemente un gráfico de dos dimensiones,donde en un eje (la abscisa) se grafica una variable (independiente), y en elotro eje (la ordenada) se grafica la otra variable (dependiente). Si las variablesestán correlacionadas, el gráfico mostraría algún nivel de correlación(tendencia) entre las dos variables. Si no hay ninguna correlación, el gráficopresentaría una figura sin forma, una nube de puntos dispersos en el gráfico.
  30. 30. DIAGRAMAS DE DISPERSIÓN ESTADÍSTICA Gráfico de puntos para variables cuantitativasDisposición: Eje de abscisas: variable independiente (X) Eje de ordenadas: variable dependiente (Y)Frecuentemente X es una variable controlada (no aleatoria)Un punto por cada observación (par de valores X-Y)Aproximación al tipo de relación existente entre las variables
  31. 31. FORMAS TÍPICAS DE LOS DIAGRAMAS DE DISPERSIÓN ESTADÍSTICA
  32. 32. EL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSONEl Coeficiente de Correlación Lineal de Pearson es uníndice estadístico que permite medir la fuerza de la relaciónlineal entre dos variables. Su resultado es un valor quefluctúa entre –1 (correlación perfecta de sentido negativo) y+1 (correlación perfecta de sentido positivo). Cuanto máscercanos al 0 sean los valores, indican una mayor debilidadde la relación o incluso ausencia de correlación entre lasdos variables. Su cálculo se basa en la expresión:
  33. 33. EL COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSONSi el coeficiente de correlación de Pearson (r) es cercano a0, las dos variables no tienen mucho que ver entre sí (notienen casi ninguna covariación lineal). Si su valor escercano a +/-1, esto significa que la relación entre las dosvariables es lineal y está bien representada por una línea.
  34. 34. CORRELACIÓN LINEALES ENTRE VARIABLES CUANTITATIVAS• A pesar del hecho que el coeficiente de Pearson es capaz demanejar solamente dos variables, es fácil calcular una matriz decorrelación entre todos los pares potenciales de variables, paraluego evaluar aquellas relaciones relevantes.• Un aspecto débil del análisis de correlación es que sólo detectala parte lineal de las relaciones entre las variables. Por ejemplo, unarelación que obedece a una ecuación curvilineal pasaríainadvertida.• Sin embargo, las variables a evaluar pueden experimentartransformaciones que permite su “linealización”, para cualresulta previamente necesario conocer la forma exacta de larelación.
  35. 35. EJEMPLO CORRELACIÓN Total Ocupados entre 25 y 45 años (con ingresos) a Correlati ons Ingres o horario de Cantidad la Años de de hijos ocupación est udio Niv el de menores ppal (aprox .) Instrucción de 12 añosIngres o horario de la Pears on C orrelation 1, 000 ,354** ,365** -, 072**ocupación ppal Sig. (2-t ailed) , ,000 ,000 ,000Años de estudio (aprox .) Pears on C orrelation ,354** 1, 000 ,945** -, 223** Sig. (2-t ailed) ,000 , ,000 ,000Niv el de Ins trucción Pears on C orrelation ,365** ,945** 1, 000 -, 217** Sig. (2-t ailed) ,000 ,000 , ,000Cantidad de hijos Pears on C orrelation -, 072** -, 223** -, 217** 1, 000menores de 12 años Sig. (2-t ailed) ,000 ,000 ,000 , **. Correlat ion is signif icant at the 0. 01 lev el (2-tailed). a. List wise N=10338
  36. 36. EJEMPLO CORRELACIÓN Total Ocupados entre 25 y 45 años (con ingresos) Varones a Correlati ons Ingres o horario de Cantidad la Años de de hijos ocupación est udio Niv el de menores ppal (aprox .) Instrucción de 12 añosIngres o horario de la Pears on C orrelation 1, 000 ,341** ,352** -, 071**ocupación ppal Sig. (2-t ailed) , ,000 ,000 ,000Años de estudio (aprox .) Pears on C orrelation ,341** 1, 000 ,940** -, 202** Sig. (2-t ailed) ,000 , ,000 ,000Niv el de Ins trucción Pears on C orrelation ,352** ,940** 1, 000 -, 191** Sig. (2-t ailed) ,000 ,000 , ,000Cantidad de hijos Pears on C orrelation -, 071** -, 202** -, 191** 1, 000menores de 12 años Sig. (2-t ailed) ,000 ,000 ,000 , **. Correlat ion is signif icant at the 0. 01 lev el (2-tailed). a. List wise N=5844
  37. 37. EJEMPLO CORRELACIÓN Total Ocupados entre 25 y 45 años (con ingresos) Mujeres a Correlati ons Ingres o horario de Cantidad la Años de de hijos ocupación est udio Niv el de menores ppal (aprox .) Instrucción de 12 añosIngres o horario de la Pears on C orrelation 1, 000 ,402** ,414** -, 075**ocupación ppal Sig. (2-t ailed) , ,000 ,000 ,000Años de estudio (aprox .) Pears on C orrelation ,402** 1, 000 ,949** -, 251** Sig. (2-t ailed) ,000 , ,000 ,000Niv el de Ins trucción Pears on C orrelation ,414** ,949** 1, 000 -, 251** Sig. (2-t ailed) ,000 ,000 , ,000Cantidad de hijos Pears on C orrelation -, 075** -, 251** -, 251** 1, 000menores de 12 años Sig. (2-t ailed) ,000 ,000 ,000 , **. Correlat ion is signif icant at the 0. 01 lev el (2-tailed). a. List wise N=4494
  38. 38. EJEMPLO GRAFICO DISPERSIÓNTotal Ocupados entre 25 y 45 años (con ingresos) 80 70 60 50 40 30 20 Sexo 10 Mujer 0 Varón 0 5 10 15 20 Años de estudio (aprox.)
  39. 39. Modelos de Regresión Lineal Problemas de Causalidad El investigador suele tener razones teóricas oprácticas para creer que determinada variable escausalmente dependiente de una o más variablesdistintas. Si hay suficientes observaciones empíricas sobreestas variables, el análisis de regresión es unmétodo apropiado para describir la estructura,fuerza y sentido exacto de esta asociación.
  40. 40. Modelos de Regresión Lineal Problemas de Causalidad El modelo permite diferenciar variablesexplicativas, independientes o predictivas (métricas),variables a explicar o dependientes, y variablescontrol o intervinientes (métricas o transformadas envariables categoriales). La distinción entre variables dependientes eindependientes debe efectuarse con arreglo afundamentos teóricos, por conocimiento oexperiencia y estudios anteriores. Métodos de tipo: Y : f (X, є) / Y = B0 + B1X1 + U
  41. 41. Modelos de Regresión Lineal Respuestas Metodológicas Estima la fuerza o bondad explicativa del modeloteórico independientemente de las características de lasvariables introducidas Predice el valor medio que puede asumir la variable Ydado un valor de X (regresión a la media) bajo unintervalo de confianza Estima el efecto neto de cada una de las variablesintervinientes sobre la variable dependiente (controlsobre los demás efectos suponiendo independenciaentre las variables predictivas).
  42. 42. Modelos de Regresión Lineal Función Lineal de RegresiónEl objetivo de la técnica de regresión es establecer la relaciónestadística que existe entre la variable dependiente (Y) y una omás variables independientes (X1, X2,… Xn). Para poder realizaresto, se postula una relación funcional entre las variables.Debido a su simplicidad analítica, la forma que más se utiliza enla práctica es la relación lineal: ŷ= b0 + b1x1 +… bnxndonde los coeficientes b0 y b1, … bn, son los factores quedefinen la variación promedio de y, para cada valor de x.Estimada esta función teórica a partir de los datos, cabepreguntarse qué tan bien se ajusta a la distribución real.
  43. 43. GRÁFICOS DE DISPERSIÓN / PENDIENTE DE LA RECTA• En el caso de asumir una recta, se admite que existe unaproporción entre la diferencia de dos valores A y ladiferencia entre dos valores de B. A ese factor de ajusteentre ambas series se le llama pendiente de la recta, y seasume que es constante a lo largo de toda la recta.
  44. 44. Modelos de Regresión Lineal Función Lineal de Regresión- El parámetro b0, conocido como la “ordenada en elorigen,” nos indica cuánto vale Y cuando X = 0. Elparámetro b1, conocido como la “pendiente,” nos indicacuánto aumenta Y por cada aumento en X.- La técnica consiste en obtener estimaciones de estoscoeficientes a partir de una muestra de observacionessobre las variables Y y X.- En el análisis de regresión, estas estimaciones seobtienen por medio del método de mínimos cuadrados.Logradas estas estimaciones se puede evaluar la bondadde ajuste y significancia estadística.
  45. 45. GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓNPara el cálculo de la recta de regresión se aplica el método demínimos cuadrados entre dos variables. Esta línea es la que hacemínima la suma de los cuadrados de los residuos, es decir, esaquella recta en la que las diferencias elevadas al cuadrado entrelos valores calculados por la ecuación de la recta y los valoresreales de la serie, son las menores posibles. y = a + bx
  46. 46. Modelos de Regresión Lineal Función Lineal de RegresiónUna pregunta importante que se plantea en el análisisde regresión es la siguiente: ¿Qué parte de lavariación total en Y se debe a la variación en X?¿Cuánto de la variación de Y no explica X?El estadístico que mide esta proporción o porcentajese denomina coeficiente de determinación (R2). Si porejemplo, al hacer los cálculos respectivos se obtieneun valor de 0.846. Esto significa que el modelo explicael 84.6 % de la variación de la variable dependiente.
  47. 47. CURVA MONOTÓNICA CURVA NO MONOTÓNICA• En el caso de usar una curva monotónica, ese factor de proporción entre lasdos variables no es constante a lo largo de toda la recta, y por lo tanto lapendiente de la misma es variable en su recorrido. Se dice que la línea deajuste es no lineal puesto que es una curva.• Por último, en el caso de usar una curva no monotónica varía tanto lapendiente de la curva como el sentido de la relación, que en unos sectorespuede ser positiva (ascendente) y en otros negativa (descendente).
  48. 48. FUNCIONES NO LINEALESExponenciales Logarítmicas
  49. 49. AJUSTE DE VARIABLES A FUNCIONES NO LINEALES• Hacer el diagrama de dispersión de las dos variables y evaluar si elpatrón resultante sigue la forma lineal o alguna otra función.• Identificada dicha función, substituir los valores de una variable con susvalores cuadrados, raíz cuadrada, logarítmicos o con alguna otramodificación, y hacer de nuevo la matriz de correlación.• Identificar la función que mejor ajuste por medio de un paqueteestadístico y determinar los coeficientes para la construcción de esaecuación. FUNCIONES NO LINEALES Exponencial: Logarítmica: Polinómica: y = a + bx y = a + log b x y = a + b x + c x2
  50. 50. PRÁCTICA: CORRELACIÓN DEVARIABLES Paso 1: abre el archivo EJEMPLO_ANSCOMBE.sav
  51. 51.  Gracias

×