Pasw Antes Spss

  • 1,213 views
Uploaded on

Curso de SPSS departamento de derecho, impartido por Adolfo Castillo Navarro y Edgar Oswaldo Gonzalez Bello

Curso de SPSS departamento de derecho, impartido por Adolfo Castillo Navarro y Edgar Oswaldo Gonzalez Bello

More in: Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
1,213
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
43
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.
  • SPSS Inc. Copyright 2006 SPSS Inc.

Transcript

  • 1.
    • PASW como herramienta tecnológica para el análisis de datos cuantitativos
    MIE. Edgar Oswaldo González Bello MGTI. Adolfo Castillo Navarro. Universidad de Sonora
  • 2.
    • Previo
    • Computadora personal.
    • Datos de investigación tipo cuantitativa.
    • Conocimientos básicos de estadística.
    • Utilidad de las herramientas tecnologías en los procesos de investigación.
    • Importancia de procesamiento de datos por parte del investigador (errores).
  • 3.
    • Qué es PASW (SPSS)?
    • Es un programa estadístico de Análisis de datos de aplicación en la investigación y la mercadotecnia.
    • Ofrece ventajas de realizar cálculos mas complejos de la estadística de manera eficiente y eficaz, y con un mínimo de esfuerzos.
    • Introducción e historia ( 42 años ).
      • 1968 Desarrollo y soporte en la Universidad de Chicago
      • 1975 Empresa SPSS Inc.
      • Multiplataforma (Windows, Linux y Mac)
  • 4.
    • Objetivo
    • Que se pretende en el curso?
    • Desarrollar habilidades en el manejo del programa de análisis estadístico para aplicación en la investigación educativa del tipo cuantitativa.
    • Para que sirve?
    • Importancia de procesamiento de datos por parte del investigador (manejar sus propios datos sin errores).
    • Es imprescindible que el investigador mantenga el control de la situación en todo momento, y sea el quien se convierta en el tomador de decisiones; ya que el software lo único que hace es obedecer una orden, pero no manifiesta en ningún momento si el diseño de nuestro estudio es el adecuado, si la técnica es la idónea, etc.
  • 5.
    • Tema 1 Generalidades
  • 6.
    • Iniciamos
    • Paquete estadístico utilizado.
      • Versiones 16,17,18.
      • Nuevas pruebas no paramétricas
      • visualizaciones interactivas
    • Instalación y ejecución.
    • Ventanas, estructura y rutinas elementales de funcionamiento.
  • 7.
    • Tema 2 Datos
  • 8.
    • Datos
    • Aspectos previos a la preparación de datos.
    • Vista de menús -> Vista de datos, vista de variables
    • Formatos de los datos
    • Matriz de datos
    • Menú vista variables
  • 9.
    • Datos
    • Introducción de datos con el PASW
      • Definición de variables
      • Tipos de variables considerando la escala de medida
      • Introducción de datos
  • 10.
    • Escalas de medida
  • 11.
    • Datos…
    • Codificación de respuestas en relación a sus datos.
      • Preguntas de cuestionario abiertas (cualitativas).
    • Almacenamiento de datos.
      • Concientización sobre la perdida de datos.
    • Revisión, depuración y verificación de la información capturada.
    • Lectura de datos de archivos externos.
      • Archivos de Excel y Bases de datos.
  • 12.
    • Tema 3 Estadística descriptiva
  • 13.
    • Estadística Descriptiva
    • Análisis descriptiva
    • Análisis de frecuencia
    • Frecuencia de variables nominales y ordinales.
    • Resultados en PASW: visor de resultados y editor de gráficos.
    • Análisis de respuestas múltiples categóricas
    • Análisis de respuestas múltiples dicotómicas
    • Estadísticos descriptivos de una variable
  • 14.
    • Tablas de contingencia
    • Analizan variables cualitativas medidas en escalas nominales u ordinales, estando interesados en analizar el grado de la dependencia existente entre ellas (que llamaremos asociación) y el tipo de ésta. Son el equivalente a las Tablas de Frecuencia Bidimensionales cuando las variables analizadas son cualitativas.
    el propósito de la investigación, qué es lo que queremos lograr, qué deseamos saber,
  • 15.
    • Tablas de contingencia
    • Los grados de asociación se han ideado diversos procedimientos, denominados coeficientes de asociación, entre los que destacaremos los siguientes:
    • Coeficiente de contingencia C de K. Pearson : Tiene un campo de verificación de entre 0 y 1. Una relación perfecta ocurre cuando este coeficiente se iguala a 1, en tanto que en 0 se dice que las variables investigadas son independientes.
    • Coeficiente T de Tschuprow : igualmente varía de 0 a 1.
    • Coeficiente V de Cramer : se trata de un coeficiente que toma el valor de 1 cuando existe asociación perfecta entre atributos, cualquiera que sea el número de filas y columnas de la tabla de contingencia analizada.
  • 16.
    • Tablas de contingencia
    • Coeficiente Lambda de Goodman y Kruskall : Suponiendo que se ha elegido Y como factor explicado y X como explicativo, se evalúa la capacidad de X para predecir Y mediante el coeficiente λx. Tanto λx como λy varían entre 0 y 1 y están especialmente pensadas como medidas asimétricas.  Si λ se aproxima a 1 existe asociación entre X e Y, y se se aproxima a cero existirá independencia.
    • Coeficiente Gamma de Goodman y Kruskall : Se basa en la relación relativa que siguen los rangos de dos atributos expresados en escala ordinal. La perfecta asociación positiva se da cuando y=1. La perfecta asociación negativa cuando y=-1, y la independencia de valores se da cuando y=0.  La asociación será tanto mayor cuanto más se aproxime “y”, en valor absoluto, a la unidad (-1<=y<=1).
  • 17.
    • Tablas de contingencia
    • Coeficiente de correlación de rangos de Kendall : Se trata de medidas de asociación para factores ordinales. La perfecta asociación positiva se da cuando ta=1. La perfecta asociación negativa se da cuando ta=-1, y la independencia se da cuando ta=0. La asociación será tanto mayor cuanto más se aproxime ta en valor absoluto, a la unidad.
    • Coeficiente “d de Somers” : La perfecta asociación positiva se da cuando d=1, asociación negativa cuando d=-1, y la independencia se da cuando d=0. La asociación será tanto mayor, cuánto más se aproxime d, en valor absoluto, a la unidad.
    • Coeficiente Eta : se utiliza cuando el atributo dependiente se mide en un intervalo y el atributo independiente se mide en una escala ordinal o nominal. El rango se mide igual que los coeficientes anteriores, 1 para una relación perfecta, y 0 cuando existe independencia de variables.
  • 18. Ejemplo
    • El nivel de estudios que la mayoría de la población posee es de “bachillerato” con un 42.1%, le siguen estudios Universitarios con un 24.5% , Educación Básica con un 21.3% y primaria con un 12.1%. Del 53.1% de mujeres, el 22.4% posee estudios universitarios, en tanto que del 46.9% de caballeros, el 11.9 posee estudios Universitarios.
  • 19.
    • Tema 4 Ventana Editor de datos
  • 20.
    • Menú Datos
    • Definir propiedades de variables (etiqueta los valores de las variables y define otras propiedades después de explorar datos);
    • Copiar propiedades de datos (permite copiar sobre el archivo de datos de trabajo, las propiedades de un conjunto de datos y de las variables seleccionadas);
    • Definir fechas (Definir fechas genera variables de fecha que se pueden utilizar para establecer la periodicidad de una serie temporal y para etiquetar los resultados de los análisis de series temporales);
    • Insertar caso (permite insertar un caso en el editor);
  • 21.
    • Menú Datos (continuación)
    Ordenar casos (permite ordenar casos según criterios preestablecidos); Transponer (transpone filas por columnas en el editor de datos); Reestructurar (reestructura los datos de varias variables –columnas- en un único caso y convertirlos en grupos de casos relacionados –filas- y viceversa); Fundir archivos (permite mezclar archivos por casos o por variables); Agregar (permite agregar variables a un archivo); Diseño ortogonal (admite diseñar y mostrar diseños factoriales ortogonales); Segmentar archivo (admite segmentar archivos según ciertos criterios); Seleccionar casos (admite la elección de uno o varios casos); Ponderar casos (permite la ponderación de casos).
  • 22.
    • Menú Transformar
    Calcular variable (realiza cálculos); Contar valores dentro de los casos (encuentra frecuencias absolutas de valores); Recodificar en las mismas variables (recodifica los valores de una variable); Recodificar en distintas variables (recodifica los valores en distintas variable); Asignar rangos a casos (crea nuevas variables que contienen rangos); Crear serie temporal (crea una variable tipo serie de tiempo); Reemplazar valores perdidos (Reemplazar valores perdidos creando nuevas variables);
  • 23.
    • Menú Analizar
    Informes, Estadísticos descriptivos, Tablas, Comparar medias, Modelo lineal general, Modelos mixtos, Correlaciones, Regresión, Loglineal, Reducción de datos, Escalas, Pruebas no paramétricas, Series temporales, Supervivencia y Respuesta múltiples.
  • 24.
    • Menú Analizar (submenú Informes)
    • Cubos OLAP (del inglés On-Line Analytic Processing -Procesamiento analítico interactivo-, calcula totales, medias y otros estadísticos univariados para variables de resumen continuas dentro de las categorías de una o más variables categóricas de agrupación);
    • Resúmenes de casos (calcula estadísticos de subgrupo para las variables dentro de las categorías de una o más variables de agrupación);
    • Informe de estadísticos en filas (genera informes en los cuales se presentan distintos estadísticos de resumen en filas);
    • Informe de estadísticos en columnas (genera informes de resumen en los que diversos estadísticos de resumen aparecen en columnas distintas).
  • 25.
    • Menú Analizar (submenú Estadísticos descriptivos)
    • Frecuencias (muestra estadísticos y representaciones gráficas que resultan útiles para describir muchos tipos de variables, y es un buen procedimiento para la inspección inicial de datos);
    • Descriptivos (presenta estadísticos de resumen univariados para varias variables en una única tabla y calcula valores tipificados, denominados generalmente como puntuaciones “Z”);
    • Explorar (genera estadísticos de resumen y representaciones gráficas, bien para todos los casos o bien de forma separada para grupos de casos);
  • 26.
    • Menú Analizar (submenú Estadísticos descriptivos)
    Tablas de contingencia (crea tablas de clasificación doble y múltiple y, además, proporciona una serie de pruebas y medidas de asociación para las tablas de doble clasificación); Tablas de contingencia (crea tablas de clasificación doble y múltiple y, además, proporciona una serie de pruebas y medidas de asociación para las tablas de doble clasificación); Razón (brinda una amplia lista de estadísticos de resumen para describir la razón entre dos variables de escala, por ej. mediana, moda, desviación típica, máximos y mínimos, y otros muy usuales en investigación).  
  • 27.
    • Menú Analizar (submenú Tablas)
    Tablas personalizadas (el investigador selecciona las variables y las medidas de resumen que aparecerán en la tabla); Conjuntos de respuestas múltiples (se utiliza para agrupar frecuencias de respuestas por indicadores y variables); Se puede realizar todo tipo de análisis y mostrarlos de diversas maneras, siempre en formato de tablas.
  • 28.
    • Menú Analizar (submenú comparar medias)
    Medias (calcula medias de subgrupo y estadísticos univariados relacionados para variables dependientes dentro de las categorías de una o más variables independientes); Prueba T para una muestra (contrasta si la media de una sola variable difiere de una constante especificada); Prueba T para muestras independientes (compara las medias de dos grupos de casos); Prueba T para muestras relacionadas (compara las medias de dos variables de un solo grupo); ANOVA de un factor (este procedimiento genera un análisis de varianza de un factor para una variable dependiente cuantitativa respecto a una única variable de factor -variable independiente-).
  • 29.
    • Menú Analizar (submenú modelo lineal general)
    Univariante (proporciona un análisis de regresión y un análisis de varianza para una variable dependiente mediante uno o más factores o variables); Multivariante (proporciona un análisis de regresión y un análisis de varianza para variables dependientes múltiples por una o más covariables o variables de factor); Medidas repetidas (analiza grupos de variables dependientes relacionadas que representan diferentes medidas del mismo atributo); Componentes de la varianza (se emplea para modelos de efectos mixtos, estima la contribución de cada efecto aleatorio a la varianza de la variable dependiente).
  • 30.
    • Menú Analizar (submenú modelos mixtos)
    Opción Lineales (en este cuadro de diálogo le facilita al investigador seleccionar variables que definen sujetos y observaciones repetidas, y elegir una estructura de covarianzas para los residuos).
    • Menú Analizar (submenú correlaciones)
    Correlaciones (incluye correlaciones parciales, bivariadas y distancias).
  • 31.
    • Menú Analizar (submenú Regresión)
    Lineales (estima los coeficientes de un modelo lineal, con una o más variables independientes, que mejor prediga el valor de la variable dependiente); Estimación curvilínea (genera estadísticos de estimación curvilínea por regresión y gráficos relacionados para varios modelos diferentes de estimación curvilínea por regresión); Logística binaria (es de mucha utilidad para los casos en los que se desea predecir la presencia o ausencia de una característica o resultado según los valores de un conjunto de variables predictoras); Logística multinomial (es útil en aquellas situaciones en las que el investigador desee poder clasificar a los sujetos según los valores de un conjunto de variables predictoras);
  • 32.
    • Menú Analizar (submenú Regresión)
    Ordinal (permite dar forma a la dependencia de una respuesta ordinal politómica sobre un conjunto de predictores, que pueden ser factores o covariables); Probit (mide la relación entre la intensidad de un estímulo y la proporción de casos que presentan una cierta respuesta a dicho estímulo); No lineal (es un método para encontrar un modelo no lineal para la relación entre la variable dependiente y un conjunto de variables independientes); Estimación ponderada (permite calcular los coeficientes de un modelo de regresión lineal mediante mínimos cuadrados ponderados -MCP, WLS-, de forma que se les dé mayor ponderación a las observaciones más precisas -es decir, aquéllas con menos variabilidad- al determinar los coeficientes de regresión); Mínimos cuadrados en dos fases (utiliza variables instrumentales que no estén correlacionadas con los términos de error para calcular los valores estimados de los predictores problemáticos); Escalamiento óptimo (amplía la aproximación típica mediante un escalamiento de las variables nominales, ordinales y numéricas simultáneamente).
  • 33.
    • Menú Analizar (submenú Loglineal)
    Analiza las frecuencias de las observaciones incluidas en cada categoría de la clasificación cruzada de una tabla de contingencia, e incluye los apartados de General, Logit y Selección del modelo . )
  • 34.
    • Menú Analizar (submenú clasificar)
    Conglomerados bietapico (es una herramienta de exploración que descubre las agrupaciones naturales -o conglomerados- de un conjunto de datos que, de otra manera, no sería posible detectar); Conglomerado de K medias (con este procedimiento se intenta identificar grupos de casos relativamente homogéneos basándose en las características seleccionadas y utilizando un algoritmo que puede gestionar un gran número de casos); Conglomerados jerárquicos (combina los conglomerados basándose en las características seleccionadas y los clasifica en orden de jerarquía); Discriminante (este análisis resulta útil para las situaciones en las que se desea construir un modelo predictivo para pronosticar el grupo de pertenencia de un caso a partir de las características observadas de cada uno de ellos). Se utiliza cuando se requiere análisis de conglomerados.
  • 35.
    • Menú Analizar (submenú reducción de dimensiones)
    Análisis factorial (identifica variables subyacentes, o factores, que expliquen la configuración de las correlaciones dentro de un conjunto de variables observadas); Análisis de correspondencias (describe las relaciones existentes entre dos variables nominales, recogidas en una tabla de correspondencias, sobre un espacio de pocas dimensiones, mientras que al mismo tiempo se describen las relaciones entre las categorías de cada variable); Escalamiento óptimo (permite realizar escalados de las variables, cual se tratara de un mapa).
  • 36.
    • Menú Analizar (submenú Escala)
    Análisis de fiabilidad (permite estudiar las propiedades de las escalas de medición y de los elementos que las constituyen); Escalamiento multidimensional (trata de encontrar la estructura de un conjunto de medidas de distancia entre objetos o casos); Escalamiento multidimensional -PROXSCAL- (su propósito es encontrar la estructura existente en un conjunto de medidas de proximidades entre objetos).
  • 37.
    • Menú Analizar (submenú Pruebas no paramétricas)
  • 38.
    • Menú Analizar (submenú Pruebas no paramétricas-cuadros de diálogos antiguos)
    Chi-cuadrado (tabula una variable en categorías y calcula un estadístico de chi-cuadrado); Binomial (compara las frecuencias observadas de las dos categorías de una variable dicotómica con las frecuencias esperadas en una distribución binomial con un parámetro de probabilidad especificado. Por defecto, el parámetro de probabilidad para ambos grupos es 0,5); Rachas (contrasta si es aleatorio el orden de aparición de dos valores de una variable);
  • 39.
    • Menú Analizar (submenú Pruebas no paramétricas-cuadros de diálogos antiguos)
    K-S de 1 muestra (Prueba de Kolmogorov-Smirnov para una muestra compara la función de distribución acumulada observada de una variable con una distribución teórica determinada, que puede ser la normal, la uniforme, la de Poisson o la exponencial); 2 muestras independientes (compara dos grupos de casos existentes en una variable); K muestras independientes (realiza pruebas para varias muestras independientes compara dos o más grupos de casos respecto a una variable); 2 muestras relacionadas (compara las distribuciones de dos variables); K muestras relacionadas (compara las distribuciones de dos o más variables).
  • 40.
    • Menú Analizar (submenú Supervivencia)
    Tablas de mortalidad (se utiliza en situaciones en las se desea examinar la distribución de un período entre dos eventos, como por ejemplo, la duración del empleo) Kaplan-Meier (se basa en la estimación de las probabilidades condicionales en cada punto temporal cuando tiene lugar un evento y en tomar el límite del producto de esas probabilidades para estimar la tasa de supervivencia en cada punto temporal); Regresión de Cox (es un método para crear modelos para datos de tiempos de espera hasta un evento con casos censurados presentes); Cox con covariable dependiente del tiempo (denominado también modelo de regresión de Cox extendido, el cual permite especificar las covariables dependientes del tiempo).
  • 41.
    • Menú Analizar (submenú Respuesta múltiple)
    Definir conjuntos de variables (agrupa variables elementales en conjuntos de categorías múltiples y de dicotomías múltiples, para los que se pueden obtener tablas de frecuencias y tablas de contingencia);  
  • 42.
    • Datos perdidos
    Datos perdidos porque la pregunta no afectaba a dicho entrevistado, etc. Un entrevistado se niega a responder Los valores de datos especificados como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayoría de los cálculos.
  • 43.
    • Tema 5 Tabla de frecuencias
  • 44.
    • Tabla de frecuencias
    • Lectura de tablas de frecuencia
  • 45.
    • Tema 6 Creación y transformación de variables y datos
  • 46.
    • Creación y transformación de variables y datos
    • Crear variables nuevas.
    • Decodificar variables.
    • Re codificación automática.
    • Categorizar variables.
    • Re codificar en las mismas variables.
    • Cálculos y operaciones: procedimiento calcular
    • Creación de nuevas variables uniendo valores de variables de origen (contar apariciones)
    • Selección de casos mediante criterios condicionales
  • 47.
    • Tema 7 Depuración de la información
  • 48.
    • Depuración de la información
    • Listado de valores de las variables
    • Preguntas filtro y preguntas filtradas
    • Comprobación de consistencias lógicas entre variables
    • Nivel de representatividad e las respuestas obtenidas
    • No respuesta parcial. Utilización del menú “reemplazar valores perdidos”
  • 49.
    • Tema 8 Correlaciones
  • 50.
    • Correlaciones
    • Correlaciones bivariadas
    • Correlaciones parciales
  • 51.
    • Tema 9 Selección y ponderación de casos
  • 52.
    • Selección y ponderación de casos
    • Selección de casos
    • Ponderación de casos
  • 53.
    • Tema 10 Comparación de medias
  • 54.
    • Comparación de medias
    • Obtención de medias de las variables
    • Comparación de una media empírica
    • Relación entre dos variables: Análisis bivariable
    • Análisis simple de varianza
  • 55.
    • Tema 11 Gráficos Exportar gráficos a Excel etc.
  • 56.
    • Gracias por su atención