Presentación BarbWin V6 // V7

3,061 views
2,922 views

Published on

Published in: Education, Technology, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
3,061
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
61
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Presentación BarbWin V6 // V7

    1. 1. Software Gandia Soluciones a la gestión y análisis de datos TESI, SL www.tesigandia.com
    2. 2. Familia de software Gandia <ul><li>Gandia BarbWin </li></ul><ul><ul><li>Software para proceso de datos </li></ul></ul><ul><ul><li>Productos derivados </li></ul></ul><ul><ul><ul><li>Gandia DataEntry </li></ul></ul></ul><ul><ul><ul><li>Gandia DataWin </li></ul></ul></ul><ul><ul><ul><li>Gandia Visor </li></ul></ul></ul><ul><ul><ul><li>Gandia Trans </li></ul></ul></ul><ul><li>Gandia Integra </li></ul><ul><ul><li>CatiNet, CapiNet y HapiNet integrados en una misma aplicación web. </li></ul></ul>
    3. 3. Gandia BarbWin Versión v6 y v7 TESI Departamento de formación
    4. 4. Gráfico de flujo del programa Gandia BarbWin <ul><li>Entrada de datos: </li></ul><ul><li>Interna </li></ul><ul><li>Externa </li></ul>Adecuación de datos para el proceso Proceso de datos: -Tablas -Proceso estadísticos Impresión de resultados Análisis de datos Diseño de tabla de datos
    5. 5. Gandia BarbWin <ul><li>Variables o campos de respuesto </li></ul><ul><ul><li>En Gandia BarbWin cada variable tiene sus propiedades individualizadas, de forma que dos variables del mismo tipo pueden tener opciones diferentes </li></ul></ul><ul><ul><li>Esencialmente una variable tiene tres propiedades fundamentales: NOMBRE, TIPO y CODIGOS </li></ul></ul><ul><li>Datos </li></ul><ul><ul><li>Se presentan en una matriz de k*n celdas y se puede trabajar mediante la utilización de formularios o mediante la utilización de hoja de datos </li></ul></ul>
    6. 6. El escritorio de trabajo (v6) Panel de vistas Navegador de variables Tabla de variables Tabla de datos
    7. 7. El escritorio de trabajo (v7) Panel de vistas Navegador de grupos Tabla de variables Tabla de datos
    8. 8. Panel de vistas <ul><li>El panel de vistas nos permite acceder a diferentes partes del software (grupos sólo versión 7) </li></ul><ul><li>El más importante es el acceso a ventanas, dado que nos permite realizar acciones múltiples con las mismas </li></ul>
    9. 9. Input al programa: Abrir... <ul><li>Gandia BarbWin abre archivos de datos: </li></ul><ul><ul><li>formato antiguos de BarbWin </li></ul></ul><ul><ul><li>Barbro DOS y Barbro Catibar </li></ul></ul><ul><ul><li>Archivos ASCII delimitados por tabuladores, blancos, comas, etc </li></ul></ul><ul><ul><li>Archivos ASCII sin delimitador (siempre que exista un archivo *.str con las columnas -y opcionalmente códigos- que ocupan las variables </li></ul></ul><ul><ul><li>Archivos Dbase y Paradox (*.dbf y *.db) </li></ul></ul><ul><ul><li>Archivos MsAccess </li></ul></ul><ul><ul><li>Archivos IBM Bin </li></ul></ul><ul><li>Gandia BarbWin abre otros archivos como: </li></ul><ul><ul><li>Archivos *.html (estando activa la ventana de informe) </li></ul></ul><ul><ul><li>Archivos *.tab (librerías de tablas) </li></ul></ul><ul><ul><li>Archivos de gráficos (extensión según versión) </li></ul></ul>
    10. 10. Output del programa: Guardar... <ul><li>Gandia BarbWin guarda archivos de datos: </li></ul><ul><ul><li>formatos aniguos de BarbWin 1.0, 2.0 y 3.0 </li></ul></ul><ul><ul><li>Barbro DOS </li></ul></ul><ul><ul><li>Archivos ASCII delimitados por tabuladores, blancos, comas, etc </li></ul></ul><ul><ul><li>Archivos ASCII sin delimitador (siempre que exista un archivo *.str con las columnas -y opcionalmente códigos- que ocupan las variables </li></ul></ul><ul><ul><li>Archivos Dbase y Paradox (*.dbf y *.db) </li></ul></ul><ul><ul><li>Archivos MsAccess </li></ul></ul><ul><ul><li>Archivos IBM Bin </li></ul></ul><ul><ul><li>Sintaxis de SPSS </li></ul></ul><ul><li>Gandia BarbWin guarda otros archivos como: </li></ul><ul><ul><li>Archivos *.html (estando activa la ventana de informe) </li></ul></ul><ul><ul><li>Archivos de office (xls y doc) </li></ul></ul><ul><ul><li>Archivos *.tab (librerías de tablas) </li></ul></ul><ul><ul><li>Archivos *.chf y *.chd (gráficos Chart FX) </li></ul></ul>
    11. 11. Opciones del sistema
    12. 12. Opciones de estudio
    13. 13. Tipos de variables (datos) <ul><li>Categoría (nivel de medición nominal o cualitativo) </li></ul><ul><li>Múltiples (nivel de medición nominal o cualitativo pero multi respuesta) </li></ul><ul><li>Numéricas ordinales (nivel de medición ordinal) </li></ul><ul><li>Numéricas métricas (nivel de medición de intervalo, métrica o de razón) </li></ul><ul><li>Alfanuméricas (texto) </li></ul><ul><li>Otras </li></ul><ul><ul><li>Fecha, hora, fecha grabación, hora grabación, etc. </li></ul></ul>
    14. 14. Diseño de variables <ul><li>Paso 1: </li></ul><ul><ul><li>Definir características principales </li></ul></ul><ul><ul><ul><li>Nombre </li></ul></ul></ul><ul><ul><ul><li>Tipo </li></ul></ul></ul><ul><ul><ul><li>Texto extra </li></ul></ul></ul><ul><ul><ul><li>Códigos permitidos (en categoría y múltiples) </li></ul></ul></ul><ul><ul><ul><li>Valores permitidos (numéricas) </li></ul></ul></ul><ul><li>Paso 2: </li></ul><ul><ul><li>Definir propiedades de grabación </li></ul></ul><ul><ul><ul><li>Valores por defecto </li></ul></ul></ul><ul><ul><ul><li>Saltos, filtros y controles </li></ul></ul></ul><ul><li>Paso 3: (mientras se está produciendo la entrada de datos, el técnico puede realizar las siguientes tareas...) </li></ul><ul><ul><li>Definir etiquetas de códigos </li></ul></ul><ul><ul><li>Definir variables especiales (necesarias para tabulación y/o análisis) </li></ul></ul><ul><ul><ul><li>Virtuales </li></ul></ul></ul><ul><ul><ul><li>Expresiones </li></ul></ul></ul><ul><ul><ul><li>Sinónimos </li></ul></ul></ul>
    15. 15. ¿Cómo navegamos a través de las variables? <ul><li>Una vez estamos en el diálogo de cada variable: </li></ul><ul><ul><li>Alt-Inicio sitúa en primera variable </li></ul></ul><ul><ul><li>Alt-Fin sitúa en última variable </li></ul></ul><ul><ul><li>Alt-Flecha izquierda sitúa en anterior variable </li></ul></ul><ul><ul><li>Alt-Flecha derecha sitúa en posterior variable </li></ul></ul><ul><ul><li>Alt-Flecha arriba sitúa en la siguiente pestaña de la misma variable </li></ul></ul><ul><ul><li>Alt-Flecha abajo sitúa en la anterior pestaña de la misma variable </li></ul></ul><ul><ul><li>Alt-N crea una nueva variable </li></ul></ul><ul><ul><li>Alt-B borra la variable actual </li></ul></ul>
    16. 16. Operaciones con las variables <ul><li>Existen un conjunto de órdenes en Gandia BarbWin que permiten crear o modificar variables, si tener en cuenta sus datos. En v6 están agrupadas bajo el epígrafe de Datos > Operaciones con variables, mientras que en v7 se agrupan en el menú contextual derecho de la tabla de variables. Algunas de estas opciones son: </li></ul><ul><ul><li>Nueva, que permite añadir nuevos variables a la tabla actual </li></ul></ul><ul><ul><li>Modificar accede a la edición de las propiedades individuales de la variable </li></ul></ul><ul><ul><li>Renombrar permite el cambio masivo y automático del nombre de las variables (muy aconsejador para exportar a formatos externos) </li></ul></ul><ul><ul><li>Mover accede a un diálogo donde se indicará donde ubicar la variable seleccionada </li></ul></ul>
    17. 17. Propiedades de variable: Básicas <ul><li>Características básicas </li></ul><ul><ul><li>Se definen aquellas propiedades sin las cuáles la variable no existe. </li></ul></ul><ul><li>Generales </li></ul><ul><ul><li>Varias propiedades que afectan a la visualización </li></ul></ul><ul><li>Grabación </li></ul><ul><ul><li>Controlan la forma en la que se grabará la variable: nº de caracteres, valores por defecto, valor del NC, etc. </li></ul></ul><ul><li>Tabulación </li></ul><ul><ul><li>Propiedades relacionadas con la apariencia y el tipo de resultados a ofrecer de la variables al ser tabulada o analizada. </li></ul></ul>
    18. 18. Propiedades de Variable: Grabación <ul><li>Relacionadas con el dato de grabación </li></ul><ul><ul><li>Valor por defecto, constante, dato con Intro al grabar... </li></ul></ul><ul><li>Relacionadas con el flujo y control del cuestionario </li></ul><ul><ul><li>Saltos, filtros y controles </li></ul></ul><ul><li>Relacionadas con el tamaño del campo de grabación </li></ul><ul><ul><li>Tamaño del campo (caracteres para que salte de campo a campo) </li></ul></ul><ul><li>Relacionadas con la visualización en pantalla </li></ul><ul><ul><li>Facilidades de identificación de la posición de grabación con el cuestionario en papel </li></ul></ul><ul><li>Relacionadas con el control de códigos en grabación (“editing” y codificación) </li></ul><ul><ul><li>¿Qué hacemos con un código que no está en la lista de valores permitidos o códigos? </li></ul></ul>
    19. 19. Propiedades de Variable: Otras <ul><li>Tabulación / Análisis </li></ul><ul><ul><li>Creación de bases de cálculo (%) </li></ul></ul><ul><ul><li>Rangos para cálculo de estadísticos </li></ul></ul><ul><ul><li>Bases y valores especiales (sacar de la base) </li></ul></ul><ul><ul><li>Propiedades relacionadas con mostrar o eliminar información en las tablas de contingencia y estadísticos </li></ul></ul><ul><ul><li>Ordenación de códigos por frecuencias </li></ul></ul><ul><ul><li>Cálculo de estadísticos básicos (casos, media y desviación) </li></ul></ul><ul><ul><li>Cálculo de estadísticos básicos en variables de tipo múltiple (casos y media menciones, y también % en base respuesta) </li></ul></ul><ul><ul><li>Relacionadas con las variables no codificadas </li></ul></ul><ul><li>Generales </li></ul><ul><ul><li>Relacionadas con los textos de los valores especiales </li></ul></ul><ul><ul><ul><li>Textos y valores de los códigos especiales </li></ul></ul></ul><ul><ul><li>Relacionadas con el tamaño del campo de la variable </li></ul></ul><ul><ul><ul><li>Longitud y número de decimales en los procesos </li></ul></ul></ul><ul><ul><li>Relacionadas con las menciones </li></ul></ul><ul><ul><ul><li>Dígitos no contemplados en menciones (sólo múltiples) </li></ul></ul></ul>
    20. 20. Valores especiales en Gandia BarbWin <ul><li>ASCII “&” </li></ul><ul><ul><li>Valor de no contestación </li></ul></ul><ul><li>ASCII “-” </li></ul><ul><ul><li>Valor de no procede o no grabado </li></ul></ul><ul><li>ASCII “+” </li></ul><ul><ul><li>Valor de no sabe contestar </li></ul></ul><ul><li>ASCII “ “ </li></ul><ul><ul><li>cualquier otro valor no codificado , que no sea + ó & </li></ul></ul>& - +
    21. 21. ¿Cómo y dónde escribir condiciones? <ul><li>Componentes de una condición… </li></ul><ul><ul><li>Variable </li></ul></ul><ul><ul><li>Códigos </li></ul></ul><ul><ul><li>Operadores </li></ul></ul><ul><ul><li>Funciones </li></ul></ul><ul><li>Ejemplos… </li></ul><ul><ul><li>EDAD=(55_99) </li></ul></ul><ul><ul><li>VAR59>5 Y VAR50=3 </li></ul></ul><ul><ul><li>EDAD=(0_18) Y SEXO=2 </li></ul></ul><ul><ul><li>CIUDAD=5 O (CIUDAD=3 Y SUBV1=3) </li></ul></ul><ul><ul><li>(XMEDIA(VAR1;VAR2;VAR3)>5 Y SEXO=1) O (EDAD>18 Y CIUDAD=3) </li></ul></ul>
    22. 22. Operadores lógicos <ul><li>Y, las dos proposiciones en la condición (operandos) han de ser verdaderos </li></ul><ul><li>O, una de las dos proposiciones o las dos proposiciones son verdaderas </li></ul><ul><li>NO, Y NO, la proposición que se niega es falsa </li></ul><ul><li>O NO, una proposición es falsa y la otra es verdadera </li></ul>
    23. 23. Operadores aritméticos <ul><li>Suma +, Se usa para sumar dos operandos. Sólo se pueden utilizar variables numéricas y expresiones aritméticas para efectuar esta operación </li></ul><ul><li>Resta -, Se usa para restar dos operandos. Sólo se pueden utilizar variables numéricas y expresiones aritméticas para efectuar esta operación </li></ul><ul><li>Multiplicación *, Se usa para multiplicar dos operandos. Sólo se pueden utilizar variables numéricas y expresiones aritméticas para efectuar esta operación </li></ul><ul><li>División /, Se usa para dividir dos operandos. Sólo se pueden utilizar variables numéricas y expresiones aritméticas para efectuar esta operación </li></ul><ul><li>Exponente ^,Se usa para elevar un operando a la potencia que marque otro operando. Sólo se pueden utilizar variables numéricas y expresiones aritméticas para efectuar esta operación </li></ul>
    24. 24. Operadores aritméticos <ul><li>Mayor que >, Se utiliza para comparar dos operandos, que pueden ser variables de categoría, numéricas, expresiones aritméticas, fecha y hora. </li></ul><ul><li>Menor que <, Se utiliza para comparar dos operandos, que pueden ser variables de categoría, numéricas, expresiones aritméticas, fecha y hora. </li></ul><ul><li>Mayor igual >=, Se utiliza para comparar dos operandos, que pueden ser variables de categoría, numéricas, expresiones aritméticas, fecha y hora. </li></ul><ul><li>Menor igual <=, Se utiliza para comparar dos operandos, que pueden ser variables de categoría, numéricas, expresiones aritméticas, fecha y hora. </li></ul><ul><li>Distinto < >, Se utiliza para comparar dos operandos, que pueden ser variables de categoría, numéricas, expresiones aritméticas, fecha y hora. </li></ul>
    25. 25. Funciones <ul><li>Las funciones permiten al usuario calcular valores por registro a partir de valores de ese registro o constantes. Por ejemplo calcular la media de varias variables o el valor máximo de ciertas variables. Se debe diferenciar de los cálculos para todo el fichero que por ejemplo se obtienen en análisis univariante, codificar, etc. </li></ul><ul><li>Normalmente las funciones se utilizarán en: </li></ul><ul><ul><li>condiciones de tipo aritmético </li></ul></ul><ul><ul><li>expresiones aritméticas (tipo de variable) </li></ul></ul><ul><ul><li>la orden CALCULAR (donde se escriben tanto condiciones como expresiones de tipo aritmético) </li></ul></ul><ul><ul><li>la orden REEMPLAZAR </li></ul></ul>
    26. 26. Operadores aritméticos <ul><li>=, se utiliza para comparar por igualdad dos operandos. En variables múltiples, un = permite que se cumpla individualmente las partes de la condición. </li></ul><ul><li>= =,en variables de tipo múltiple, se utiliza para seleccionar el cumplimiento estricto de una combinación múltiple, y no una de sus partes. </li></ul><ul><li>!=, se utiliza como incluido en… y siempre es el primer valor en el segundo </li></ul>
    27. 27. Funciones más habituales <ul><li>En estos casos, si existe una variable entre las que componen la función cuyo valor es especial (&, +, ) la función no se calcula. </li></ul><ul><ul><li>SUMA(exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.;...) </li></ul></ul><ul><ul><li>MEDIA (exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.;...) </li></ul></ul><ul><ul><li>DESVTIP (exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.;...) </li></ul></ul><ul><li>En estos casos, si existe una variable entre las que componen la función cuyo valor es especial (&, +, ) la función se calcula, siendo N el número de variables que tiene valor para el cálculo de los estadísticos. </li></ul><ul><ul><li>XSUMA(exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.;...) </li></ul></ul><ul><ul><li>XMEDIA (exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.;...) </li></ul></ul><ul><ul><li>XDESVTIP (exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.; exp.aritm.;...) </li></ul></ul>
    28. 28. Operaciones con los datos <ul><li>Una de las funciones esenciales de Gandia BarbWin es el manejo específico de los datos accedidos al sistema por medio de la entrada de datos o de importaciones de fuentes externas. En este segundo caso, se requiere de herramientas que permitan depurar la información </li></ul><ul><li>Estas dos diferentes situaciones dan lugar a unas operaciones localizadas en: </li></ul><ul><ul><li>v6 >>> Menú Datos > Operaciones con Datos </li></ul></ul><ul><ul><li>v7 >>> Menú Datos > DataEntry </li></ul></ul>
    29. 29. Operaciones con los datos accedidos desde el sistema <ul><li>Datos accedidos desde el DataEntry del sistema </li></ul><ul><ul><li>Registrar permite entrar los datos de forma asistida. </li></ul></ul><ul><ul><li>Modificar, permite editar registros ya grabados. </li></ul></ul><ul><ul><li>Verificar permite grabar contra lo ya grabado controlando errores. </li></ul></ul><ul><ul><li>Borrar, permite eliminar definitivamente registros que cumplan una determinada condición. </li></ul></ul><ul><ul><li>Registro aleatorios, crea una tabla de datos ficticia, válida para preparar el análisis de datos o testar los controles de flujo. </li></ul></ul><ul><ul><li>Pulsaciones, calcula el nº de pulsaciones efectuadas en una entrada de datos. </li></ul></ul>
    30. 30. Operaciones para depuración de bases de datos externas <ul><li>Conjunto de operaciones destinadas a reparar inconsistencias o errores de grabación en bases de datos externas, es decir bases grabadas con DataEntry diferente a BarbWin, sin controles, saltos o filtros. </li></ul><ul><ul><li>Validar </li></ul></ul><ul><ul><li>Filtrar </li></ul></ul><ul><ul><li>Depurar variable </li></ul></ul><ul><ul><li>Depurar fichero </li></ul></ul>
    31. 31. Operaciones de gestión, agregación o generación de nuevos archivos de datos <ul><li>Conjunto de operaciones que nos permite agregar o crear nuevas bases de datos. </li></ul><ul><ul><li>Unir ficheros permite sumar registros con la misma o distinta estructura en un único fichero. </li></ul></ul><ul><ul><li>Añadir datos externos, permite sumar registros a la tabla actual si el fichero externo tiene las mismas variables y estructura que el actual. </li></ul></ul><ul><ul><li>Fusionar estudios, une registros con una misma identificación de ficheros distintos (fusionar con repeticiones). </li></ul></ul><ul><ul><li>Añadir datos mediante fusión, añade datos de varios registros de un fichero secundario en un registro primario. </li></ul></ul><ul><ul><li>Actualizar variables, crea nuevas informaciones. </li></ul></ul><ul><ul><li>Crear subfichero, crea ficheros con otro nivel de análisis. </li></ul></ul><ul><ul><li>Recrear fichero principal (v7), crea una estructura horizontal a partir de un fichero vertical. </li></ul></ul>
    32. 32. Operaciones de codificación <ul><li>Conjunto de órdenes que nos permite realizar la codificación de preguntas abiertas </li></ul><ul><ul><li>Codificación automática, codificación tradicional de Gandia BarbWin </li></ul></ul><ul><ul><li>Codificación manual (v7), nuevo sistema de codificación de abiertas literales para los ficheros que vienen de campo electrónico </li></ul></ul><ul><ul><li>Recodificación </li></ul></ul><ul><ul><li>Recodificación masiva (v7) </li></ul></ul><ul><ul><li>Reparación de codificaciones (v7) </li></ul></ul><ul><ul><li>Limpiar códigos (v7) </li></ul></ul>
    33. 33. Operaciones de cálculo y reemplazo <ul><li>Conjunto de operaciones que nos permiten realizar cálculos o reemplazos de informaciones ciertas en las bases de datos </li></ul><ul><ul><li>Calcular </li></ul></ul><ul><ul><li>Calcular en grupo de registros </li></ul></ul><ul><ul><li>Reemplazar </li></ul></ul><ul><ul><li>Sustituir valores </li></ul></ul><ul><ul><li>Reemplazar por acumulación </li></ul></ul>
    34. 34. Operaciones de transformación <ul><li>Conjunto de operaciones que modifican los datos de la base por medio de cálculos o transformaciones específicas. </li></ul><ul><ul><li>Proporcionalizar permite corregir el típico error de campo en la suma de porcentajes o recalcular en base a un valor de otra variable. </li></ul></ul><ul><ul><li>Unir permite crear una nueva variable suma lógica de las variables a unir según determinados parámetros. </li></ul></ul><ul><ul><li>Transponer, permite crear nuevas variables a partir de los códigos de las originales. </li></ul></ul><ul><ul><li>Anidar permite crear rápidamente variables multidimensionales y las prepara para una presentación adecuada generando grupos de códigos. </li></ul></ul><ul><ul><li>Binarizar permite crear variables binarias a partir de los códigos de una variable. Cada variable binaria muestra la presencia o no de un código en la variable original. </li></ul></ul><ul><ul><li>Jerarquizar permite reordenar los rangos de un conjunto de variables. </li></ul></ul><ul><ul><li>Combinar: crea distintas combinaciones entre los datos, de forma que se puedan analizar los grupos TURF con máximo porcentaje. </li></ul></ul><ul><ul><li>Desplazar </li></ul></ul><ul><ul><li>Dicotomizar </li></ul></ul>
    35. 35. Otras opciones específicas de transformación <ul><li>Sobre cadenas </li></ul><ul><ul><li>Agregar </li></ul></ul><ul><ul><li>Desagregar </li></ul></ul><ul><ul><li>Conversión de múltiples </li></ul></ul><ul><li>Sobre múltiples </li></ul><ul><ul><li>Detectar </li></ul></ul><ul><ul><li>Dividir </li></ul></ul><ul><ul><li>Generar </li></ul></ul><ul><ul><li>Agrupar binarias </li></ul></ul><ul><ul><li>Crear combinaciones </li></ul></ul><ul><ul><li>Renombrar con raíz común (v7) </li></ul></ul><ul><li>Sobre numéricas </li></ul><ul><ul><li>Formato fijo de decimales </li></ul></ul><ul><li>Sobre categóricas </li></ul><ul><ul><li>Cambiar de tipo </li></ul></ul>
    36. 36. Análisis de datos <ul><li>Univariante </li></ul><ul><ul><li>Recuentos </li></ul></ul><ul><ul><li>Descriptivos </li></ul></ul><ul><li>Bivariante </li></ul><ul><ul><li>Tablas de contingencia </li></ul></ul><ul><ul><ul><li>Pruebas de significación y asociación </li></ul></ul></ul><ul><ul><li>Análisis de varianza </li></ul></ul><ul><ul><li>Correlaciones </li></ul></ul><ul><ul><li>Pruebas no paramétricas </li></ul></ul><ul><ul><li>Contrastes de hipótesis </li></ul></ul><ul><li>Multivariante </li></ul><ul><ul><li>Regresión </li></ul></ul><ul><ul><li>Reducción de datos </li></ul></ul><ul><ul><ul><li>Anaco simple </li></ul></ul></ul><ul><ul><ul><li>Anaco Múltiple </li></ul></ul></ul><ul><ul><ul><li>Componentes principales </li></ul></ul></ul><ul><ul><li>Clasificación </li></ul></ul><ul><ul><ul><li>Segmentación </li></ul></ul></ul><ul><ul><ul><li>Cluster </li></ul></ul></ul><ul><ul><li>Fiabilidad </li></ul></ul>
    37. 37. Univariante - Recuento <ul><li>Objetivo: conocer como se distribuyen los datos en una variable. </li></ul><ul><li>Funcionamiento: independiente a la codificación, no tiene en cuenta los intervalos que se hayan podido establecer en la misma. </li></ul><ul><li>Aporta información de cuartiles, mediana y acumulado porcentual. </li></ul><ul><li>No tiene en cuenta los No sabe y los No contesta </li></ul><ul><li>Posibilidad de gráfico y traspaso a Excel y Word </li></ul><ul><li>Válido para cualquier tipo de variable </li></ul><ul><li>Presentado en forma de tabla </li></ul>
    38. 38. Univariante - Descriptivos <ul><li>Válido para variables numéricas métricas </li></ul><ul><li>Se presentan los estadísticos fundamentales de la distribución de frecuencias. </li></ul><ul><li>Traspaso a Word y Excel </li></ul><ul><li>Transposición de la matriz para trabajar con columnas de variables. </li></ul>
    39. 39. Bivariante - Tablas de contingencia <ul><li>Tipos de tablas </li></ul><ul><ul><li>Tablas marginales de frecuencias </li></ul></ul><ul><ul><li>Tablas marginales de estadísticos </li></ul></ul><ul><ul><li>Tablas cruzadas de frecuencias </li></ul></ul><ul><ul><li>Tablas cruzadas de estadísticos </li></ul></ul><ul><ul><li>Tablas cruzadas con cálculos estadísticos de tercera variable </li></ul></ul><ul><li>Bases de cálculo </li></ul><ul><ul><li>Automáticas </li></ul></ul><ul><ul><li>Generadas por el usuario </li></ul></ul><ul><li>Selecciones de datos </li></ul><ul><li>Grupos de cálculo </li></ul><ul><ul><li>Unitarios </li></ul></ul><ul><ul><li>Combinados </li></ul></ul><ul><li>Ponderaciones </li></ul><ul><ul><li>Del fichero </li></ul></ul><ul><ul><li>De cada variable </li></ul></ul>
    40. 40. Tabla marginal de frecuencias Tabla con sólo filas, en cabecera se puede observar la frecuencia, el porcentaje que representa sobre el total muestral y en caso de no ser multi-respuesta la variable, el acumulado porcentual.
    41. 41. Tabla de contingencia Individuales y combinadas... Se pueden incluir más estadísticos de celda, además de pruebas de significación que veremos más adelante.
    42. 42. Tabla de contingencia y gráficos ABS,VER,HOR,TOT
    43. 43. Bases de cálculo (1) <ul><li>Definición </li></ul><ul><ul><li>Una base es un condición que se asocia a una o más variables, de forma que, sólo los cuestionarios que cumplen esa condición serán el 100% de los casos tabulados es ese cruce. </li></ul></ul><ul><li>Tipos </li></ul><ul><ul><li>Existen bases automáticas (derivadas de la aplicación de un filtro o salto) y bases asociadas por el usuario. </li></ul></ul><ul><li>Creación </li></ul><ul><ul><li>Desde Tabulación > Bases </li></ul></ul><ul><ul><li>Desde gestión de variables en las propiedades de tabulación </li></ul></ul><ul><li>Asociación </li></ul><ul><ul><li>En la definición de la tabla (temporal) </li></ul></ul><ul><ul><li>En la variable (indefinida) </li></ul></ul>
    44. 44. Bases de cálculo (2) Este valor general la base, para que la variable a la que afecta sus porcentajes sean base 100 para los que en Pregunta 14 contestaron un NO La misma tabla sin base automática, da una información engañosa pues aparecen 120 NS/NC que no lo son verdaderamente.
    45. 45. Ponderaciones y equilibraje (1) <ul><li>La ponderación es un proceso cuyo resultado deriva en una adecuación de la muestra a las proporciones existentes en la población o a las proporciones deseadas por el investigador. </li></ul><ul><li>Tipos de ponderación </li></ul><ul><ul><li>Por elevación de la muestra (elevación de la muestra = variable que contiene coeficiente de elevación muestral) </li></ul></ul><ul><ul><li>Por defectos de campo </li></ul></ul><ul><ul><li>Por efectos del tipo de muestra (estratificada, controlada, y no proporcional) </li></ul></ul><ul><li>El proceso que se utiliza para llegar a obtener el coeficiente de ponderación se denomina equilibraje de muestras. </li></ul>
    46. 46. Ponderaciones y equilibraje (2) <ul><li>Equilibraje por cuotas cruzadas </li></ul><ul><li>Equilibraje por cuotas directas </li></ul>Base de cálculo de la ponderación Iteraciones Utilizar ponderación existente
    47. 47. Ponderaciones y equilibraje (3) <ul><li>¿Cómo obtengo los pesos? </li></ul><ul><ul><li>Por una constante </li></ul></ul><ul><ul><li>Indexando pesos según condiciones </li></ul></ul><ul><ul><li>Por equilibraje </li></ul></ul><ul><li>Independientemente de la forma en que se obtenga el peso, en un fichero puede haber: </li></ul><ul><ul><li>Una variable de ponderación para todo el fichero </li></ul></ul><ul><ul><li>Distintas variables de peso para algunas variables en particular </li></ul></ul><ul><li>¿Qué pasa si... </li></ul><ul><ul><li>...hacemos una tabla con variable ponderadas según fichero? </li></ul></ul><ul><ul><li>...hacemos una tabla en la que coincide una variable ponderada por fichero y una variable ponderada por individual? </li></ul></ul><ul><ul><li>...hacemos una tabla donde coinciden en el cruce dos variables ponderadas individual? </li></ul></ul>
    48. 48. Gestión de tablas... <ul><li>Visualizar las tablas </li></ul><ul><ul><li>En pantalla </li></ul></ul><ul><ul><li>Vista preliminar </li></ul></ul><ul><ul><li>Desde librerías de tablas </li></ul></ul><ul><li>Imprimir las tablas </li></ul><ul><ul><li>Todo (ABS+VER+HOR+....) </li></ul></ul><ul><ul><li>Sólo alguno de los juegos </li></ul></ul><ul><ul><li>Parte de un juego </li></ul></ul><ul><ul><li>Desde librerías de tablas </li></ul></ul><ul><li>Guardar en librerías de tablas </li></ul><ul><ul><li>Sin visualización en pantalla </li></ul></ul><ul><ul><li>Con visualización en pantalla </li></ul></ul><ul><li>Traspasar a EXCEL-WORD </li></ul><ul><ul><li>Todo (ABS+VER+HOR+....) </li></ul></ul><ul><ul><li>Sólo alguno de los juegos </li></ul></ul><ul><ul><li>Parte de un juego </li></ul></ul>
    49. 49. Gráficos en las tablas: creación y gestión... <ul><li>En tablas de marginales </li></ul><ul><li>En tablas de frecuencias </li></ul><ul><li>En tablas de estadísticos </li></ul><ul><li>Bases </li></ul><ul><li>Opciones de los gráficos </li></ul><ul><li>Guardar gráfico </li></ul><ul><ul><li>Un gráfico </li></ul></ul><ul><ul><li>Muchos gráficos </li></ul></ul><ul><li>Traspasar gráficos a PowerPoint, Excel y Word </li></ul>
    50. 50. Proceso de datos aplicado Roberto Gil Saura Departamento de Desarrollo TESI, SL [email_address] http:// www.tesigandia.com
    51. 51. Módulo 1. Introducción al análisis de datos Proceso de datos aplicado
    52. 52. Etapas del proceso de datos <ul><li>Preparación de los datos para el análisis </li></ul><ul><ul><li>Creación de la base de datos </li></ul></ul><ul><ul><li>Codificación de la información cualitativa </li></ul></ul><ul><ul><li>Registro o grabación de la información </li></ul></ul><ul><ul><li>Adecuación de los datos a las necesidades de análisis </li></ul></ul><ul><li>Análisis básico de los datos </li></ul><ul><ul><li>Análisis descriptivo univariante </li></ul></ul><ul><ul><li>Análisis cruzado o tabulación </li></ul></ul><ul><li>Análisis avanzado de los datos </li></ul><ul><ul><li>Análisis multivariante de la información </li></ul></ul><ul><ul><ul><li>Reducción de datos </li></ul></ul></ul><ul><ul><ul><li>Clasificación </li></ul></ul></ul>
    53. 53. Creación de la base y preparación del proceso <ul><li>Base de datos (matriz de trabajo)‏ </li></ul><ul><ul><li>Preguntas (variables en columnas) en columnas </li></ul></ul><ul><ul><li>Individuos (registros, cuestionarios) en filas </li></ul></ul><ul><ul><li>Nivel de análisis </li></ul></ul><ul><li>Redacción del plan de tabulación </li></ul><ul><ul><li>Documento que guía el análisis </li></ul></ul><ul><li>Tabulación básica </li></ul><ul><ul><li>Obtención de marginales de los datos de muestra y de perfil social (sección de clasificación)‏ </li></ul></ul><ul><ul><li>Obtención de marginales de las preguntas del cuestionario (sección de preguntas temáticas)‏ </li></ul></ul><ul><ul><li>Obtención de descriptivos y recuentos anexos </li></ul></ul><ul><li>Tabulación cruzada (clasificación por temáticas)‏ </li></ul><ul><li>Tabulación avanzada </li></ul><ul><ul><li>Aplicación de filtros clasificatorios y obtención de tablas temáticas </li></ul></ul><ul><ul><li>Gráficos fundamentales </li></ul></ul><ul><ul><li>Análisis avanzado de la información </li></ul></ul>
    54. 54. Plan de análisis <ul><li>El plan de análisis, tabulación o explotación, es un documento de trabajo que debe ser diseñado para cumplir con tres propósitos … </li></ul><ul><li>1) Proporcionar datos de la muestra total de forma descriptiva. </li></ul><ul><li>2) Determinar mediante tabulación qué diferencias existen entre subgrupos socio - demográficos y actitudinales dentro de la muestra. </li></ul><ul><li>3) Seleccionar cualquier otro tipo de análisis complejo univariado, bivariado o multivariado necesario para ayudar a interpretar los resultados. </li></ul>
    55. 55. Escalas de medida Tipos de escala de medida Escala nominal Escala ordinal Escala de intervalo Escala métrica, de razón o proporcional Cuanti tativa Cuali tativa + -
    56. 56. Módulo 2. Análisis de variables individuales (univariante) Proceso de datos aplicado
    57. 57. Análisis univariante – escalas nominal y ordinal <ul><li>Cálculo de frecuencias </li></ul><ul><ul><li>valores reales del fichero (recuento) </li></ul></ul><ul><ul><li>valores por intervalos (tabulación de marginales) </li></ul></ul><ul><ul><li>Aporta... </li></ul></ul><ul><ul><ul><li>información sobre el número de apariciones </li></ul></ul></ul><ul><ul><ul><li>% que representa ese número de apariciones sobre el total de muestra </li></ul></ul></ul><ul><ul><ul><li>acumulado de los % </li></ul></ul></ul><ul><ul><li>A tener en cuenta </li></ul></ul><ul><ul><ul><li>Bases de pregunta </li></ul></ul></ul><ul><ul><ul><li>Niveles de análisis </li></ul></ul></ul><ul><ul><ul><li>En variables múltiples, base casos o base respuestas </li></ul></ul></ul><ul><li>Caso especial: Moda </li></ul><ul><ul><ul><li>Valor/es más repetido/s en la distribución; una distribución puede ser multimodal. </li></ul></ul></ul>
    58. 58. Análisis univariante – escala ordinal y de intervalo <ul><li>Medida de tendencia central </li></ul><ul><ul><li>Mediana </li></ul></ul><ul><ul><ul><li>Valor que deja el 50% de los casos de la distribución por arriba y por abajo del mismo. Si no existe valor exacto, siempre toma aquel valor que se acerca más al 50%. </li></ul></ul></ul><ul><ul><ul><li>De la misma forma, el primer cuartil, valor que deja el 25% de los casos por detrás y el 75% de los casos por delante en la distribución. Si no existe valor exacto, siempre toma aquel valor que se acerca más al 25%. Por último, el tercer cuartil, valor que deja el 75% de los casos por detrás y el 25% de los casos por delante en la distribución. Si no existe valor exacto, siempre toma aquel valor que se acerca más al 75% </li></ul></ul></ul>
    59. 59. Análisis univariante – escala de razón e intervalo <ul><li>Cálculo de frecuencias </li></ul><ul><ul><li>valores reales del fichero (recuento) </li></ul></ul><ul><ul><li>valores por intervalos (tabulación de marginales) </li></ul></ul><ul><ul><li>Aporta... </li></ul></ul><ul><ul><ul><li>información sobre el número de apariciones </li></ul></ul></ul><ul><ul><ul><li>porcentaje que representa ese número de apariciones sobre el total de muestra </li></ul></ul></ul><ul><ul><ul><li>acumulado de los porcentajes </li></ul></ul></ul><ul><li>Cálculo de estadísticos </li></ul><ul><ul><li>medidas de caracterización (máximo, mínimo, rango) </li></ul></ul><ul><ul><li>medidas de tendencia central (media, mediana) </li></ul></ul><ul><ul><li>medidas de dispersión (desviación coeficiente variación, varianza) </li></ul></ul><ul><ul><li>medidas de error (error, intervalo de confianza) </li></ul></ul>
    60. 60. Análisis univariante – escala de razón e intervalo Coeficiente de variación, dispersión relativa que se pueda dar en una distribución de frecuencias. Al ser un cociente no dimensional, puede servir como medida de comparación de dos distribuciones con media y desviaciones diferentes. Desviación, medida de dispersión paramétrica igual a la raíz cuadrada de la varianza, o de la media del cuadrado de las desviaciones de los valores de una distribución desde su media. Media aritmética, medida de tendencia central paramétrica, aplicable específicamente en el caso de variables cuantitativas con escalas de intervalo o de razón, que representa el punto de la distribución de los valores de una variable, en el que se hacen iguales las desviaciones en relación con dicho punto, de los valores de la distribución situados sobre ese punto con los situados por debajo de ese punto.
    61. 61. Análisis univariante – estadísticos (escala de razón o proporción métrica y algunas ordinales) Intervalo de confianza de la media en muestras <30 casos, en ese intervalo de confianza se encuentra con un 95.5 % de confianza el verdadero valor poblacional de la media. Intervalo de confianza de la media en muestras >30 casos, en ese intervalo de confianza se encuentra con un 95.5 % de confianza el verdadero valor poblacional de la media. Error estimado, error que se comete con la media muestral sobre el verdadero valor poblacional. Máximo / Mínimo
    62. 62. Pruebas sobre una muestra <ul><li>Estas pruebas persiguen caracterizar la distribución para asumir una serie de propiedades o alternativas para las variables analizadas. </li></ul><ul><ul><li>Binomial </li></ul></ul><ul><ul><ul><li>La distribución binomial es la distribución muestral de las proporciones observadas en muestras tomadas de forma aleatoria de una población de dos clases. Nuestra hipótesis nula será en este caso la pertenencia de los datos de proporción a una población particular. Esta es una prueba de la bondad del ajuste a la distribución binomial. </li></ul></ul></ul><ul><ul><li>Jhi 2 </li></ul></ul><ul><ul><ul><li>En algunas ocasiones el investigador se plantea por el número de sujetos, objetos o respuestas que se clasifican en diferentes categorías. La prueba c2 es adecuada para analizar este supuesto ya que puede utilizarse para analizar si la diferencia entre los observado y lo esperado en una determinada distribución arrojan unas diferencias significativas. </li></ul></ul></ul><ul><ul><li>Kolgomorov-Smirnov </li></ul></ul><ul><ul><ul><li>Prueba estadística en la que compramos las frecuencias relativas acumuladas (esperadas y observadas) de las distribuciones (uniforme o normal) para saber si los datos de que disponemos pueden provenir de una muestra con esas características. </li></ul></ul></ul>
    63. 63. Módulo 3. Análisis entre dos variables (bivariante) Proceso de datos aplicado
    64. 64. Análisis bivariante <ul><li>Escalas nominales, ordinales y de intervalo </li></ul><ul><ul><li>En ocasiones, no sólo nos interesa conocer las medidas más importantes de una variable, sino también las relaciones entre ellas. Para ello acudimos a las tablas de contingencia. </li></ul></ul><ul><li>¿Cómo se lee una tabla? </li></ul><ul><ul><li>Conocer la muestra mediante los marginales de fila en cabecera </li></ul></ul><ul><ul><li>Mirar las variables y sus categorías </li></ul></ul><ul><ul><li>Mirar los marginales de filas y columnas </li></ul></ul><ul><ul><li>Mirar relaciones celda / totales dentro de la tabla (prueba Jhi²)‏ </li></ul></ul><ul><li>¿Cómo se leen los porcentajes? </li></ul><ul><ul><li>Porcentajes verticales o calculados en base al total de la columna </li></ul></ul><ul><ul><li>Porcentajes horizontales o calculados en base al total de la fila </li></ul></ul><ul><ul><li>Porcentajes totales o calculados en base a la N de muestra total para la variable seleccionada (eliminando filtros o bases no deseadas) </li></ul></ul>
    65. 65. Análisis de tablas cruzadas - Tabulación <ul><li>De casos </li></ul><ul><ul><li>Marginal </li></ul></ul><ul><ul><li>Bivariada </li></ul></ul><ul><ul><li>Bivariada con estadísticos </li></ul></ul><ul><ul><li>3D – Tridimensional </li></ul></ul><ul><li>De grupos de casos </li></ul><ul><ul><li>Marginal </li></ul></ul><ul><ul><li>Bivariada </li></ul></ul><ul><ul><li>Bivariada con estadísticos </li></ul></ul><ul><ul><li>3D – Tridimensional </li></ul></ul>
    66. 66. Condiciones / Segmentación en las tablas <ul><li>Concepto de base: </li></ul><ul><ul><li>Fila de la tabla de contingencia que nos informa de un cambio en el total de registros que se utilizan como “base” para el cálculo de porcentajes, generando un nuevo subtotal que será base 100%. </li></ul></ul><ul><li>Concepto de filtro </li></ul><ul><ul><li>Columna de la tabla de contingencia que nos informa de un cambio en el total de registros que se utilizan como “base” para el cálculo de porcentajes, generando un nuevo subtotal que será base 100%. </li></ul></ul><ul><li>Los porcentajes siempre deben mostrarse con un rango de 0 a 100, evitar el uso de ,00 (decimales) si el error de la muestra es mayor al 1%. </li></ul>
    67. 67. Pruebas de asociación o independencia <ul><li>Conjunto de pruebas que nos miden si hay asociación o independencia entre las celdas relacionadas en la tabla. </li></ul><ul><ul><li>Jhi² (de celda, Pearson) </li></ul></ul><ul><ul><ul><li>Se pretende con este test, válido para escalas nominales pero extensivo al resto, ver de un solo vistazo aquellas celdas cuyo porcentaje (vertical) es significativamente mayor (>) o menor (<) al porcentaje que cabría esperar ante un comportamiento proporcional de las categorías testadas en sus marginales. (Significación < 0,05, valor de comparación 3,84) </li></ul></ul></ul><ul><ul><li>Jhi² (de tabla, Pearson) </li></ul></ul><ul><ul><ul><li>Se pretende con esta prueba analizar la relación existente entre dos variables medidas en escalas nominales, ordinales o de intervalo (en menor medida) si existe relación de dependencia entre ambas o si su relación sólo es debida a efectos aleatorios de la muestra. A mayor valor de Jhi², mayor grado de dependencia (Significación < 0,05). </li></ul></ul></ul><ul><ul><li>V de Cramer </li></ul></ul><ul><ul><ul><li>Igual objetivo que el anterior, pero sitúa entre 0 y 1 los valores extremos de la prueba. Basado en Jhi², ofrece un valor 1 cuando las variables son absolutamente dependientes (diagonal principal) y un 0 cuando son absolutamente independientes (equitativamente distribuidos). </li></ul></ul></ul>
    68. 68. Limitaciones de Jhi² <ul><li>Es una técnica de aproximación, no exacta. Por ello, a menor muestra, más pequeño debe ser el nivel de significación para tomar la decisión con relativa seguridad. </li></ul><ul><li>En esencia, la prueba parte de una utilización de variables continuas, sin embargo se utiliza con variables nominales, lo cual genera una incorrección, que sólo es insalvable en las tablas de 2x2, donde se utiliza la corrección por continuidad de Yates. </li></ul><ul><li>Es una prueba que depende de la unidad de medida, efecto que salvan otras pruebas como V de Cramer. </li></ul><ul><li>La disparidad entre la aproximación de Pearson y la distribución Jhi aumenta conforme disminuye N. Utilizar probabilidad exacta de Fisher si hay frecuencias menores a 5. </li></ul><ul><li>El modelo puede no funcionar correctamente cuando existen frecuencias esperadas inferiores a 5. Se considera válido si menos del 20% de las celdas tienen frecuencias esperadas inferiores a 5. Caso de no ser así, no queda más remedio que agrupar categorías columna o fila. </li></ul>
    69. 69. Pruebas de significación <ul><li>t - Student para contraste de proporciones o medias e muestra indepenedientes </li></ul><ul><ul><li>En esta prueba se trata de ver si las diferencias entre las columnas porcentuales dentro de una misma categoría en una variable son significativas en la población de la cual se extrajeron las muestras </li></ul></ul><ul><ul><li>Prueba equivalente para la media aritmética </li></ul></ul><ul><ul><li>Esta prueba sólo se realizará si las muestras provienen de poblaciones que son independientes </li></ul></ul><ul><ul><li>Formatos de ejecución </li></ul></ul><ul><ul><ul><li>Con base real o base ponderada </li></ul></ul></ul><ul><ul><ul><li>Con datos de una columnas de variable o columnas de tabla </li></ul></ul></ul><ul><ul><ul><li>Diferentes niveles de confianza </li></ul></ul></ul>
    70. 70. Pruebas de correlación (1)‏ <ul><li>Objetivo, medir relación métrica y lineal </li></ul><ul><ul><li>Cuando la variables de las que se desea calcular la relación son numéricas métricas se aplica la correlación de Pearson o análisis de regresión simple </li></ul></ul><ul><li>Si no es métrica la relación </li></ul><ul><ul><li>Ante relaciones entre otro tipo de escalas acudiremos a las pruebas no paramétricas donde coexisten Spearman o los diferentes coeficientes de Kendall. </li></ul></ul><ul><li>Valores </li></ul><ul><ul><li>Los valores suelen estar en la mayoría de coeficientes entre [ -1 ≥ r ≤ 1] </li></ul></ul><ul><li>Tipo de relación lineal </li></ul><ul><ul><li>Directa </li></ul></ul><ul><ul><li>Inversa </li></ul></ul>
    71. 71. Pruebas de correlación (2)‏ <ul><li>Pearson </li></ul><ul><ul><li>... nos indicará si existe relación entre las variables analizadas, cuantifica esa relación y el signo del coeficiente muestra la dirección de la misma. </li></ul></ul><ul><li>Spearman </li></ul><ul><ul><li>...conocido como “rho”, es una medida de asociación que requiere que AL MENOS UNA de las dos variables que intervengan en el análisis esté reflejando ordenaciones, es decir, medición ordinal. </li></ul></ul><ul><li>Tau de Kendall </li></ul><ul><ul><li>... tiene igual funcionamiento que el coeficiente de rangos de Spearman y es muy utilizado para mediciones medias de jueces. Valora la relación entre las ordenaciones otorgadas por los jueces, teniendo en cuenta las concordancias y las discordancias. </li></ul></ul><ul><li>Concordancia de Kendall (W)‏ </li></ul><ul><ul><li>... se diferencia de los anteriores por trabajar con k ordenaciones en lugar de con 2 ordenaciones. </li></ul></ul>
    72. 72. Análisis de la varianza <ul><li>Descripción </li></ul><ul><ul><li>El análisis de la varianza es un método explicativo que se utiliza para comprender la relación existente entre dos variables (nominal :: explicativa o independiente:: y otra métrica :: cuantitativa a explicar::) </li></ul></ul><ul><li>Objetivo </li></ul><ul><ul><li>El modelo de cálculo implica analizar si las puntuaciones medias de la variable dependiente en cada uno de los cortes o grupos de la variable independiente pueden diferir significativamente. </li></ul></ul><ul><ul><li>La prueba está basada en el análisis de las sumas de cuadrados explicadas entre los grupos y también intra grupo. La suma de cuadrados de la variable total viene expresada por la suma de las dos anteriores. </li></ul></ul><ul><li>Lectura de la prueba </li></ul><ul><ul><li>Se dice que hay una relación de dependencia entre ambas variables cuando la fuente de variación inter grupo es superior a la fuente de variación intra grupo. </li></ul></ul><ul><li>Estadístico </li></ul><ul><ul><li>La existencia de esa relación viene materializada por el uso del estadístico F. </li></ul></ul><ul><li>La hipótesis nula es la igualdad de medias entre los grupos. </li></ul><ul><ul><li>Si rechazamos esta hipótesis, es decir si el estadístico F es significativo (<0,05), rechazaremos la Ho y aceptaremos la existencia de relación entre las variables. Las puntuaciones medias de la variable dependiente están condicionadas por la pertenencia al grupo de la independiente. </li></ul></ul>
    73. 73. Regresión simple <ul><li>Descripción </li></ul><ul><ul><li>Se usa para detectar la relación de dependencia entre dos variables medidas en escala métrica o de intervalos, es decir, cuantitativas. </li></ul></ul><ul><li>Los objetivos de este análisis son: </li></ul><ul><ul><li>determinar si la variable explicada lo es por medio de la variable explicativa </li></ul></ul><ul><ul><li>determinar el tipo de relación entre ambas variables </li></ul></ul><ul><ul><li>conocer la intensidad de la relación entre las variables. </li></ul></ul><ul><li>El análisis se realiza por medio del estudio de las fuentes de variación de las variables: </li></ul><ul><ul><li>Suma de cuadrados de la variable a explicar, sumatorio de la diferencia cuadrática del sumatorio de los valores de la variable a explicar menos su media. </li></ul></ul><ul><ul><li>Suma de cuadrados de la regresión, sumatorio de la diferencia cuadrática de los valores predichos por la regresión menos su media </li></ul></ul><ul><ul><li>Suma de cuadrados residual, sumatorio de la diferencia cuadrática de los valores reales de la variable a explicar menos los valores predichos por el modelo. </li></ul></ul><ul><li>La ecuación que representa el modelo es Y=B0+B1X+e </li></ul><ul><ul><li>B0 es el término independiente, </li></ul></ul><ul><ul><li>B1 es el moderador o multiplicador del valor de X </li></ul></ul><ul><ul><li>e, el término residual. </li></ul></ul><ul><ul><li>B0 indica el valor que tomaría Y en el caso de que X fuera 0. </li></ul></ul><ul><ul><li>B1 >0 indica que un aumento en la variable explicativa, repercutiría en la variable a explicar en un aumento de esa cantidad proporcional. </li></ul></ul><ul><ul><li>B1 >0 indica que una aumento en la variable explicativa, repercutiría en la variable a explicar en una disminución en esa cantidad proporcional. </li></ul></ul><ul><li>Ambos coeficientes deben ser significativos para la aceptación del análisis, dado que así confirmamos su participación real en el modelo. </li></ul>
    74. 74. Módulo 4. Análisis entre n variables (multivariante) Proceso de datos aplicado
    75. 75. Supuestos paramétricos en multivariado <ul><li>Normalidad en las mediciones </li></ul><ul><ul><li>Los test de significatividad pueden dejar de ser válidos </li></ul></ul><ul><li>Igualdad de varianzas (homocedasticidad) en todos los niveles de la variable dependiente </li></ul><ul><ul><li>Afecta al error típico, y por tanto a los test de significatividad </li></ul></ul><ul><li>Linealidad en las relaciones </li></ul><ul><ul><li>Sólo aplicable a aquellas técnicas que se basan en la correlación lineal de los datos </li></ul></ul><ul><li>Independencia entre las observaciones </li></ul><ul><ul><li>La probabilidad de ocurrencia de un evento no afecta a la probabilidad de ocurrencia de otro </li></ul></ul><ul><li>Tamaño muestral suficiente para la técnica elegida </li></ul>
    76. 76. Criterios de clasificación del multivariado <ul><li>Dependencia </li></ul><ul><ul><li>Técnicas de interdependencia </li></ul></ul><ul><ul><li>Técnicas de dependencia </li></ul></ul><ul><li>Objetivo de la técnica </li></ul><ul><ul><li>Modelización lineal (regresión)‏ </li></ul></ul><ul><ul><li>Reducción de datos, comprensión del espacio muestral </li></ul></ul><ul><ul><li>Clasificación de sujetos u objetos en la muestra </li></ul></ul><ul><ul><li>Fiabilidad de escalas </li></ul></ul>
    77. 77. Técnicas objeto de este módulo <ul><li>Regresión lineal múltiple </li></ul><ul><ul><li>Modelo forward stepwise </li></ul></ul><ul><li>Reducción de datos </li></ul><ul><ul><li>Análisis de correspondencias </li></ul></ul><ul><ul><li>Análisis de correspondencias múltiple </li></ul></ul><ul><ul><li>Factorial de componentes </li></ul></ul><ul><li>Clasificación </li></ul><ul><ul><li>Segmentación (Jhi², A.I.D. y Jhi² de tabla)‏ </li></ul></ul><ul><ul><li>Cluster jerárquico y k medias </li></ul></ul><ul><li>Fiabilidad de escalas </li></ul><ul><ul><li>Alpha de Cronbach </li></ul></ul>
    78. 78. Análisis de regresión lineal múltiple <ul><li>Definición y utilidad </li></ul><ul><ul><li>Paradigma de las técnicas de dependencia y base de una gran parte de las técnicas multivariantes, su objetivo es explicar el comportamiento de una variable dependiente a partir de las relaciones entre variables independientes. Trata de captar los efectos de cada variable por separado. </li></ul></ul><ul><ul><li>Analizamos sólo OLS (mínimos cuadrados ordinarios)‏ </li></ul></ul><ul><li>Grado de utilización en la práctica </li></ul><ul><ul><li>En desuso como tal, porque se está modelando hoy en día con evoluciones o especificaciones del mismo: logit, probit, logística, etc. </li></ul></ul><ul><li>Condiciones para el análisis </li></ul><ul><ul><li>variables de tipo numérico con las que se cree puede haber una relación lineal. </li></ul></ul><ul><ul><li>linealidad de parámetros </li></ul></ul><ul><ul><li>existencia de perturbación estocástica en el modelo con media 0 </li></ul></ul><ul><ul><li>homocedasticidad </li></ul></ul><ul><ul><li>ausencia de correlación serial </li></ul></ul><ul><ul><li>ausencia de multicolinealidad </li></ul></ul><ul><ul><li>matriz de datos no estocástica e independiente </li></ul></ul>
    79. 79. Términos utilizados (1)‏ <ul><li>Modelo utilizado: paso a paso </li></ul><ul><ul><li>En este tipo de metodología, las variables se incorporan una a una, comenzado por aquella que tiene un mayor poder explicativo de la variable dependiente. </li></ul></ul><ul><li>Excepciones </li></ul><ul><ul><li>Se puede combinar con una metodología de forzado de participación </li></ul></ul><ul><li>Suma de cuadrados explicada por la variable actual </li></ul><ul><ul><li>Total de la varianza explicada por el modelo que aporta la variable que se introduce en el paso n </li></ul></ul><ul><li>R cuadrado de la variable </li></ul><ul><ul><li>% de la varianza explicada por el modelo que aporta la variable que se introduce en el paso n </li></ul></ul><ul><li>Suma de cuadrados explicada por las variables (acumulado)‏ </li></ul><ul><ul><li>Total de la varianza explicada por el modelo que aportan las variables introducidas en el modelo hasta el paso n </li></ul></ul><ul><li>R cuadrado de las variables (acumulado) </li></ul><ul><ul><li>% de la varianza explicada por el modelo que aportan las variables introducidas en el modelo hasta el paso n </li></ul></ul>
    80. 80. Términos utilizados (2)‏ <ul><li>Suma de cuadrados total </li></ul><ul><ul><li>Total de la varianza explicada por el modelo que aportan las variables introducidas al final del modelo. </li></ul></ul><ul><li>Coeficiente de correlación múltiple y coeficiente de correlación múltiple ajustado a los grados de libertad </li></ul><ul><ul><li>Bondad del ajuste producido por la totalidad del modelo </li></ul></ul><ul><li>Valor F para el análisis de varianza y significación </li></ul><ul><ul><li>Prueba inferencial que aporta la significatividad de la relación lineal planteada en el conjunto del modelo. </li></ul></ul><ul><li>Error estándar de estimación y error estándar de estimación ajustado a los grados de libertad </li></ul><ul><ul><li>Estimación del error que se produce en el modelo </li></ul></ul><ul><li>Predicción por el modelo </li></ul><ul><ul><li>Valor de la variable dependiente utilizando el modelo lineal de regresión </li></ul></ul><ul><li>Residuo </li></ul><ul><ul><li>Diferencia entre el valor real y el predicho por el modelo </li></ul></ul><ul><li>Coeficiente de regresión </li></ul><ul><ul><li>Valor que permite medir la relación de la variable independiente con la dependiente del modelo. </li></ul></ul><ul><li>Error estándar de regresión </li></ul><ul><ul><li>Medida de precisión de los coeficientes de regresión proporcional al error de estimación e inversamente proporcional a la variabilidad de la variable, descontada la del resto de variables del modelo. </li></ul></ul><ul><li>Valor t - Student y significación </li></ul><ul><ul><li>Prueba inferencial que aporta la significatividad de la relación lineal planteada específicamente para el regresor especificado </li></ul></ul>   
    81. 81. Análisis de correspondencias simple y múltiple <ul><li>Concepto y utilidad </li></ul><ul><ul><li>Análisis geométrico que permite visualizar la relación geométrica entre las categorías que conforman una tabla de contingencia. </li></ul></ul><ul><ul><li>Permite conocer las asociaciones que se producen entre las categorías de columna y fila y entre ellas mismas. </li></ul></ul><ul><li>Condiciones de utilización </li></ul><ul><ul><li>Variables de cualquier tipo que conformen una tabla de contingencia. Se trabajará con los datos cualitativos de la misma. </li></ul></ul><ul><li>Grado de utilización en la práctica </li></ul><ul><ul><li>Muy utilizado para realizar posicionamientos de atributos y marcas. </li></ul></ul><ul><li>Máximo número de dimensiones </li></ul><ul><ul><li>Menor número de filas o columnas -1 (máximo de 6 en Barbwin)‏ </li></ul></ul>
    82. 82. Términos utilizados <ul><li>Perfiles de fila y columna (no impresos)‏ </li></ul><ul><ul><li>El perfil es un vector que contiene las frecuencias relativas de cada fila o columna. Resultado del cociente entre la celda y su total fila o columna. En Gandia BarbWin son los porcentajes verticales y horizontales en el análisis. Son utilizados para calcular la distancia entre todas las categorías. </li></ul></ul><ul><li>Distancia (no impresas)‏ </li></ul><ul><ul><li>Operación realizada para obtener una medición de la separación o cercanía entre las categorías analizadas, se utiliza la distancia Jhi². </li></ul></ul><ul><li>Masa </li></ul><ul><ul><li>Representa el peso de cada categoría de fila o columna sobre el total de la muestra, es decir, porcentajes totales de categoría. </li></ul></ul><ul><li>Valor propio o inercia </li></ul><ul><ul><li>Resultado de operar la masa con la distancia, es el indicativo del peso que tendrá cada variable original en las dimensiones finales. </li></ul></ul><ul><li>Contribuciones absolutas </li></ul><ul><ul><li>Indica el peso que cada categoría de fila o columna (de forma independiente) tiene en el total de la dimensión </li></ul></ul><ul><li>Contribuciones relativas </li></ul><ul><ul><li>Indican el peso de cada dimensión en cada categoría de fila y columna </li></ul></ul><ul><li>Distancia al centroide (baricentro)‏ </li></ul><ul><ul><li>Medida de la separación de cada categoría del centro del la representación gráfica </li></ul></ul>
    83. 83. Diferencias entre simple y múltiple <ul><li>El input del análisis no es una tabla de contingencia, sino que es una tabla de doble entrada de las frecuencias cruzadas de las n variables del análisis con las n variables, por lo que: </li></ul><ul><ul><li>en la diagonal principal tenemos los marginales de las n variables </li></ul></ul><ul><ul><li>en las celdas adyacentes a la diagonal principal de cada variable existen valores 0 </li></ul></ul><ul><ul><li>en el resto de celdas, frecuencia cruzada. </li></ul></ul><ul><li>En la presentación de las inercias o valores propios, se realiza la transformación de Benzécri y de Greenacre para facilitar la retención de dimensiones a partir de los % de varianza explicada. </li></ul><ul><li>El anaco múltiple aporta un cálculo de variables que contienen las coordenadas de las dimensiones para cada uno de los individuos del análisis, pudiendo representarse un mapa de coordenadas XY sobre las dimensiones seleccionadas de la concentración de individuos. </li></ul>
    84. 84. Análisis de componentes principales <ul><li>Concepto y utilidad </li></ul><ul><ul><li>Prueba muy conocida y utilizada que permite reducir el espacio dimensional de un conjunto multivariante de datos a un conjunto de factores cuya composición proviene de combinaciones lineales y normales que maximizan la representatividad de los datos originales y minimizan la pérdida de información. </li></ul></ul><ul><ul><li>En la práctica permite reducir y agrupar el número de dimensiones de un problema </li></ul></ul><ul><li>Condiciones de utilización </li></ul><ul><ul><li>Variables con escala al menos de intervalo. Matriz de individuos por variables. </li></ul></ul><ul><ul><li>Correlaciones significativas entre las variables que participan. Se comparte las mismas fuentes de variabilidad, es decir que las correlaciones sean elevadas. </li></ul></ul><ul><li>Grado de utilización en la práctica </li></ul><ul><ul><li>Muy utilizado </li></ul></ul><ul><li>Variantes </li></ul><ul><ul><li>Infinidad, presentadas para estructuras de datos específicos: componentes principales, máxima verosimilitud, alpha, etc. … </li></ul></ul><ul><li>Máximo número de componentes </li></ul><ul><ul><li>Igual número que variables originales incluidas en la estructura de datos </li></ul></ul><ul><li>Situación ideal </li></ul><ul><ul><li>Pocos componentes explican mucha varianza </li></ul></ul>
    85. 85. Términos utilizados (1)‏ <ul><li>Saturaciones o cargas </li></ul><ul><ul><li>Peso de la variable en cada componente o factor </li></ul></ul><ul><ul><li>El ideal es que cada variable tenga saturaciones altas en un único factor y bajas en el resto. </li></ul></ul><ul><li>Matriz de correlaciones </li></ul><ul><ul><li>Matriz que nos permite observar a simple vista los coeficientes de correlación de Pearson entre las variables que intervienen en el análisis. </li></ul></ul><ul><li>Prueba de esfericidad de Bartlett </li></ul><ul><ul><li>Prueba que reafirma la viabilidad del análisis de componentes principales, pues testa que la matriz de correlaciones es significativamente diferente de la matriz identidad. En este caso, la nube de puntos sería una esfera. Si se obtiene un valor de Jhi² que si es significativo, se rechaza la hipótesis nula de esfericidad o incorrelación. </li></ul></ul><ul><li>Valor propio </li></ul><ul><ul><li>Este valor indica la varianza de la matriz de correlaciones explicada por el componente o factor. </li></ul></ul>
    86. 86. Términos utilizados (2)‏ <ul><li>Solución directa / rotada </li></ul><ul><ul><li>Directa -> Matriz de pesos factoriales donde se puede observar la participación o peso de cada variable en el componente </li></ul></ul><ul><ul><li>Rotada -> Ídem tras la rotación de los ejes factoriales. </li></ul></ul><ul><li>Contribuciones absolutas </li></ul><ul><ul><li>Cada celda muestra el porcentaje de participación de cada variable en el componente extraído. El porcentaje es vertical. </li></ul></ul><ul><li>Contribuciones relativas </li></ul><ul><ul><li>(1) La primera fila de valores muestra el porcentaje de participación de cada variable en los diferentes factores extraídos y por tanto suma 100. </li></ul></ul><ul><ul><li>(2) La segunda fila de valores muestra el porcentaje de participación de cada variable en los diferentes factores, contabilizando los extraídos y los no extraídos. </li></ul></ul><ul><li>Comunalidad final </li></ul><ul><ul><li>Proporción de la varianza inicial de una variable explicada por el componente o factor. Suma de los cuadrados de las saturaciones de una variable en todos los factores. </li></ul></ul><ul><li>Rotación </li></ul><ul><ul><li>Método matemático utilizado para rotarlos ejes factoriales y facilitar el análisis de los investigadores. VARIMAX que tiende a que cada variable cargue mucho en un componente y poco en el resto. </li></ul></ul><ul><ul><li>El método de componentes principales extrae componentes con baja correlación. </li></ul></ul>
    87. 87. Técnicas de clasificación <ul><li>Concepto y utilidad </li></ul><ul><ul><li>Conjunto de técnicas con una orientación común hacia la clasificación de la información, donde agrupamos técnicas de interdependencia y técnicas de dependencia. La elección de una u otra dependerá del tipo de información de partida y destino que se tenga y requiera. </li></ul></ul><ul><li>Tipos </li></ul><ul><ul><li>Segmentación </li></ul></ul><ul><ul><li>Cluster </li></ul></ul><ul><ul><li>Discriminante </li></ul></ul>
    88. 88. Segmentación <ul><li>Definición y utilidad </li></ul><ul><ul><li>Técnica de clasificación que tiene como objetivo la elaboración de subgrupos muestrales en base a el mayor poder de explicación en la variable dependiente. </li></ul></ul><ul><li>Segmentación AID </li></ul><ul><ul><li>Técnica de segmentación que basada en el análisis de varianza, parte del intento de clasificar una muestra a partir de dicotomías grupales en las variable independientes que serán cualitativas y codificadas </li></ul></ul><ul><li>Segmentación Jhi² </li></ul><ul><ul><li>Técnica de segmentación que basada en la realización de pruebas Jhi², parte del intento de clasificar una muestra a partir de dicotomías grupales en las variable independientes que serán cualitativas y codificadas </li></ul></ul><ul><li>Segmentación de Jhi² tabla </li></ul><ul><ul><li>Técnica de segmentación que basada en la realización de pruebas Jhi² de tabla, parte del intento de clasificar una muestra a partir de la búsqueda de la asociación más alta en pruebas de asociación. </li></ul></ul>
    89. 89. Segmentación <ul><li>Condiciones para el análisis </li></ul><ul><ul><li>Variable dependiente de tipo numérica métrica en AID, e independientes cualitativas y codificadas </li></ul></ul><ul><ul><li>Variable dependiente como dicotomía en una muestra, numérica métrica en Jhi², e independientes cualitativas y codificadas </li></ul></ul><ul><ul><li>Variables codificadas con diferentes niveles en Jhi² de tabla. </li></ul></ul><ul><li>Ejecución en GBW </li></ul><ul><ul><li>Disponemos de dos peculiaridades … </li></ul></ul><ul><ul><ul><li>Forzar al test de un grupo con el resto </li></ul></ul></ul><ul><ul><ul><li>Agrupar por continuidad de categoría </li></ul></ul></ul><ul><ul><li>Fijación de un número mínimo de casos para considerar el grupo </li></ul></ul><ul><ul><li>Fijación del nivel de segmentación máximo </li></ul></ul>
    90. 90. Tipología, cluster o análisis de conglomerados <ul><li>Definición y utilidad </li></ul><ul><ul><li>Conjunto de técnicas cuyo fin último es la clasificación de la información en base a una serie de atributos relevantes señalados por el investigador. Para ellos se utilizan las similitudes entre las valoraciones dadas a los atributos señalados. </li></ul></ul><ul><li>Tipos </li></ul><ul><ul><li>Cluster, técnicas válidas para cuando no tenemos idea de cómo se puede agrupar la información </li></ul></ul><ul><li>Ejecución en GBW </li></ul><ul><ul><li>Selección de variables de tipo numérico métrico o de tipo nominal. Las nominales o múltiples se binarizan. El proceso de normalización es interno y automático. </li></ul></ul>
    91. 91. Análisis cluster <ul><li>Tipos </li></ul><ul><ul><li>Cluster jerárquico, análisis en el que se parte de una agrupación unitaria a una agrupación total. Análisis asociativo. </li></ul></ul><ul><ul><li>Cluster no jerárquico o k medias, análisis en el que hay una conjetura inicial sobre el número de grupos a formar y se itera el método de clasificación hasta clasificar toda la información en el número de grupos marcados. Análisis partitivo o de optimización. </li></ul></ul><ul><li>Condiciones para el análisis </li></ul><ul><ul><li>Representatividad muestral </li></ul></ul><ul><ul><li>Ausencia de multicolinealidad </li></ul></ul>
    92. 92. Terminología (1)‏ <ul><li>Distancia </li></ul><ul><ul><li>Euclídeas o euclídeas al cuadrado si los datos son mediciones. Recordemos que la distancia euclídea al cuadrado reforzará más las distancias entre los puntos de un plano. </li></ul></ul><ul><ul><li>Jhi² si los datos a agrupar son frecuencias (sólo no jerárquico). </li></ul></ul><ul><li>Método de análisis </li></ul><ul><ul><li>Distancia mínima (single linkage), agrupa a aquellos casos que tengan una menor distancia entre ellos; la distancia entre dos clusters es la distancia entre sus dos puntos más próximos. </li></ul></ul><ul><ul><li>Distancia máxima (complete linkage), agrupa en función de la distancia entre los puntos más alejados; la distancia entre dos clusters es la distancia entre sus puntos más alejados. </li></ul></ul><ul><ul><li>Agrupación de medianas o agrupación de centroides (medianas), agrupa a los individuos en función de se mediana o de su media. </li></ul></ul>Lejanos Próximos
    93. 93. Terminología (2)‏ <ul><li>En cluster no jerárquico, puntos de partida </li></ul><ul><ul><li>K primeros </li></ul></ul><ul><ul><li>K aleatorios </li></ul></ul><ul><ul><li>K con máxima distancia </li></ul></ul><ul><ul><li>K del jerárquico </li></ul></ul><ul><ul><li>K del usuario </li></ul></ul><ul><ul><li>K más numerosos </li></ul></ul><ul><li>Cálculo de distancias </li></ul><ul><ul><li>Distancia de cada individuo al centro del cluster </li></ul></ul><ul><ul><li>Distancia promedio de todos los individuos que pertenecen al centro </li></ul></ul><ul><ul><li>Matriz final de distancias intra y entre los clusters. </li></ul></ul><ul><li>Variable de grupo </li></ul><ul><ul><li>Guarda el código de grupo de pertenencia en el cluster. </li></ul></ul><ul><li>Dendograma </li></ul><ul><li>Análisis de varianza </li></ul><ul><li>Correlaciones entre los clusters </li></ul>
    94. 94. Análisis de fiabilidad <ul><li>Definición y utilidad </li></ul><ul><ul><li>Método que nos permite analizar la precisión de la relación lineal y sumativa de las valoraciones ofrecidas a diferentes ítems que conforman dimensiones de una dimensión de mayor rango mejor explicada por el conjunto de variables que por sí misma. </li></ul></ul><ul><li>Condiciones para el análisis </li></ul><ul><ul><li>Variables de medición </li></ul></ul><ul><ul><li>Mayor fiabilidad a mayor cantidad de ítems </li></ul></ul><ul><li>Ejecución en GBW </li></ul><ul><ul><li>En Gandia BarbWin se utiliza el alpha de Cronbach como medida de la fiabilidad de escalas </li></ul></ul>
    95. 95. Métodos de análisis y terminología (1)‏ <ul><li>Método </li></ul><ul><ul><li>Normal, incluye todas las variable del análisis aunque su varianza sea 0. </li></ul></ul><ul><ul><li>Covarianzas, elimina del análisis aquellas variables que tienen varianza 0. </li></ul></ul><ul><li>Análisis de varianza </li></ul><ul><ul><li>Técnica bivariante o multivariante que permite analizar la relación entre las medias de los grupos y la media total en diferentes niveles de la variable de agrupación </li></ul></ul><ul><li>Entre personas </li></ul><ul><ul><li>cada persona es analizada como un grupo; se analiza la diferencia entre las medias individuales de las puntuaciones en el conjunto de elementos con la media global de todos los elementos de la escala </li></ul></ul><ul><li>Intra personas </li></ul><ul><ul><li>cada persona es analizada como un grupo; se analiza la diferencia entre las puntuaciones individuales e cada elemento de la escala con las medias de cada individuo en la escala </li></ul></ul><ul><li>Entre medidas </li></ul><ul><ul><li>se analiza la diferencia entre las puntuaciones individuales de cada elemento en relación con la media de la muestra para cada elemento </li></ul></ul>
    96. 96. Terminología (2)‏ <ul><li>Residuos </li></ul><ul><ul><li>Diferencia de los residuos individuales en cada elemento de la escala en relación con la media de los residuos individuales en la escala </li></ul></ul><ul><li>Prueba F </li></ul><ul><ul><li>Valida si hay diferencias entre las medias de las variables que conforman la escala. Significaciones valores a 0 nos llevan a aceptar la Ha y rechaza la Ho de igualdad de medias. </li></ul></ul><ul><li>Media y varianza si ítem borrado </li></ul><ul><ul><li>Medición si eliminamos un ítem de la escala </li></ul></ul><ul><li>Correlación corregida </li></ul><ul><ul><li>Correlación del ítem con la escala </li></ul></ul><ul><li>Alpha si ítem borrado </li></ul><ul><ul><li>Coeficiente final si borramos el ítem seleccionado </li></ul></ul><ul><li>Alpha de Cronbach </li></ul><ul><ul><li>Coeficiente de correlación entre los ítems de la escala. Una escala fiable debe producir valores altos de alpha. </li></ul></ul><ul><li>Estadísticos entre los ítems </li></ul><ul><ul><li>Media, varianza, covarianza y correlación </li></ul></ul><ul><li>T² de Hotelling </li></ul><ul><ul><li>Medida utilizada para contrastar la hipótesis de medias iguales en el análisis de fiabilidad; se distribuye como una F </li></ul></ul><ul><li>Iteración del proceso </li></ul>

    ×