Este documento describe los pasos para preparar datos en IBM SPSS Statistics. Explica cómo asignar propiedades a las variables como etiquetas descriptivas, valores perdidos y nivel de medición. También cubre cómo definir formatos de presentación para variables numéricas. El proceso de preparación de datos ayuda a describir y organizar los datos para análisis posteriores.
1. UNIVERSIDAD JUÁREZ AUTÓNOMA DE
TABASCO
DIVISIÓN ACADÉMICA DE EDUCACIÓN Y ARTES
LIC. CIENCIAS DE LA EDUCACIÓN
Asignatura:
Herramientas informáticas de apoyo a la investigación
cuantitativa.
Tema:
Preparación de los datos.
Alumnas:
Jessica del Carmen reyes García.
Virginia Avalos Laines
Karen Beatriz Pérez Domínguez
2. 2.5 PREPARACIÓN DE LOS DATOS
Cuando abra un archivo de datos o introduzca datos en
el Editor de datos, podrá empezar a crear informes,
gráficos y análisis sin ningún trabajo preliminar adicional.
Sin embargo, hay algunas funciones de preparación
adicional de los datos que pueden resultarle útiles, entre
las que se incluyen:
Asignar propiedades de las variables que describan los
datos y determinen cómo se deben tratar ciertos valores.
Identificar los casos que pueden contener información
duplicada y excluir dichos casos de los análisis o
eliminarlos del archivo de datos.
Crear nuevas variables con algunas categorías
distintas que representen rangos de valores de variables
que tengan un mayor número de valores posibles.
3. PROPIEDADES DE VARIABLES
Los datos introducidos en la
Vista de datos del Editor de
datos o leídos desde un
formato de archivos externo
(como una hoja de cálculo
de Excel o un archivo de
datos de texto) carecen de
ciertas propiedades de
variables que pueden
resultar muy útiles, como:
Definición de etiquetas de
valor descriptivas para
códigos numéricos (por
ejemplo, 0 = Hombre y 1 =
Mujer).
Identificación de códigos
de valores perdidos (por
ejemplo, 99 = No procede).
Asignación del nivel de
medida (nominal, ordinal o
de escala).
4. TODAS ESTAS PROPIEDADES DE VARIABLES (Y OTRAS) SE PUEDEN
ASIGNAR EN LA VISTA DE VARIABLES DEL EDITOR DE DATOS. TAMBIÉN
HAY ALGUNAS UTILIDADES QUE LE PUEDEN OFRECER ASISTENCIA EN
ESTE PROCESO
Definir propiedades de variables puede ayudarle a definir
etiquetas de valor descriptivas y valores perdidos. Esto es
especialmente útil para datos categóricos con códigos
numéricos utilizados para valores de categorías.
Definir nivel de medición para desconocido identifica las
variables (campos) que no tengan un nivel de medición
definido y permite definir el nivel de medición de esas
variables. Es importante para los procedimientos en los que el
nivel de medición puede afectar a los resultados o determinar
qué funciones estarán disponibles.
Copiar propiedades de datos ofrece la posibilidad de utilizar
un archivo de datos con IBM® SPSS® Statistics como
plantilla para definir las propiedades de variables y archivos
en el archivo de datos actual. Esto es particularmente útil si
utiliza frecuentemente archivos de datos con un formato
externo que tenga un contenido similar, como puedan ser
informes mensuales en formato Excel.
5. DEFINICIÓN DE PROPIEDADES DE VARIABLES
Definir propiedades de variables está diseñado para
ayudarle en el proceso de asignar atributos a variables,
incluyendo la creación de etiquetas de valor descriptivas
para variables categóricas (nominales u ordinales).
Definir propiedades de variables:
Explora los datos reales y enumera todos valores de
datos únicos para cada variable seleccionada.
Identifica valores sin etiquetas y ofrece una función de
“etiquetas automáticas”.
Permite copiar etiquetas de valor definidas y otros
atributos de otra variable en la variable seleccionada o
de la variable seleccionada a varias variables
adicionales.
6. PARA DEFINIR PROPIEDADES DE VARIABLES
Elija en los menús:
Datos > Definir propiedades de variables...
7. La Vista de variables contiene descripciones de las
propiedades de cada variable del archivo de datos. En la Vista
de variables:
Las filas son variables.
Las columnas son las características de las variables.
PARA VISUALIZAR O DEFINIR LOS ATRIBUTOS DE
LAS VARIABLES
Desde la Vista de Variables, para definir variables nuevas,
introduzca un nombre de variable en cualquier fila vacía y
seleccione los atributos que desea definir o modificar.
NOMBRES DE VARIABLE
Para los nombres de variable se aplican las siguientes normas:
El nombre debe comenzar por una letra.
Los nombres de variable no pueden terminar en punto.
No se pueden utilizar espacios en blanco ni caracteres
especiales.
Cada nombre de variable debe ser único; no se permiten
duplicados.
8. TIPO DE VARIABLE
La propiedad del tipo de variable especifica los tipos de
datos de cada variable. Por defecto se asume que todas las
variables nuevas son numéricas.
9. Los tipos de variable disponibles son los siguientes:
Numérico. Una variable cuyos valores son números, se muestran en
formato numérico estándar.
Coma. Una variable numérica cuyos valores se muestran con comas
que delimitan cada tres posiciones y con el punto como delimitador
decimal.
Punto. Una variable numérica cuyos valores se muestran con puntos
que delimitan cada tres posiciones y con la coma como delimitador
decimal.
Notación científica. Una variable numérica cuyos valores se muestran
con una E intercalada y un exponente con signo que representa una
potencia de base diez. El Editor de datos acepta para estas variables
valores numéricos con o sin el exponente.
Fecha. Una variable numérica cuyos valores se muestran en uno de los
diferentes formatos de fecha-calendario u hora-reloj. Es necesario
seleccionar un formato de la lista. Para introducir la fecha se pueden
utilizar: barras, guiones, puntos, comas o espacios.
Dólar. Una variable numérica que se muestra con un signo dólar inicial
($), comas que delimitan cada tres posiciones y un punto como
delimitador decimal. Se pueden introducir valores de datos con o sin el
signo dólar inicial.
10. Moneda personalizada. Una variable numérica cuyos valores se
muestran en uno de los formatos de moneda personalizados que se
hayan definido previamente en la pestaña Moneda del cuadro de
diálogo Opciones.
Cadena. Una variable cuyos valores no son numéricos y, por lo tanto,
no se utilizan en los cálculos. Las mayúsculas y las minúsculas se
consideran diferentes. Este tipo también se conoce como variable
alfanumérica.
ETIQUETAS DE VARIABLE
Puede asignar etiquetas de variable descriptivas, pueden contener
espacios y caracteres reservados que no se admiten en los nombres
de variable.
Etiquetas de valor (Valores)
Puede asignar etiquetas de valor descriptivas a cada valor de una
variable. Este proceso es especialmente útil si el archivo de datos
utiliza códigos numéricos para representar categorías que no son
numéricas (por ejemplo, códigos 1 y 2 para hombre y mujer).
11. Para especificar etiquetas de valor
Pulse en el botón de la casilla Valores de la variable que se quiere
definir.
Para cada valor, escriba el valor y una etiqueta.
Pulse en Añadir para introducir la etiqueta de valor.
Pulse en Aceptar.
12. Valores perdidos
Valores perdidos define los valores de los datos definidos como
perdidos por el usuario. Por ejemplo, es posible que quiera distinguir
los datos perdidos porque un encuestado se niegue a responder. Los
valores de datos que se especifican como perdidos por el usuario
aparecen marcados para un tratamiento especial y se excluyen de la
mayoría de los cálculos.
13. Para definir los valores perdidos
Introduzca los valores o el rango de valores que representen los datos
perdidos. Se considera que son válidos todos los valores de cadena,
incluidos los valores vacíos o nulos, a no ser que se definan explícitamente
como perdidos.
DEFINICIÓN DE ETIQUETAS DE VALOR Y OTRAS PROPIEDADES
DE LAS VARIABLES
El cuadro de diálogo principal Definir propiedades de variables proporciona la
siguiente información para las variables exploradas:
Lista de variables exploradas. Para cada variable explorada, aparecerá
una marca de verificación en la columna Sin etiqueta (S/E) indicando que la
variable contiene valores sin etiquetas de valor asignadas.
Para ordenar la lista de variables para que aparezcan todas las variables con
valores sin etiquetas en la parte superior de la lista:
Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de
variables exploradas.
También puede ordenarla por nombre de variable o nivel de medida pulsando
en el encabezado de columna correspondiente debajo de la Lista de
variables exploradas.
14.
15. Etiqueta. Muestra las etiquetas de valor que ya se han
definido. Puede añadir o cambiar las etiquetas de esta
columna.
Valor. Valores únicos para cada variable seleccionada. Esta lista
de valores únicos se basa en el número de casos explorados
16. Recuento. Número de veces que aparece cada valor
en los casos explorados.
Perdidos. Valores definidos para representar valores
perdidos. Puede cambiar la designación de la categoría
de los valores perdidos pulsando en la casilla de
verificación
Cambiado. Indica que ha añadido o cambiado una
etiqueta de valor.
17.
18.
19. Nivel de medida.
Las etiquetas de valor son especialmente útiles
para las variables categóricas (nominales u
ordinales),
Algunos procedimientos tratan a las variables
categóricas y de escala de manera diferente, por
lo que a veces es importante asignar el nivel de
medida correcto.
Sin embargo, por defecto, todas las nuevas
variables numéricas se asignan al nivel de medida
de escala.
Por tanto, puede que muchas variables que son de
hecho categóricas, aparezcan inicialmente como
variables de escala
.
.
20. Nivel de medida Tipo de datos
Numerico Cadena Fecha tiempo
Escala
Ordinal
Nominal
21. Papel. Algunos cuadros de diálogo permiten preseleccionar variables para
su análisis en función de papeles definidos
.
Copiar propiedades. Puede copiar las etiquetas de valor y otras
propiedades de las variables de otra variable a la variable seleccionada en
ese momento o desde la variable seleccionada en ese momento a una o
varias otras variables.
Valores sin etiquetas. Para crear automáticamente etiquetas para valores
sin etiquetas, pulse en: Etiquetas automáticas
22. Etiqueta de variable y formato de presentación
Puede cambiar de la etiqueta de variable descriptiva y el formato de presentación.
• No puede cambiar el tipo fundamental de la variable (numérica o de cadena).
• Para las variables de cadena, sólo puede cambiar la etiqueta de variable, no el
formato de presentación.
• Para las variables numéricas, puede cambiar el tipo numérico (como numérico,
fecha, dólar o moneda personalizada), el ancho (número máximo de dígitos,
incluyendo los indicadores decimales y/o de agrupación) y el número de posiciones
decimales.
• Para el formato de fecha numérica, puede seleccionar un formato de fecha
específico (como dd-mm-aaaa, mm/dd/aa, aaaaddd)
• Para formato numérico personalizado, puede seleccionar uno de los cinco formatos
de moneda personalizados (de CCA a CCE).
• Aparece un asterisco en la columna Valor si el ancho especificado es inferior al
ancho de los valores explorados o los valores mostrados para etiquetas de valor
definidas ya existentes o categorías de valores perdidos.
• Aparece un período (.) si los valores explorados o los valores mostrados para
etiquetas de valor definidas ya existentes o categorías de valores perdidos no son
válidos para el tipo de formato de presentación seleccionado. Por ejemplo, un valor
numérico interno inferior a 86.400 no es válido para una variable de formato de
fecha.