Представление данных.
Окна.
Data View - содержимое текущего файла данных
Variable View – описание структуры файла данных
Шкалы измерения переменных (Type и Measure)
Кодирование данных (Values) и пропущенных данных (Missing values)
Вопросы для самопроверки. Маленькие хитрости
2. Представление данных в SPSS
Данные представляются в виде матрицы, строкам которой соответствуют объекты (анкеты),
а столбцам - признаки (отдельные вопросы и подвопросы анкеты). Синонимом слова
"признак" является слово "переменная”.
Столбцы – переменные с закодированными ответами на вопросы анкеты (variables).
1 столбец = 1 переменная
Строки – единицы наблюдения: респондент, пациент, предприятие, товар и т.п. (case)
1 строка = 1 наблюдение
Имя переменной (Variable Name) - это последовательность букв и цифр, начинающаяся с
буквы, длиной не более 8 символов. Применяются буквы только латинского алфавита.
Внутри имени можно использовать знаки . @ # _ $.
Метка переменной (Variable Label) используется для пояснения смысла переменной.
Например, переменная с именем populath имеет метку “Численность населения в тыс.
чел.”, а переменная с именем Urban - метку “Процент городского населения”. Метки
переменных могут быть длиной до 256 знаков. Их можно записывать кириллическим
шрифтом.
3. Окна в SPSS
1. Окно приложения SPSS - содержит главное меню системы, используемое для работы с файлами, для
выбора статистических процедур и т.п., а также панель инструментов, служащую для ускорения доступа к
ресурсам.
2. Окно редактора данных содержит в себе два листа с ярлычками Data View и Variable View. На листе Data
View отображается содержимое текущего файла данных, а на листе Variable View – описание структуры
файла данных. С помощью редактора данных можно создавать новые файлы данных или корректировать
старые. Окно редактора данных открывается автоматически при запуске SPSS , и в нем отображается
пустой файл данных. При сохранении на внешних устройствах файлы данных получают расширение .SAV.
3. Окно вывода - в него попадают все результаты работы с системой: сообщения об ошибках, описательные
статистики, таблицы сопряженности, диаграммы, графики, отчеты и пр. Окна вывода могут быть сохранены в
файлах с расширением SPV.
4. Окно синтаксиса - текстовое окно - оно позволяет
•
- написать программу статистической обработки на специальном языке команд SPSS и выполнить ее,
вместо того, чтобы работать в диалоговом режиме через меню, это удобно тогда, когда нужно много раз
повторять одну и ту же последовательность действий, однако это требует знания командного языка;
•
- автоматически сохранить в виде команд последовательность действий, выполняемых через меню, с тем,
чтобы потом не повторять эти действия, а только запустить запомненную программу, возможно при
необходимости немного ее изменив!!!!!
Автоматическое сохранение команд делается с помощью кнопки PASTE, которой снабжено большинство
диалоговых команд, кроме того, в системе идет автоматическое сохранение всех выполняемых команд в
специальном системном журнале. Окна синтаксиса сохраняются в файлах с расширением SPS.
6. Шкалы измерения переменных (Type и Measure)
Номинальная шкала (Nominal).
1 вариант: тип переменной (Type) – символьный (String). “мужской” или “женский”, или “муж” и ”жен”
2 вариант: тип переменной (Type) – числовой (Numeric). 1, если респондент мужчина, и 2 - если женщина.
Эти числа являются всего лишь кодами категорий, к ним не могут применяться никакие свойства чисел, такие как
относительное значение, сложение или умножение.
Порядковая, ординальная или ранговая шкала (Nominal или Ordinal)
Это упорядоченная номинальная шкала. Каждая категория находится в позиции выше или ниже по отношению к другой.
Классификация работников на клерков, менеджеров и высшее руководство; работа "интересна", "безразлична" или "не
интересна”.
Здесь неизвестно, насколько выше та или иная категория: расстояние между категориями невозможно измерить. Упорядочение
- единственная математическая операция, применимая к порядковой шкале.
Интервальная шкала (Ordinal)
Можно определить не только порядок значений, но и расстояние между значениями.
Не имеет смысла рассматривать, во сколько раз одно значение больше другого. Интервальная шкала не имеет определенной
нулевой отметки, в разных системах измерения температуры ноль определен по-разному, и нельзя сказать, что 80оС в два
раза горячее, чем 40оF.
Шкала отношений (Scale)
Позволяет измерять порядок и расстояние между значениями, но и пропорции значений. Зарплата, рост, вес.
К этой шкале могут применяться любые математические операции.
7. Кодирование данных (Values)
и пропущенных данных (Missing values)
Как правило, "затрудняюсь ответить", "отказ от ответа" и "нет ответа“ кодируются кодами 997, 998 и 999 соответственно.
(7, 8, 9) или (97, 98,99) в зависимости от принятого количества знаков.
8. Вопросы для самопроверки.
Маленькие хитрости
Вопрос
Шкала
Тип
переменной
Имя
переменной
(Variable name)
1.Фамилия
Номинальная
(nominal)
Символьный
Name
2. Пол
Номинальная
Числовой
(целый)
Sex
3. Возраст
Интервальная
(scale)
Числовой
Age
4. Образование
Порядковая
(ordinal)
Числовой
(целый)
Educ
Метка
переменной
(Variable label)
Фамилия
респондента
Пол
респондента
Метки значений
(Value label)
Нет
1 –мужской
2- женский
Возраст
Нет
Образование
1- Незаконченное
среднее
2 - Среднее
3 - Незаконченное
высшее
4 - Высшее
Если бы в опросе
участвовали
респонденты
из 10 городов,
то какой тип
надо было бы
присвоить
переменной
с именем City и
меткой
переменной
“Город”?
NB! Если присвоить символьный тип, то при вводе, сколько было
респондентов из Владивостока, столько раз и придется набирать
название города. Лучше уж каждому городу присвоить номер и вместо
названия города вводить его номер, правда, нужно помнить, какому
городу соответствует какой номер, но SPSS подскажет это, если вместо
ввода номера города нажать стрелку в углу ячейки и выбрать город из
вывалившегося списка, тогда номер метки сам окажется в ячейке.
Попробуйте это с полом респондента.
У переменных есть значения и есть метки значений, в ячейках же
показывается либо то, либо другое, управляет этим команда:
View
Value Label
Попробуйте.
Возможность выбирать при вводе из списка работает
только при включенном режиме Value Label