3. Чтобы работать с Google таблицами,
необходимо завести аккаунт Google
4. Google документы:
Допускают совместную работу над
таблицей онлайн.
Если вдруг оборвалась связь с
интернетом, то работать с документом
невозможно.
Можно включить возможность
автономной работы.
11. Готово
Примечание: Если таблица отказывается импортировать файл .xls, ссылаясь на
то, что это неизвестный ей формат, можно попробовать открыть этот файл в
таблице Excel или Open/Libre Calc и сохранить его, например, в версии 97-2003.
12. Важно: До начала обработки данных обязательно
нужно сделать копию документа, чтобы исходный
вариант на всякий случай тоже сохранился.
13. Как правило, данные в таблице бывают отформатированы.
Удобства ради уберем форматирование, чтобы видеть
таблицу в чистом виде.
18. Что делать с отсутствующими
данными?
• Это всегда зависит от конкретной ситуации.
• Отсутствие данных может быть поводом
провести расследование именно по этому
вопросу.
• Можно попробовать обратиться в ведомства,
отвечающие за публикацию этих данных, и
запросить недостающую информацию.
• Можно попробовать поискать наборы данных
по той же теме в других источниках.
19. Что делать с отсутствующими
данными?
• В ряде случаев, когда речь идет об общих
тенденциях и соотношениях, отсутствием
данных можно пренебречь: например,
вообще не рассматривать данные за
определенный период, а исследовать тот
период, для которого все данные есть.
• Аналитики в применении к некоторым
случаям могут сопоставлять просто последние
имеющиеся данные для каждого случая.
20. Важно: все допущения в работе с
данными желательно фиксировать в
таблице – например, в форме
комментария.
21. В нашем случае данных за 2010 и 2011 гг. существенно
меньше, чем за прочие годы. Попробуем посмотреть тот
период, за который у нас больше данных.
22. Выделяем нужную область, копируем её (Ctrl+C),
создаем новую вкладку в таблице и вставляем туда
то, что скопировали (Ctrl+V)
25. В нашем случае рассортируем страны по признаку общей
численности самоубийств от максимальных показателей к
минимальным.
26.
27. Теперь у нас есть рассортированные данные,
и мы можем сосредоточиться на странах с
максимальными и минимальными
значениями.
К примеру, можно сопоставить эти
показатели с другими индикаторами
благополучия/неблагополучия. Например,
ВВП, продолжительность жизни, уровень
безработицы и т.д.
28. Забегая вперед, скажу, что во многих случаях из тех, с
которыми мы хотим сопоставить наши данные, отсутствуют
значения за 2004 г. Также по ряду стран некоторые данные
представлены очень неполно. Набор стран, с которыми мы в
дальнейшем будем работать, обусловлен и этими
факторами.
29. За 2005 год отсутствуют данные по Италии. В порядке
допущения внесем в ячейку тот же показатель, что в 2006 г.
(необходимо это указать).
30. Теперь попробуем соотнести это с
другими показателями, как-то:
• Продолжительность жизни
• ВВП
• Уровень безработицы
• Бюджет на социальные нужды
• Бюджет на пособия по безработице
32. Одно из возможных решений – представить
данные в виде интерактивной динамической
схемы
https://docs.google.com/spreadsheet/ccc?key=0AofhFA7uQyz0dEwxMGE2Q
WpsNUtpbDhmN0U3cXJ0MXc#gid=0
33. Динамическую схему (motion
chart) разработал Ханс
Рослинг (Hans Rosling),
шведский врач и статистик.
Выступления Рослинга (в том числе презентация
динамической схемы) на конференции TED:
http://www.ted.com/speakers/hans_rosling.html
34. В свою очередь, сводная таблица
должна выглядеть примерно так:
51. Ссылки:
• Таблица, которая была создана в итоге:
https://docs.google.com/spreadsheet/ccc?key=0Aof
hFA7uQyz0dEwxMGE2QWpsNUtpbDhmN0U3cXJ0M
Xc#gid=0
• Google Диск: https://drive.google.com
• Data Wrangler: http://vis.stanford.edu/wrangler/