Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Визуализация данных на географических картах в Tableau. Следующий уровень.

2,817 views

Published on

Расширенный тренинг по созданию визуализаций на географических картах в Tableau. Рассматриваются визуализация линейных объектов, сетей распределения, использование собственных баз данных для геокодирования. Также рассматривается использование произвольных изображений в качестве подложки для визуализаций.

Материал разработан для курса Информационные технологии в менеджменте факультета логистики НИУ ВШЭ, 2014 год

Published in: Data & Analytics

Визуализация данных на географических картах в Tableau. Следующий уровень.

  1. 1. Визуализация данных на географических картах Следующий уровень v0.2 Заходякин Глеб postlogist@gmail.com Факультет логистики НИУ ВШЭ
  2. 2. План занятия • Визуализация линейных объектов • Визуализация сети распределения • Пользовательская база данных для геокодирования • Использование изображений в качестве подложки для карты • Интерактивность 2
  3. 3. Файлы данных • Файлы данных для выполнения тренинга можно загрузить по ссылке: https://yadi.sk/d/aDo7AnGUdVXvk 3
  4. 4. КАРТА ЛИНИЙ МОСКОВСКОГО МЕТРОПОЛИТЕНА Визуализация линейных объектов 4
  5. 5. Файл данных • Изучите содержимое файла metro_stations.xlsx в Excel • Источник данных – Википедия: https://ru.wikipedia.org/wiki/Список_станций_Московского_метрополитена – На листе Станции содержится список станций московского метро с указанием координат и характеристик. – На листе Линии содержится список линий метрополитена и их цветовые обозначения на схеме метро • Создайте новую рабочую книгу: metro_stations.twbx • Закройте файл в Excel и создайте подключение к данным на листе Станции в Tableau (можно просто перетащить файл в окно Tableau) • При импорте нужно указать географическую роль – Latitude и Longitude для полей Широта и Долгота 5
  6. 6. Визуализация линейных объектов • Вспомним, что все линейные объекты на картах изображаются с помощью ломаных линий (возможно, с очень большим числом сегментов, чтобы обеспечить гладкость) • Для построения ломаной линии нужны 4 поля: координаты каждого узла, порядковый номер узла, код линии. Порядковый номер узла должен быть числового типа, либо датой/временем. Код линии может быть любого дискретного типа 6
  7. 7. Данные о маршрутах линий метрополитена • На рисунке показан фрагмент таблицы с данными о станциях (часть строк и столбцов скрыта) • В таблице для каждой станции указаны координаты, номер и название линии, порядковый номер на линии • Обратите внимание, что начальный и конечный узел ломаной линии не соединяются автоматически, поэтому запись о станции Парк культуры продублирована, чтобы кольцевая линия получилась замкнутой 7
  8. 8. Визуализация линий метро на карте • Числовые поля Линия и Порядковый номер на линии по умолчанию добавлены в список фактов. Сделайте их измерениями, перетащив в список Dimensions • Добавьте координаты станций в область строк и столбцов • Добавьте название линии в область цвета (Color) • Поменяйте тип графического элемента на панели Marks на Line и добавьте измерение Порядковый номер на линии в область Path • Щелкните по области Color и включите отображение маркеров, чтобы показать расположение станций, там же установите полупрозрачность (Transparency) • В контекстном меню цветовой легенды выберите Edit Colors… и назначьте линиям привычные цвета (см. лист Линии в Excel) • Задайте имя листа в книге Tableau - Линии 8
  9. 9. Добавление вычисляемых полей • Интересно помимо расположения станций отразить на карте их характеристики – например, возраст и глубину залегания. Чтобы рассчитать возраст, можно воспользоваться функцией DateDiff() • Чтобы создать вычисляемые поля, выберите команду Create Calculated Field… в контекстном меню области данных • Формулы для вычисления полей можно печатать с клавиатуры, или выбирать их элементы, щелкая по спискам полей и функций • Для удобства поиска нужных функций, используйте категории функций (Date) • Краткая подсказка по функции выводится здесь же. Нажав на ссылку Help, можно перейти к подробной справке • Глубина в наборе данных указана как отрицательное число. Для визуализации удобнее использовать противоположное ей число. Создайте поле Глубина2, вычисляемое по формуле: - Глубина 9
  10. 10. Визуализация глубины залегания станций • Продублируйте созданный ранее лист Линии. Назовите копию Глубина залегания станций • Перетащите поле Глубина2 в область размера (Size) • Зажав правую кнопку мыши, перетащите поле Название станции в область метки (Label). Выберите в появившемся диалоге (Drop Field) вариант ATTR(Название станции). – Измерение Название станции преобразуется в атрибут. В отличие от измерений, атрибуты не используются для группировки данных. Если не делать такое преобразование, то вся сеть разделится на отдельные станции • Щелкнув по области метки (Label), задайте, чтобы метки выводились только для подсвеченных (Highlighted) объектов. Запретите перекрытие меток с другими объектами. • Результат показан на рисунке. Проверьте, чтобы в области цветовой легенды был включен режим подсветки для всех объектов того же цвета: по клику на станции должна выбираться вся линия 10
  11. 11. Визуализация возраста станций • Продублируйте предыдущий лист и назовите копию: Возраст станций • В области Size замените поле Глубина2 на Возраст 11
  12. 12. Визуализация развития метрополитена • Чтобы можно было видеть, как росла сеть метрополитена, добавим фильтр по году открытия станции • Перетащите поле Дата открытия в область фильтра (Filters). Выберите Year в появившемся окне Filter Field. В окне настройки фильтра пока можно ничего выбирать, нажмите OK • В контекстном меню поля Дата открытия в области фильтров переключите тип дат на непрерывные годы (Year в нижней части меню) • Появится окно настройки фильтра. Выберите здесь фильтрацию по дате окончания (Ending date). Пока не меняйте порог фильтра 12
  13. 13. Добавление быстрого фильтра • В контекстном меню поля Дата открытия в области фильтров выберите Show Quick Filter • Попробуйте менять порог фильтрации, вы увидите, как росла со временем сеть московского метро • Слайдер быстрого фильтра можно двигать с помощью стрелок на клавиатуре (нажатие клавиши Shift позволяет изменять порог более плавно) 13
  14. 14. Настройка карты-подложки • В предыдущем тренинге мы уже добавляли новые источники карт для подложки. Теперь мы рассмотрим, что можно сделать с помощью настройки штатных карт Tableau • В меню Map выберите команду Map Options… • Область данных заменится на окно форматирования карты. Здесь можно: – выбрать стиль карты – темный, светлый, стандартный; – осветлить подложку (washout), чтобы пестрые цвета не отвлекали пользователя от ваших данных – включить или отключить некоторые элементы карты-подложки: границы, названия, дорожную сеть… – некоторые типы карт (в основном, на территорию США) позволяют накладывать слои со статистическими данными по регионам • С помощью форматирования, постарайтесь получить вид карты-подложки как на рисунке 14
  15. 15. ВИЗУАЛИЗАЦИЯ СЕТИ РАСПРЕДЕЛЕНИЯ Визуализация линейных объектов 15
  16. 16. Файл данных • Создайте новую книгу Tableau – distribution network.twbx • Создайте подключение к файлу distribution_network.csv – Укажите для поля Name тип данных: String – Выберите режим подключения: Extract • Основные поля для визуализации сети: координаты склада/магазина (данные уже геокодированы), Маршрут (каждое сочетание склад – магазин имеет свой уникальный номер маршрута), Порядковый номер (1 – склад, 2 – магазин) • Также с маршрутом связаны несколько характеристик – поток (FlowTrucks, FlowPallets), коэффициент загрузки машин (TruckUtilization) • Size – это характеристика склада (размер арендуемой площади), он продублирован для всех маршрутов, которые начинаются на данном складе • MaxDays – это максимально допустимое число дней на поставку для данного магазина 16
  17. 17. Названия объектов • Сейчас для складов и магазинов названия содержатся в разных столбцах • Поскольку подписи для объектов на карте должны формироваться на основе одного поля, необходимо создать вычисляемое поле Название, которое будет для всех пунктов отправления (порядковый номер = 1) содержать название склада, а для всех пунктов назначения (порядковый номер = 2) – название магазина 17
  18. 18. Визуализация размещения объектов • Переименуйте рабочий лист в Сеть распределения • Сделайте поля Маршрут и Порядковый номер измерениями • Добавьте координаты в область строк и столбцов (Rows/Columns) • Добавьте Название в область метки (Label) • Переключите тип графического элемента (Marks) на Shape и добавьте Порядковый номер в область фигуры (Shape) и цвета (Color) • Выберите для складов (порядковый номер = 1) красные треугольники с заливкой, а для магазинов – зеленые круги с заливкой (в контекстном меню легенды для фигур и цветов) • Задайте для поля Size агрегирующую функцию по умолчанию – AVG (среднее) и перетащите это поле в область размера (Size) 18
  19. 19. Визуализация товарных потоков • Продублируйте (Ctrl-перетаскивание) поле Latitude в области строк (Rows) • В области Marks откройте карточку для первого поля Latitude (соответствует верхней диаграмме) • Удалите все поля из области Marks • Переключите тип графического элемента на Line • Добавьте поле Маршрут в детали (Detail), а поле Порядковый номер – в Path. • Добавьте поле FlowTrucks в область размера (Size). • Выберите темно-синий цвет для линии (Color) • Совместите диаграммы, выбрав в контекстном меню поля Latitude режим Dual Axis 19
  20. 20. ПОЛЬЗОВАТЕЛЬСКАЯ БАЗА ДЛЯ ГЕОКОДИРОВАНИЯ Расширение возможностей Tableau 20
  21. 21. Импорт данных для геокодирования • Чтобы обеспечить возможность геокодирования названий населенных пунктов на русском языке, мы дополним базу данных геокодирования Tableau • Распакуйте содержимое архива russian_geocoding.zip на рабочий стол (должна появиться папка russian geocoding, содержащая 3 файла) • Выполните команду меню Map/Geocoding/Import custom geocoding… • Укажите в диалоге Import Custom Geocoding путь к папке russian geocoding и нажмите Import • В вашем личном каталоге (Мои документы>My Tableau Repository) создастся копия базы данных геокодирования, в которую будут добавлены данные о русских названиях • Удалить данные для геокодирования можно с помощью команды меню: Map/Geocoding/Remove custom geocoding • Будет создана новая иерархия географических ролей: Субъект [федерации] > Район > Название • Описание требований к файлам для импорта содержится в справке Tableau. Попасть в нужный раздел можно с помощью ссылки “Learn about Custom Geocoding” в окне Import Custom Geocoding • Данные для геокодирования можно найти на сайтах: geonames.org, geonames.nga.mil, gis-lab.info • Данные в базе, которую мы импортировали, созданы на основе набора данных, подготовленного сообществом gis-lab.info: http://gis-lab.info/qa/vmap0-settl-rus.html 21
  22. 22. Файл данных • Создайте новую рабочую книгу: top_cities.twbx • Создайте подключение к источнику данных top_cities.csv – это данные о городах России с населением свыше 100 жителей – источник: http://ru.wikipedia.org/wiki/Список_городов_России_с_населением_более_100_тысяч_жителей • Если программа не распознала, что в первой строке файла содержатся заголовки, то выберите в настройках таблицы этот режим • Выберите для полей Город и Субъект географические роли: Название и Субъект 22
  23. 23. Визуализация развития городов • Добавьте поля Город и Субъект в область деталей (Detail) • Сделайте поле Год измерением и добавьте его в область страниц (Pages) • Добавьте поле Население в область размера (Size) • Запустите анимацию, нажав на кнопку воспроизведения в области Pages • В большинстве случаев, импортированная база для геокодирования содержала координаты нужного города, однако некоторые города там отсутствуют, даже крупные 23
  24. 24. ДОСТОПРИМЕЧАТЕЛЬНОСТИ НА СХЕМЕ ТОКИЙСКОГО МЕТРО Использование изображения как подложки 24
  25. 25. Файл данных • Создайте новую рабочую книгу japan_subway.twbx • Создайте подключение к источнику данных japan_subway.xlsx • Файл данных содержит список достопримечательностей Токио • Ваша задача – визуализировать эти достопримечательности на схеме Токийского метро 25
  26. 26. Изображение-подложка • В качестве подложки для визуализации можно использовать не только географические карты, но и любой графический файл. С этим файлом можно связать условную систему координат, и затем использовать эти координаты в наборе данных. • Выполните команду Map>Background Images и выберите набор данных japan_subway. • В списке Background Images нажмите Add Image… • Укажите путь к файлу japan_subway.jpg • Свяжите X Field с полем x в наборе данных и установите правую границу в 100 • Свяжите Y Field с полем y в наборе данных и установите верхнюю границу в 60 • На вкладке Options выберите Always show entire image • Установите размытие изображения 26
  27. 27. Визуализация набора данных • Добавьте координаты x, y в область столбцов и строк, поле Name - в область метки • Добавьте поля Comment и URL в область подсказки (Tooltip) • Отредактируйте параметры подсказки и графического элемента, чтобы получить результат как на рисунке • Отключите вывод подписей для координатных осей (Show header в контекстном меню оси) 27
  28. 28. Как получить координаты • Предположим, мы хотим включить в набор данных координаты станции Meguro. Когда уже есть привязанное изображение, координаты точки можно получить так: – установите курсор мыши в нужную точку и в контекстном меню выполните команду Annotate>Point – в полученной аннотации будут указаны нужные координаты 28
  29. 29. Интерактивность • С рабочим листом можно связывать действия, которые срабатывают, когда пользователь указывает или выделяет графический элемент на листе • Выполните команду меню Worksheet>Actions и добавьте новое действие Add Action >URL • Укажите имя для действия (Name): Найти <Name> Area в Google Maps. Примечание: название поля в угловых скобках надо добавлять через меню Insert • В области Run Action on нужно выбрать: Menu • В поле URL укажите: https://maps.google.com/maps?q=<Name>,+Tokyo,+Japan&hl=en Примечание: название поля в угловых скобках надо добавлять через меню Insert • Если вы хотите использовать поля, содержащие строки на русском языке, то, скорее всего, потребуется установить флажок URL Encode • Теперь при наведении мыши на станцию в подсказке должна быть ссылка на Google maps 29

×