Консультация
«Профессия дата-журналист»
РАДЧЕНКО ИРИНА АЛЕКСЕЕВНА
18 ОКТЯБРЯ 2018 Г.
Вопрос №1
u На портале DataReview (http://datareview.info/article/irina-radchenko-data-
zhurnalistika-nachinaet-obretat-svoih-pionerov/) вы приводите цитату Т. Бернеса-Ли.
Расскажите, пожалуйста, что скрывается за фразой "Журналисты должны
хорошо уметь работать с данными и ориентироваться в них, как рыба в воде".
Каковы критерии того, что журналист умеет хорошо работать с данными?
Ответ №1
Основной критерий
Грамотная статья в стиле дата-журналистики.
Ответ №1
Какой дата-журналист (ДЖ) сможет написать грамотную статью?
1. ДЖ обладает компьютерной грамотностью.
2. ДЖ имеет представление и умеет пользоваться научным подходом.
3. ДЖ полностью самостоятельно может выстроить процесс управления данными
(Data Management Strategy/Data Management Plan).
4. ДЖ имеет соответствующие компетенции в области работы с данными (данные
и структуры данных, статистика, управление данными, анализ данных, визуализация
данных, подготовка данных, очистка данных, методы работы с большими данными,
программирование, ориентированные на данные, работа с открытыми данными,
юридические аспекты работы с данными и тд).
Вопрос №2
u В этой же статье Вы говорите "Для написания статей в стиле дата-
журналистики необходимы открытые данные". Данные в различных
соц.сетях – вроде как открытые данные, но вместе с тем – они являются
персональными данными. Можем ли мы использовать их с юридической
точки зрения?
Ответ №2
Данные из соцсетей не являются открытыми данными.
Примеры:
u Скандал с Cambridge Analytica
(https://en.wikipedia.org/wiki/Facebook%E2%80%93Cambridge_Analytica_data_scan
dal).
u Удаление аккаунтов DataSocialHub (https://vc.ru/services/47867-rossiyskaya-social-
data-hub-pozhalovalas-na-blokirovki-66-akkauntov-v-facebook-iz-za-sbora-dannyh-
polzovateley).
u Что такое персональные данные? https://ec.europa.eu/info/law/law-topic/data-
protection/reform/what-personal-data_en
Вопрос №3
u Что лучше использовать R или Python?
Какие библиотеки R вы можете порекомендовать?
Ответ №3
u Все зависит от задач.
Parameter R Python
Objective
Data analysis and
statistics
Deployment and
production
Primary Users Scholar and R&D
Programmers and
developers
Popularity of
Programming
Language.
Percentage change
4.23% in 2018 21.69% in 2018
Average Salary $99.000 $100.000
Integration Run locally Well-integrated with app
Disadvantages
Slow High Learning
curve
Dependencies
between library
Not as many libraries as R
Advantages
• Graphs are made to
talk. R makes it beautiful
• Large catalog for data
analysis
• GitHub interface
• RMarkdown
• Shiny
• Jupyter notebook:
Notebooks help to share
data with colleagues
• Mathematical
computation
• Deployment
• Code Readability
• Speed
• Function in Pythonhttps://www.guru99.com/r-vs-python.html
Популярность R (син.) и Python (оранж.)
Ответ №3
Библиотеки R для работы с данными (малая толика от множества)
u RMySQL, RPostgresSQL, RSQLite – для работы с SQL
u XLConnect, xlsx – работа с Excel
u jsonlite – работа с JSON
u dplyr – описательная статистика
u stringr – работа со строками и регулярными выражениями
u ggplot2 – визуализация данных
u ggvis – интерактивная визуализация
u htmlwidgets – визуализация на основе JavaScript
u shiny – отчеты и веб-приложения
u maps – работа с картами
u randomForest – Random Forest для машинного обучения
Вопрос №4
u Какой уровень зарплат у дата-журналиста в 2018 году?
Какие перспективы роста зарплат?
Ответ №4
Ответ №4
Вопрос №5
u Дата журналистика – это подмножество Data Science?
Ответ №5
u Нет
Data
Science
Journalism
DataJournalism
Вопрос №6
u Какими софт-скиллами и хард-скиллами должен обладать хороший
дата-журналист?
Ответ №6
Hard skills
u Excellent spreadsheet skills, with the ability to teach others.
u Proficiency with relational databases and SQL.
u Strong analytical, research and investigative skills.
u Successful public records requests for databases.
u Familiar with math and basic statistics needed for data analysis.
u An understanding of data visualization and news apps.
u Experience analyzing data with code (Python, R).
u Familiarity with spatial analysis using GIS programs (QGIS or ArcMap).
u Other preferred skills: web scraping, statistical testing and programming.
Web development skills a plus.
Ответ №6
Soft skills
u Team up with reporters throughout the newsroom to produce data-driven stories.
u Teach and mentor reporters, both one-on-one and in group settings, to promote data
journalism skill across all beats.
u Strong written and verbal communication skills.
u Excellent interpersonal skills and an ability to collaborate with diverse individuals.
u Stay current with developments and trends in data journalism.
u Ability to manage multiple projects under tight deadlines.
Вопрос №7
u Где дата-журналисту искать работу?
Ответ №7
В России
u Медиа-агентства
u По знакомству (по знакомству во ВШЭ и в медиа-тусовке)
u Гуглить (и найти случайные вакансии)
За рубежом
u Медиа-агентства
u Агрегаторы (indeed, glassdoor, etc)
u Гуглить, общаться с зарубежными дата-журналистами
Радченко Ирина Алексеевна
iradche@gmail.com
Октябрь 2018

Data journalist

  • 1.
  • 2.
    Вопрос №1 u Напортале DataReview (http://datareview.info/article/irina-radchenko-data- zhurnalistika-nachinaet-obretat-svoih-pionerov/) вы приводите цитату Т. Бернеса-Ли. Расскажите, пожалуйста, что скрывается за фразой "Журналисты должны хорошо уметь работать с данными и ориентироваться в них, как рыба в воде". Каковы критерии того, что журналист умеет хорошо работать с данными?
  • 3.
    Ответ №1 Основной критерий Грамотнаястатья в стиле дата-журналистики.
  • 4.
    Ответ №1 Какой дата-журналист(ДЖ) сможет написать грамотную статью? 1. ДЖ обладает компьютерной грамотностью. 2. ДЖ имеет представление и умеет пользоваться научным подходом. 3. ДЖ полностью самостоятельно может выстроить процесс управления данными (Data Management Strategy/Data Management Plan). 4. ДЖ имеет соответствующие компетенции в области работы с данными (данные и структуры данных, статистика, управление данными, анализ данных, визуализация данных, подготовка данных, очистка данных, методы работы с большими данными, программирование, ориентированные на данные, работа с открытыми данными, юридические аспекты работы с данными и тд).
  • 5.
    Вопрос №2 u Вэтой же статье Вы говорите "Для написания статей в стиле дата- журналистики необходимы открытые данные". Данные в различных соц.сетях – вроде как открытые данные, но вместе с тем – они являются персональными данными. Можем ли мы использовать их с юридической точки зрения?
  • 6.
    Ответ №2 Данные изсоцсетей не являются открытыми данными. Примеры: u Скандал с Cambridge Analytica (https://en.wikipedia.org/wiki/Facebook%E2%80%93Cambridge_Analytica_data_scan dal). u Удаление аккаунтов DataSocialHub (https://vc.ru/services/47867-rossiyskaya-social- data-hub-pozhalovalas-na-blokirovki-66-akkauntov-v-facebook-iz-za-sbora-dannyh- polzovateley). u Что такое персональные данные? https://ec.europa.eu/info/law/law-topic/data- protection/reform/what-personal-data_en
  • 7.
    Вопрос №3 u Чтолучше использовать R или Python? Какие библиотеки R вы можете порекомендовать?
  • 8.
    Ответ №3 u Всезависит от задач. Parameter R Python Objective Data analysis and statistics Deployment and production Primary Users Scholar and R&D Programmers and developers Popularity of Programming Language. Percentage change 4.23% in 2018 21.69% in 2018 Average Salary $99.000 $100.000 Integration Run locally Well-integrated with app Disadvantages Slow High Learning curve Dependencies between library Not as many libraries as R Advantages • Graphs are made to talk. R makes it beautiful • Large catalog for data analysis • GitHub interface • RMarkdown • Shiny • Jupyter notebook: Notebooks help to share data with colleagues • Mathematical computation • Deployment • Code Readability • Speed • Function in Pythonhttps://www.guru99.com/r-vs-python.html Популярность R (син.) и Python (оранж.)
  • 9.
    Ответ №3 Библиотеки Rдля работы с данными (малая толика от множества) u RMySQL, RPostgresSQL, RSQLite – для работы с SQL u XLConnect, xlsx – работа с Excel u jsonlite – работа с JSON u dplyr – описательная статистика u stringr – работа со строками и регулярными выражениями u ggplot2 – визуализация данных u ggvis – интерактивная визуализация u htmlwidgets – визуализация на основе JavaScript u shiny – отчеты и веб-приложения u maps – работа с картами u randomForest – Random Forest для машинного обучения
  • 10.
    Вопрос №4 u Какойуровень зарплат у дата-журналиста в 2018 году? Какие перспективы роста зарплат?
  • 11.
  • 12.
  • 13.
    Вопрос №5 u Датажурналистика – это подмножество Data Science?
  • 14.
  • 15.
    Вопрос №6 u Какимисофт-скиллами и хард-скиллами должен обладать хороший дата-журналист?
  • 16.
    Ответ №6 Hard skills uExcellent spreadsheet skills, with the ability to teach others. u Proficiency with relational databases and SQL. u Strong analytical, research and investigative skills. u Successful public records requests for databases. u Familiar with math and basic statistics needed for data analysis. u An understanding of data visualization and news apps. u Experience analyzing data with code (Python, R). u Familiarity with spatial analysis using GIS programs (QGIS or ArcMap). u Other preferred skills: web scraping, statistical testing and programming. Web development skills a plus.
  • 17.
    Ответ №6 Soft skills uTeam up with reporters throughout the newsroom to produce data-driven stories. u Teach and mentor reporters, both one-on-one and in group settings, to promote data journalism skill across all beats. u Strong written and verbal communication skills. u Excellent interpersonal skills and an ability to collaborate with diverse individuals. u Stay current with developments and trends in data journalism. u Ability to manage multiple projects under tight deadlines.
  • 18.
    Вопрос №7 u Гдедата-журналисту искать работу?
  • 19.
    Ответ №7 В России uМедиа-агентства u По знакомству (по знакомству во ВШЭ и в медиа-тусовке) u Гуглить (и найти случайные вакансии) За рубежом u Медиа-агентства u Агрегаторы (indeed, glassdoor, etc) u Гуглить, общаться с зарубежными дата-журналистами
  • 20.