2. Вопрос №1
u На портале DataReview (http://datareview.info/article/irina-radchenko-data-
zhurnalistika-nachinaet-obretat-svoih-pionerov/) вы приводите цитату Т. Бернеса-Ли.
Расскажите, пожалуйста, что скрывается за фразой "Журналисты должны
хорошо уметь работать с данными и ориентироваться в них, как рыба в воде".
Каковы критерии того, что журналист умеет хорошо работать с данными?
4. Ответ №1
Какой дата-журналист (ДЖ) сможет написать грамотную статью?
1. ДЖ обладает компьютерной грамотностью.
2. ДЖ имеет представление и умеет пользоваться научным подходом.
3. ДЖ полностью самостоятельно может выстроить процесс управления данными
(Data Management Strategy/Data Management Plan).
4. ДЖ имеет соответствующие компетенции в области работы с данными (данные
и структуры данных, статистика, управление данными, анализ данных, визуализация
данных, подготовка данных, очистка данных, методы работы с большими данными,
программирование, ориентированные на данные, работа с открытыми данными,
юридические аспекты работы с данными и тд).
5. Вопрос №2
u В этой же статье Вы говорите "Для написания статей в стиле дата-
журналистики необходимы открытые данные". Данные в различных
соц.сетях – вроде как открытые данные, но вместе с тем – они являются
персональными данными. Можем ли мы использовать их с юридической
точки зрения?
6. Ответ №2
Данные из соцсетей не являются открытыми данными.
Примеры:
u Скандал с Cambridge Analytica
(https://en.wikipedia.org/wiki/Facebook%E2%80%93Cambridge_Analytica_data_scan
dal).
u Удаление аккаунтов DataSocialHub (https://vc.ru/services/47867-rossiyskaya-social-
data-hub-pozhalovalas-na-blokirovki-66-akkauntov-v-facebook-iz-za-sbora-dannyh-
polzovateley).
u Что такое персональные данные? https://ec.europa.eu/info/law/law-topic/data-
protection/reform/what-personal-data_en
7. Вопрос №3
u Что лучше использовать R или Python?
Какие библиотеки R вы можете порекомендовать?
8. Ответ №3
u Все зависит от задач.
Parameter R Python
Objective
Data analysis and
statistics
Deployment and
production
Primary Users Scholar and R&D
Programmers and
developers
Popularity of
Programming
Language.
Percentage change
4.23% in 2018 21.69% in 2018
Average Salary $99.000 $100.000
Integration Run locally Well-integrated with app
Disadvantages
Slow High Learning
curve
Dependencies
between library
Not as many libraries as R
Advantages
• Graphs are made to
talk. R makes it beautiful
• Large catalog for data
analysis
• GitHub interface
• RMarkdown
• Shiny
• Jupyter notebook:
Notebooks help to share
data with colleagues
• Mathematical
computation
• Deployment
• Code Readability
• Speed
• Function in Pythonhttps://www.guru99.com/r-vs-python.html
Популярность R (син.) и Python (оранж.)
9. Ответ №3
Библиотеки R для работы с данными (малая толика от множества)
u RMySQL, RPostgresSQL, RSQLite – для работы с SQL
u XLConnect, xlsx – работа с Excel
u jsonlite – работа с JSON
u dplyr – описательная статистика
u stringr – работа со строками и регулярными выражениями
u ggplot2 – визуализация данных
u ggvis – интерактивная визуализация
u htmlwidgets – визуализация на основе JavaScript
u shiny – отчеты и веб-приложения
u maps – работа с картами
u randomForest – Random Forest для машинного обучения
10. Вопрос №4
u Какой уровень зарплат у дата-журналиста в 2018 году?
Какие перспективы роста зарплат?
15. Вопрос №6
u Какими софт-скиллами и хард-скиллами должен обладать хороший
дата-журналист?
16. Ответ №6
Hard skills
u Excellent spreadsheet skills, with the ability to teach others.
u Proficiency with relational databases and SQL.
u Strong analytical, research and investigative skills.
u Successful public records requests for databases.
u Familiar with math and basic statistics needed for data analysis.
u An understanding of data visualization and news apps.
u Experience analyzing data with code (Python, R).
u Familiarity with spatial analysis using GIS programs (QGIS or ArcMap).
u Other preferred skills: web scraping, statistical testing and programming.
Web development skills a plus.
17. Ответ №6
Soft skills
u Team up with reporters throughout the newsroom to produce data-driven stories.
u Teach and mentor reporters, both one-on-one and in group settings, to promote data
journalism skill across all beats.
u Strong written and verbal communication skills.
u Excellent interpersonal skills and an ability to collaborate with diverse individuals.
u Stay current with developments and trends in data journalism.
u Ability to manage multiple projects under tight deadlines.
19. Ответ №7
В России
u Медиа-агентства
u По знакомству (по знакомству во ВШЭ и в медиа-тусовке)
u Гуглить (и найти случайные вакансии)
За рубежом
u Медиа-агентства
u Агрегаторы (indeed, glassdoor, etc)
u Гуглить, общаться с зарубежными дата-журналистами