SlideShare a Scribd company logo
1 of 20
Download to read offline
Консультация
«Профессия дата-журналист»
РАДЧЕНКО ИРИНА АЛЕКСЕЕВНА
18 ОКТЯБРЯ 2018 Г.
Вопрос №1
u На портале DataReview (http://datareview.info/article/irina-radchenko-data-
zhurnalistika-nachinaet-obretat-svoih-pionerov/) вы приводите цитату Т. Бернеса-Ли.
Расскажите, пожалуйста, что скрывается за фразой "Журналисты должны
хорошо уметь работать с данными и ориентироваться в них, как рыба в воде".
Каковы критерии того, что журналист умеет хорошо работать с данными?
Ответ №1
Основной критерий
Грамотная статья в стиле дата-журналистики.
Ответ №1
Какой дата-журналист (ДЖ) сможет написать грамотную статью?
1. ДЖ обладает компьютерной грамотностью.
2. ДЖ имеет представление и умеет пользоваться научным подходом.
3. ДЖ полностью самостоятельно может выстроить процесс управления данными
(Data Management Strategy/Data Management Plan).
4. ДЖ имеет соответствующие компетенции в области работы с данными (данные
и структуры данных, статистика, управление данными, анализ данных, визуализация
данных, подготовка данных, очистка данных, методы работы с большими данными,
программирование, ориентированные на данные, работа с открытыми данными,
юридические аспекты работы с данными и тд).
Вопрос №2
u В этой же статье Вы говорите "Для написания статей в стиле дата-
журналистики необходимы открытые данные". Данные в различных
соц.сетях – вроде как открытые данные, но вместе с тем – они являются
персональными данными. Можем ли мы использовать их с юридической
точки зрения?
Ответ №2
Данные из соцсетей не являются открытыми данными.
Примеры:
u Скандал с Cambridge Analytica
(https://en.wikipedia.org/wiki/Facebook%E2%80%93Cambridge_Analytica_data_scan
dal).
u Удаление аккаунтов DataSocialHub (https://vc.ru/services/47867-rossiyskaya-social-
data-hub-pozhalovalas-na-blokirovki-66-akkauntov-v-facebook-iz-za-sbora-dannyh-
polzovateley).
u Что такое персональные данные? https://ec.europa.eu/info/law/law-topic/data-
protection/reform/what-personal-data_en
Вопрос №3
u Что лучше использовать R или Python?
Какие библиотеки R вы можете порекомендовать?
Ответ №3
u Все зависит от задач.
Parameter R Python
Objective
Data analysis and
statistics
Deployment and
production
Primary Users Scholar and R&D
Programmers and
developers
Popularity of
Programming
Language.
Percentage change
4.23% in 2018 21.69% in 2018
Average Salary $99.000 $100.000
Integration Run locally Well-integrated with app
Disadvantages
Slow High Learning
curve
Dependencies
between library
Not as many libraries as R
Advantages
• Graphs are made to
talk. R makes it beautiful
• Large catalog for data
analysis
• GitHub interface
• RMarkdown
• Shiny
• Jupyter notebook:
Notebooks help to share
data with colleagues
• Mathematical
computation
• Deployment
• Code Readability
• Speed
• Function in Pythonhttps://www.guru99.com/r-vs-python.html
Популярность R (син.) и Python (оранж.)
Ответ №3
Библиотеки R для работы с данными (малая толика от множества)
u RMySQL, RPostgresSQL, RSQLite – для работы с SQL
u XLConnect, xlsx – работа с Excel
u jsonlite – работа с JSON
u dplyr – описательная статистика
u stringr – работа со строками и регулярными выражениями
u ggplot2 – визуализация данных
u ggvis – интерактивная визуализация
u htmlwidgets – визуализация на основе JavaScript
u shiny – отчеты и веб-приложения
u maps – работа с картами
u randomForest – Random Forest для машинного обучения
Вопрос №4
u Какой уровень зарплат у дата-журналиста в 2018 году?
Какие перспективы роста зарплат?
Ответ №4
Ответ №4
Вопрос №5
u Дата журналистика – это подмножество Data Science?
Ответ №5
u Нет
Data
Science
Journalism
DataJournalism
Вопрос №6
u Какими софт-скиллами и хард-скиллами должен обладать хороший
дата-журналист?
Ответ №6
Hard skills
u Excellent spreadsheet skills, with the ability to teach others.
u Proficiency with relational databases and SQL.
u Strong analytical, research and investigative skills.
u Successful public records requests for databases.
u Familiar with math and basic statistics needed for data analysis.
u An understanding of data visualization and news apps.
u Experience analyzing data with code (Python, R).
u Familiarity with spatial analysis using GIS programs (QGIS or ArcMap).
u Other preferred skills: web scraping, statistical testing and programming.
Web development skills a plus.
Ответ №6
Soft skills
u Team up with reporters throughout the newsroom to produce data-driven stories.
u Teach and mentor reporters, both one-on-one and in group settings, to promote data
journalism skill across all beats.
u Strong written and verbal communication skills.
u Excellent interpersonal skills and an ability to collaborate with diverse individuals.
u Stay current with developments and trends in data journalism.
u Ability to manage multiple projects under tight deadlines.
Вопрос №7
u Где дата-журналисту искать работу?
Ответ №7
В России
u Медиа-агентства
u По знакомству (по знакомству во ВШЭ и в медиа-тусовке)
u Гуглить (и найти случайные вакансии)
За рубежом
u Медиа-агентства
u Агрегаторы (indeed, glassdoor, etc)
u Гуглить, общаться с зарубежными дата-журналистами
Радченко Ирина Алексеевна
iradche@gmail.com
Октябрь 2018

More Related Content

Similar to Data journalist

Лекция 1. Введение в Big Data и MapReduce
Лекция 1. Введение в Big Data и MapReduceЛекция 1. Введение в Big Data и MapReduce
Лекция 1. Введение в Big Data и MapReduceTechnopark
 
Журналистика данных 101
Журналистика данных 101Журналистика данных 101
Журналистика данных 101Krystsina Shveda
 
Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big DataAndrey Kazakevich
 
Моделирование бизнес-процессов. Занятие 1
Моделирование бизнес-процессов. Занятие 1Моделирование бизнес-процессов. Занятие 1
Моделирование бизнес-процессов. Занятие 1Olya Kollen, PhD
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013Gleb K
 
Семинар 24-25 апреля 2014 г. «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»
Семинар 24-25 апреля 2014 г.  «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»Семинар 24-25 апреля 2014 г.  «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»
Семинар 24-25 апреля 2014 г. «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»АНАЛИТИКА ПЛЮС
 
Дата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаДата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаMax Kornev
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Evgeniy Pavlovskiy
 
SECON'2016. Бартунов Олег, Карьера в Open Source
SECON'2016. Бартунов Олег, Карьера в Open SourceSECON'2016. Бартунов Олег, Карьера в Open Source
SECON'2016. Бартунов Олег, Карьера в Open SourceSECON
 
Низкомолекулярное проектирование: структурированные данные и UX
Низкомолекулярное проектирование: структурированные данные и UXНизкомолекулярное проектирование: структурированные данные и UX
Низкомолекулярное проектирование: структурированные данные и UXLara Simonova
 
Top big data architecture patterns by Igor Chub
Top big data architecture patterns  by Igor ChubTop big data architecture patterns  by Igor Chub
Top big data architecture patterns by Igor Chub.NET User Group Dnipro
 
School IT recruiting
School IT recruiting School IT recruiting
School IT recruiting Olga Kotova
 
Платформа и решения НРЕ для больших данных
Платформа и решения НРЕ для больших данныхПлатформа и решения НРЕ для больших данных
Платформа и решения НРЕ для больших данныхAndrey Karpov
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13Vladimir Krylov
 
Открытые данные: от теории к практике
Открытые данные: от теории к практикеОткрытые данные: от теории к практике
Открытые данные: от теории к практикеMoscow IT Department
 
Большому аналитику - большие данные
Большому аналитику - большие данныеБольшому аналитику - большие данные
Большому аналитику - большие данныеSQALab
 
Машинное обучение на платформе .NET
Машинное обучение на платформе .NETМашинное обучение на платформе .NET
Машинное обучение на платформе .NETDotNetConf
 

Similar to Data journalist (20)

Умник
УмникУмник
Умник
 
Лекция 1. Введение в Big Data и MapReduce
Лекция 1. Введение в Big Data и MapReduceЛекция 1. Введение в Big Data и MapReduce
Лекция 1. Введение в Big Data и MapReduce
 
Журналистика данных 101
Журналистика данных 101Журналистика данных 101
Журналистика данных 101
 
Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
 
Моделирование бизнес-процессов. Занятие 1
Моделирование бизнес-процессов. Занятие 1Моделирование бизнес-процессов. Занятие 1
Моделирование бизнес-процессов. Занятие 1
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013
 
Семинар 24-25 апреля 2014 г. «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»
Семинар 24-25 апреля 2014 г.  «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»Семинар 24-25 апреля 2014 г.  «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»
Семинар 24-25 апреля 2014 г. «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»
 
Дата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаДата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контента
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
SECON'2016. Бартунов Олег, Карьера в Open Source
SECON'2016. Бартунов Олег, Карьера в Open SourceSECON'2016. Бартунов Олег, Карьера в Open Source
SECON'2016. Бартунов Олег, Карьера в Open Source
 
Низкомолекулярное проектирование: структурированные данные и UX
Низкомолекулярное проектирование: структурированные данные и UXНизкомолекулярное проектирование: структурированные данные и UX
Низкомолекулярное проектирование: структурированные данные и UX
 
Top big data architecture patterns by Igor Chub
Top big data architecture patterns  by Igor ChubTop big data architecture patterns  by Igor Chub
Top big data architecture patterns by Igor Chub
 
School IT recruiting
School IT recruiting School IT recruiting
School IT recruiting
 
Платформа и решения НРЕ для больших данных
Платформа и решения НРЕ для больших данныхПлатформа и решения НРЕ для больших данных
Платформа и решения НРЕ для больших данных
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13
 
Открытые данные: от теории к практике
Открытые данные: от теории к практикеОткрытые данные: от теории к практике
Открытые данные: от теории к практике
 
Большому аналитику - большие данные
Большому аналитику - большие данныеБольшому аналитику - большие данные
Большому аналитику - большие данные
 
RST2014_Kazan_ReflowReader
RST2014_Kazan_ReflowReaderRST2014_Kazan_ReflowReader
RST2014_Kazan_ReflowReader
 
Машинное обучение на платформе .NET
Машинное обучение на платформе .NETМашинное обучение на платформе .NET
Машинное обучение на платформе .NET
 
W2 zharkova
W2 zharkovaW2 zharkova
W2 zharkova
 

More from Irina Radchenko

Аналитик, данные и джаз
Аналитик, данные и джазАналитик, данные и джаз
Аналитик, данные и джазIrina Radchenko
 
Как и где искать открытые данные?
Как и где искать открытые данные?Как и где искать открытые данные?
Как и где искать открытые данные?Irina Radchenko
 
Дата-экспедиции. Data Expeditions
Дата-экспедиции. Data ExpeditionsДата-экспедиции. Data Expeditions
Дата-экспедиции. Data ExpeditionsIrina Radchenko
 
Data Expeditions Eduthon
Data Expeditions EduthonData Expeditions Eduthon
Data Expeditions EduthonIrina Radchenko
 
Анализ 
и визуализация данных
Анализ 
и визуализация данныхАнализ 
и визуализация данных
Анализ 
и визуализация данныхIrina Radchenko
 
Data management syllabus
Data management syllabusData management syllabus
Data management syllabusIrina Radchenko
 
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...Irina Radchenko
 
How to become a Data Scientist
How to become a Data Scientist How to become a Data Scientist
How to become a Data Scientist Irina Radchenko
 
Вебинар по статистике
Вебинар по статистикеВебинар по статистике
Вебинар по статистикеIrina Radchenko
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data JournalismIrina Radchenko
 
Introduction to Open Data
Introduction to Open DataIntroduction to Open Data
Introduction to Open DataIrina Radchenko
 
Open Data hackathons in Russia
Open Data hackathons in RussiaOpen Data hackathons in Russia
Open Data hackathons in RussiaIrina Radchenko
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data JournalismIrina Radchenko
 
Open science as a cultural basis in Digital economy
Open science as a cultural basis in Digital economyOpen science as a cultural basis in Digital economy
Open science as a cultural basis in Digital economyIrina Radchenko
 

More from Irina Radchenko (20)

Аналитик, данные и джаз
Аналитик, данные и джазАналитик, данные и джаз
Аналитик, данные и джаз
 
Open access as is
Open access as isOpen access as is
Open access as is
 
Как и где искать открытые данные?
Как и где искать открытые данные?Как и где искать открытые данные?
Как и где искать открытые данные?
 
Дата-экспедиции. Data Expeditions
Дата-экспедиции. Data ExpeditionsДата-экспедиции. Data Expeditions
Дата-экспедиции. Data Expeditions
 
Data expedition
Data expeditionData expedition
Data expedition
 
Data Expeditions Eduthon
Data Expeditions EduthonData Expeditions Eduthon
Data Expeditions Eduthon
 
Анализ 
и визуализация данных
Анализ 
и визуализация данныхАнализ 
и визуализация данных
Анализ 
и визуализация данных
 
Data management syllabus
Data management syllabusData management syllabus
Data management syllabus
 
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...
 
FREYA project
FREYA projectFREYA project
FREYA project
 
How to become a Data Scientist
How to become a Data Scientist How to become a Data Scientist
How to become a Data Scientist
 
Вебинар по статистике
Вебинар по статистикеВебинар по статистике
Вебинар по статистике
 
Программа CATT
Программа CATTПрограмма CATT
Программа CATT
 
Open Data aspects
Open Data aspectsOpen Data aspects
Open Data aspects
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data Journalism
 
Introduction to Open Data
Introduction to Open DataIntroduction to Open Data
Introduction to Open Data
 
Open Data hackathons in Russia
Open Data hackathons in RussiaOpen Data hackathons in Russia
Open Data hackathons in Russia
 
Working with Open Data
Working with Open DataWorking with Open Data
Working with Open Data
 
Introduction to Data Journalism
Introduction to Data JournalismIntroduction to Data Journalism
Introduction to Data Journalism
 
Open science as a cultural basis in Digital economy
Open science as a cultural basis in Digital economyOpen science as a cultural basis in Digital economy
Open science as a cultural basis in Digital economy
 

Data journalist

  • 2. Вопрос №1 u На портале DataReview (http://datareview.info/article/irina-radchenko-data- zhurnalistika-nachinaet-obretat-svoih-pionerov/) вы приводите цитату Т. Бернеса-Ли. Расскажите, пожалуйста, что скрывается за фразой "Журналисты должны хорошо уметь работать с данными и ориентироваться в них, как рыба в воде". Каковы критерии того, что журналист умеет хорошо работать с данными?
  • 3. Ответ №1 Основной критерий Грамотная статья в стиле дата-журналистики.
  • 4. Ответ №1 Какой дата-журналист (ДЖ) сможет написать грамотную статью? 1. ДЖ обладает компьютерной грамотностью. 2. ДЖ имеет представление и умеет пользоваться научным подходом. 3. ДЖ полностью самостоятельно может выстроить процесс управления данными (Data Management Strategy/Data Management Plan). 4. ДЖ имеет соответствующие компетенции в области работы с данными (данные и структуры данных, статистика, управление данными, анализ данных, визуализация данных, подготовка данных, очистка данных, методы работы с большими данными, программирование, ориентированные на данные, работа с открытыми данными, юридические аспекты работы с данными и тд).
  • 5. Вопрос №2 u В этой же статье Вы говорите "Для написания статей в стиле дата- журналистики необходимы открытые данные". Данные в различных соц.сетях – вроде как открытые данные, но вместе с тем – они являются персональными данными. Можем ли мы использовать их с юридической точки зрения?
  • 6. Ответ №2 Данные из соцсетей не являются открытыми данными. Примеры: u Скандал с Cambridge Analytica (https://en.wikipedia.org/wiki/Facebook%E2%80%93Cambridge_Analytica_data_scan dal). u Удаление аккаунтов DataSocialHub (https://vc.ru/services/47867-rossiyskaya-social- data-hub-pozhalovalas-na-blokirovki-66-akkauntov-v-facebook-iz-za-sbora-dannyh- polzovateley). u Что такое персональные данные? https://ec.europa.eu/info/law/law-topic/data- protection/reform/what-personal-data_en
  • 7. Вопрос №3 u Что лучше использовать R или Python? Какие библиотеки R вы можете порекомендовать?
  • 8. Ответ №3 u Все зависит от задач. Parameter R Python Objective Data analysis and statistics Deployment and production Primary Users Scholar and R&D Programmers and developers Popularity of Programming Language. Percentage change 4.23% in 2018 21.69% in 2018 Average Salary $99.000 $100.000 Integration Run locally Well-integrated with app Disadvantages Slow High Learning curve Dependencies between library Not as many libraries as R Advantages • Graphs are made to talk. R makes it beautiful • Large catalog for data analysis • GitHub interface • RMarkdown • Shiny • Jupyter notebook: Notebooks help to share data with colleagues • Mathematical computation • Deployment • Code Readability • Speed • Function in Pythonhttps://www.guru99.com/r-vs-python.html Популярность R (син.) и Python (оранж.)
  • 9. Ответ №3 Библиотеки R для работы с данными (малая толика от множества) u RMySQL, RPostgresSQL, RSQLite – для работы с SQL u XLConnect, xlsx – работа с Excel u jsonlite – работа с JSON u dplyr – описательная статистика u stringr – работа со строками и регулярными выражениями u ggplot2 – визуализация данных u ggvis – интерактивная визуализация u htmlwidgets – визуализация на основе JavaScript u shiny – отчеты и веб-приложения u maps – работа с картами u randomForest – Random Forest для машинного обучения
  • 10. Вопрос №4 u Какой уровень зарплат у дата-журналиста в 2018 году? Какие перспективы роста зарплат?
  • 13. Вопрос №5 u Дата журналистика – это подмножество Data Science?
  • 15. Вопрос №6 u Какими софт-скиллами и хард-скиллами должен обладать хороший дата-журналист?
  • 16. Ответ №6 Hard skills u Excellent spreadsheet skills, with the ability to teach others. u Proficiency with relational databases and SQL. u Strong analytical, research and investigative skills. u Successful public records requests for databases. u Familiar with math and basic statistics needed for data analysis. u An understanding of data visualization and news apps. u Experience analyzing data with code (Python, R). u Familiarity with spatial analysis using GIS programs (QGIS or ArcMap). u Other preferred skills: web scraping, statistical testing and programming. Web development skills a plus.
  • 17. Ответ №6 Soft skills u Team up with reporters throughout the newsroom to produce data-driven stories. u Teach and mentor reporters, both one-on-one and in group settings, to promote data journalism skill across all beats. u Strong written and verbal communication skills. u Excellent interpersonal skills and an ability to collaborate with diverse individuals. u Stay current with developments and trends in data journalism. u Ability to manage multiple projects under tight deadlines.
  • 18. Вопрос №7 u Где дата-журналисту искать работу?
  • 19. Ответ №7 В России u Медиа-агентства u По знакомству (по знакомству во ВШЭ и в медиа-тусовке) u Гуглить (и найти случайные вакансии) За рубежом u Медиа-агентства u Агрегаторы (indeed, glassdoor, etc) u Гуглить, общаться с зарубежными дата-журналистами