SlideShare a Scribd company logo
1 of 55
Магистерская программа
«Науки о данных» [“Data Science”]
и её специализации
Факультет компьютерных наук,
Департамент анализа данных и искусственного интеллекта
Высшая школа экономики, Москва, 2016
www.hse.ru
Академический руководитель:
д.ф.-м.н. С.О. Кузнецов
Высшая школа экономики, Москва, 2016
Магистерская программа «Науки о данных»
Что это такое (формально)?
фото
фото
• Программа «Науки о данных» [“Data Science”]
• Академический руководитель – д.ф.-м.н. С.О. Кузнецов
• Направление 01.04.02 «Прикладная математика и информатика»
• Подготовка ведётся с 2014 года
• Приём 2016 года – 40 бюджетных мест, 10 платных
• 3 специализации
• Оригинальный образовательный стандарт НИУ ВШЭ
• (http://www.hse.ru/ma/datasci/documents)
• В дальнейшем – Аспирантура по специальностям:
• 05.13.18 «Математическое моделирование, численные методы и комплексы
программ»
• 05.13.17 «Теоретические основы информатики»
• 05.13.11 «Математическое и программное обеспечение вычислительных машин,
комплексов и компьютерных сетей»
• Поддерживается Аспирантской школой по компьютерным наукам
• (http://aspirantura.hse.ru/cs)
2
Высшая школа экономики, Москва, 2016
Актуальность
О чём это?
фото
фото
• «Науки о данных» [“Data Science”] – одна из наиболее быстро
развивающихся прикладных междисциплинарных областей
современных информационных технологий
• DataJobs - What is Data Science? (https://datajobs.com/what-is-data-science)
• The Life of a Data Scientist (http://www.mastersindatascience.org/careers/data-scientist)
• Спрос на специалистов растёт непрерывно
• Hoping to land this year's 'hottest job'? Here's what you need to be a data scientist
(http://www.pcworld.com/article/3028002/hoping-to-land-this-years-hottest-job-heres-what-you-need-
to-be-a-data-scientist.html)
• В 2016 году это лучшая работа в Америке
• 25 Best Jobs in America (https://www.glassdoor.com/Best-Jobs-in-America-LST_KQ0,20.htm)
• Все ведущие университеты предлагают программу какого-либо уровня
• (http://www.mastersindatascience.org/schools/23-great-schools-with-masters-programs-in-data-
science)
• Все ведущие площадки MOOC предлагают хотя бы один курс или
целые цепочки курсов
• Courcera - Launch Your Career in Data Science
(https://www.coursera.org/specializations/jhudatascience)
3
Высшая школа экономики, Москва, 2016
Актуальность
фото
фото
• Кем предстоит работать?
• Учёным (разрабатывающим новые методы)
• Аналитиком (решающим прикладные задачи)
• Технологом (поддерживающим и развивающим имеющиеся
инструменты)
• Программист, администратор хранилищ данных и знаний, ...
• Спрос увеличивается инициативами, связанными с
Open Science, Open Data, Big Data, ...
• The Open Definition (http://opendefinition.org).
• Simon Chignard, A brief history of Open Data
(http://www.paristechreview.com/2013/03/29/brief-history-open-data).
• European Commission – Open Science
(http://ec.europa.eu/research/openscience/index.cfm)
• Появились термины «Журналистика данных», «Семантические
технологии», «Онтологическое моделирование», …
• Data driven journalism (http://datadrivenjournalism.net)
4
Высшая школа экономики, Москва, 2016
Отличие от других программ
фото
фото
• Общие методы анализа данных и конкретные задачи из различных
предметных областей
• 3 специализации (см. далее)
• Поддержка научными группами мирового уровня
• Вовлечение в интереснейшие проекты анализа данных или
проекты создания интеллектуальных алгоритмов и ПО
• Большая открытость и большое число партнёров (см. далее)
• Прекрасные возможности академической и научной мобильности
Отличия:
• От Business Intelligence (бизнес-аналитики)
• Понимание основ и акцент на создании новых методов
• От Computer Science (компьютерных наук)
• Акцент на анализе данных и междисциплинарность
5
Высшая школа экономики, Москва, 2016
Магистерская программа «Науки о данных»
Как поступить?
фото
фото
• Поступление на программу
• (http://www.hse.ru/ma/datasci/enroll)
• Экзамен по математике или олимпиада
• + квалификационный тест по английскому языку
• Распределение по специализациям – в начале учебного года
• Для поступления на специализацию «Анализ Интернет-данных»
необходимо пройти собеседование в компании Яндекс (ШАД)
6
Высшая школа экономики, Москва, 2016
Специализации магистерской программы
фото
фото
Интеллектуальные системы и структурный анализ (ИССА)
• Ориентирована на подготовку системных аналитиков и разработчиков, использующих и
создающих информационные системы с элементами искусственного интеллекта.
Предусматривается углубленное изучение методов анализа данных, машинного
обучения, структурного анализа, извлечения знаний из неструктурированных данных,
автоматической обработки текста.
Анализ Интернет-данных (АИД)
• Интернет-данные имеют свою специфику и интересны с различных точек зрения:
поиска, динамики изменения, формы представления. Программа ориентирована на
анализ особенностей Интернет-данных, задач их анализа и методов решения этих
задач. Концепция и учебный план разработаны совместно с компанией «Яндекс».
Подготовка студентов проходит с участием преподавателей из Школы анализа данных
компании «Яндекс».
Технологии моделирования сложных систем (ТМСС)
• Концепция и учебный план разработаны совместно с Институтом проблем передачи
информации им. А. А. Харкевича РАН для овладения современными методами
предсказательного моделирования сложных систем в широком спектре прикладных
областей от аэродинамики до биоинформатики. Подготовка студентов проходит с
участием преподавателей из ИППИ РАН.
7
Высшая школа экономики, Москва, 2016
Зарубежные партнёры
С кем мы активно сотрудничаем?
фото
фото
• Harvard University (USA)
• University of Texas at Brownsville (USA)
• Lorraine Research Laboratory in Computer Science and its Applications
(LORIA Nancy, France)
• Institut Supérieur d’Informatique, de Modélisation et de leurs Applications
(L’ISIMA Clermont-Ferrand, France)
• Institut National des Sciences Appliquées (INSA LYON, France)
• University of Blaise Pascal (Clermont-Ferrand, France)
• Katholieke Universiteit Leuven (KU Leuven, Belgium)
• Technische Universität Dresden (TU Dresden, Germany)
• Eindhoven University of Technology (TU/e, Eindhoven, Netherlands)
• Palacky Univeristy (Olomouc, Czech Republic)
• Université du Québec en Outaouais (Gatineau, Canada)
8
Высшая школа экономики, Москва, 2016
Российские партнёры
С кем мы активно сотрудничаем?
фото
фото
• Институт Проблем Передачи Информации РАН им. А.А. Харкевича
• Институт Системного Анализа РАН
• Школа анализа данных компании Яндекс
• ФНКЦ Детской гематологии, онкологии и иммунологии
им. Д. Рогачева
• Компании ImhoNet, Avicomp, АлгоМост и др.
• Фонд Сколково
• Партнёры из НИУ ВШЭ
• Департамент математики на факультете экономики, факультет
математики, факультет филологии, департамент психологии,
департамент программной инженерии, кафедра публичной
политики и др.
9
Высшая школа экономики, Москва, 2016
Ведущие преподаватели
Clustering and Data Mining
фото
фото
• Борис Миркин, д.т.н
• Professor Emeritus, Department of Applied
Mathematics and Informatics, State University Higher
School of Economics, Moscow
• Professor Emeritus, School of Computer Science and
Information Systems, Birkbeck College, London
University
• Учебник «Введение в анализ данных»
• (http://www.hse.ru/pubs/share/direct/demo_document/131681837)
10
Высшая школа экономики, Москва, 2016
Ведущие преподаватели
Social Network Analysis
фото
фото
• Леонид Жуков, PhD
• Professor, Department of Applied Mathematics and
Informatics
State University Higher School of Economics
• Visiting Faculty, Department of Computer Science,
California Institute of Technology
• Family tree construction, search
of historical records and other
information about ancestors
11
Высшая школа экономики, Москва, 2016
Ведущие преподаватели
Medical Informatics, Digital Imaging
фото
фото
• Олег Пьяных, PhD
• Professor, Department of Applied Mathematics and
Informatics, State University Higher School of
Economics
• Assistant Professor of Radiology, Harvard Medical
School
• Lecturer, Harvard Extension School, Harvard
University
• Digital Imaging and Communications in Medicine (DICOM):
A Practical Introduction and Survival Guide
• (http://www.algom.com/droleg/)
12
Высшая школа экономики, Москва, 2016
Структура программы
Чего не избежать?
фото
фото
• Дисциплины магистерской программы
• Современные методы анализа данных
• Б.Г. Миркин, профессор
• Современные методы принятия решений
• Дж. Декруэ, профессор
• + адаптационные дисциплины
• Дисциплины специализации
• Обязательные (2-3)
• По выбору (4-6)
• Включая одну дисциплину из общеуниверситетского пула
• Практики
• Научно-исследовательская (летняя после 1 курса)
• Преддипломная
• Магистерская диссертация!
13
Высшая школа экономики, Москва, 2016
Специализация «Интеллектуальные системы и
структурный анализ» (ИССА)
фото
фото
• Департамент Анализа данных и искусственного
интеллекта ФКН НИУ ВШЭ
• Международная научно-учебная лаборатория
Интеллектуальных систем и структурного анализа
ФКН НИУ ВШЭ
• (см. далее)
14
Высшая школа экономики, Москва, 2016
Обязательные дисциплины
Чего не избежать на специализации?
фото
фото
• Упорядоченные множества в анализе данных
• С.О. Кузнецов, профессор
• Ф.В. Строк, преподаватель
• Machine Learning and Data Mining (на английском)
• Д.И. Игнатов, доцент
• Структурный анализ и визуализация сетей (на английском)
• Л.Е. Жуков, профессор
• Научно-исследовательский семинар «Интеллектуальные
системы и структурный анализ»
• Все вместе
15
Высшая школа экономики, Москва, 2016
Вариативные дисциплины
фото
фото
• Медицинская информатика
• О.С, Пьяных, профессор
• Компьютерная лингвистика и анализ текста
• Е.И. Большакова, доцент
• Н.Э. Ефремова, старший преподаватель
• Распределённые системы
• А.А. Незнанов, доцент
• Проектирование взаимодействия с пользователем
• А.А. Незнанов, доцент
• Структурные методы классификации и прогнозирования в
слабо-формализованных системах
• А.А. Дорофеюк, профессор
• Математические модели макросистем
• Ю.С. Попков, профессор
• …
• + Дисциплина по выбору из общеуниверситетского пула (МагоЛего)
16
Высшая школа экономики, Москва, 2016
Специализация
«Анализ Интернет-данных» (АИД)
фото
фото
• Базовая кафедра компании Яндекс ФКН НИУ ВШЭ
• Базовая организация:
Компания «Яндекс»
• + Школа анализа данных (https://yandexdataschool.ru)
• Студенты поступают в ШАД одновременно с
распределением на специализацию!
17
Высшая школа экономики, Москва, 2016
«Анализ Интернет-данных»
Дисциплины специализации
фото
фото
• Научный семинар «Анализ Интернет-данных»
• Автоматическая обработка текстов
• Алгоритмы для работы с большими объемами данных
• Анализ изображений и видео
• Язык Python
• Methods and Systems for Processing Big Data (на английском)
18
Высшая школа экономики, Москва, 2016
Специализация «Технологии моделирования
сложных систем» (ТМСС)
фото
фото
• Базовая кафедра технологий моделирования
сложных систем ФКН НИУ ВШЭ
• Базовая организация:
Институт проблем передачи
информации им. А.А. Харкевича РАН
• Основан в 1961 году
• 500+ сотрудников
• 150+ молодых ученых
• 3 лауреата медали Филдса
• 1 лауреат премии Абеля
• Андрей Николаевич Соболевский, д.ф.-м.н., зам. директора ИППИ РАН,
зам. зав. кафедрой технологий моделирования сложных систем
19
Высшая школа экономики, Москва, 2016
«Технологии моделирования сложных систем»
Дисциплины специализации
фото
фото
• Научный семинар «Технологии моделирования сложных
систем»
• Введение в проблемы и методы вероятностной
диагностики
• Динамические системы и дифференциальные уравнения
• Игры и предсказания с приложениями к финансовой
математике
• Стохастические динамики сложных многокомпонентных
систем
• Predictive Modelling (на английском)
20
Высшая школа экономики, Москва, 2016
Основные темы ИППИ РАН
фото
фото
21
Высшая школа экономики, Москва, 2016
Академические проекты ИППИ РАН
фото
фото
22
Физтех
МГУМежфакультетская
базовая кафедра
проблем передачи
информации
и анализа данных
МФТИ
Учебно-научный центр
«Биоинформатика»
Вышка
Базовая кафедра ИППИ РАН
на факультете математики
НИУ ВШЭ
Факультет компьютерных
наук НИУ ВШЭ
ИППИ РАН
Высшая школа экономики, Москва, 2016
Стартапы ИППИ РАН
DATADVANCE
23
http://www.datadvance.net
Высшая школа экономики, Москва, 2016
Стартапы ИППИ РАН
ООО «Телум»
24
http://www.telum.ru
Высшая школа экономики, Москва, 2016
Ежегодная школа-конференция ИППИ РАН
«Информационные технологии и системы»
фото
фото
25
• Проводится с 1965 года
• Возобновлена в 2007 году
• Ежегодно более 100 участников,
более 40 аффилиаций
• Пленарные лекции
10-12 ученых с мировым именем
• Доклады и постеры
молодых участников
2014
Н. Новгород
ННГУ
НИУ ВШЭ НН
2013
Калининград
БФУ
им. И. Канта
2015
Сочи
МФТИ
НИУ ВШЭ
Высшая школа экономики, Москва, 2016
МНУЛ ИССА
фото
фото
• Международная научно-учебная лаборатория
Интеллектуальных систем и структурного анализа
• НУЛ ИССА создана в сентябре 2012 года
• Является структурным подразделением департамента анализа
данных и искусственного интеллекта факультета компьютерных
наук НИУ ВШЭ
• В 2015 году получила статус международной (МНУЛ)
• Контактная информация
• Сайт: http://cs.hse.ru/ai/issa
• Заведующий лабораторией д.ф.-м.н. С.О. Кузнецов,
тел.: +7(495)772-95-90 * 22670, e-mail: skuznetsov@hse.ru
• Менеджер лаборатории Л.И. Антропова,
тел.: +7(495)772-95-90 * 22668, e-mail: lantropova@hse.ru
• Адрес: Москва, Кочновский проезд, 3.
26
Высшая школа экономики, Москва, 2016
МНУЛ ИССА
Ведущий научный сотрудник
фото
фото
• Андре Щедров, PhD
• Chair of the Mathematics Department, Professor of Mathematics,
Professor of Computer and Information Science,
University of Pennsylvania
• Интересы:
• Вычислительная логика
• Информационная
безопасность
• Криптография и
криптографические протоколы
• Коллаборативные
технологии
27
Высшая школа экономики, Москва, 2016
МНУЛ ИССА
Основные сотрудники
фото
фото
28
Кузнецов Сергей Олегович, д.ф.-м.н.
Руководитель лаборатории
Незнанов Алексей Андреевич, к.т.н., доцент
Старший научный сотрудник
Игнатов Дмитрий Игоревич, к.т.н.
Научный сотрудник
Объедков Сергей Александрович, к.т.н.
Научный сотрудник
Высшая школа экономики, Москва, 2016
фото
фото
29
Макс Канович, Professor of Computer Science, University College
London (http://www.eecs.qmul.ac.uk/~mik)
Visiting researcher
Леонид Либкин, Professor, School of Informatics, Laboratory for
Foundations of Computer Science, University of Edinburgh
(http://homepages.inf.ed.ac.uk/libkin)
Visiting researcher
4 м.н.с.: О.В. Максименкова (1), А.А. Паринов(1), Д.А. Ильвовский (0,5),
Е.Л. Черняк (1),
3 стажёра-исследователя: Ю.А. Кашницкий (1), Д.В. Гнатышак (0,5),
Э.Я. Тюрюмина (0,5)
4 лаборанта (вне основного штатного расписания)
МНУЛ ИССА
Привлекаемые сотрудники
Высшая школа экономики, Москва, 2016
Область интересов
Почему мы так называемся?
фото
фото
• Напомним: интеллектуальных систем и структурного анализа!
• Все информационные системы становятся всё более
«интеллектуальными»
• Всё в большем числе приложений приходится работать со
сложно структурированными данными, представленными в виде графов
и сетей
• Отметим: одним из важнейших аспектов интеллектуализации является
«анализ данных», который стал «интеллектуальным» (ИАД)
• Он не сводится к статистике и информационному поиску!
• ИАД – это в первую очередь специальная подготовка данных,
онтологическое моделирование, извлечение знаний и т.д.
• В основе лежат различные логики (модальная, дескриптивная, …) и
методы представления знаний (объекто-признаковые модели,
понятийные структуры, онтологии, …)
30
Высшая школа экономики, Москва, 2016
Социальные сети, как объект исследования
социологов, и как Интернет-службы
фото
фото
31
© yworks.com© slate.com
Высшая школа экономики, Москва, 2016
Решётки формальных понятий для
интерактивного анализа предметных областей
фото
фото
32
© Д.И. Игнатов
Высшая школа экономики, Москва, 2016
Структурные модели текстов в виде деревьев и
более сложных структур
фото
фото
33
• Чащи разбора
(Parse Thickets)
Высшая школа экономики, Москва, 2016
Молекулярные графы
в химической информатике
фото
фото
34
© А.А. Незнанов
Высшая школа экономики, Москва, 2016
Направления исследований
Что нам интересно?
фото
фото
• Data Mining, Knowledge Discovery, and Machine Learning
(Майнинг данных, обнаружение знаний и машинное обучение)
• Computational Logic (Вычислительная логика)
• Formal Concept Analysis (Анализ формальных понятий)
• Knowledge Bases and Applied Ontology Modelling (Базы знаний и
онтологическое моделирование)
• Multimodal Clustering (Мультимодальная кластеризация)
• Structural Analysis and Applied Graph Theory (Структурный анализ и
прикладная теория графов)
• Natural Language Processing (Автоматическая обработка текста)
• Recommender Systems and Collaborative Technologies
(Рекомендательные системы и коллаборативные технологии)
• Social Network Analysis (Анализ социальных сетей)
• Big Data Analysis (Обработка больших данных)
35
Высшая школа экономики, Москва, 2016
Основные научные проекты
Чем конкретно мы занимаемся?
фото
фото
• Развитие анализа формальных понятий и его приложений при
построении интеллектуальных систем
• Развитие методов и алгоритмов мультимодальной кластеризации
• Развитие методов обработки больших коллекций
неструктурированных текстов (в том числе – под управлением
онтологий)
• Создание интегрированной среды научных исследований в области
анализа формальных понятий и смежных областей – Formal Concept
Analysis Research Toolbox (FCART)
• Проекты по созданию прикладных программных средств анализа
неструктурированных данных (например, коллекций текстов на
естественном языке), рекомендательных систем, систем обработки
структурной информации в областях здравоохранения,
правоохранения и др.
36
Высшая школа экономики, Москва, 2016
Анализ формальных понятий
Появление Formal Concept Analysis
фото
фото
• Термин «Анализ Формальных Понятий (АФП)» [Formal Concept
Analysis (FCA)] был предложен Рудольфом Вилле [Rudolf Wille],
который начал работу над своим исследованием «restructuring lattice
theory» в конце 1970-х годов в Техническом университете Дармштадта
• АФП уходит корнями в работы, посвящённые связям Галуа и
решеткам замкнутых множеств (G. Birkhoff, O. Ore и др.), и ранние
работы о приложениях теории решёток к задачам информатики (M.
Barbut, B. Monjardet и др.)
• На ранних этапах развития АФП зачастую неверно воспринимался как
ещё один тяжело масштабируемый формализм для работы с таблицами
из нулей и единиц
• После работ группы профессора Б. Гантера из Дрезденского
политехнического университета, С.О. Кузнецова и многих других
исследователей стала понятна актуальность АФП при решении задач
обработки больших объёмов сложных динамических данных,
связанных с некоторыми дополнительными знаниями (онтологиями)
37
Высшая школа экономики, Москва, 2016
Анализ формальных понятий
Достижения и приложения
фото
фото
• Развитие теоретических основ и инструментария узорных структур
[Pattern Structures]
• Развитие понятия устойчивости формальных понятий
[Stability of a Formal Concepts]
• Применение аппарата АФП в приложениях здравоохранения,
криминалистики, анализа социальных сетей и др.
38
Высшая школа экономики, Москва, 2016
Анализ формальных понятий
Достижения и приложения
фото
фото
39
Высшая школа экономики, Москва, 2016
Formal Concept Analysis Research Toolbox (FCART)
фото
фото
40
JSON Collection
Data Snapshot
(Multivalued Context)
Binary Context
Concept Lattice
FCART
Import/Export
Tools
Pattern Structure
Clusters
External Data Set
External Data
Query Description
Snapshot Profile
Scaling Query +
Graph Generators
LDS
Import/Export
Tools
Local Data
Storage
Session DB
External Data Source
SOMs
Analytic Artifacts
Высшая школа экономики, Москва, 2016
Публикационная активность
фото
фото
• За 3 года существования лаборатории её сотрудниками опубликовано
более 90 работ по проектам, ведущимся в МНУЛ
• http://cs.hse.ru/ai/issa/publications
• Большинство работ опубликовано на английском языке
издательствами Springer и Elsevier
• Сергей Олегович Кузнецов и Дмитрий Игоревич Игнатов стали одними
из самых публикуемых и цитируемых сотрудников НИУ ВШЭ
• Сергей Александрович Объедков в 2013 году стал победителем
Scopus Award Russia за выдающийся вклад в развитие компьютерных
наук на национальном и международном уровнях
• Наш новый ведущий специалист Андре Щедров – один из наиболее
публикуемых и цитируемых авторов в области вычислительной
логики
41
Высшая школа экономики, Москва, 2016
Организация научных мероприятий
Периодический семинар лаборатории
фото
фото
Периодический научный семинар лаборатории вот уже третий год
проходит по четвергам в 16:40 как минимум каждые 2 недели
• За 2013-2016 годы проведено более 60 заседаний
• Докладчиками были как крупные российские и зарубежные учёные
(Steffen Hoelldobler, Sebastian Rudolph, TU Dresden (Germany), Jean-Francois Boulicaut,
INSA Lyon (France), Laurent Bienvenu, Laboratoire J-V. Poncelet (France), Boris Gutkin,
Ecole Normale Supérieure (France), Max Kanovich, University of London (GB), Andre
Scedrov, University of Pennsylvania (USA), Пьяных О.С., Harvard Medical School (USA),
Alessandro Moschitti, University of Trento (Italy), Dominik Slezak, University of Warsaw &
Infobright Inc. (Poland), Tomasz Kociumaka, Warsaw university (Poland), Аржанцев И.В.,
НИУ ВШЭ, Осипов Г.С., ИСА РАН, Жуков Л.Е., НИУ ВШЭ и многие др.)
так и молодые специалисты (студенты и аспиранты)
42
Высшая школа экономики, Москва, 2016
Организация научных мероприятий
Серии международных семинаров «What can FCA do for … ?»
фото
фото
C 2012 года лаборатория организует ежегодный семинар
• Workshop “What can FCA do for Artificial Intelligence?” (FCA4AI)
• В рамках ведущих мировых конференций по искусственному
интеллекту: ECAI и IJCAI
• Руководители:
• Sergei Kuznetsov, Higher Schools of Economics, Moscow, Russia
• Amedeo Napoli, LORIA-INRIA, Vandoeuvre les Nancy, France
• Sebastian Rudolph, Technische Universitaet Dresden, Germany
+ Другие семинары “What can FCA do … ?”
43
Высшая школа экономики, Москва, 2016
Организация научных мероприятий
2013 год
фото
фото
• 10.01.2013 – 20th International Conference on Conceptual Structures (ICCS
2013) – http://iccs2013.hbcse.tifr.res.in
• 24.03.2013 – International Workshop “Formal Concept Analysis meets
Information Retrieval” (FCAIR) в рамках ECIR 2013 – http://fcair.hse.ru
• 25.03.2013 – 35th European Conference on Information Retrieval (ECIR 2013),
совместно с компанией Яндекс – http://ecir2013.org
• Впервые в России за 35 лет!
• 04.04.2013 – Вторая всероссийская конференция по Анализу
Изображений, Сетей и Текстов (АИСТ 2013) – http://aistconf.org/legacy/2013
• 03.08.2013 – 2nd International Workshop “What can FCA do for Artificial
Intelligence?” (FCA4AI 2014) в рамках IJCAI 2013 – http://fca4ai.hse.ru/2013
• 07.12.2013 – 2nd International IEEE Workshop on Experimental Economics
and Machine Learning в рамках конференции IEEE ICDM 2013 –
http://eeml.hse.ru/2013
44
Высшая школа экономики, Москва, 2016
Организация научных мероприятий
Крупнейшее мероприятие 2013 года
фото
фото
В 2013 году лаборатория участвовала в организации совместно с
компанией Яндекс
• 35th The annual European Conference on Information Retrieval
(ECIR’2013)
• а также семинар
• Formal Concept Analysis meets Information Retrieval (FCAIR)
45
Высшая школа экономики, Москва, 2016
Организация научных мероприятий
2014 год
фото
фото
• 09.04.2014 – Третья всероссийская конференция по Анализу
Изображений, Сетей и Текстов (АИСТ 2014) – http://aistconf.org/legacy/2014
• 03.06.2014 – 2nd International Conference on Information Technology and
Quantitative Management (ITQM 2014) – http://itqm2014.hse.ru
• 06.06.2014 – 9th International Computer Science Symposium in Russia (CSR
2014) – http://logic.pdmi.ras.ru/csr2014
• 16.06.2014 – 24th Annual Symposium on Combinatorial Pattern Matching
(CPM 2014) – http://cpm2014.hse.ru
• 19.08.2014 – 3rd International Workshop “What can FCA do for Artificial
Intelligence?” (FCA4AI 2014) в рамках IJCAI 2013 –
http://www.fca4ai.hse.ru/2014
• 11.09.2014 – 16th International Conference on Artificial Intelligence:
Methodology, Systems, Applications (AIMSA 2014) –
http://www.aimsaconference.org
46
Высшая школа экономики, Москва, 2016
Организация научных мероприятий
2015-2016 годы
фото
фото
• 09.04.2015 – Четвёртая всероссийская конференция по Анализу
Изображений, Сетей и Текстов (АИСТ 2015) – http://aistconf.org
• 22.06.2015 – International Workshop on Social Network Analysis using Formal
Concept Analysis (SNAFCA-2015) – http://www.snafca2015.sitew.org
• 25.07.2015 – CFP FCA4AI Workshop at IJCAI 2015 "What can FCA do for
Artificial Intelligence?'' (4th Edition)
• 30.11.2015 – The international Russian-South African workshop on
applications of Formal Concept Analysis in Computer Science and Data
Analysis (RuZA2015) – https://cs.hse.ru/en/ai/issa/Ruza_Workshop
• 07.04.2016 – Пятая всероссийская конференция по Анализу Изображений,
Сетей и Текстов (АИСТ 2016) – http://aistconf.org
• 18.07.2016 – 3d International Workshop on Concept Discovery in Unstructured Data
• 18.07.2016 – 5th International Workshop on Experimental Economics and Machine
Learning
47
Высшая школа экономики, Москва, 2016
фото
фото
48
фото
фото
• Лаборатория впервые в России провела конференцию
The Thirteenth International Conference
on Concept Lattices and Their Applications (CLA 2016)
• Место проведения: Москва, НИУ ВШЭ
• Даты: 18-22.07.2016
• Web-site: http://cla2016.hse.ru
Организация научных мероприятий
Concept Lattices and Their Applications (CLA-2016)
Высшая школа экономики, Москва, 2016
Проекты Центра фундаментальных исследований
фото
фото
49
Год Название
Число
публикаций
2012
Математические модели, алгоритмы и программные средства
интеллектуального анализа информации в текстовой и структурной форме
42
2013
Математические модели, алгоритмы и программные средства
интеллектуального анализа больших данных (Big Data) в текстовой и
структурной форме
29
2014
Математические модели, алгоритмы и программные средства
интеллектуального анализа данных в текстовой и структурной форме
38
2015
Интеллектуальный анализ данных на основе решеток замкнутых описаний
и прикладных онтологий
29
2016
Майнинг сложно структурированных данных и семантические
технологии (Mining Data with Complex Structure and Semantic
Technologies)
--
Высшая школа экономики, Москва, 2016
Трудоустройство в лаборатории и после
фото
фото
• Лаборатория – прекрасная стартовая площадка как для дальнейшей
научной карьеры, так и для продвижения в бизнес-среде
• Лаборатория ищет инициативных исследователей, которые готовы
участвовать в разработке и апробации методов анализа данных
(аналитиков) и/или реализации программных средств (программистов).
• Для того чтобы поступить в лабораторию, нужно прислать резюме
заведующему, пройти собеседование и, возможно, аттестацию
(проверку математических знаний и/или навыков программирования)
• Студенты и аспиранты изначально зачисляются на должность
стажёра-исследователя с испытательным сроком
• Аспиранты обычно становятся младшими научными сотрудниками
• МНУЛ ИССА уже может гордиться трудоустройством стажёров в Yandex,
Вымпелком, Witology, Imhonet, АлгоМост, Лабораторию Цифрового
Общества, а также участием сотрудников в программах студенческого и
академического обмена с международными партнерами
50
Высшая школа экономики, Москва, 2016
фото
фото
51
Пример НИР студента
Анализ данных в клинической информатике
фото
• МД-2014: «Методы обнаружения знаний в задаче сравнения
эффективности стратегий лечения»
• Для детей, больных лейкозом, случайным образом выбирается один из двух
вариантов протокола лечения. В среднем эффект от лечения одинаков.
Необходимо выделить и описать подгруппы пациентов, в которых один из
видов лечения значительно эффективнее другого
Федеральный научно-клинический центр детской
гематологии, онкологии и иммунологии им.
Дмитрия Рогачева (ФНКЦ ДГОИ)
• Современное научно-исследовательское и лечебное
учреждение – крупнейшее в Европе
• Специализируется на лечении болезней крови,
иммунной системы, злокачественных новообразований
и др.
• Проводятся уникальные операции по трансплантации
клеток костного мозга от доноров, проживающих по
всему миру
Высшая школа экономики, Москва, 2016
фото
фото
52
Пример НИР студента (2)
Анализ данных в клинической информатике
фото
Стандартные подходы к оценке
выживаемости:
• Кривые выживаемости Каплан-
Майера (на рисунке)
• Логранговый критерий
• Критерий эквивалентости
• Модель пропорциональных рисков
Кокса
• и тд.
Предложенный подход:
• Найти пары физиологически схожих пациентов
• Разбить пары на группы согласно
эффективности каждого из двух видов лечения
• Попытаться описать эти группы методами
машинного обучения
• Проверить полученные гипотезы
стандартными инструментами анализа
выживаемости
фото
фото
53
Высшая школа экономики, Москва, 2016
Пример НИР студента (3)
Анализ данных в клинической информатике
фото
• Для пациентов с пальпируемым размером селезенки ≥ 3.5 см в возрасте старше 6.6 лет
и pre-pre-B или pre-B иммуно-фенотипом метилпреднизолон в дозе 60 мг/м2/сут
(MePRED) эффективнее, чем дексаметазон в дозе 6 мг/м2/сут (DEXA)
• Всего таких пациентов 47
• При лечении всех пациентов MePRED, возможно, удалось бы спасти около
8 пациентов, т.е. порядка 1/6 всей группы
Подтверждённая гипотеза (пример):
Показаны графики выживаемости в
группах
Высшая школа экономики, Москва, 2016
Некоторые темы магистерских диссертаций
специализации «ИССА»
фото
фото
• Алгоритмические аспекты булевой матричной факторизации и ее
приложения в Анализе Формальных Понятий
• Оценка качества медицинских изображений
• Мета-анализ практического использования различных математических
моделей анализа результатов клинических исследований
• Цифровые водяные знаки на основе изменения глубины в
стереоскопических видео
• Консенсусная кластеризация на основе решеток понятий
• Методы бикластеризации для рекомендательных систем
• Сравнительный анализ методов трикластеризации и их приложения
• Исследование способов встраивания контекстной информации в
коллаборативные рекомендательные алгоритмы
• Машинное обучение с использованием глубоких нейронных сетей
• Исследование качества методов анализа неструктурированных текстовых
коллекций под управлением онтологий
• Методы предварительной лингвистической обработки текстов для
построения таксономий
54
125319, Россия, Москва, Кочновский проезд, д. 3
Тел.: +7(495)772-95-90 * 22675
https://www.hse.ru/ma/datasci

More Related Content

Similar to Кузнецов С.О. «Магистерская программа Науки о данных и её специализации»

Открытые данные в открытом университете (Open data in open university)
Открытые данные в открытом университете (Open data in open university)Открытые данные в открытом университете (Open data in open university)
Открытые данные в открытом университете (Open data in open university)Irina Radchenko
 
Подготовка специалистов в университете Дубна
Подготовка специалистов в университете ДубнаПодготовка специалистов в университете Дубна
Подготовка специалистов в университете ДубнаAtner Yegorov
 
Кафедра КИТ 2016-2017
Кафедра КИТ 2016-2017Кафедра КИТ 2016-2017
Кафедра КИТ 2016-2017Valentinych
 
Сотрудничество с МИРЭА - 10 классы
Сотрудничество с МИРЭА - 10 классыСотрудничество с МИРЭА - 10 классы
Сотрудничество с МИРЭА - 10 классыМария Маркевич
 
Профессия Data Scientist
 Профессия Data Scientist Профессия Data Scientist
Профессия Data ScientistLeonid Zhukov
 
Естественнонаучное образование в России и в мире
Естественнонаучное образование в России и в миреЕстественнонаучное образование в России и в мире
Естественнонаучное образование в России и в миреIlya Orlov
 
презентация чгту рус
презентация чгту руспрезентация чгту рус
презентация чгту русramcoopersoon
 
Презентация МТИ (полная версия)
Презентация МТИ (полная версия)Презентация МТИ (полная версия)
Презентация МТИ (полная версия)Andrey Ignatov
 
Аржанцев И.В. «ФКН: первые итоги, задачи и перспективы»
Аржанцев И.В. «ФКН: первые итоги, задачи и перспективы»Аржанцев И.В. «ФКН: первые итоги, задачи и перспективы»
Аржанцев И.В. «ФКН: первые итоги, задачи и перспективы»skutylev
 
Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»ARCCN
 
12 Общая презентация о Сколковском институте науки и технологий
12 Общая презентация о Сколковском институте науки и технологий12 Общая презентация о Сколковском институте науки и технологий
12 Общая презентация о Сколковском институте науки и технологийStartupvillage2015
 
Концепция развития российского математического образования. Ход проекта.
Концепция развития российского математического образования. Ход проекта.Концепция развития российского математического образования. Ход проекта.
Концепция развития российского математического образования. Ход проекта.MSPU
 
Информационный буклет 39.04.01 "Социология" магистерская программа "Современ...
Информационный буклет 39.04.01 "Социология" магистерская программа "Современ...Информационный буклет 39.04.01 "Социология" магистерская программа "Современ...
Информационный буклет 39.04.01 "Социология" магистерская программа "Современ...Оксана Феоктистова
 
Отчёт о ходе реализации проекта
Отчёт о ходе реализации проектаОтчёт о ходе реализации проекта
Отчёт о ходе реализации проектаigorod
 
Глазистов А.В. «Научная комиссия»
Глазистов А.В.  «Научная комиссия»Глазистов А.В.  «Научная комиссия»
Глазистов А.В. «Научная комиссия»skutylev
 
Доклад-Александра Чулока- Мегатренды: вызовы или окна возможностей для развит...
Доклад-Александра Чулока- Мегатренды: вызовы или окна возможностей для развит...Доклад-Александра Чулока- Мегатренды: вызовы или окна возможностей для развит...
Доклад-Александра Чулока- Мегатренды: вызовы или окна возможностей для развит...Cuing_iot
 
Презентация кафедры ЭК (Ver. 2.0)
Презентация кафедры ЭК (Ver. 2.0)Презентация кафедры ЭК (Ver. 2.0)
Презентация кафедры ЭК (Ver. 2.0)psuti
 

Similar to Кузнецов С.О. «Магистерская программа Науки о данных и её специализации» (20)

Открытые данные в открытом университете (Open data in open university)
Открытые данные в открытом университете (Open data in open university)Открытые данные в открытом университете (Open data in open university)
Открытые данные в открытом университете (Open data in open university)
 
Подготовка специалистов в университете Дубна
Подготовка специалистов в университете ДубнаПодготовка специалистов в университете Дубна
Подготовка специалистов в университете Дубна
 
Demenev A.G. MSSiVT-2012
Demenev A.G. MSSiVT-2012Demenev A.G. MSSiVT-2012
Demenev A.G. MSSiVT-2012
 
Кафедра КИТ 2016-2017
Кафедра КИТ 2016-2017Кафедра КИТ 2016-2017
Кафедра КИТ 2016-2017
 
Demenev ag pru-cl-2010
Demenev ag pru-cl-2010Demenev ag pru-cl-2010
Demenev ag pru-cl-2010
 
Сотрудничество с МИРЭА - 10 классы
Сотрудничество с МИРЭА - 10 классыСотрудничество с МИРЭА - 10 классы
Сотрудничество с МИРЭА - 10 классы
 
Профессия Data Scientist
 Профессия Data Scientist Профессия Data Scientist
Профессия Data Scientist
 
Естественнонаучное образование в России и в мире
Естественнонаучное образование в России и в миреЕстественнонаучное образование в России и в мире
Естественнонаучное образование в России и в мире
 
презентация чгту рус
презентация чгту руспрезентация чгту рус
презентация чгту рус
 
Презентация МТИ (полная версия)
Презентация МТИ (полная версия)Презентация МТИ (полная версия)
Презентация МТИ (полная версия)
 
Аржанцев И.В. «ФКН: первые итоги, задачи и перспективы»
Аржанцев И.В. «ФКН: первые итоги, задачи и перспективы»Аржанцев И.В. «ФКН: первые итоги, задачи и перспективы»
Аржанцев И.В. «ФКН: первые итоги, задачи и перспективы»
 
Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»Магистерская программа «Распределённые системы и компьютерные сети»
Магистерская программа «Распределённые системы и компьютерные сети»
 
12 Общая презентация о Сколковском институте науки и технологий
12 Общая презентация о Сколковском институте науки и технологий12 Общая презентация о Сколковском институте науки и технологий
12 Общая презентация о Сколковском институте науки и технологий
 
Концепция развития российского математического образования. Ход проекта.
Концепция развития российского математического образования. Ход проекта.Концепция развития российского математического образования. Ход проекта.
Концепция развития российского математического образования. Ход проекта.
 
Информационный буклет 39.04.01 "Социология" магистерская программа "Современ...
Информационный буклет 39.04.01 "Социология" магистерская программа "Современ...Информационный буклет 39.04.01 "Социология" магистерская программа "Современ...
Информационный буклет 39.04.01 "Социология" магистерская программа "Современ...
 
Отчёт о ходе реализации проекта
Отчёт о ходе реализации проектаОтчёт о ходе реализации проекта
Отчёт о ходе реализации проекта
 
Глазистов А.В. «Научная комиссия»
Глазистов А.В.  «Научная комиссия»Глазистов А.В.  «Научная комиссия»
Глазистов А.В. «Научная комиссия»
 
ОС3. Хронолайнер
ОС3. ХронолайнерОС3. Хронолайнер
ОС3. Хронолайнер
 
Доклад-Александра Чулока- Мегатренды: вызовы или окна возможностей для развит...
Доклад-Александра Чулока- Мегатренды: вызовы или окна возможностей для развит...Доклад-Александра Чулока- Мегатренды: вызовы или окна возможностей для развит...
Доклад-Александра Чулока- Мегатренды: вызовы или окна возможностей для развит...
 
Презентация кафедры ЭК (Ver. 2.0)
Презентация кафедры ЭК (Ver. 2.0)Презентация кафедры ЭК (Ver. 2.0)
Презентация кафедры ЭК (Ver. 2.0)
 

Кузнецов С.О. «Магистерская программа Науки о данных и её специализации»

  • 1. Магистерская программа «Науки о данных» [“Data Science”] и её специализации Факультет компьютерных наук, Департамент анализа данных и искусственного интеллекта Высшая школа экономики, Москва, 2016 www.hse.ru Академический руководитель: д.ф.-м.н. С.О. Кузнецов
  • 2. Высшая школа экономики, Москва, 2016 Магистерская программа «Науки о данных» Что это такое (формально)? фото фото • Программа «Науки о данных» [“Data Science”] • Академический руководитель – д.ф.-м.н. С.О. Кузнецов • Направление 01.04.02 «Прикладная математика и информатика» • Подготовка ведётся с 2014 года • Приём 2016 года – 40 бюджетных мест, 10 платных • 3 специализации • Оригинальный образовательный стандарт НИУ ВШЭ • (http://www.hse.ru/ma/datasci/documents) • В дальнейшем – Аспирантура по специальностям: • 05.13.18 «Математическое моделирование, численные методы и комплексы программ» • 05.13.17 «Теоретические основы информатики» • 05.13.11 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей» • Поддерживается Аспирантской школой по компьютерным наукам • (http://aspirantura.hse.ru/cs) 2
  • 3. Высшая школа экономики, Москва, 2016 Актуальность О чём это? фото фото • «Науки о данных» [“Data Science”] – одна из наиболее быстро развивающихся прикладных междисциплинарных областей современных информационных технологий • DataJobs - What is Data Science? (https://datajobs.com/what-is-data-science) • The Life of a Data Scientist (http://www.mastersindatascience.org/careers/data-scientist) • Спрос на специалистов растёт непрерывно • Hoping to land this year's 'hottest job'? Here's what you need to be a data scientist (http://www.pcworld.com/article/3028002/hoping-to-land-this-years-hottest-job-heres-what-you-need- to-be-a-data-scientist.html) • В 2016 году это лучшая работа в Америке • 25 Best Jobs in America (https://www.glassdoor.com/Best-Jobs-in-America-LST_KQ0,20.htm) • Все ведущие университеты предлагают программу какого-либо уровня • (http://www.mastersindatascience.org/schools/23-great-schools-with-masters-programs-in-data- science) • Все ведущие площадки MOOC предлагают хотя бы один курс или целые цепочки курсов • Courcera - Launch Your Career in Data Science (https://www.coursera.org/specializations/jhudatascience) 3
  • 4. Высшая школа экономики, Москва, 2016 Актуальность фото фото • Кем предстоит работать? • Учёным (разрабатывающим новые методы) • Аналитиком (решающим прикладные задачи) • Технологом (поддерживающим и развивающим имеющиеся инструменты) • Программист, администратор хранилищ данных и знаний, ... • Спрос увеличивается инициативами, связанными с Open Science, Open Data, Big Data, ... • The Open Definition (http://opendefinition.org). • Simon Chignard, A brief history of Open Data (http://www.paristechreview.com/2013/03/29/brief-history-open-data). • European Commission – Open Science (http://ec.europa.eu/research/openscience/index.cfm) • Появились термины «Журналистика данных», «Семантические технологии», «Онтологическое моделирование», … • Data driven journalism (http://datadrivenjournalism.net) 4
  • 5. Высшая школа экономики, Москва, 2016 Отличие от других программ фото фото • Общие методы анализа данных и конкретные задачи из различных предметных областей • 3 специализации (см. далее) • Поддержка научными группами мирового уровня • Вовлечение в интереснейшие проекты анализа данных или проекты создания интеллектуальных алгоритмов и ПО • Большая открытость и большое число партнёров (см. далее) • Прекрасные возможности академической и научной мобильности Отличия: • От Business Intelligence (бизнес-аналитики) • Понимание основ и акцент на создании новых методов • От Computer Science (компьютерных наук) • Акцент на анализе данных и междисциплинарность 5
  • 6. Высшая школа экономики, Москва, 2016 Магистерская программа «Науки о данных» Как поступить? фото фото • Поступление на программу • (http://www.hse.ru/ma/datasci/enroll) • Экзамен по математике или олимпиада • + квалификационный тест по английскому языку • Распределение по специализациям – в начале учебного года • Для поступления на специализацию «Анализ Интернет-данных» необходимо пройти собеседование в компании Яндекс (ШАД) 6
  • 7. Высшая школа экономики, Москва, 2016 Специализации магистерской программы фото фото Интеллектуальные системы и структурный анализ (ИССА) • Ориентирована на подготовку системных аналитиков и разработчиков, использующих и создающих информационные системы с элементами искусственного интеллекта. Предусматривается углубленное изучение методов анализа данных, машинного обучения, структурного анализа, извлечения знаний из неструктурированных данных, автоматической обработки текста. Анализ Интернет-данных (АИД) • Интернет-данные имеют свою специфику и интересны с различных точек зрения: поиска, динамики изменения, формы представления. Программа ориентирована на анализ особенностей Интернет-данных, задач их анализа и методов решения этих задач. Концепция и учебный план разработаны совместно с компанией «Яндекс». Подготовка студентов проходит с участием преподавателей из Школы анализа данных компании «Яндекс». Технологии моделирования сложных систем (ТМСС) • Концепция и учебный план разработаны совместно с Институтом проблем передачи информации им. А. А. Харкевича РАН для овладения современными методами предсказательного моделирования сложных систем в широком спектре прикладных областей от аэродинамики до биоинформатики. Подготовка студентов проходит с участием преподавателей из ИППИ РАН. 7
  • 8. Высшая школа экономики, Москва, 2016 Зарубежные партнёры С кем мы активно сотрудничаем? фото фото • Harvard University (USA) • University of Texas at Brownsville (USA) • Lorraine Research Laboratory in Computer Science and its Applications (LORIA Nancy, France) • Institut Supérieur d’Informatique, de Modélisation et de leurs Applications (L’ISIMA Clermont-Ferrand, France) • Institut National des Sciences Appliquées (INSA LYON, France) • University of Blaise Pascal (Clermont-Ferrand, France) • Katholieke Universiteit Leuven (KU Leuven, Belgium) • Technische Universität Dresden (TU Dresden, Germany) • Eindhoven University of Technology (TU/e, Eindhoven, Netherlands) • Palacky Univeristy (Olomouc, Czech Republic) • Université du Québec en Outaouais (Gatineau, Canada) 8
  • 9. Высшая школа экономики, Москва, 2016 Российские партнёры С кем мы активно сотрудничаем? фото фото • Институт Проблем Передачи Информации РАН им. А.А. Харкевича • Институт Системного Анализа РАН • Школа анализа данных компании Яндекс • ФНКЦ Детской гематологии, онкологии и иммунологии им. Д. Рогачева • Компании ImhoNet, Avicomp, АлгоМост и др. • Фонд Сколково • Партнёры из НИУ ВШЭ • Департамент математики на факультете экономики, факультет математики, факультет филологии, департамент психологии, департамент программной инженерии, кафедра публичной политики и др. 9
  • 10. Высшая школа экономики, Москва, 2016 Ведущие преподаватели Clustering and Data Mining фото фото • Борис Миркин, д.т.н • Professor Emeritus, Department of Applied Mathematics and Informatics, State University Higher School of Economics, Moscow • Professor Emeritus, School of Computer Science and Information Systems, Birkbeck College, London University • Учебник «Введение в анализ данных» • (http://www.hse.ru/pubs/share/direct/demo_document/131681837) 10
  • 11. Высшая школа экономики, Москва, 2016 Ведущие преподаватели Social Network Analysis фото фото • Леонид Жуков, PhD • Professor, Department of Applied Mathematics and Informatics State University Higher School of Economics • Visiting Faculty, Department of Computer Science, California Institute of Technology • Family tree construction, search of historical records and other information about ancestors 11
  • 12. Высшая школа экономики, Москва, 2016 Ведущие преподаватели Medical Informatics, Digital Imaging фото фото • Олег Пьяных, PhD • Professor, Department of Applied Mathematics and Informatics, State University Higher School of Economics • Assistant Professor of Radiology, Harvard Medical School • Lecturer, Harvard Extension School, Harvard University • Digital Imaging and Communications in Medicine (DICOM): A Practical Introduction and Survival Guide • (http://www.algom.com/droleg/) 12
  • 13. Высшая школа экономики, Москва, 2016 Структура программы Чего не избежать? фото фото • Дисциплины магистерской программы • Современные методы анализа данных • Б.Г. Миркин, профессор • Современные методы принятия решений • Дж. Декруэ, профессор • + адаптационные дисциплины • Дисциплины специализации • Обязательные (2-3) • По выбору (4-6) • Включая одну дисциплину из общеуниверситетского пула • Практики • Научно-исследовательская (летняя после 1 курса) • Преддипломная • Магистерская диссертация! 13
  • 14. Высшая школа экономики, Москва, 2016 Специализация «Интеллектуальные системы и структурный анализ» (ИССА) фото фото • Департамент Анализа данных и искусственного интеллекта ФКН НИУ ВШЭ • Международная научно-учебная лаборатория Интеллектуальных систем и структурного анализа ФКН НИУ ВШЭ • (см. далее) 14
  • 15. Высшая школа экономики, Москва, 2016 Обязательные дисциплины Чего не избежать на специализации? фото фото • Упорядоченные множества в анализе данных • С.О. Кузнецов, профессор • Ф.В. Строк, преподаватель • Machine Learning and Data Mining (на английском) • Д.И. Игнатов, доцент • Структурный анализ и визуализация сетей (на английском) • Л.Е. Жуков, профессор • Научно-исследовательский семинар «Интеллектуальные системы и структурный анализ» • Все вместе 15
  • 16. Высшая школа экономики, Москва, 2016 Вариативные дисциплины фото фото • Медицинская информатика • О.С, Пьяных, профессор • Компьютерная лингвистика и анализ текста • Е.И. Большакова, доцент • Н.Э. Ефремова, старший преподаватель • Распределённые системы • А.А. Незнанов, доцент • Проектирование взаимодействия с пользователем • А.А. Незнанов, доцент • Структурные методы классификации и прогнозирования в слабо-формализованных системах • А.А. Дорофеюк, профессор • Математические модели макросистем • Ю.С. Попков, профессор • … • + Дисциплина по выбору из общеуниверситетского пула (МагоЛего) 16
  • 17. Высшая школа экономики, Москва, 2016 Специализация «Анализ Интернет-данных» (АИД) фото фото • Базовая кафедра компании Яндекс ФКН НИУ ВШЭ • Базовая организация: Компания «Яндекс» • + Школа анализа данных (https://yandexdataschool.ru) • Студенты поступают в ШАД одновременно с распределением на специализацию! 17
  • 18. Высшая школа экономики, Москва, 2016 «Анализ Интернет-данных» Дисциплины специализации фото фото • Научный семинар «Анализ Интернет-данных» • Автоматическая обработка текстов • Алгоритмы для работы с большими объемами данных • Анализ изображений и видео • Язык Python • Methods and Systems for Processing Big Data (на английском) 18
  • 19. Высшая школа экономики, Москва, 2016 Специализация «Технологии моделирования сложных систем» (ТМСС) фото фото • Базовая кафедра технологий моделирования сложных систем ФКН НИУ ВШЭ • Базовая организация: Институт проблем передачи информации им. А.А. Харкевича РАН • Основан в 1961 году • 500+ сотрудников • 150+ молодых ученых • 3 лауреата медали Филдса • 1 лауреат премии Абеля • Андрей Николаевич Соболевский, д.ф.-м.н., зам. директора ИППИ РАН, зам. зав. кафедрой технологий моделирования сложных систем 19
  • 20. Высшая школа экономики, Москва, 2016 «Технологии моделирования сложных систем» Дисциплины специализации фото фото • Научный семинар «Технологии моделирования сложных систем» • Введение в проблемы и методы вероятностной диагностики • Динамические системы и дифференциальные уравнения • Игры и предсказания с приложениями к финансовой математике • Стохастические динамики сложных многокомпонентных систем • Predictive Modelling (на английском) 20
  • 21. Высшая школа экономики, Москва, 2016 Основные темы ИППИ РАН фото фото 21
  • 22. Высшая школа экономики, Москва, 2016 Академические проекты ИППИ РАН фото фото 22 Физтех МГУМежфакультетская базовая кафедра проблем передачи информации и анализа данных МФТИ Учебно-научный центр «Биоинформатика» Вышка Базовая кафедра ИППИ РАН на факультете математики НИУ ВШЭ Факультет компьютерных наук НИУ ВШЭ ИППИ РАН
  • 23. Высшая школа экономики, Москва, 2016 Стартапы ИППИ РАН DATADVANCE 23 http://www.datadvance.net
  • 24. Высшая школа экономики, Москва, 2016 Стартапы ИППИ РАН ООО «Телум» 24 http://www.telum.ru
  • 25. Высшая школа экономики, Москва, 2016 Ежегодная школа-конференция ИППИ РАН «Информационные технологии и системы» фото фото 25 • Проводится с 1965 года • Возобновлена в 2007 году • Ежегодно более 100 участников, более 40 аффилиаций • Пленарные лекции 10-12 ученых с мировым именем • Доклады и постеры молодых участников 2014 Н. Новгород ННГУ НИУ ВШЭ НН 2013 Калининград БФУ им. И. Канта 2015 Сочи МФТИ НИУ ВШЭ
  • 26. Высшая школа экономики, Москва, 2016 МНУЛ ИССА фото фото • Международная научно-учебная лаборатория Интеллектуальных систем и структурного анализа • НУЛ ИССА создана в сентябре 2012 года • Является структурным подразделением департамента анализа данных и искусственного интеллекта факультета компьютерных наук НИУ ВШЭ • В 2015 году получила статус международной (МНУЛ) • Контактная информация • Сайт: http://cs.hse.ru/ai/issa • Заведующий лабораторией д.ф.-м.н. С.О. Кузнецов, тел.: +7(495)772-95-90 * 22670, e-mail: skuznetsov@hse.ru • Менеджер лаборатории Л.И. Антропова, тел.: +7(495)772-95-90 * 22668, e-mail: lantropova@hse.ru • Адрес: Москва, Кочновский проезд, 3. 26
  • 27. Высшая школа экономики, Москва, 2016 МНУЛ ИССА Ведущий научный сотрудник фото фото • Андре Щедров, PhD • Chair of the Mathematics Department, Professor of Mathematics, Professor of Computer and Information Science, University of Pennsylvania • Интересы: • Вычислительная логика • Информационная безопасность • Криптография и криптографические протоколы • Коллаборативные технологии 27
  • 28. Высшая школа экономики, Москва, 2016 МНУЛ ИССА Основные сотрудники фото фото 28 Кузнецов Сергей Олегович, д.ф.-м.н. Руководитель лаборатории Незнанов Алексей Андреевич, к.т.н., доцент Старший научный сотрудник Игнатов Дмитрий Игоревич, к.т.н. Научный сотрудник Объедков Сергей Александрович, к.т.н. Научный сотрудник
  • 29. Высшая школа экономики, Москва, 2016 фото фото 29 Макс Канович, Professor of Computer Science, University College London (http://www.eecs.qmul.ac.uk/~mik) Visiting researcher Леонид Либкин, Professor, School of Informatics, Laboratory for Foundations of Computer Science, University of Edinburgh (http://homepages.inf.ed.ac.uk/libkin) Visiting researcher 4 м.н.с.: О.В. Максименкова (1), А.А. Паринов(1), Д.А. Ильвовский (0,5), Е.Л. Черняк (1), 3 стажёра-исследователя: Ю.А. Кашницкий (1), Д.В. Гнатышак (0,5), Э.Я. Тюрюмина (0,5) 4 лаборанта (вне основного штатного расписания) МНУЛ ИССА Привлекаемые сотрудники
  • 30. Высшая школа экономики, Москва, 2016 Область интересов Почему мы так называемся? фото фото • Напомним: интеллектуальных систем и структурного анализа! • Все информационные системы становятся всё более «интеллектуальными» • Всё в большем числе приложений приходится работать со сложно структурированными данными, представленными в виде графов и сетей • Отметим: одним из важнейших аспектов интеллектуализации является «анализ данных», который стал «интеллектуальным» (ИАД) • Он не сводится к статистике и информационному поиску! • ИАД – это в первую очередь специальная подготовка данных, онтологическое моделирование, извлечение знаний и т.д. • В основе лежат различные логики (модальная, дескриптивная, …) и методы представления знаний (объекто-признаковые модели, понятийные структуры, онтологии, …) 30
  • 31. Высшая школа экономики, Москва, 2016 Социальные сети, как объект исследования социологов, и как Интернет-службы фото фото 31 © yworks.com© slate.com
  • 32. Высшая школа экономики, Москва, 2016 Решётки формальных понятий для интерактивного анализа предметных областей фото фото 32 © Д.И. Игнатов
  • 33. Высшая школа экономики, Москва, 2016 Структурные модели текстов в виде деревьев и более сложных структур фото фото 33 • Чащи разбора (Parse Thickets)
  • 34. Высшая школа экономики, Москва, 2016 Молекулярные графы в химической информатике фото фото 34 © А.А. Незнанов
  • 35. Высшая школа экономики, Москва, 2016 Направления исследований Что нам интересно? фото фото • Data Mining, Knowledge Discovery, and Machine Learning (Майнинг данных, обнаружение знаний и машинное обучение) • Computational Logic (Вычислительная логика) • Formal Concept Analysis (Анализ формальных понятий) • Knowledge Bases and Applied Ontology Modelling (Базы знаний и онтологическое моделирование) • Multimodal Clustering (Мультимодальная кластеризация) • Structural Analysis and Applied Graph Theory (Структурный анализ и прикладная теория графов) • Natural Language Processing (Автоматическая обработка текста) • Recommender Systems and Collaborative Technologies (Рекомендательные системы и коллаборативные технологии) • Social Network Analysis (Анализ социальных сетей) • Big Data Analysis (Обработка больших данных) 35
  • 36. Высшая школа экономики, Москва, 2016 Основные научные проекты Чем конкретно мы занимаемся? фото фото • Развитие анализа формальных понятий и его приложений при построении интеллектуальных систем • Развитие методов и алгоритмов мультимодальной кластеризации • Развитие методов обработки больших коллекций неструктурированных текстов (в том числе – под управлением онтологий) • Создание интегрированной среды научных исследований в области анализа формальных понятий и смежных областей – Formal Concept Analysis Research Toolbox (FCART) • Проекты по созданию прикладных программных средств анализа неструктурированных данных (например, коллекций текстов на естественном языке), рекомендательных систем, систем обработки структурной информации в областях здравоохранения, правоохранения и др. 36
  • 37. Высшая школа экономики, Москва, 2016 Анализ формальных понятий Появление Formal Concept Analysis фото фото • Термин «Анализ Формальных Понятий (АФП)» [Formal Concept Analysis (FCA)] был предложен Рудольфом Вилле [Rudolf Wille], который начал работу над своим исследованием «restructuring lattice theory» в конце 1970-х годов в Техническом университете Дармштадта • АФП уходит корнями в работы, посвящённые связям Галуа и решеткам замкнутых множеств (G. Birkhoff, O. Ore и др.), и ранние работы о приложениях теории решёток к задачам информатики (M. Barbut, B. Monjardet и др.) • На ранних этапах развития АФП зачастую неверно воспринимался как ещё один тяжело масштабируемый формализм для работы с таблицами из нулей и единиц • После работ группы профессора Б. Гантера из Дрезденского политехнического университета, С.О. Кузнецова и многих других исследователей стала понятна актуальность АФП при решении задач обработки больших объёмов сложных динамических данных, связанных с некоторыми дополнительными знаниями (онтологиями) 37
  • 38. Высшая школа экономики, Москва, 2016 Анализ формальных понятий Достижения и приложения фото фото • Развитие теоретических основ и инструментария узорных структур [Pattern Structures] • Развитие понятия устойчивости формальных понятий [Stability of a Formal Concepts] • Применение аппарата АФП в приложениях здравоохранения, криминалистики, анализа социальных сетей и др. 38
  • 39. Высшая школа экономики, Москва, 2016 Анализ формальных понятий Достижения и приложения фото фото 39
  • 40. Высшая школа экономики, Москва, 2016 Formal Concept Analysis Research Toolbox (FCART) фото фото 40 JSON Collection Data Snapshot (Multivalued Context) Binary Context Concept Lattice FCART Import/Export Tools Pattern Structure Clusters External Data Set External Data Query Description Snapshot Profile Scaling Query + Graph Generators LDS Import/Export Tools Local Data Storage Session DB External Data Source SOMs Analytic Artifacts
  • 41. Высшая школа экономики, Москва, 2016 Публикационная активность фото фото • За 3 года существования лаборатории её сотрудниками опубликовано более 90 работ по проектам, ведущимся в МНУЛ • http://cs.hse.ru/ai/issa/publications • Большинство работ опубликовано на английском языке издательствами Springer и Elsevier • Сергей Олегович Кузнецов и Дмитрий Игоревич Игнатов стали одними из самых публикуемых и цитируемых сотрудников НИУ ВШЭ • Сергей Александрович Объедков в 2013 году стал победителем Scopus Award Russia за выдающийся вклад в развитие компьютерных наук на национальном и международном уровнях • Наш новый ведущий специалист Андре Щедров – один из наиболее публикуемых и цитируемых авторов в области вычислительной логики 41
  • 42. Высшая школа экономики, Москва, 2016 Организация научных мероприятий Периодический семинар лаборатории фото фото Периодический научный семинар лаборатории вот уже третий год проходит по четвергам в 16:40 как минимум каждые 2 недели • За 2013-2016 годы проведено более 60 заседаний • Докладчиками были как крупные российские и зарубежные учёные (Steffen Hoelldobler, Sebastian Rudolph, TU Dresden (Germany), Jean-Francois Boulicaut, INSA Lyon (France), Laurent Bienvenu, Laboratoire J-V. Poncelet (France), Boris Gutkin, Ecole Normale Supérieure (France), Max Kanovich, University of London (GB), Andre Scedrov, University of Pennsylvania (USA), Пьяных О.С., Harvard Medical School (USA), Alessandro Moschitti, University of Trento (Italy), Dominik Slezak, University of Warsaw & Infobright Inc. (Poland), Tomasz Kociumaka, Warsaw university (Poland), Аржанцев И.В., НИУ ВШЭ, Осипов Г.С., ИСА РАН, Жуков Л.Е., НИУ ВШЭ и многие др.) так и молодые специалисты (студенты и аспиранты) 42
  • 43. Высшая школа экономики, Москва, 2016 Организация научных мероприятий Серии международных семинаров «What can FCA do for … ?» фото фото C 2012 года лаборатория организует ежегодный семинар • Workshop “What can FCA do for Artificial Intelligence?” (FCA4AI) • В рамках ведущих мировых конференций по искусственному интеллекту: ECAI и IJCAI • Руководители: • Sergei Kuznetsov, Higher Schools of Economics, Moscow, Russia • Amedeo Napoli, LORIA-INRIA, Vandoeuvre les Nancy, France • Sebastian Rudolph, Technische Universitaet Dresden, Germany + Другие семинары “What can FCA do … ?” 43
  • 44. Высшая школа экономики, Москва, 2016 Организация научных мероприятий 2013 год фото фото • 10.01.2013 – 20th International Conference on Conceptual Structures (ICCS 2013) – http://iccs2013.hbcse.tifr.res.in • 24.03.2013 – International Workshop “Formal Concept Analysis meets Information Retrieval” (FCAIR) в рамках ECIR 2013 – http://fcair.hse.ru • 25.03.2013 – 35th European Conference on Information Retrieval (ECIR 2013), совместно с компанией Яндекс – http://ecir2013.org • Впервые в России за 35 лет! • 04.04.2013 – Вторая всероссийская конференция по Анализу Изображений, Сетей и Текстов (АИСТ 2013) – http://aistconf.org/legacy/2013 • 03.08.2013 – 2nd International Workshop “What can FCA do for Artificial Intelligence?” (FCA4AI 2014) в рамках IJCAI 2013 – http://fca4ai.hse.ru/2013 • 07.12.2013 – 2nd International IEEE Workshop on Experimental Economics and Machine Learning в рамках конференции IEEE ICDM 2013 – http://eeml.hse.ru/2013 44
  • 45. Высшая школа экономики, Москва, 2016 Организация научных мероприятий Крупнейшее мероприятие 2013 года фото фото В 2013 году лаборатория участвовала в организации совместно с компанией Яндекс • 35th The annual European Conference on Information Retrieval (ECIR’2013) • а также семинар • Formal Concept Analysis meets Information Retrieval (FCAIR) 45
  • 46. Высшая школа экономики, Москва, 2016 Организация научных мероприятий 2014 год фото фото • 09.04.2014 – Третья всероссийская конференция по Анализу Изображений, Сетей и Текстов (АИСТ 2014) – http://aistconf.org/legacy/2014 • 03.06.2014 – 2nd International Conference on Information Technology and Quantitative Management (ITQM 2014) – http://itqm2014.hse.ru • 06.06.2014 – 9th International Computer Science Symposium in Russia (CSR 2014) – http://logic.pdmi.ras.ru/csr2014 • 16.06.2014 – 24th Annual Symposium on Combinatorial Pattern Matching (CPM 2014) – http://cpm2014.hse.ru • 19.08.2014 – 3rd International Workshop “What can FCA do for Artificial Intelligence?” (FCA4AI 2014) в рамках IJCAI 2013 – http://www.fca4ai.hse.ru/2014 • 11.09.2014 – 16th International Conference on Artificial Intelligence: Methodology, Systems, Applications (AIMSA 2014) – http://www.aimsaconference.org 46
  • 47. Высшая школа экономики, Москва, 2016 Организация научных мероприятий 2015-2016 годы фото фото • 09.04.2015 – Четвёртая всероссийская конференция по Анализу Изображений, Сетей и Текстов (АИСТ 2015) – http://aistconf.org • 22.06.2015 – International Workshop on Social Network Analysis using Formal Concept Analysis (SNAFCA-2015) – http://www.snafca2015.sitew.org • 25.07.2015 – CFP FCA4AI Workshop at IJCAI 2015 "What can FCA do for Artificial Intelligence?'' (4th Edition) • 30.11.2015 – The international Russian-South African workshop on applications of Formal Concept Analysis in Computer Science and Data Analysis (RuZA2015) – https://cs.hse.ru/en/ai/issa/Ruza_Workshop • 07.04.2016 – Пятая всероссийская конференция по Анализу Изображений, Сетей и Текстов (АИСТ 2016) – http://aistconf.org • 18.07.2016 – 3d International Workshop on Concept Discovery in Unstructured Data • 18.07.2016 – 5th International Workshop on Experimental Economics and Machine Learning 47
  • 48. Высшая школа экономики, Москва, 2016 фото фото 48 фото фото • Лаборатория впервые в России провела конференцию The Thirteenth International Conference on Concept Lattices and Their Applications (CLA 2016) • Место проведения: Москва, НИУ ВШЭ • Даты: 18-22.07.2016 • Web-site: http://cla2016.hse.ru Организация научных мероприятий Concept Lattices and Their Applications (CLA-2016)
  • 49. Высшая школа экономики, Москва, 2016 Проекты Центра фундаментальных исследований фото фото 49 Год Название Число публикаций 2012 Математические модели, алгоритмы и программные средства интеллектуального анализа информации в текстовой и структурной форме 42 2013 Математические модели, алгоритмы и программные средства интеллектуального анализа больших данных (Big Data) в текстовой и структурной форме 29 2014 Математические модели, алгоритмы и программные средства интеллектуального анализа данных в текстовой и структурной форме 38 2015 Интеллектуальный анализ данных на основе решеток замкнутых описаний и прикладных онтологий 29 2016 Майнинг сложно структурированных данных и семантические технологии (Mining Data with Complex Structure and Semantic Technologies) --
  • 50. Высшая школа экономики, Москва, 2016 Трудоустройство в лаборатории и после фото фото • Лаборатория – прекрасная стартовая площадка как для дальнейшей научной карьеры, так и для продвижения в бизнес-среде • Лаборатория ищет инициативных исследователей, которые готовы участвовать в разработке и апробации методов анализа данных (аналитиков) и/или реализации программных средств (программистов). • Для того чтобы поступить в лабораторию, нужно прислать резюме заведующему, пройти собеседование и, возможно, аттестацию (проверку математических знаний и/или навыков программирования) • Студенты и аспиранты изначально зачисляются на должность стажёра-исследователя с испытательным сроком • Аспиранты обычно становятся младшими научными сотрудниками • МНУЛ ИССА уже может гордиться трудоустройством стажёров в Yandex, Вымпелком, Witology, Imhonet, АлгоМост, Лабораторию Цифрового Общества, а также участием сотрудников в программах студенческого и академического обмена с международными партнерами 50
  • 51. Высшая школа экономики, Москва, 2016 фото фото 51 Пример НИР студента Анализ данных в клинической информатике фото • МД-2014: «Методы обнаружения знаний в задаче сравнения эффективности стратегий лечения» • Для детей, больных лейкозом, случайным образом выбирается один из двух вариантов протокола лечения. В среднем эффект от лечения одинаков. Необходимо выделить и описать подгруппы пациентов, в которых один из видов лечения значительно эффективнее другого Федеральный научно-клинический центр детской гематологии, онкологии и иммунологии им. Дмитрия Рогачева (ФНКЦ ДГОИ) • Современное научно-исследовательское и лечебное учреждение – крупнейшее в Европе • Специализируется на лечении болезней крови, иммунной системы, злокачественных новообразований и др. • Проводятся уникальные операции по трансплантации клеток костного мозга от доноров, проживающих по всему миру
  • 52. Высшая школа экономики, Москва, 2016 фото фото 52 Пример НИР студента (2) Анализ данных в клинической информатике фото Стандартные подходы к оценке выживаемости: • Кривые выживаемости Каплан- Майера (на рисунке) • Логранговый критерий • Критерий эквивалентости • Модель пропорциональных рисков Кокса • и тд. Предложенный подход: • Найти пары физиологически схожих пациентов • Разбить пары на группы согласно эффективности каждого из двух видов лечения • Попытаться описать эти группы методами машинного обучения • Проверить полученные гипотезы стандартными инструментами анализа выживаемости
  • 53. фото фото 53 Высшая школа экономики, Москва, 2016 Пример НИР студента (3) Анализ данных в клинической информатике фото • Для пациентов с пальпируемым размером селезенки ≥ 3.5 см в возрасте старше 6.6 лет и pre-pre-B или pre-B иммуно-фенотипом метилпреднизолон в дозе 60 мг/м2/сут (MePRED) эффективнее, чем дексаметазон в дозе 6 мг/м2/сут (DEXA) • Всего таких пациентов 47 • При лечении всех пациентов MePRED, возможно, удалось бы спасти около 8 пациентов, т.е. порядка 1/6 всей группы Подтверждённая гипотеза (пример): Показаны графики выживаемости в группах
  • 54. Высшая школа экономики, Москва, 2016 Некоторые темы магистерских диссертаций специализации «ИССА» фото фото • Алгоритмические аспекты булевой матричной факторизации и ее приложения в Анализе Формальных Понятий • Оценка качества медицинских изображений • Мета-анализ практического использования различных математических моделей анализа результатов клинических исследований • Цифровые водяные знаки на основе изменения глубины в стереоскопических видео • Консенсусная кластеризация на основе решеток понятий • Методы бикластеризации для рекомендательных систем • Сравнительный анализ методов трикластеризации и их приложения • Исследование способов встраивания контекстной информации в коллаборативные рекомендательные алгоритмы • Машинное обучение с использованием глубоких нейронных сетей • Исследование качества методов анализа неструктурированных текстовых коллекций под управлением онтологий • Методы предварительной лингвистической обработки текстов для построения таксономий 54
  • 55. 125319, Россия, Москва, Кочновский проезд, д. 3 Тел.: +7(495)772-95-90 * 22675 https://www.hse.ru/ma/datasci