Essays on using Formal Concept Analysis in Information EngineeringWitology
The document discusses using formal concept analysis (FCA) and temporal concept analysis (TCA) to analyze police and healthcare data. It describes a case study that used FCA and self-organizing maps to improve the definition and detection of domestic violence cases from police reports. It also discusses using FCA and TCA to detect human trafficking and profile potential terrorists from police data, and using process mining techniques to analyze integrated healthcare pathways.
Witology's technology includes a collaborative online environment called the Witology platform, facilitators to manage collaborative work, and Witodology methodology for generating knowledge through identifying explicit and tacit knowledge from a large number of participants. The platform creates a socio-semantic network to rate ideas
Provide a unified vision of automated processes, possibly through a common document that contains hierarchy and relationships of the whole system of technical requirements
Essays on using Formal Concept Analysis in Information EngineeringWitology
The document discusses using formal concept analysis (FCA) and temporal concept analysis (TCA) to analyze police and healthcare data. It describes a case study that used FCA and self-organizing maps to improve the definition and detection of domestic violence cases from police reports. It also discusses using FCA and TCA to detect human trafficking and profile potential terrorists from police data, and using process mining techniques to analyze integrated healthcare pathways.
Witology's technology includes a collaborative online environment called the Witology platform, facilitators to manage collaborative work, and Witodology methodology for generating knowledge through identifying explicit and tacit knowledge from a large number of participants. The platform creates a socio-semantic network to rate ideas
Provide a unified vision of automated processes, possibly through a common document that contains hierarchy and relationships of the whole system of technical requirements
НИР "Анализ информационной деятельности территориальных органов МЧС России"Artukhin Valeriy
Презентация к докладу 30.01.2014 г. по научно-исследовательской работе "Анализ информационной деятельности территориальных органов МЧС России" на научно-техническом совете Всероссийского научно-исследовательского института по проблемам гражданской обороны и чрезвычайных ситуаций МЧС России.
Доклад Анатолия Левенчука "Системо-системная инженерия: основные методы и инструменты" на секции "Интеллектуальная энергетика как система систем: от концепции к платформе с открытой архитектурой" конференции UpGrid, 31 октября 2013г.
Разработка системы гибкой автоматизации Интернет-торговлиAnatoly Simkin
Данное научно-практическое исследование проводилось в период с 2009 до 2011 года в МГТУ им. Н.Э.Баумана. Исследование затрагивает как научные методы управления соответсвиями бизнес-процессов, так и практические подходы к проектированию и разработке системы автоматизации Интернет-торговли. Проведенные исследования и последующая практическая реализации разработанной модели позволило сформировать типовое продуктовое решение для Интернет-магазинов.
В работе содержится:
1. Исследование предметной области методов управления соответствиями бизнес-процессов и средств проектирования систем автоматизации Интернет-торговли
2. Разработка модели гибкой автоматизации бизнес-процессов с использованием семантических сетей
3. Проектирование, разработка и апробация информационной системы
Концепция применения онтологических структур в ERP-системахAnatoly Simkin
В данной статье поднята проблематика анализа информации, предоставляемой информационными системами. Рассмотрены актуальные способы ее структурирования и представления пользователю. Предложена концепция построения и применения онтологических структур в информационных системах для анализа данных.
This article is devoted to the problems of data analysis that is provided by information systems. The actual methods of structuring and representation for user were considered. There was proposed the principle of making and applying the ontology structure in information systems for data analysis.
SPb BA & SA Night. Learning a New Business Domain [1.01, RUS]Alex V. Petrov
Известные и неизвестные приемы освоения новых предметных областей — обязательный инструмент в арсенале успешного аналитика. Именно им был посвящен II «Вечер системного и бизнес-анализа» в С.-Петербурге, прошедший 05 сентября 2015 г. Ключевые темы: индукция и дедукция, концептуальные модели и онтологии, разбор примеров, командная работа и менторство.
Taxonomy vs folksonomy Tsepkov Analyst Days 2016Maxim Tsepkov
http://mtsepkov.org/SMD-AnalystDays2016 Коммуникация при различной структуре мышления - таксономия против фолксономии. Выступление Максима Цепкова на AnalystDays-2016.
Интегрированный подход к управлению информацией жизненного цикла антропогенн...Сергей Волков
Презентация к защите серии стандартов "Интегрированный подход": ГОСТ Р 57269-2016, ГОСТ Р 57295-2016, ГОСТ Р 57296-2016.
Презентация показывает ключевые особенности интегрированного подхода при анализе и разработке проектов.
НИР "Анализ информационной деятельности территориальных органов МЧС России"Artukhin Valeriy
Презентация к докладу 30.01.2014 г. по научно-исследовательской работе "Анализ информационной деятельности территориальных органов МЧС России" на научно-техническом совете Всероссийского научно-исследовательского института по проблемам гражданской обороны и чрезвычайных ситуаций МЧС России.
Доклад Анатолия Левенчука "Системо-системная инженерия: основные методы и инструменты" на секции "Интеллектуальная энергетика как система систем: от концепции к платформе с открытой архитектурой" конференции UpGrid, 31 октября 2013г.
Разработка системы гибкой автоматизации Интернет-торговлиAnatoly Simkin
Данное научно-практическое исследование проводилось в период с 2009 до 2011 года в МГТУ им. Н.Э.Баумана. Исследование затрагивает как научные методы управления соответсвиями бизнес-процессов, так и практические подходы к проектированию и разработке системы автоматизации Интернет-торговли. Проведенные исследования и последующая практическая реализации разработанной модели позволило сформировать типовое продуктовое решение для Интернет-магазинов.
В работе содержится:
1. Исследование предметной области методов управления соответствиями бизнес-процессов и средств проектирования систем автоматизации Интернет-торговли
2. Разработка модели гибкой автоматизации бизнес-процессов с использованием семантических сетей
3. Проектирование, разработка и апробация информационной системы
Концепция применения онтологических структур в ERP-системахAnatoly Simkin
В данной статье поднята проблематика анализа информации, предоставляемой информационными системами. Рассмотрены актуальные способы ее структурирования и представления пользователю. Предложена концепция построения и применения онтологических структур в информационных системах для анализа данных.
This article is devoted to the problems of data analysis that is provided by information systems. The actual methods of structuring and representation for user were considered. There was proposed the principle of making and applying the ontology structure in information systems for data analysis.
SPb BA & SA Night. Learning a New Business Domain [1.01, RUS]Alex V. Petrov
Известные и неизвестные приемы освоения новых предметных областей — обязательный инструмент в арсенале успешного аналитика. Именно им был посвящен II «Вечер системного и бизнес-анализа» в С.-Петербурге, прошедший 05 сентября 2015 г. Ключевые темы: индукция и дедукция, концептуальные модели и онтологии, разбор примеров, командная работа и менторство.
Taxonomy vs folksonomy Tsepkov Analyst Days 2016Maxim Tsepkov
http://mtsepkov.org/SMD-AnalystDays2016 Коммуникация при различной структуре мышления - таксономия против фолксономии. Выступление Максима Цепкова на AnalystDays-2016.
Интегрированный подход к управлению информацией жизненного цикла антропогенн...Сергей Волков
Презентация к защите серии стандартов "Интегрированный подход": ГОСТ Р 57269-2016, ГОСТ Р 57295-2016, ГОСТ Р 57296-2016.
Презентация показывает ключевые особенности интегрированного подхода при анализе и разработке проектов.
Мировой и российский рынки People as the platformWitology
The document discusses the People as the Platform market from the supply side and demand side perspectives. From the supply side, it segments the market into key application areas like social CRM, social software in the workplace, and collaborative decision making. It provides revenue estimates for these segments from 2008-2014. From the demand side, it notes that the average company spends $166k annually on external software and services for social business, with spending varying based on company size and revenues. The market is expected to grow at a compound annual growth rate of around 28% from 2008-2014 according to the analysis.
"Социально-сетевой анализ форумов при помощи пакета UCINet"Witology
Докладчик: Алексей Друца,
аспирант Мех-Мата МГУ, м.н.с. Лаборатории Компьютерного Моделирования Мех-мата МГУ.
Доклад посвящен демонстрации функциональных возможностей программного пакета UCINet с точки зрения проведения социально-сетевого анализа обсуждений интернет-форума.
Программный пакет UCINet представляет собой интегрированную среду по форматированию и обработке входных и выходных данных о графе, которым является ветка обсуждения интернет-форума.
В рамках семинара будут представлены краткое описание основных характеристик графов, полученных результатов, а также подробно рассмотрены отдельные функциональные блоки пакета.
Видео: http://vimeo.com/user7862600
Алгоритмы анализа графов социальных связей Witology
Докладчики: Анастасия Беззубцева (стажер Witology)
Алексей Милованов (стажер Witology)
В рамках доклада ведется речь о существующих алгоритмах, применяемых для анализа социальных сетей, сообществ на примере данных ряда групп ВКонтакте.
Алгоритмы классификации в машинном обученииWitology
В докладе рассмотрены наиболее популярные алгоритмы классификации в машинном обучении, их преимущества и недостатки, а также приведены результаты использования алгоритмов на реальных данных, в частности, в задаче классификации текстов по классам эмоций.
Интересные результаты RUSSIR'11: WEB of DATAWitology
В рамках семинара докладчик рассказывает об основных темах и идеях, которыми жила летняя школа по информационному поиску на протяжении 5 дней. В их числе параметры, оценка, улучшение поисковых систем; графы в соцмедиа; коллективный информационный поиск.
Модели когнитивной психологии и задачи искусственного интеллектаWitology
Докладчик: Сергей Каунов
В рамках семинара рассматриваются следующие темы:
- Что такое искусственный интеллект и для чего традиционно используются модели ИИ?
- Что в психологии, как гуманитарной дисциплине, может найти полезного инженер, и что приведёт его в тупик.
- Взаимосвязь ИИ и психологии.
- Роль ИИ в когнитологии
Анализ формальных понятий: Применение в WitologyWitology
Докладчик: Александра Каминская
В докладе рассказывается о том, что такое анализ формальных понятий
(АФП) как один из методов анализы данных. Даны необходимые
определения и приведены простейшие примеры. Затронуты темы
решеток понятий, импликации и ассоциативных правил (выявление
признаковых зависимостей). Вторая часть доклада посвящена
применению АФП в Witology - а именно, анализу данных внутреннего
проекта с помощью построения решеток понятий.
Rostislav Yavorsky - Research Challenges of Dynamic Socio-Semantic NetworksWitology
This document presents a model for dynamic socio-semantic networks and identifies key research challenges. The model represents social networks as weighted multi-graphs of members and their relationships, and content as multi-graphs of elements and relations. Authorship links members and content. Network dynamics include changes to members, relationships, content, and context over time. Research challenges involve discovering influential members and texts from network evolution data using interdisciplinary approaches that combine social science, linguistics and machine learning.
1. Программа семинара
Утренняя сессия (12:00-14:00)
1. Ростислав Яворский (Witology). Интеллектуальный краудсорсинг и деятельные сообщества.
В докладе будут перечислены слабые и сильные стороны использования краудсорсинга в
бизнесе и сформулированы некоторые релевантные задачи, которые имеют четкую
математическую формулировку.
2. Алексей Друца (Witology, МГУ). Визуализация данных социосемантической сети.
Рассматривается пакет программ социально-сетевого анализа WitoAnalytics, позволяющий
анализировать и визуализировать данные социосемантической сети платформы Witology. На
текущий момент он включает более 10 визуализаций социосемантической сети, а также
алгоритмы кластеризации и анализа текстовых данных.
3. Александр Воробьев (Witology, МГУ). Определение компетенций участников конкурса и уровня
представленных ими проектов.
Рассмотрим некоторый конкурс проектов. В рамках этого конкурса его участники предлагают
проекты и оценивают качество проектов, предложенных другими участниками. Важным
условием является возможность участника представить на конкурс любое количество
проектов. На основе всех оценок, выставленных участниками проектам, нам необходимо
оценить качество проектов и характеристики участников как оценщиков проектов и как
авторов (создателей) проектов. Предлагается модель такого конкурса - байесовская сеть, в
которой применимы стандартные методы оценки параметров.
4. Алексей Трегубов (Witology, МГУ). Алгоритмы рейтингования участников социальной сети,
основанные на марковской модели.
Рассматриваются различные алгоритмы рейтингования участников социальной сети,
основанные на марковской модели. Выбираются алгоритмы, наиболее
соответствующие составу и специфике данных с проектов компании Витология, и
применяются к этим данным. Сопоставляются результаты их применения.
5. Дмитрий Игнатов, Александра Каминская (ВШЭ, Witology). Цели создания ПУГ. Система анализа
данных Witology.
В докладе будут освящены основные цели создания проектно-учебной группы «Алгоритмы
интеллектуального анализа данных (Data Mining) для Интернет-форумов обсуждения
инновационных проектов». Кроме того, будет описана система анализа данных
коллаборативной платформы компании Witology и результаты некоторых экспериментов. В
основу системы положен ряд моделей и методов современного анализа объектно-признаковых и
неструктурированных данных (текстов), таких как Анализ Формальных Понятий, спектральная
кластеризация, извлечение ключевых словосочетаний и слов из текстов.
2. 6. Константин Блинкин, Никита Ромашкин (ВШЭ). Прототип системы анализа данных CrowDM.
Для достижения ряда задач, стоящих перед проектно-учебной группой,, разрабатывается
система анализа данных CrowDM на основе решеток формальных понятий. В докладе
описываются основные возможности, уже реализованные в системе, процесс работы с
программой и выдаваемые результаты. Приведены примеры построения решеток понятий,
выделения устойчивых понятий и бикластеров по данным проекта Сбербанк-21. Обозначены
функциональные возможности, которые планируется реализовать в системе в будущем.
Вечерняя сессия (15:00-17:00)
7. Екатерина Черняк, Даниил Недумов (ВШЭ). Извлечение ключевых слов (ключевых выражений).
Реализация алгоритма выделения ключевых слов и словосочетаний. Сравнительный анализ
подходов к вычислению сходства тегов.
Важной промежуточной задачей в рамках проекта «Алгоритмы интеллектуального анализа
данных (Data Mining) для Интернет-форумов обсуждения инновационных проектов» является
извлечение ключевых слов и ключевых выражений из текстов сообщений форумов. В докладе
будут освещены общие подходы к проблеме выделения ключевых слов, рассказано о принципах,
примененных в проекте. Также будут представлены два подхода к вычислению сходств тегов и
показаны результаты сравнительного анализа эффективности их работы.
Кроме того, в докладе будут рассмотрены практические аспекты задачи выделения ключевых
слов и словосочетаний. Особое внимание будет уделено использованию внешних приложений для
морфологического анализа и программной реализации других этапов алгоритма. Будут
представлены некоторые результаты,
полученные для текстов проекта Сбербанк-21.
8. Ольга Чугунова (ВШЭ). Спектральная и иерархическая кластеризация пользователей по активности
и ключевым словам.
В докладе представлен отчет по анализу данных по пользователям проекта методами
кластер-анализа. В работе применялись два метода: аддитивно-спектральный метод
нечеткого кластер-анализа и иерархический метод кластер-анализа. Первый метод
использовался для анализа активности пользователей (по матрице человек-человек-
комментарий), второй – для выявления связей между пользователями на основе используемых
ими слов (по матрице человек-ключевое слово). Полученные обоими методами результаты, к
сожалению, не оправдали ожиданий: интерпретация найденных кластеров оказалась
затруднительной.
9. Федор Строк (ВШЭ). Анализ социальных сетей. Результаты экспериментов на данных Witology.
В данном докладе будут рассмотрены подходы к анализу данных проекта Сбербанк-21 с точки
зрения социальных сетей. Основное внимание уделяется вопросам индексов центральности,
отдельного внимание заслуживает изучение взаимосвязи рейтингов, предложенных Witology, и
индексов центральности агентов. Так же затрагиваются вопросы визуализации мер
центральностей для больших сетей.
10. Андрей Константинов (ВШЭ). Модель рекомендательной системы для внедрения на платформу
Witology.
В докладе будет кратко рассказано о существующих алгоритмах рекомендательных систем, а
также о возможностях внедрения реокмендательной системы в платформу Witology в трёх
аспектах: рекомендация интересных идей, рекомендация интересных людей, поиск
антагонистов.
3. 11. Анастасия Беззубцева (ВШЭ, Witology). Анализ распределений по данным проекта Сбербанк-21: в
погоне за power law. О типологиях пользователей коллаборативной платформы.
Одной из задач, поставленных в рамках работы проектно-учебной группы CrowDM, является
базовый статистический анализ данных одного из проектов краудсорсинговой платформы
Witology. Этой частью исследований в надежде найти интересные закономерности занималась
Анастасия Беззубцева. Поскольку деятельность участников сетевых сообществ чаще всего
подчиняется степенному закону, именно его Анастасия и пыталась найти, что даже отчасти
получилось. Анализ распределений активности на проекте также требовался для еще одной
части исследования – построения типологии пользователей коллаборативной платформы
Witology. Полученная типология далека от совершенства, полноты и универсальности, однако
уже можно сказать, что на проекте «Сбербанк-21» наблюдались шесть классов пользователей
(неактивные, прохожие, критики, создатели, спорщики и звезды), а их активность примерно
соответствует близкому к закону Парето правилу Нильсена «90 – 9 – 1»: большая часть
сообщества только потребляет и ничего не создает, и лишь на активных единицах держится
все сообщество.