Проектный офис РОСНАНО провел информационный семинар, посвященный вопросам взаимодействия с Фондом развития инновационного центра «Сколково» и условиям получения статуса резидента инновационного центра проектными компаниями.
Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сло...AINL Conferences
Лексико-семантические ресурсы играют ключевую роль в автоматической обработке текста. В последние годы ресурсы, создаваемые сообществом, такие как Википедия и Wiktionary, становятся привлекательной альтернативой для классических ресурсов, создаваемых экспертами, таких как WordNet, особенно для языков для которых мало ресурсов. Недавние крупномасштабные проекты, например YAGO, BabelNet, UBY, нацелены на комбинирование множества лексикосемантических ресурсов в рамках одной системы. В своем докладе я представлю выравнивание смыслов слов как задачу, критически важную для комбинирования лексико-семантических ресурсов и взаимодополняющего использования их сильных сторон. В задаче выравнивания смыслов слов, смысл термина (например, Java как язык программирования) должен быть связан с синонимичными значениями во множестве ресурсов и отделен от других значений того же слова (например, Java, как остров). В докладе будут рассмотрены два подхода к решению описанной задачи: основанный на близости текстов и основанный на графах, также их оценка на парах лексико-семантических ресурсов с различными свойствами. В конце будут приведены примеры использования выровненных лексикосемантических ресурсов в автоматической бработке текста.
Сергей Уласень (Eugene Goostman) "Организация диалога в системе общения на ес...AINL Conferences
Что будет рассмотрено:
имитация диалога в простых конструкциях "вопрос-ответ"
управление ходом диалога
имитация реальной личности
этапы разработки чатбота
как тестируется база знаний
как база знаний корректируется по результатам общения
Владислав Мараев "Унимодальные речевые интерфейсы: проблемы и перспективы"AINL Conferences
Доклад посвящен практическим аспектам применения речевых интерфейсов на основе опыта разработки телефонных систем для контакт-центров. В докладе будут описаны основные ограничения, вызванные качеством распознавания речи, спонтанным характером речи и когнитивными способностями человека. Кроме того, будут рассмотрены основные метрики эффективности интерфейсов и лучшие практики, применяемые в их разработке. Наконец, часть доклада будет касаться того, как появление дополнительной модальности способно повысить эффективность речевых интерфейсов.
Дмитрий Суворов "Интеллектуальный помощник Лекси"AINL Conferences
Доклад расскажет о новой разработке нашей команды - интеллектуальном домашнем помощнике Лекси. Лекси - это настольное устройство с искусственном интеллектом на борту. Он должен стать не просто помощником людей, а их другом или хотя бы питомцем. Устройство выполнено в концепции интернета-вещей. Особое внимание в докладе уделено концепции домашних помощников, проблеме создания интересного живого устройства-собеседника, решению технических проблем, значительно сковывающих возможности голосового общения человека и машин.
Николай Бузурнюк "Автономная система распознавания русской речи"AINL Conferences
В докладе рассматривается решение задачи распознавания русской речи на большом словаре с использованием комбинированных признаков входного сигнала. Ноу-хау алгоритма является подобранный сбалансированных набор признаков входного сигнала. Важными свойствами решения являются высокая производительность, компактность и обучаемость, что позволяет использовать систему во встраиваемых устройствах. Приводится общее описание решения, а также достигнутые результаты.
Поиск ответа на вопросы сформулированные на естественном языке часто требуют от когнитивных систем выявления скрытых семантических взаимосвязей между различными объектами. Доклад посвящен описанию метода распространения активации (spreading-activation) на базе трех источников для измерения семантической близости: N-граммы, база знаний PRISMATIC и ссылки Википедии. Данные подход был применен для повышения вероятности ответа на вопросы из категорий COMMON BONDS и MISSING LINK.
Анна Власова, Кирилл Зоркий "Как отличить в диалоге робота от человека"AINL Conferences
Диалог, который ведет автоматический виртуальный собеседник, имеет определенные структурные отличия от диалога, которые ведет человек. Эти отличия проявляются
в уровне и способе понимания роботом реплики пользователя
в характере, стилистике и других особенностях формирования ответа робота
в общей схеме и глубине всего диалога
Интересно проанализировать такие отличия в зависимости от назначения и приоритетной тематики виртуального собеседника. Разработчики роботов закладывают разные диалоговое поведение в собеседников разных типов. Роботы будут существенно отличаться
в зависимости от задачи общения: развлечение/консультация
в зависимости от цели, поставленной разработчиками: максимально скрыть, что это робот/не скрывать/наоборот, сакцентировать внимание пользователя на "автоматическом" характере общения
в зависимости от декларируемой узости тематики общения
Подробнее о разнице в моделях диалога для разных типов роботов-собеседников, их восприятии человеком и прикладной эффективности той или иной модели мы расскажем в докладе.
Антон Колонин "О создании программных агентов для "интернета вещей"AINL Conferences
Конвергенция таких современных IT-трендов как "интернет вещей" (internet of things), "глобальная смысловая сеть" (semantic web, "things instead of strings") и робототехника приводит к созданию нового поколения программных агентов. Эти агенты будут способны автономно функционировать в глобальной сети, соединяющей как людей, так и устройства самого разного рода. Им нужно будет обладать способностями адаптивного интеллекта, позволяющими производить обучение агентов применительно к конкретным задачам пользователей в различных прикладных областях, оперируя со смысловыми сетями ("графами знаний") – как загружаемыми пользователями-людьми и другими агентами-корреспондентами, так и достраиваемыми в ходе взаимодействия с окружающем миром. В рамках проекта Aigents, создается среда интеллектуальных агентов для поиска информации в интернете. Каждый агент включает семантическую базу данных, развитую систему управления онтологиями, возможности интеллектуальной адаптации, а также - языковый интерфейс, позволяющий агентам взаимодействовать как друг с другом, так и с пользователями.
Эриберто Кваджавитль "Адаптивное обучение с подкреплением для интерактивных ...AINL Conferences
В своем выступлении я опишу наш текущий проект в Interaction Lab, на факультете математики и компьютерных наук университета Херриот-Ватт, Шотландия. Наше исследование посвящено разработке голосовой интерактивной системы, которая может эффективно и адаптивно взаимодействовать с людьми. Такие системы часто используют обучение с подкреплением (Reinforcement Learning), вычислительную модель, которая методом проб и ошибок выучивает сложные модели поведения. Недостатком таких систем является ограниченная масштабируемость, т.е. трудности при работе с большим пространством возможностей и паралелльными задачами. Я опишу три возможных решения этой проблемы: использование предыдущих знаний, повторное использование выученных стратегий и гибкое взаимодействие. Все три подхода будут проиллюстрированы действующими системами, которые тестировались на реальных пользователях. В конце я обсужу возможные направления будущей работы, нацеленной на использование систем Reinforcement Learning в реальных (неэкспериментальных) системах.
WordNet для русского языка. Русские тезаурусы: что есть и что надо? Ведущий: ...AINL Conferences
В рамках круглого стола мы предлагаем обсудить существующие семантические ресурсы для автоматической обработки текстов на русском языке, а также определить потребности в таких ресурсах. В дискуссии примут участие разработчики и "потребители" тезаурусов и лингвистических онтологий, академические исследователи и практики.
Участники
- Елена Трещева (Саратовский университет)
- Наталья Лукашевич (МГУ)
- Анатолий Старостин (ABBYY)
- Ирина Гуревич (Технический Университет Дармштадта)
- Виктор Бочаров (OpenCorpora)
- Александр Силонов ( Sanoma Independent Media)
- и др.
Ирина Гуревич "Язык программирования – это не остров: выравнивание смысла сл...AINL Conferences
Лексико-семантические ресурсы играют ключевую роль в автоматической обработке текста. В последние годы ресурсы, создаваемые сообществом, такие как Википедия и Wiktionary, становятся привлекательной альтернативой для классических ресурсов, создаваемых экспертами, таких как WordNet, особенно для языков для которых мало ресурсов. Недавние крупномасштабные проекты, например YAGO, BabelNet, UBY, нацелены на комбинирование множества лексикосемантических ресурсов в рамках одной системы. В своем докладе я представлю выравнивание смыслов слов как задачу, критически важную для комбинирования лексико-семантических ресурсов и взаимодополняющего использования их сильных сторон. В задаче выравнивания смыслов слов, смысл термина (например, Java как язык программирования) должен быть связан с синонимичными значениями во множестве ресурсов и отделен от других значений того же слова (например, Java, как остров). В докладе будут рассмотрены два подхода к решению описанной задачи: основанный на близости текстов и основанный на графах, также их оценка на парах лексико-семантических ресурсов с различными свойствами. В конце будут приведены примеры использования выровненных лексикосемантических ресурсов в автоматической обработке текста.
Игорь Андреев (Mail.ru) "Перевод с русского на русский, или о применении тех...AINL Conferences
На сегодняшний день статистический машинный перевод представляет собой быстро развивающееся направление прикладной лингвистики с хорошо проработанным математическим аппаратом и доступным программным обеспечением. И хотя целью этого направления является поиск закономерностей в текстах, написанных на различных языках, с его помощью можно извлечь значительную пользу из моноязычных языковых ресурсов. В докладе будет показано, как применить наработки в области МП к решению задачи повышения качества web-поиска по низкочастотным запросам. Исследования проводились на реальных данных проекта Поиск@Mail.Ru, и полученные решения в настоящее время уже частично реализованы в проекте.
Илья Мельников (Яндекс) "Классификатор коротких текстов с использованием вект...AINL Conferences
В докладе описан подход, решающий задачу классификации коротких текстов на основании семантического сопоставления с обучающими примерами.
Раскрыты такие аспекты, как:
Максимальный упор на сравнение по смыслу (против известных статистических методов)
Устойчивость к разнообразию формулировок, использованию синонимов
Построение модели на малом количестве данных
Для решения этих задач создан классификатор на основе векторного представления слов. Обучающие тексты отображаются в многомерное пространство в виде наборов точек. Для анализируемого текста класс определяется соотношениями близостей между представлением текста и обучающих примеров. Делается допущение об условной независимости слов в фразе. Подход применим в любых задачах, где необходимо по смыслу классифицировать фразы диалога или короткие тексты.
Тестирование проводилось интерактивном стенде для Yac/m. Порядка 70 обучающих примеров, 4 класса. Получена accuracy порядка 250%, проверка методом 5 fold cross validation.
Анатолий Старостин (ABBYY) "ABBYY InfoExtractor: технология разработки предме...AINL Conferences
Доклад посвящен описанию той части технологии ABBYY Compreno, с помощью которой разрабатываются предметно-ориентированные системы извлечения информации из текстов. Обсуждаются принципы работы базового механизма извлечения информации а также инструментальная среда OntoDPS (Ontological Data Preparation System), позволяющая настраивать его под конкретные предметные области. Базовый механизм позволяет использовать для извлечения информации результаты полного семантико-синтаксического анализа текста и применять к ним продукционную систему правил извлечения информации. Система правил компонуется в рамках OntoDPS. Она неразрывно связана с онтологией той предметной области, для которой создается система извлечения информации.
Особое внимание в докладе уделяется вопросам модульности и инкапсуляции. Демонстрируется то, как за счет декларативной природы правил извлечения информации становится возможным их гибкое переиспользование между системами извлечения информации. Обсуждаются также вопросы автоматизированного тестирования создаваемых систем. Акцент в докладе делается в большей степени на архитектурных и технологических решениях. Конкретные онтологические и лингвистические вопросы почти не затрагиваются. Для обсуждения деталей такого рода в рамках демо-сессии конференции AINL 2014 планируется демонстрация внутреннего устройства и работы конкретной системы извлечения информации из новостных текстов.
Paolo Rosso "On irony detection in social media"AINL Conferences
Каковы лингвистические паттерны, которым следуют пользователи социальных сетей, чтобы высказывать иронию в совсем коротких фразах? Лингвистические средства - такие как неоднозначность, непоследовательность, неожиданность эмоциональный контекст, гораздо более широкий, чем просто негативная или позитивная тональность - играют очень важную роль триггеров иронии. В иронических текстах буквальный смысл сообщения как правило отрицается, но формальные маркеры отрицания отсутствуют. Это делает задачу определения иронии очень сложной. В своем выступлении я опишу как ирония выражается в социальных сетях (Twitter, Amazon, Facebook и др.) и каково современное положение дел в автоматическом определении иронии. Определение иронии очень важно для таких задач анализа текста как определение тональности сообщения, извлечение мнений, или анализ репутаций, и существует определенный интерес исследовательского сообщества к этой теме. На конференции SemEval 2015 будет организована задача-соревнование по определению тональности фигуративного языка в Твиттере (Sentiment Analysis of Figurative Language in Twitter, http://alt.qcri.org/semeval2015/task11/). В конце я коснусь еще более сложной проблемы различения иронии, сатиры и сарказма, например: Если вам тяжело смеяться над собой, я буду счастлив сделать это за вас.
2. КЛЮЧЕВЫЕ ПРЕФЕРЕНЦИИ
СТАТУСА УЧАСТНИКА
ВОЗМОЖНОСТЬ ПОЛУЧЕНИЯ
ГРАНТОВОГО ФИНАНСИРОВАНИЯ
В РАЗМЕРЕ ДО 300 МЛН. РУБ.
НАЛОГОВЫЕ ЛЬГОТЫ:
• Освобождение от обязанностей
налогоплательщика по налогу на прибыль
• Освобождение от обязанностей
налогоплательщика по налогу на добавленную
стоимость
• Освобождение от обложение налогом на
имущество организаций
• Пониженный тариф страховых взносов – 14%
3. ЛЬГОТЫ
ДЛЯ УЧАСТНИКОВ ПРОЕКТА СКОЛКОВО
МИГРАЦИОННЫЕ ЛЬГОТЫ:
• Отмена квотирования на привлечение
иностранной рабочей силы
• Отмена оформления разрешения на
привлечение и использование
иностранной рабочей силы
• Увеличение срока действия
разрешительных документов до 3-х лет
ТАМОЖЕННЫЕ ЛЬГОТЫ:
• Сниженные ставки за услуги
таможенного представителя
• Возмещение затрат по уплате
ввозной таможенной пошлины и НДС
ВОЗМОЖНОСТЬ
ПОЛУЧЕНИЯ ДОСТУПА
К R&D-ИНФРАСТРУКТУРЕ
НА ЛЬГОТНЫХ УСЛОВИЯХ
(использование оборудования и лабораторий
на базе ЦКП Сколково)
ВОЗМОЖНОСТЬ
РАЗМЕЩЕНИЯ НА
ТЕРРИТОРИИ
ИННОВАЦИОННОГО
ЦЕНТРА «СКОЛКОВО»
5. ЮРИДИЧЕСКИЕ УСЛУГИ БУХГАЛТЕРСКИЕ УСЛУГИ
ТЕХНОЛОГИЧЕСКИЕ
СЕРВИСЫ
ЗАЩИТА ИНТЕЛЛЕКТУАЛЬНОЙ
СОБСТВЕННОСТИ
АРЕНДА ОФИСНЫХ
ПОМЕЩЕНИЙ
ВИДЕОКОНФЕРЕНЦИИ CISCO
КАДРОВЫЙ СЕРВИС
ВИЗОВО-МИГРАЦИОННАЯ
ПОДДЕРЖКА
МАРКЕТИНГОВЫЙ СЕРВИС ЖИЛИЩНЫЙ СЕРВИС
ТАМОЖЕННО-ФИНАНСОВАЯ
КОМПАНИЯ
ПОЧТОВЫЙ СЕРВИС
Узнай больше на tp.sk.ru
6. ПРОЦЕДУРА ПОЛУЧЕНИЯ СТАТУСА УЧАСТНИКА
ИННОВАЦИОННОГО ПРОЕКТА «СКОЛКОВО»
Подача заявки Формальная проверка
(внутренний процесс Фонда)
Экспертиза по существу
(независимые эксперты)
1 Регистрация на
сайте: www.sk.ru
2 Заполнение
анкеты online
1 Проверка полноты и
комплектности
заполнения заявки
2 Юридическая проверка
3 Оценка на соответствие
форсайту (приоритетные
сферы в рамках пяти
основных стратегических
направлений,
поддерживаемых проектом
«Сколково»)
4 Голосование экспертов:
10 экспертов по
направлению форсайта
проекта выбираются
случайным образом
• Продукт / технология обладают
конкурентными
преимуществами перед
мировыми аналогами
• Продукт / технология обладает
существенным потенциалом
коммерциализации, как
минимум, на российском рынке
• Проект теоретически реализуем
• Ключевые исследователи
обладают необходимыми
знаниями для успешной
реализации проекта /
проведения исследований;
• В Команде проекта присутствует
специалист с международным
опытом в области
исследований, разработок /
коммерциализации их
результатов
!
КРИТЕРИИ
Соискатель..
* Процесс участника
* Процесс Фонда
Участник..
7. ОБЩАЯ СХЕМА ВЫДЕЛЕНИЯ ФИНАНСИРОВАНИЯ (ГРАНТ)
Фонд проверяет
комплектность
1. Заявка 2. Грантовый
меморандум
~ 1,5 месяца ~ 2 недели
3. Проверка
документов на
соответствие
(Due diligence)
4. Грантовый
комитет
Доработка проекта
(возможно получение
Минигранта)
Мотивированный отказ
Участник готовит
презентацию по
формату и подает
через App.Sk.ru
или
10 дней
Фонд принимает
решение о
принятии к
рассмотрению
Участник направляет
Грантовый
меморандум с
приложениями
Службы Фонда
осуществляют
проверку и внешнюю
экспертизу
не более 90 (+10) дней
Участник получает
результаты
рассмотрения
Подготовка к
заседанию
Грантового комитета
Грантовый комитет
принимает решение
о выделении гранта
8. КОМАНДА
КОНСУЛЬТАЦИОННОГО ЦЕНТРА
Ольга Платонова
Руководитель
консультационного центра
доб. 2162
Юлия Юдина
Главный специалист
консультационного центра
доб. 2441
Максим Тепикин
Специалист
консультационного центра
доб. 2407
ЗВОНИТЕ НАМ
+7 (495) 967 01 48
ПИШИТЕ НАМ
SkTechnopark@sk.ru
ЧИТАЙТЕ НАС
tp.sk.ru