2. Состав системы
База знаний
патентов
Экспертные
таблицы
База знаний
предметных
областей
БД
онтологий
предметных
областей
БД лингвистики
Справочники,
классификаторы
и пр.
Метасловарь
РБД
БД
патентов
…
БД
патентов
…
БД
патентов
…
БД
патентов
РФ
БД
патентов
EU
БД
патентов
USA
Распределенная
БД патентов
Семантический
профиль (сеть)
Статистический профиль
(n –мерный тематический
вектор)
Информационный портрет источника
Галерея источников (патенты, статьи и т.д.)
3. Расширение вычислительного кластера ВолгГТУ
(конец 2014 – начало 2015)
- приобретено 10 узлов на платформе Intel на базе Intel Xeon E5 v3 с 2 Xeon
Phi 31S1P каждый
(РСК технологии)
- приобретен 1 узел SuperMicro на базе Intel Xeon E5 v3 с 6 Xeon Phi 31S1P
(аналог выставочного образца Aquarius на НСКФ-2014) – у компании Aquarius
- приобретен интерконнект Infiniband FDR 56Гбит от Mellanox
Характеристики узлов кластера на базе
Xeon E5 / Xeon Phi
Комплектующие 11 узлов 2 узла
Процессор
Intel Xeon E5-2650V3
(2,3 GHz, 10 ядер) x2
Intel Xeon E5-2660
(2,2 GHz, 8 ядер) x2
Память 64Gb DDR4 128Gb DDR3
Жесткий диск SSD Intel 240Gb SATA 1 Tb
Сопроцессор
Intel Xeon Phi
Coprocessor 31s1p x2
Intel Xeon Phi
Coprocessor 31s1p x2
4. Возможности системы• Формирование сети релевантных патентов для введенной заявки на русском и английском языках
• Принятие решений о невозможности выдачи патента по заявке, по которой уже был выдан патент (выданный по
заявке патент имеется в базе знаний).
Многомерное патентное пространство
Узел:
статистический
профиль
семантический
профиль метаданные
источника
Связь:
статистическая
мера близости
доля пересечения
семантических
сетей
Recall (%) Recall
50
Recall
100
Recall
200
Recall
300
Recall
500
Recall
1000
TF*IDF 32 44 50 53 58 66
LDA 43 53 62 66 72 83
Фразы 72 81 90 92 96 98
Фразы +
синонимы
74 82 91 93 96 98
Фразы +
синонимы
Поиск
среди US
патентов
59 68 80 85 88 93
Наш метод 84 91 95.5 97.5 98.5 99.6
Сравнительный анализ методов
6. Входные данные
• Полный текст заявки:
– реферат
– описание
– формула
Выходные данные
• Список существующих патентов, отсортированный по степени
релевантности заявке
• Решение да/нет о возможности выдачи патента для заявки
• Перечень существующих патентов, на основании которых
было принято решение о невозможности выдачи патента
• Визуализация пересечения текста формулы заявки с
текстами формул существующих патентов.
7. Поддерживаемые языки
• Русский
• Английский
Базы патентов в открытом
доступе
• Российские патенты, выданные за
период с 1993 по 2014 годы
• Американские патенты, выданные за
период с 2005 по 2014 годы
12. Возможности системы, находящиеся
на этапе тестирования и внедрения
• Определение возможности выдачи патента для
заявки на основании анализа массивов патентов на
других языках
• Принятие решений о невозможности выдачи
патента по результатам анализа массива отказных
заявок
13. Перечень проектов 2015 года
• 15-07-06254 «Разработка интеллектуальной методологии поиска новых
технических решений в глобальном патентном пространстве на основе
кросстематических и прогнозных состояний мирового технического
уровня» - 2015 год, продолжено финансирование в 2016 году;
• 15-07-09142 «Разработка методов анализа патентного массива для
актуализации базы данных физических эффектов» - 2015 год,
продолжено финансирование в 2016 году;
• 15-37-50292 «Разработка метода и технологии извлечения
формализованных знаний о физических эффектах и приемах
улучшения эксплуатационных характеристик нано- и микроэлементов
информационно-измерительных и управляющих систем и создание CAI
(Computer-Aided Innovation) системы концептуального проектирования
таких элементов» -2015 год (5 месяцев);
• 15-37-50355 «Разработка и исследование технологии сбора, обработки
и интеграции разнородной информации о перспективных технологиях
из открытых научных источников на основе автоматической генерации
интеллектуальных агентов мультиагентных систем» -2015 год (5
месяцев)