SlideShare a Scribd company logo
1 of 14
Download to read offline
Система E-Patent Examiner
Май 2016, ВолгГТУ
Состав системы
База знаний
патентов
Экспертные
таблицы
База знаний
предметных
областей
БД
онтологий
предметных
областей
БД лингвистики
Справочники,
классификаторы
и пр.
Метасловарь
РБД
БД
патентов
…
БД
патентов
…
БД
патентов
…
БД
патентов
РФ
БД
патентов
EU
БД
патентов
USA
Распределенная
БД патентов
Семантический
профиль (сеть)
Статистический профиль
(n –мерный тематический
вектор)
Информационный портрет источника
Галерея источников (патенты, статьи и т.д.)
Расширение вычислительного кластера ВолгГТУ
(конец 2014 – начало 2015)
- приобретено 10 узлов на платформе Intel на базе Intel Xeon E5 v3 с 2 Xeon
Phi 31S1P каждый
(РСК технологии)
- приобретен 1 узел SuperMicro на базе Intel Xeon E5 v3 с 6 Xeon Phi 31S1P
(аналог выставочного образца Aquarius на НСКФ-2014) – у компании Aquarius
- приобретен интерконнект Infiniband FDR 56Гбит от Mellanox
Характеристики узлов кластера на базе
Xeon E5 / Xeon Phi
Комплектующие 11 узлов 2 узла
Процессор
Intel Xeon E5-2650V3
(2,3 GHz, 10 ядер) x2
Intel Xeon E5-2660
(2,2 GHz, 8 ядер) x2
Память 64Gb DDR4 128Gb DDR3
Жесткий диск SSD Intel 240Gb SATA 1 Tb
Сопроцессор
Intel Xeon Phi
Coprocessor 31s1p x2
Intel Xeon Phi
Coprocessor 31s1p x2
Возможности системы• Формирование сети релевантных патентов для введенной заявки на русском и английском языках
• Принятие решений о невозможности выдачи патента по заявке, по которой уже был выдан патент (выданный по
заявке патент имеется в базе знаний).
Многомерное патентное пространство
Узел:
статистический
профиль 
семантический
профиль  метаданные
источника
Связь:
статистическая
мера близости 
доля пересечения
семантических
сетей
Recall (%) Recall
50
Recall
100
Recall
200
Recall
300
Recall
500
Recall
1000
TF*IDF 32 44 50 53 58 66
LDA 43 53 62 66 72 83
Фразы 72 81 90 92 96 98
Фразы +
синонимы
74 82 91 93 96 98
Фразы +
синонимы
Поиск
среди US
патентов
59 68 80 85 88 93
Наш метод 84 91 95.5 97.5 98.5 99.6
Сравнительный анализ методов
Информационный портрет
источника
Семантический профиль заявки на патент
Совпадающие вершины
Ключевые понятия,
отсутствующие в других патентах
Явные отличия
Статистический профиль
0 50 100 150 200 250 300
Тема 4
Тема 5
Тема 6
Тема 8
Патент 2 22,190338 71,266464 277,808685 13,378813
Тема 4 Тема 5 Тема 6 Тема 8
Поступившая
заявка
Патент 3
Патент 6
Входные данные
• Полный текст заявки:
– реферат
– описание
– формула
Выходные данные
• Список существующих патентов, отсортированный по степени
релевантности заявке
• Решение да/нет о возможности выдачи патента для заявки
• Перечень существующих патентов, на основании которых
было принято решение о невозможности выдачи патента
• Визуализация пересечения текста формулы заявки с
текстами формул существующих патентов.
Поддерживаемые языки
• Русский
• Английский
Базы патентов в открытом
доступе
• Российские патенты, выданные за
период с 1993 по 2014 годы
• Американские патенты, выданные за
период с 2005 по 2014 годы
Диаграмма потоков данных
Подсистема поиска патентов-аналогов по тексту заявки
Пример интерфейса
Web-интерфейс с реализацией алгоритмов
параллельной мультисерверной обработки
входящей информации
Возможности системы, находящиеся
на этапе тестирования и внедрения
• Определение возможности выдачи патента для
заявки на основании анализа массивов патентов на
других языках
• Принятие решений о невозможности выдачи
патента по результатам анализа массива отказных
заявок
Перечень проектов 2015 года
• 15-07-06254 «Разработка интеллектуальной методологии поиска новых
технических решений в глобальном патентном пространстве на основе
кросстематических и прогнозных состояний мирового технического
уровня» - 2015 год, продолжено финансирование в 2016 году;
• 15-07-09142 «Разработка методов анализа патентного массива для
актуализации базы данных физических эффектов» - 2015 год,
продолжено финансирование в 2016 году;
• 15-37-50292 «Разработка метода и технологии извлечения
формализованных знаний о физических эффектах и приемах
улучшения эксплуатационных характеристик нано- и микроэлементов
информационно-измерительных и управляющих систем и создание CAI
(Computer-Aided Innovation) системы концептуального проектирования
таких элементов» -2015 год (5 месяцев);
• 15-37-50355 «Разработка и исследование технологии сбора, обработки
и интеграции разнородной информации о перспективных технологиях
из открытых научных источников на основе автоматической генерации
интеллектуальных агентов мультиагентных систем» -2015 год (5
месяцев)
Публикации 2015 года
• 21 статья, из них 10 Scopus/WoS, 8 ВАК.

More Related Content

Similar to E-Patent Examiner

Fee free Russian patents analisys
Fee free Russian patents analisysFee free Russian patents analisys
Fee free Russian patents analisysNikolay Popov
 
Перспективные исследования и технологии
Перспективные исследования и технологииПерспективные исследования и технологии
Перспективные исследования и технологииAncud Ltd.
 
Open Source Testing Framework: real project example and best practices
Open Source Testing Framework: real project example and best practicesOpen Source Testing Framework: real project example and best practices
Open Source Testing Framework: real project example and best practicesAliaksandr Ikhelis
 
Реализация тестового фреймворка на основе OPEN-SOURCE инструментов
Реализация тестового фреймворка на основе OPEN-SOURCE инструментовРеализация тестового фреймворка на основе OPEN-SOURCE инструментов
Реализация тестового фреймворка на основе OPEN-SOURCE инструментовSQALab
 
Lan-Crawler Bachlor RU
Lan-Crawler Bachlor RULan-Crawler Bachlor RU
Lan-Crawler Bachlor RUcDima
 
Russian universities patents (name standardization)
Russian universities patents (name standardization)Russian universities patents (name standardization)
Russian universities patents (name standardization)Nikolay Popov
 
Лекция 1. Модель OSI.
Лекция 1. Модель OSI.Лекция 1. Модель OSI.
Лекция 1. Модель OSI.Alexey Furmanov
 
заявка петелин 3
заявка петелин 3заявка петелин 3
заявка петелин 3dgim
 
Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017Timur Ovadia Berezin
 
Building Open Source Test Automation Frameworks. Watir based automation case ...
Building Open Source Test Automation Frameworks. Watir based automation case ...Building Open Source Test Automation Frameworks. Watir based automation case ...
Building Open Source Test Automation Frameworks. Watir based automation case ...Aliaksandr Ikhelis
 
Разработка веб-сервисов осень 2013 лекция 8
Разработка веб-сервисов осень 2013 лекция 8Разработка веб-сервисов осень 2013 лекция 8
Разработка веб-сервисов осень 2013 лекция 8Technopark
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 finalyaevents
 
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet APIПротокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet APIEkaterina Kuchinskaya
 
Лекция 3. Браузеры (2009)
Лекция 3. Браузеры (2009)Лекция 3. Браузеры (2009)
Лекция 3. Браузеры (2009)Alexey Furmanov
 
C# Web. Занятие 01.
C# Web. Занятие 01.C# Web. Занятие 01.
C# Web. Занятие 01.Igor Shkulipa
 
SearchInform. Алексей Попов. "Как выбрать идеальную DLP-систему?"
SearchInform. Алексей Попов. "Как выбрать идеальную DLP-систему?"SearchInform. Алексей Попов. "Как выбрать идеальную DLP-систему?"
SearchInform. Алексей Попов. "Как выбрать идеальную DLP-систему?"Expolink
 
Платформа для автоматического тестирования Erlang проектов на примере UserGat...
Платформа для автоматического тестирования Erlang проектов на примере UserGat...Платформа для автоматического тестирования Erlang проектов на примере UserGat...
Платформа для автоматического тестирования Erlang проектов на примере UserGat...DevDay
 
Автореферат кандидатской диссертации
Автореферат кандидатской диссертацииАвтореферат кандидатской диссертации
Автореферат кандидатской диссертацииАндрей Гайнулин
 

Similar to E-Patent Examiner (20)

Fee free Russian patents analisys
Fee free Russian patents analisysFee free Russian patents analisys
Fee free Russian patents analisys
 
Перспективные исследования и технологии
Перспективные исследования и технологииПерспективные исследования и технологии
Перспективные исследования и технологии
 
Audit
AuditAudit
Audit
 
Open Source Testing Framework: real project example and best practices
Open Source Testing Framework: real project example and best practicesOpen Source Testing Framework: real project example and best practices
Open Source Testing Framework: real project example and best practices
 
Реализация тестового фреймворка на основе OPEN-SOURCE инструментов
Реализация тестового фреймворка на основе OPEN-SOURCE инструментовРеализация тестового фреймворка на основе OPEN-SOURCE инструментов
Реализация тестового фреймворка на основе OPEN-SOURCE инструментов
 
Lan-Crawler Bachlor RU
Lan-Crawler Bachlor RULan-Crawler Bachlor RU
Lan-Crawler Bachlor RU
 
Russian universities patents (name standardization)
Russian universities patents (name standardization)Russian universities patents (name standardization)
Russian universities patents (name standardization)
 
Лекция 1. Модель OSI.
Лекция 1. Модель OSI.Лекция 1. Модель OSI.
Лекция 1. Модель OSI.
 
заявка петелин 3
заявка петелин 3заявка петелин 3
заявка петелин 3
 
Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017Semantic technologies for business. DataFabric core. 2017
Semantic technologies for business. DataFabric core. 2017
 
Building Open Source Test Automation Frameworks. Watir based automation case ...
Building Open Source Test Automation Frameworks. Watir based automation case ...Building Open Source Test Automation Frameworks. Watir based automation case ...
Building Open Source Test Automation Frameworks. Watir based automation case ...
 
Разработка веб-сервисов осень 2013 лекция 8
Разработка веб-сервисов осень 2013 лекция 8Разработка веб-сервисов осень 2013 лекция 8
Разработка веб-сервисов осень 2013 лекция 8
 
Russir 2010 final
Russir 2010 finalRussir 2010 final
Russir 2010 final
 
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet APIПротокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
 
Лекция 3. Браузеры (2009)
Лекция 3. Браузеры (2009)Лекция 3. Браузеры (2009)
Лекция 3. Браузеры (2009)
 
Lande, Jigalo
Lande, JigaloLande, Jigalo
Lande, Jigalo
 
C# Web. Занятие 01.
C# Web. Занятие 01.C# Web. Занятие 01.
C# Web. Занятие 01.
 
SearchInform. Алексей Попов. "Как выбрать идеальную DLP-систему?"
SearchInform. Алексей Попов. "Как выбрать идеальную DLP-систему?"SearchInform. Алексей Попов. "Как выбрать идеальную DLP-систему?"
SearchInform. Алексей Попов. "Как выбрать идеальную DLP-систему?"
 
Платформа для автоматического тестирования Erlang проектов на примере UserGat...
Платформа для автоматического тестирования Erlang проектов на примере UserGat...Платформа для автоматического тестирования Erlang проектов на примере UserGat...
Платформа для автоматического тестирования Erlang проектов на примере UserGat...
 
Автореферат кандидатской диссертации
Автореферат кандидатской диссертацииАвтореферат кандидатской диссертации
Автореферат кандидатской диссертации
 

E-Patent Examiner

  • 2. Состав системы База знаний патентов Экспертные таблицы База знаний предметных областей БД онтологий предметных областей БД лингвистики Справочники, классификаторы и пр. Метасловарь РБД БД патентов … БД патентов … БД патентов … БД патентов РФ БД патентов EU БД патентов USA Распределенная БД патентов Семантический профиль (сеть) Статистический профиль (n –мерный тематический вектор) Информационный портрет источника Галерея источников (патенты, статьи и т.д.)
  • 3. Расширение вычислительного кластера ВолгГТУ (конец 2014 – начало 2015) - приобретено 10 узлов на платформе Intel на базе Intel Xeon E5 v3 с 2 Xeon Phi 31S1P каждый (РСК технологии) - приобретен 1 узел SuperMicro на базе Intel Xeon E5 v3 с 6 Xeon Phi 31S1P (аналог выставочного образца Aquarius на НСКФ-2014) – у компании Aquarius - приобретен интерконнект Infiniband FDR 56Гбит от Mellanox Характеристики узлов кластера на базе Xeon E5 / Xeon Phi Комплектующие 11 узлов 2 узла Процессор Intel Xeon E5-2650V3 (2,3 GHz, 10 ядер) x2 Intel Xeon E5-2660 (2,2 GHz, 8 ядер) x2 Память 64Gb DDR4 128Gb DDR3 Жесткий диск SSD Intel 240Gb SATA 1 Tb Сопроцессор Intel Xeon Phi Coprocessor 31s1p x2 Intel Xeon Phi Coprocessor 31s1p x2
  • 4. Возможности системы• Формирование сети релевантных патентов для введенной заявки на русском и английском языках • Принятие решений о невозможности выдачи патента по заявке, по которой уже был выдан патент (выданный по заявке патент имеется в базе знаний). Многомерное патентное пространство Узел: статистический профиль  семантический профиль  метаданные источника Связь: статистическая мера близости  доля пересечения семантических сетей Recall (%) Recall 50 Recall 100 Recall 200 Recall 300 Recall 500 Recall 1000 TF*IDF 32 44 50 53 58 66 LDA 43 53 62 66 72 83 Фразы 72 81 90 92 96 98 Фразы + синонимы 74 82 91 93 96 98 Фразы + синонимы Поиск среди US патентов 59 68 80 85 88 93 Наш метод 84 91 95.5 97.5 98.5 99.6 Сравнительный анализ методов
  • 5. Информационный портрет источника Семантический профиль заявки на патент Совпадающие вершины Ключевые понятия, отсутствующие в других патентах Явные отличия Статистический профиль 0 50 100 150 200 250 300 Тема 4 Тема 5 Тема 6 Тема 8 Патент 2 22,190338 71,266464 277,808685 13,378813 Тема 4 Тема 5 Тема 6 Тема 8 Поступившая заявка Патент 3 Патент 6
  • 6. Входные данные • Полный текст заявки: – реферат – описание – формула Выходные данные • Список существующих патентов, отсортированный по степени релевантности заявке • Решение да/нет о возможности выдачи патента для заявки • Перечень существующих патентов, на основании которых было принято решение о невозможности выдачи патента • Визуализация пересечения текста формулы заявки с текстами формул существующих патентов.
  • 7. Поддерживаемые языки • Русский • Английский Базы патентов в открытом доступе • Российские патенты, выданные за период с 1993 по 2014 годы • Американские патенты, выданные за период с 2005 по 2014 годы
  • 11. Web-интерфейс с реализацией алгоритмов параллельной мультисерверной обработки входящей информации
  • 12. Возможности системы, находящиеся на этапе тестирования и внедрения • Определение возможности выдачи патента для заявки на основании анализа массивов патентов на других языках • Принятие решений о невозможности выдачи патента по результатам анализа массива отказных заявок
  • 13. Перечень проектов 2015 года • 15-07-06254 «Разработка интеллектуальной методологии поиска новых технических решений в глобальном патентном пространстве на основе кросстематических и прогнозных состояний мирового технического уровня» - 2015 год, продолжено финансирование в 2016 году; • 15-07-09142 «Разработка методов анализа патентного массива для актуализации базы данных физических эффектов» - 2015 год, продолжено финансирование в 2016 году; • 15-37-50292 «Разработка метода и технологии извлечения формализованных знаний о физических эффектах и приемах улучшения эксплуатационных характеристик нано- и микроэлементов информационно-измерительных и управляющих систем и создание CAI (Computer-Aided Innovation) системы концептуального проектирования таких элементов» -2015 год (5 месяцев); • 15-37-50355 «Разработка и исследование технологии сбора, обработки и интеграции разнородной информации о перспективных технологиях из открытых научных источников на основе автоматической генерации интеллектуальных агентов мультиагентных систем» -2015 год (5 месяцев)
  • 14. Публикации 2015 года • 21 статья, из них 10 Scopus/WoS, 8 ВАК.