Dialog

651 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
651
On SlideShare
0
From Embeds
0
Number of Embeds
18
Actions
Shares
0
Downloads
12
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Dialog

  1. 1. ОНТОРЕДАКТОР КАК КОМПЛЕКСНЫЙ ИНСТРУМЕНТ ОНТОЛОГИЧЕСКОЙ ИНЖЕНЕРИИ Рубашкин В. Ш. , Пивоварова Л. М. Санкт-Петербургский государственный университет Кафедр а информационных систем факультета филологии и искусств
  2. 2. Онторедактор – инструментальная среда, предназначенная для создания онтологии или работы с ней.
  3. 3. <ul><li>Основные проблемы которые должна решать инструментальная среда: </li></ul><ul><ul><li>Методология формализации знаний </li></ul></ul><ul><ul><li>Унификация онтологий </li></ul></ul><ul><ul><li>Пополнение онтологий </li></ul></ul><ul><ul><li>Достоверность и целостность </li></ul></ul>
  4. 4. <ul><li>InTez – еще один онторедактор? </li></ul><ul><li>( Protégé , ODE, … + еще 92 ? ) </li></ul><ul><li>2 подхода : </li></ul><ul><ul><li>Инструмент для &quot;выравнивания&quot;, слияния, ( merging & mapping ) и пополнения разнородных и даже основанных на разных моделях знаний частных онтологий. </li></ul></ul><ul><ul><li>Инструментальная среда, ориентированная на: </li></ul></ul><ul><ul><ul><li>определенную функциональность онтологии; </li></ul></ul></ul><ul><ul><ul><li>определенную модель знаний; </li></ul></ul></ul><ul><ul><ul><li>построение единой &quot;многодоменной&quot; онтологии, </li></ul></ul></ul><ul><ul><ul><li>опирающейся на онтологию верхнего уровня ( TopLevel ) </li></ul></ul></ul>
  5. 5. <ul><li>Функциональность онтологии </li></ul><ul><li>Унификация терминологии </li></ul><ul><li>Представление и логическая обработка таксономических отношений </li></ul><ul><li>Представление и логическая обработка отношений объемной совместимости/несовместимости </li></ul><ul><li>Представление и логическая обработка предметно-ассоциативных отношений </li></ul><ul><li>Поддержка представления и логической обработки количественных данных </li></ul><ul><li>Регламентация процедур описания объектов </li></ul><ul><li>Аксиоматизация описаний процессов, причинных связей, процедур </li></ul>
  6. 6. <ul><li>Модель знаний </li></ul><ul><li>Модель знаний - язык представления знаний (ЯПЗ) вместе с некоторым набором схем аксиом, определяющих дополнительные возможности системы вывода. </li></ul><ul><li>Используется для формального описания понятийно-терминологической системы: термины и связи между ними представляются как конструкты выбранного ЯПЗ (в идеале – как логические формулы некоторого логического исчисления). </li></ul><ul><li>Отсутствует разработанная методология формализации знаний. </li></ul>
  7. 7. <ul><li>Что, в часности, требует последовательной формализации в ЯПЗ: </li></ul><ul><li>Ограничения на сочетаемость терминов: </li></ul><ul><li>* жидкая пирамида, *идеи спят,*медь смертна </li></ul><ul><li>Систематическое описание связи признаков по условиям применимости </li></ul><ul><li>Порядок деления на классы (расхожий пример: пол и возраст ) vs фасетизация </li></ul><ul><li>Различение семантических примитивов и терминов, вводимых формальными толкованиями; средства определения терминов в ЯПЗ. </li></ul>
  8. 8. Конкретный пример – определение несовместимости понятий через использование таких конструкций как D isjointWith , D isjointUnion O f и др. <owl:Class rdf:ID=&quot; Паста &quot;> <rdfs:subClassOf rdf:resource=&quot;# Съестное &quot;/> <owl:disjointWith rdf:resource=&quot;# Мясо &quot;/> <owl:disjointWith rdf:resource=&quot;# Дичь &quot;/> <owl:disjointWith rdf:resource=&quot;# Морепродукты &quot;/> <owl:disjointWith rdf:resource=&quot;# Десерт &quot;/> <owl:disjointWith rdf:resource=&quot;# Фрукты &quot;/> </owl:Class> Создается явное впечатление, что предлагается описывать отношение объемной несовместимости способом «каждый с каждым»
  9. 9. <ul><li>Что следовало бы сделать: </li></ul><ul><li>Продукты питания </li></ul><ul><li>по консистенции: </li></ul><ul><ul><ul><li>Твердые </li></ul></ul></ul><ul><ul><ul><li>Жидкие ( напитки ) </li></ul></ul></ul><ul><ul><ul><li>Кашеобразные </li></ul></ul></ul><ul><ul><ul><li>Неоднородной консистенции* </li></ul></ul></ul><ul><ul><li>культивируемость: </li></ul></ul><ul><ul><ul><li>Культурного происхождения </li></ul></ul></ul><ul><ul><ul><li>Природного происхождения </li></ul></ul></ul>
  10. 10. <ul><li>по происхождению: </li></ul><ul><ul><ul><li>Животного происхождения </li></ul></ul></ul><ul><li> Виды продуктов животного происхождения: </li></ul><ul><ul><ul><ul><ul><li>Мясо / птица, говядина, свинина, … / </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Продукты водной среды (животного происхождения) </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Молочные продукты </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Яйца </li></ul></ul></ul></ul></ul><ul><ul><ul><li>Растительного происхождения </li></ul></ul></ul><ul><li> Виды продуктов растительного </li></ul><ul><li>происхождения: </li></ul><ul><ul><ul><ul><ul><li>Овощи / зеленые, красные, другие; </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>листовые, плодовые, корнеплоды; … / </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>Фрукты </li></ul></ul></ul></ul></ul><ul><ul><ul><li>Смешанные </li></ul></ul></ul><ul><ul><ul><li>Синтетические </li></ul></ul></ul>
  11. 11. NB : Внетаксономические импликативы: Мясо  Твердая консистенция Дичь = df Мясо & Природного происхождения Водка – алкогольный напиток ----------------------------------------- Мясо   Водка
  12. 12. <ul><li>Функциональность онторедактора </li></ul><ul><li>Общие характеристики: </li></ul><ul><li>операционная среда ( СУБД ) </li></ul><ul><li>графический редактор таксономий </li></ul><ul><li>толковый словарь </li></ul><ul><li>представление связей </li></ul>
  13. 13. <ul><li>Функциональность онторедактора </li></ul><ul><li>Навигация и поиск: </li></ul><ul><li>Вербальный поиск концепта </li></ul><ul><li>Просмотр дерева признаков </li></ul><ul><li>Установка фильтров </li></ul><ul><li>Навигация по связям </li></ul><ul><li>Навигация по лексическим вариантам </li></ul>
  14. 14. <ul><li>Функциональность онторедактора </li></ul><ul><li>Ввод и редактирование </li></ul><ul><li>«Ручной» ввод концептов </li></ul><ul><li>Пакетный ввод концептов </li></ul><ul><li>Ввод связей между концептами </li></ul><ul><li>Ввод лексических вариантов концепта </li></ul><ul><li>Графическое редактирование </li></ul><ul><li>Редактирование словарных описаний </li></ul><ul><li>Логический контроль данных при вводе </li></ul>
  15. 15. Обеспечение достоверности Формальная и содержательная правильность Процедура ввода должна обнаруживать и блокировать ввод, например, концепта, определяемого И-толковани ем вида Тигр  животное And металлический ( определяющие концепты должны быть объемно совместимы ) Но: Лед  квазиобъект And цилиндрической формы - формально правильн о (содержательная ошибка) . .
  16. 16. <ul><li>Формальная и содержательная правильность </li></ul><ul><li>Еще пример: </li></ul><ul><li>формально неправильн о: </li></ul><ul><li>БАЗОВ ЫЙ ПРИЗНАК ( метр ) = перемещение </li></ul><ul><li>категориальн ая ошибк а ( базовым признаком может быть только концепт класса наименование признака сочетающ ее ся с числом ) ; </li></ul><ul><li>правильно : </li></ul><ul><li>БАЗОВ ЫЙ ПРИЗНАК ( метр ) = линейный размер </li></ul><ul><li>Но: </li></ul><ul><li>БАЗОВ ЫЙ ПРИЗНАК ( метр ) = масса </li></ul><ul><li>- формально правильн о (содержательная ошибка) . </li></ul>
  17. 17. <ul><li>Условия формальной достоверности </li></ul><ul><li>Неизбыточность и полнота описания - должны предъявляться и определяться те и только те словарные признаки, которые релевантны для концептов данного типа </li></ul><ul><li>Непротиворечивость описания - словарные характеристики не должны противоречить друг другу. (в терминах OWL – не должны находиться в отношении Disjoint ). </li></ul><ul><li>Правильность означивания - вводимые значения определяемых словарных признаков должны принадлежать области их допустимых значений. </li></ul>
  18. 18. Обеспечение достоверности Конечная цель при проектировании процедур ввода состоит в том, чтобы полностью исключить формально определимые ошибки . При этом технологически &quot;хорошее&quot; решение будет состоять не в том, чтобы уметь обнаруживать формальные ошибки post factum , а в том, чтобы сама процедура ввода была спроектирована так, что бы ввод логически некорректных элементов описания оказыва л ся вообще невозможным.
  19. 19. Тестирование Проверить содержательную правильность описаний концептов можно только путем организации &quot;лабораторных&quot; испытаний и экспертной оценки их результатов администратором. Окончательную проверку и отладку (&quot;бета-тестирование&quot;) онтология может пройти в рамках целевых информационных технологий. &quot;Тестирование&quot; отдельных концептов сводится к просмотру и проверке содержимого словарных статей и, следовательно, относится к компетенции подсистемы навигации и броузинга. Собственно тестирование как отличающаяся от броузинга процедура может состоять только в тестировании отношений между концептами – как объемных, так и ассоциативных.

×