ОНТОРЕДАКТОР КАК КОМПЛЕКСНЫЙ ИНСТРУМЕНТ ОНТОЛОГИЧЕСКОЙ ИНЖЕНЕРИИ  Рубашкин В. Ш. ,  Пивоварова Л. М.     Санкт-Петербургский государственный университет   Кафедр а   информационных систем  факультета филологии и искусств
Онторедактор  – инструментальная среда, предназначенная для создания онтологии или работы с ней.
Основные проблемы которые должна решать инструментальная среда: Методология формализации знаний Унификация онтологий Пополнение онтологий Достоверность и целостность
InTez  – еще один онторедактор? ( Protégé ,  ODE, … +  еще 92 ? ) 2   подхода :  Инструмент для "выравнивания", слияния, ( merging & mapping ) и пополнения разнородных и даже основанных на разных моделях знаний частных онтологий. Инструментальная среда, ориентированная на:  определенную функциональность онтологии; определенную модель знаний; построение единой "многодоменной" онтологии,  опирающейся на онтологию верхнего уровня ( TopLevel )
Функциональность   онтологии Унификация терминологии Представление и логическая обработка таксономических отношений Представление и логическая обработка отношений объемной совместимости/несовместимости Представление и логическая обработка предметно-ассоциативных отношений Поддержка представления и логической обработки количественных данных Регламентация процедур описания объектов Аксиоматизация описаний процессов, причинных связей, процедур
Модель знаний Модель знаний   -  язык представления знаний (ЯПЗ) вместе с некоторым набором схем аксиом, определяющих  дополнительные  возможности системы вывода. Используется для формального описания понятийно-терминологической системы:  термины и связи между ними представляются  как конструкты выбранного ЯПЗ (в идеале – как логические формулы некоторого логического исчисления). Отсутствует разработанная методология формализации знаний.
Что, в часности, требует последовательной формализации в ЯПЗ: Ограничения на сочетаемость терминов:  * жидкая пирамида, *идеи спят,*медь смертна Систематическое описание   связи признаков по условиям применимости Порядок деления на классы (расхожий пример:  пол и возраст )  vs  фасетизация Различение семантических примитивов и терминов, вводимых формальными толкованиями; средства определения терминов в ЯПЗ.
Конкретный пример – определение несовместимости понятий через использование таких конструкций как  D isjointWith ,  D isjointUnion O f   и др. <owl:Class rdf:ID=&quot; Паста &quot;> <rdfs:subClassOf rdf:resource=&quot;# Съестное &quot;/> <owl:disjointWith rdf:resource=&quot;# Мясо &quot;/> <owl:disjointWith rdf:resource=&quot;# Дичь &quot;/> <owl:disjointWith rdf:resource=&quot;# Морепродукты &quot;/> <owl:disjointWith rdf:resource=&quot;# Десерт &quot;/> <owl:disjointWith rdf:resource=&quot;# Фрукты &quot;/> </owl:Class> Создается явное впечатление, что предлагается описывать отношение объемной несовместимости способом «каждый с каждым»
Что следовало бы сделать: Продукты питания по консистенции: Твердые Жидкие ( напитки ) Кашеобразные Неоднородной консистенции* культивируемость: Культурного происхождения Природного происхождения
по происхождению: Животного происхождения     Виды продуктов  животного происхождения: Мясо / птица, говядина, свинина,  … / Продукты водной среды (животного происхождения) Молочные продукты Яйца Растительного происхождения   Виды продуктов  растительного  происхождения:   Овощи / зеленые, красные, другие;  листовые, плодовые, корнеплоды;  … / Фрукты Смешанные Синтетические
NB :  Внетаксономические импликативы: Мясо     Твердая консистенция Дичь = df  Мясо  &  Природного происхождения Водка – алкогольный напиток ----------------------------------------- Мясо       Водка
Функциональность онторедактора Общие характеристики: операционная среда  ( СУБД ) графический редактор таксономий толковый словарь представление связей
Функциональность онторедактора Навигация и поиск: Вербальный поиск концепта  Просмотр дерева признаков Установка фильтров Навигация по связям   Навигация по лексическим вариантам
Функциональность онторедактора Ввод и редактирование «Ручной» ввод концептов Пакетный ввод концептов Ввод связей между концептами Ввод лексических вариантов концепта Графическое редактирование Редактирование словарных описаний Логический контроль данных при вводе
Обеспечение достоверности Формальная и содержательная правильность Процедура ввода должна обнаруживать и блокировать ввод, например,  концепта, определяемого  И-толковани ем  вида  Тигр      животное  And  металлический   ( определяющие концепты должны быть  объемно  совместимы ) Но: Лед     квазиобъект  And  цилиндрической формы   -  формально правильн о (содержательная ошибка) . .
Формальная и содержательная правильность Еще пример: формально неправильн о:   БАЗОВ ЫЙ  ПРИЗНАК   ( метр )   =  перемещение  категориальн ая  ошибк а   ( базовым признаком может быть только концепт класса  наименование признака  сочетающ ее ся с числом ) ;   правильно :   БАЗОВ ЫЙ  ПРИЗНАК   ( метр )   =  линейный размер Но: БАЗОВ ЫЙ  ПРИЗНАК   ( метр )   =  масса -  формально правильн о (содержательная ошибка) .
Условия формальной достоверности Неизбыточность и полнота описания   -  должны  предъявляться и определяться  те и только те словарные признаки, которые релевантны для концептов данного типа   Непротиворечивость описания   -  словарные  характеристики не должны противоречить друг другу. (в терминах  OWL  – не должны находиться в отношении  Disjoint ).  Правильность означивания   -  вводимые значения определяемых словарных признаков должны принадлежать области их допустимых значений.
Обеспечение достоверности Конечная цель при проектировании процедур ввода состоит в том, чтобы  полностью исключить  формально определимые ошибки . При этом технологически &quot;хорошее&quot; решение будет состоять не в том, чтобы уметь обнаруживать формальные ошибки  post factum , а  в том, чтобы сама процедура ввода была спроектирована так, что бы  ввод логически некорректных элементов описания оказыва л ся вообще невозможным.
Тестирование Проверить содержательную правильность описаний концептов можно только путем организации &quot;лабораторных&quot; испытаний и экспертной оценки их результатов администратором. Окончательную проверку и отладку (&quot;бета-тестирование&quot;) онтология может пройти  в рамках целевых информационных технологий. &quot;Тестирование&quot; отдельных концептов сводится к просмотру и проверке содержимого словарных статей и, следовательно, относится к компетенции подсистемы навигации и броузинга. Собственно тестирование  как отличающаяся от броузинга процедура может состоять только в тестировании  отношений  между концептами – как объемных, так и ассоциативных.

Dialog

  • 1.
    ОНТОРЕДАКТОР КАК КОМПЛЕКСНЫЙИНСТРУМЕНТ ОНТОЛОГИЧЕСКОЙ ИНЖЕНЕРИИ Рубашкин В. Ш. , Пивоварова Л. М. Санкт-Петербургский государственный университет Кафедр а информационных систем факультета филологии и искусств
  • 2.
    Онторедактор –инструментальная среда, предназначенная для создания онтологии или работы с ней.
  • 3.
    Основные проблемы которыедолжна решать инструментальная среда: Методология формализации знаний Унификация онтологий Пополнение онтологий Достоверность и целостность
  • 4.
    InTez –еще один онторедактор? ( Protégé , ODE, … + еще 92 ? ) 2 подхода : Инструмент для &quot;выравнивания&quot;, слияния, ( merging & mapping ) и пополнения разнородных и даже основанных на разных моделях знаний частных онтологий. Инструментальная среда, ориентированная на: определенную функциональность онтологии; определенную модель знаний; построение единой &quot;многодоменной&quot; онтологии, опирающейся на онтологию верхнего уровня ( TopLevel )
  • 5.
    Функциональность онтологии Унификация терминологии Представление и логическая обработка таксономических отношений Представление и логическая обработка отношений объемной совместимости/несовместимости Представление и логическая обработка предметно-ассоциативных отношений Поддержка представления и логической обработки количественных данных Регламентация процедур описания объектов Аксиоматизация описаний процессов, причинных связей, процедур
  • 6.
    Модель знаний Модельзнаний - язык представления знаний (ЯПЗ) вместе с некоторым набором схем аксиом, определяющих дополнительные возможности системы вывода. Используется для формального описания понятийно-терминологической системы: термины и связи между ними представляются как конструкты выбранного ЯПЗ (в идеале – как логические формулы некоторого логического исчисления). Отсутствует разработанная методология формализации знаний.
  • 7.
    Что, в часности,требует последовательной формализации в ЯПЗ: Ограничения на сочетаемость терминов: * жидкая пирамида, *идеи спят,*медь смертна Систематическое описание связи признаков по условиям применимости Порядок деления на классы (расхожий пример: пол и возраст ) vs фасетизация Различение семантических примитивов и терминов, вводимых формальными толкованиями; средства определения терминов в ЯПЗ.
  • 8.
    Конкретный пример –определение несовместимости понятий через использование таких конструкций как D isjointWith , D isjointUnion O f и др. <owl:Class rdf:ID=&quot; Паста &quot;> <rdfs:subClassOf rdf:resource=&quot;# Съестное &quot;/> <owl:disjointWith rdf:resource=&quot;# Мясо &quot;/> <owl:disjointWith rdf:resource=&quot;# Дичь &quot;/> <owl:disjointWith rdf:resource=&quot;# Морепродукты &quot;/> <owl:disjointWith rdf:resource=&quot;# Десерт &quot;/> <owl:disjointWith rdf:resource=&quot;# Фрукты &quot;/> </owl:Class> Создается явное впечатление, что предлагается описывать отношение объемной несовместимости способом «каждый с каждым»
  • 9.
    Что следовало бысделать: Продукты питания по консистенции: Твердые Жидкие ( напитки ) Кашеобразные Неоднородной консистенции* культивируемость: Культурного происхождения Природного происхождения
  • 10.
    по происхождению: Животногопроисхождения Виды продуктов животного происхождения: Мясо / птица, говядина, свинина, … / Продукты водной среды (животного происхождения) Молочные продукты Яйца Растительного происхождения Виды продуктов растительного происхождения: Овощи / зеленые, красные, другие; листовые, плодовые, корнеплоды; … / Фрукты Смешанные Синтетические
  • 11.
    NB : Внетаксономические импликативы: Мясо  Твердая консистенция Дичь = df Мясо & Природного происхождения Водка – алкогольный напиток ----------------------------------------- Мясо   Водка
  • 12.
    Функциональность онторедактора Общиехарактеристики: операционная среда ( СУБД ) графический редактор таксономий толковый словарь представление связей
  • 13.
    Функциональность онторедактора Навигацияи поиск: Вербальный поиск концепта Просмотр дерева признаков Установка фильтров Навигация по связям Навигация по лексическим вариантам
  • 14.
    Функциональность онторедактора Вводи редактирование «Ручной» ввод концептов Пакетный ввод концептов Ввод связей между концептами Ввод лексических вариантов концепта Графическое редактирование Редактирование словарных описаний Логический контроль данных при вводе
  • 15.
    Обеспечение достоверности Формальнаяи содержательная правильность Процедура ввода должна обнаруживать и блокировать ввод, например, концепта, определяемого И-толковани ем вида Тигр  животное And металлический ( определяющие концепты должны быть объемно совместимы ) Но: Лед  квазиобъект And цилиндрической формы - формально правильн о (содержательная ошибка) . .
  • 16.
    Формальная и содержательнаяправильность Еще пример: формально неправильн о: БАЗОВ ЫЙ ПРИЗНАК ( метр ) = перемещение категориальн ая ошибк а ( базовым признаком может быть только концепт класса наименование признака сочетающ ее ся с числом ) ; правильно : БАЗОВ ЫЙ ПРИЗНАК ( метр ) = линейный размер Но: БАЗОВ ЫЙ ПРИЗНАК ( метр ) = масса - формально правильн о (содержательная ошибка) .
  • 17.
    Условия формальной достоверностиНеизбыточность и полнота описания - должны предъявляться и определяться те и только те словарные признаки, которые релевантны для концептов данного типа Непротиворечивость описания - словарные характеристики не должны противоречить друг другу. (в терминах OWL – не должны находиться в отношении Disjoint ). Правильность означивания - вводимые значения определяемых словарных признаков должны принадлежать области их допустимых значений.
  • 18.
    Обеспечение достоверности Конечнаяцель при проектировании процедур ввода состоит в том, чтобы полностью исключить формально определимые ошибки . При этом технологически &quot;хорошее&quot; решение будет состоять не в том, чтобы уметь обнаруживать формальные ошибки post factum , а в том, чтобы сама процедура ввода была спроектирована так, что бы ввод логически некорректных элементов описания оказыва л ся вообще невозможным.
  • 19.
    Тестирование Проверить содержательнуюправильность описаний концептов можно только путем организации &quot;лабораторных&quot; испытаний и экспертной оценки их результатов администратором. Окончательную проверку и отладку (&quot;бета-тестирование&quot;) онтология может пройти в рамках целевых информационных технологий. &quot;Тестирование&quot; отдельных концептов сводится к просмотру и проверке содержимого словарных статей и, следовательно, относится к компетенции подсистемы навигации и броузинга. Собственно тестирование как отличающаяся от броузинга процедура может состоять только в тестировании отношений между концептами – как объемных, так и ассоциативных.