ОНТОЛОГИИ ВЕРХНЕГО
УРОВНЯ. ОБЗОР
Пивоварова Лидия Михайловна
СПбГУ
2010
Top-level онтологии: список
1. BFO
2. ConceptNet
3. DOLCE
4. OCHRE
5. PROTON
6. SUMO
7. UpperCYC
8. YAGO
9. YAMATO
Принципы описания
1. Название
2. Разработчики
3. Объем
4. Meta/top-level/domain
5. Категоризация
6. Тематическая направленность
7. Язык
8. Приложения
9. URL
BFO
• IFOMIS (Institute for Formal Ontology and Medical
Information Science, Saarland University)
• 36 концептов
• Meta
• Классы, экземпляры, отношения.
• Онтология реальности (а не представлений о ней).
• Имплементирована на различных формальных
языках, в том числе OWL и KIF
• Более сорока доменных онтологий, разработанных
на основе BFO; почти все они описывают ту или иную
область биологии или медицины.
• http://www.ifomis.org/bfo
Continuant
(Континуант)
Spatial Region
(Пространственный регион)
Independent Continuant
(Независимый континуант)
Dependent Continuant
(Зависимый континуант)
Volume
(Объем)
Line
(Линия)
Surface
(Поверхность)
Point
(Точка)
Site
(Пространство)
Object
Aggregate
(Объединение
объектов)
Object
(Объект)
Fiat Part of
Object
(«Назначенная»
часть объекта)
Boundary of
Object
(Граница
объекта)
Reliable Entity
(Относительная
сущность)
Disposition
(Поведение)
Role
(Роль)
Quality
(Качество)
Function
(Функция)
SNAP
Occurent
(Оккурент)
Processual Entity
(Процессная сущность)
Temporal Region
(Временной регион)
Processual Context
(Процессуальный
контекст)
Process
Aggregate
(Объединение
процессов)
Process
(Процесс)
Boundary of
Process
(Граница
процесса)
SPAN
Scattered
Spatiotemporal
Region
(Разрозненный
пространственно-
временной регион)
Connected
Spatiotemporal
Region
(Связный
пространственно-
временной регион)
Spatiotemporal
Interval
(Пространственно-
временной
интервал)
Spatiotemporal
Instant
(Пространственно-
временной
экземпляр)
Scattered Temporal
Region
(Разрозненный
временной регион)
Connected
Temporal Region
(Связный
временной регион)
Temporal Interval
(Временной
интервал)
Temporal Instant
(Временной
экземпляр)
Fiat Part of
Process
(«Назначенная»
часть процесс)
Spatiotemporal Region
(Пространственно-временной
регион)
ConceptNet
• MIT Media Lab
• 1029711 утверждений для английского языка 356277 для
китайского, 233423 для португальского, около 15000 для
японского и корейского, а также утверждения на датском,
венгерском, французском, испанском и итальянском
языках
• Иеррархия отсутствует; онтология представляет собой
сеть
• Сетевая структура: узлы и отношения.
• Повседневные знания (common sence).
• Непосредственно на языке программирования (Python)
• Использовалась для распознавания речи и изображений,
человеко-машинные интерфейсы, рекомендательные
системы, поисковые системы
• http://csc.media.mit.edu/conceptnet
DOLCE
• Laboratory for Applied Ontology (LOA)
• Приблизительно 100 концептов, 100 свойств и 20 аксиом
• Скорее Meta - в том же смысле, в котором BFO; однако
большее число концептов предполагает и большую
детализацию, т.е. приближение к top-level в нашем смысле
• Концепты и аксиомы
• Онтология языковых и когнитивных представлений.
• First-Order Logic; перевод на OWL, части, для который не
хватает выразительности OWL приведены в качестве
комментариев на KIF
• Первый модуль в библиотеке WonderWeb
• http://www.loa-cnr.it/DOLCE.html
Entity
Сущность
Abstract
Абстрактное
Quality
Качество
Perdurant
Динамическое
Endurant
Статическое
Physical
Endurant
Физическое
статическое
Arbitrary Sum
Произвольная
сумма
Non-physical
Endurant
Нефизическ.
статическое
Amount of
Matter
Часть материи
Physical Object
Физический
объект
Feature
Признак
Agentive
Physical Object
Агентивный
физический
объект
Non-Agentive
Physical Object
Неагентивный
физический
объект
Non-physical
Object
Нефизический
объект
Mental Object
Ментальный
объект
Social Object
Социальный
объект
Agentive Social
Object
Агентивный
социальный
объект
Non-Agentive
Social Object
Неагентивный
социальный
объект
Social Agent
Социальный
Агент
Society
Общество
Stative
Постоянное
Event
Событие
Accomplishment
Исполнение
Achievement
Достижение
Process
Процесс
State
Состояние
Entity
Сущность
Abstract
Абстрактное
Quality
Качество
Perdurant
Динамическое
Endurant
Статическое
Abstract Quality
Абстрактное
Качество
Physical Quality
Физическое
Качество
Temporal Quality
Временное
Качество
Temporal Location
Временное
месторасположение
Spatial Location
Пространственное
месторасположение
Set
Множество
Region
Регион
Fact
Факт
Abstract Region
Абстрактный
Регион
Physical Region
Физический
Регион
Temporal Region
Временной Регион
Time Interval
Временной
интервал
Space Region
Пространственный
регион
OCHRE
• University of Chicago
• Около 20 концептов
• Meta
• Концепты, свойства, ссылки.
• Информация о культурном наследии.
• XML, XMLSchema
• Более десятка археологических и
филологических баз знаний.
• http://ochre.lib.uchicago.edu/index.htm
Item
Единица
Базовые
концепты
Spatial unit
Пространственная
единица
Taxonomic unit
Таксономическая
единица
Temporal unit
Временная
единица
Agency unit
Агентивная
единица
Resource unit
Внешний ресурс
Bibliographic unit
Библиографическая
единица
Discourse unit
Дискурсивная
единица
Epigraphic unit
Эпиграфическая
единица
Script unit
Рукописная
единица
Lexical unit
Лексическая
единица
Концепты,
необходимые для
группировки других
концептов
List
Список
Hierarchy
Иеррархия
Relationship
Отношения
Query
Запрос
Text
Текст
Taxonomy
Таксономия
PROTON
• Ontotext Lab, Sirma Group
• 300 классов и 100 свойств
• top-level
• Классы и свойства.
• Онтология реальности.
• OWL Lite
• SEKT Project (Semantic Web)
• http://proton.semanticweb.org/
Entity
Сущность
Abstract
Абстрактное
Object
Объект
Happening
Происходящее
Event
Событие
Situation
Положение
Time Interval
Временной
интервал
Role
Роль
Job Position
Должность
Statement
Утверждение
Agent
Агент
Service
Сервис
Product
Продукт
Location
Местоположение
Group
Группа
Person
Персона
Organization
Организация
Information
Resource
Информационный
ресурс
Document
Документ
Contact
Information
Контактная
информация
General Term
Общий термин
Number
Число
Topic
Тема
Language
Язык
SUMO
• IEEE (Institute of Electrical and Electronics
Engineers)
• 1000 концептов и 5000 аксиом
• top-level
• Концепты и аксиомы.
• Попытка объединения существующих
онтологий верхнего уровня.
• KIF, переведена на OWL
• Доменные онтологии и лексические базы.
• http://www.ontologyportal.org/index.html
physical
(физическое)
process
(процесс)
object
(объект)
self connected
object
(связный объект)
region
(регион)
collection
(коллекция)
agent
(агент)
substance
(материя)
corpuscular object
(корпускулярный
объект)
content bearing
object
(несущий
содержание
объект)
food
(еда)
hole
(дыра)
astronomical body
(астрономическое
тело)
geographic area
(географический
регион)
group
(группа)
organization
(организация)
sentient agent
(чувствующий
агент)
geopolitical area
(геополитический
регион)
group
(группа)
organism
(организм)
dual object process
(двухобъектный
процесс)
intentional process
(интенциональный
процесс)
motion
(движение)
internal change
(внутреннее
изменение)
shape change
(изменение
формы)
abstract
(абстрактное)
graph element
(элемент графа)
graph
(граф)
proposition
(пропозиция)
relation
(отношение)
set or class
(множество
или класс)
attribute
(атрибут)
quantity
(количество)
number
(число)
real number
(вещественное
число)
imaginary number
(мнимое число)
complex number
(комплексное
число)
physical quantity
(физическое
количество)
constant quantity
(постоянное
количество)
unit of measure
(единица
измерения)
function quantity
(функциональное
количество)
internal attribute
(внутренний атрибут)
relational attribute
(относительный
атрибут)
saturation attribute
(атрибут
пропитанности)
physical state
(физическое
состояние)
breakability
attribute
(атрибут
членимости)
perceptual
attribute
(перцептивный
атрибут)
biological
attribute
(биологический
атрибут)
shape attribute
(атрибут формы)
positional attribute
(атрибут
положения)
truth value
(истинностное
значение)
social role
(социальная роль)
biological attribute
(биологический
атрибут)
time zone
(часовой пояс)
single valued relation
(отношение с одним
значением)
total valued relation
(отношение с
интервальным
значением)
partial valued relation
(отношение с
частичным значением)
binary relation
(бинарное
отношение)
ternary relation
(тернарное
отношение)
spatial relation
(пространственн
ое отношение)
temporal
relation
(временное
отношение)
quaternary
relation
(отношение
четырех
объектов)
list
(список)
predicate
(предикат)
UpperCYC
• Cycorp, Inc.
• 3000 терминов
• Meta и top-level
• Коллекции, индивидуумы, предикаты,
отношения, функции.
• Универсальная.
• CycL
• Интегрирована в онтологии CYC и OpenCYC
• http://glotta.ntua.gr/StateoftheArt/Ontologies/cov
er.html
YAGO
• 2 миллиона сущностей и 20 миллионов фактов
• Meta-модель с наполнением конкретной фактографической
информацией; в качестве промежуточного уровня
выступает WordNet
• Сущности, классы, экземпляры, отношения, факты (каждая
сущность является экземпляром какого-либо класса; факты
также являются сущностями и могут вступать в отношения).
• База фактов (главным образом - концептуализация
Википедии).
• Текстовый формат
• Извлечение информации, логический вывод, вопросно-
ответные системы.
• http://www.mpi-inf.mpg.de/yago-naga/yago/downloads.html
YAMATO
• Mizoguchi Lab, Osaka University
• Около 1000 концептов
• Meta и top-level
• Концепты, роли, носители ролей, отношения.
• Универсальная онтология с упором на
концептуализацию свойств и репрезентаций.
• XML (формат HOZO)
• Несколько отраслевых онтологий: в том числе
медицинская, генетическая, онтология поведения и
др.
• http://www.ei.sanken.osaka-
u.ac.jp/hozo/onto_library/upperOnto.htm
Entity
Сущность
Dependent Entity
Зависимая сущность
Entity
Сущность
Substrate
Основа
Time
Время
Space
Пространство
Substance
Материя
Functional
Функционал
Morphologial whole
Морфологическое
целое
Agent
Агент
Occurent
(Оккурент)
Continuant
(Континуант)
Quality value
Значение
качества
Quality
Качество
Non-unitary
Нецелостное
Object
Объект
Living
organism
Живой
организм
Chemical compound
Химическое
соединение
Artifact
Артефакт
Physical
Физическое
Abstract
Абстрактное
Semi-abstract
Полу-абстрактное
Mind
Сознание
Content
Содержание
Representation
Репрезентация
Representation
form
Форма
репрезентации
Quality-
Quantity
Качество-
Количество
Role
Роль
Feature
Свойство
Generic quality
Оригинальное
качество
Property
Свойство
Categorical
Категориальное
Quantity
Количество
Выводы и впечатления
• На сегодняшний день сложилось некое общее место самого
верхнего уровня – разделение на объекты, процессы и отношения.
• OWL является общепринятым языком импорта-экспорта, но он
является не достаточным – в большинстве проектов не
используется, или используется как вспомогательный.
• Большинство проектов не ориентированы на обработку
естественного языка как основную задачу. Скорее, онтологии
используются для организации и переорганизации знаний
предметной области и поиска по ним.
• При этом анализ текста рассматривается как важнейший инструмент
пополнения онтологии.
• Методологии создаются ad hoc, их очевидно недостаточно.
• Иногда создание онтологии становится самоцелью – гигантские
проекты заканчиваются созданием неиспользуемого продукта.
Спасибо за внимание!

онтологии верхнего уровня

  • 1.
  • 2.
    Top-level онтологии: список 1.BFO 2. ConceptNet 3. DOLCE 4. OCHRE 5. PROTON 6. SUMO 7. UpperCYC 8. YAGO 9. YAMATO
  • 3.
    Принципы описания 1. Название 2.Разработчики 3. Объем 4. Meta/top-level/domain 5. Категоризация 6. Тематическая направленность 7. Язык 8. Приложения 9. URL
  • 4.
    BFO • IFOMIS (Institutefor Formal Ontology and Medical Information Science, Saarland University) • 36 концептов • Meta • Классы, экземпляры, отношения. • Онтология реальности (а не представлений о ней). • Имплементирована на различных формальных языках, в том числе OWL и KIF • Более сорока доменных онтологий, разработанных на основе BFO; почти все они описывают ту или иную область биологии или медицины. • http://www.ifomis.org/bfo
  • 5.
    Continuant (Континуант) Spatial Region (Пространственный регион) IndependentContinuant (Независимый континуант) Dependent Continuant (Зависимый континуант) Volume (Объем) Line (Линия) Surface (Поверхность) Point (Точка) Site (Пространство) Object Aggregate (Объединение объектов) Object (Объект) Fiat Part of Object («Назначенная» часть объекта) Boundary of Object (Граница объекта) Reliable Entity (Относительная сущность) Disposition (Поведение) Role (Роль) Quality (Качество) Function (Функция) SNAP
  • 6.
    Occurent (Оккурент) Processual Entity (Процессная сущность) TemporalRegion (Временной регион) Processual Context (Процессуальный контекст) Process Aggregate (Объединение процессов) Process (Процесс) Boundary of Process (Граница процесса) SPAN Scattered Spatiotemporal Region (Разрозненный пространственно- временной регион) Connected Spatiotemporal Region (Связный пространственно- временной регион) Spatiotemporal Interval (Пространственно- временной интервал) Spatiotemporal Instant (Пространственно- временной экземпляр) Scattered Temporal Region (Разрозненный временной регион) Connected Temporal Region (Связный временной регион) Temporal Interval (Временной интервал) Temporal Instant (Временной экземпляр) Fiat Part of Process («Назначенная» часть процесс) Spatiotemporal Region (Пространственно-временной регион)
  • 7.
    ConceptNet • MIT MediaLab • 1029711 утверждений для английского языка 356277 для китайского, 233423 для португальского, около 15000 для японского и корейского, а также утверждения на датском, венгерском, французском, испанском и итальянском языках • Иеррархия отсутствует; онтология представляет собой сеть • Сетевая структура: узлы и отношения. • Повседневные знания (common sence). • Непосредственно на языке программирования (Python) • Использовалась для распознавания речи и изображений, человеко-машинные интерфейсы, рекомендательные системы, поисковые системы • http://csc.media.mit.edu/conceptnet
  • 8.
    DOLCE • Laboratory forApplied Ontology (LOA) • Приблизительно 100 концептов, 100 свойств и 20 аксиом • Скорее Meta - в том же смысле, в котором BFO; однако большее число концептов предполагает и большую детализацию, т.е. приближение к top-level в нашем смысле • Концепты и аксиомы • Онтология языковых и когнитивных представлений. • First-Order Logic; перевод на OWL, части, для который не хватает выразительности OWL приведены в качестве комментариев на KIF • Первый модуль в библиотеке WonderWeb • http://www.loa-cnr.it/DOLCE.html
  • 9.
    Entity Сущность Abstract Абстрактное Quality Качество Perdurant Динамическое Endurant Статическое Physical Endurant Физическое статическое Arbitrary Sum Произвольная сумма Non-physical Endurant Нефизическ. статическое Amount of Matter Частьматерии Physical Object Физический объект Feature Признак Agentive Physical Object Агентивный физический объект Non-Agentive Physical Object Неагентивный физический объект Non-physical Object Нефизический объект Mental Object Ментальный объект Social Object Социальный объект Agentive Social Object Агентивный социальный объект Non-Agentive Social Object Неагентивный социальный объект Social Agent Социальный Агент Society Общество Stative Постоянное Event Событие Accomplishment Исполнение Achievement Достижение Process Процесс State Состояние
  • 10.
    Entity Сущность Abstract Абстрактное Quality Качество Perdurant Динамическое Endurant Статическое Abstract Quality Абстрактное Качество Physical Quality Физическое Качество TemporalQuality Временное Качество Temporal Location Временное месторасположение Spatial Location Пространственное месторасположение Set Множество Region Регион Fact Факт Abstract Region Абстрактный Регион Physical Region Физический Регион Temporal Region Временной Регион Time Interval Временной интервал Space Region Пространственный регион
  • 11.
    OCHRE • University ofChicago • Около 20 концептов • Meta • Концепты, свойства, ссылки. • Информация о культурном наследии. • XML, XMLSchema • Более десятка археологических и филологических баз знаний. • http://ochre.lib.uchicago.edu/index.htm
  • 12.
    Item Единица Базовые концепты Spatial unit Пространственная единица Taxonomic unit Таксономическая единица Temporalunit Временная единица Agency unit Агентивная единица Resource unit Внешний ресурс Bibliographic unit Библиографическая единица Discourse unit Дискурсивная единица Epigraphic unit Эпиграфическая единица Script unit Рукописная единица Lexical unit Лексическая единица Концепты, необходимые для группировки других концептов List Список Hierarchy Иеррархия Relationship Отношения Query Запрос Text Текст Taxonomy Таксономия
  • 13.
    PROTON • Ontotext Lab,Sirma Group • 300 классов и 100 свойств • top-level • Классы и свойства. • Онтология реальности. • OWL Lite • SEKT Project (Semantic Web) • http://proton.semanticweb.org/
  • 14.
  • 15.
    SUMO • IEEE (Instituteof Electrical and Electronics Engineers) • 1000 концептов и 5000 аксиом • top-level • Концепты и аксиомы. • Попытка объединения существующих онтологий верхнего уровня. • KIF, переведена на OWL • Доменные онтологии и лексические базы. • http://www.ontologyportal.org/index.html
  • 16.
    physical (физическое) process (процесс) object (объект) self connected object (связный объект) region (регион) collection (коллекция) agent (агент) substance (материя) corpuscularobject (корпускулярный объект) content bearing object (несущий содержание объект) food (еда) hole (дыра) astronomical body (астрономическое тело) geographic area (географический регион) group (группа) organization (организация) sentient agent (чувствующий агент) geopolitical area (геополитический регион) group (группа) organism (организм) dual object process (двухобъектный процесс) intentional process (интенциональный процесс) motion (движение) internal change (внутреннее изменение) shape change (изменение формы)
  • 17.
    abstract (абстрактное) graph element (элемент графа) graph (граф) proposition (пропозиция) relation (отношение) setor class (множество или класс) attribute (атрибут) quantity (количество) number (число) real number (вещественное число) imaginary number (мнимое число) complex number (комплексное число) physical quantity (физическое количество) constant quantity (постоянное количество) unit of measure (единица измерения) function quantity (функциональное количество) internal attribute (внутренний атрибут) relational attribute (относительный атрибут) saturation attribute (атрибут пропитанности) physical state (физическое состояние) breakability attribute (атрибут членимости) perceptual attribute (перцептивный атрибут) biological attribute (биологический атрибут) shape attribute (атрибут формы) positional attribute (атрибут положения) truth value (истинностное значение) social role (социальная роль) biological attribute (биологический атрибут) time zone (часовой пояс) single valued relation (отношение с одним значением) total valued relation (отношение с интервальным значением) partial valued relation (отношение с частичным значением) binary relation (бинарное отношение) ternary relation (тернарное отношение) spatial relation (пространственн ое отношение) temporal relation (временное отношение) quaternary relation (отношение четырех объектов) list (список) predicate (предикат)
  • 18.
    UpperCYC • Cycorp, Inc. •3000 терминов • Meta и top-level • Коллекции, индивидуумы, предикаты, отношения, функции. • Универсальная. • CycL • Интегрирована в онтологии CYC и OpenCYC • http://glotta.ntua.gr/StateoftheArt/Ontologies/cov er.html
  • 19.
    YAGO • 2 миллионасущностей и 20 миллионов фактов • Meta-модель с наполнением конкретной фактографической информацией; в качестве промежуточного уровня выступает WordNet • Сущности, классы, экземпляры, отношения, факты (каждая сущность является экземпляром какого-либо класса; факты также являются сущностями и могут вступать в отношения). • База фактов (главным образом - концептуализация Википедии). • Текстовый формат • Извлечение информации, логический вывод, вопросно- ответные системы. • http://www.mpi-inf.mpg.de/yago-naga/yago/downloads.html
  • 20.
    YAMATO • Mizoguchi Lab,Osaka University • Около 1000 концептов • Meta и top-level • Концепты, роли, носители ролей, отношения. • Универсальная онтология с упором на концептуализацию свойств и репрезентаций. • XML (формат HOZO) • Несколько отраслевых онтологий: в том числе медицинская, генетическая, онтология поведения и др. • http://www.ei.sanken.osaka- u.ac.jp/hozo/onto_library/upperOnto.htm
  • 21.
    Entity Сущность Dependent Entity Зависимая сущность Entity Сущность Substrate Основа Time Время Space Пространство Substance Материя Functional Функционал Morphologialwhole Морфологическое целое Agent Агент Occurent (Оккурент) Continuant (Континуант) Quality value Значение качества Quality Качество Non-unitary Нецелостное Object Объект Living organism Живой организм Chemical compound Химическое соединение Artifact Артефакт Physical Физическое Abstract Абстрактное Semi-abstract Полу-абстрактное Mind Сознание Content Содержание Representation Репрезентация Representation form Форма репрезентации Quality- Quantity Качество- Количество Role Роль Feature Свойство Generic quality Оригинальное качество Property Свойство Categorical Категориальное Quantity Количество
  • 22.
    Выводы и впечатления •На сегодняшний день сложилось некое общее место самого верхнего уровня – разделение на объекты, процессы и отношения. • OWL является общепринятым языком импорта-экспорта, но он является не достаточным – в большинстве проектов не используется, или используется как вспомогательный. • Большинство проектов не ориентированы на обработку естественного языка как основную задачу. Скорее, онтологии используются для организации и переорганизации знаний предметной области и поиска по ним. • При этом анализ текста рассматривается как важнейший инструмент пополнения онтологии. • Методологии создаются ad hoc, их очевидно недостаточно. • Иногда создание онтологии становится самоцелью – гигантские проекты заканчиваются созданием неиспользуемого продукта.
  • 23.