Бібліотека – розвиток дитячої творчості та дозвілля для дітейpptx
Тема 11. RDF. Мова Web онтологій Web Ontology Language. Спільний формати даних CDF.
1. Мова Web онтологій Web Ontology
Language.RDF. Спільний формати даних
CDF.
Тернопіль 2015
2. RDF (Resource Description Framework) - це спосіб
представлення знань в децентралізованому світі; це
основна технологія Семантичного Вебу, який
дозволить комп'ютерним програмам користуватися
всією структурованою інформацією, розподіленої
по вузлах Інтернету. RDF - це не XML-формат в
строгому сенсі слова; це більше, ніж просто
метадані.
RDF - це модель для опису об'єктів. Об'єкти можуть
бути фізичними об'єктами (планети, люди, країни і т.
Д.), Віртуальними об'єктами (записи в блозі, wiki-
сторінки), абстрактними об'єктами (визначення
документа, повідомлення в чаті).
RDF
3. Онтологія - це система визначень об'єктів, яку
можна реалізувати з використанням RDF-
моделювання.
Семантика, в широкому сенсі слова - аналіз
відносини між мовними виразами і світом,
реальним або уявним, а також саме це відношення
(Вираз типу семантика слова) і сукупність таких
відносин (так, можна говорити про семантику деякої
мови). Дане відношення полягає в тому, що мовні
вирази (слова, словосполучення, пропозиції, тексти)
позначають те, що є у світі, - предмети, якості (або
властивості), дії, способи вчинення дій, відносини,
ситуації та їх послідовності.
4. Семантичні веб-сервіси (англ. Semantic Web
Services, SWS; іноді Semantic Web Web Services,
SWWS) - закінчені елементи програмної логіки з
однозначно описаною семантикою, доступні
через Інтернет і придатні для автоматизованого
пошуку, композиції і виконання з урахуванням їх
семантики. Часто називаються в тематичній
літературі «динамічної складової семантичної
павутини».
5. Семантична павутина — це надбудова над
сучасною Всесвітньою павутиною, яка покликана
зробити інформацію, що розміщена в мережі,
зрозумілішою для комп'ютерів. Відомо, що майже
вся інформація в Інтернеті знаходиться в текстовій
формі. Не секрет також, що прогрес в галузі
обробки людської мови (англ. Natural Language
Processing, NLP) йде дуже повільно. Комп'ютери не
можуть сприйняти й осмислити словесну
інформацію, розміщену в Інтернеті, і в найближчий
час, мабуть, не зможуть. Тоді постає питання — як
змусити комп'ютери розуміти зміст розміщеної в
мережі інформації і навчити їх користуватися нею?
На це питання і покликана відповісти концепція
семантичної павутини. Слово «семантична» у цьому
випадку означає «осмислена», «зрозуміла».
6. На сьогодні комп'ютери беруть досить обмежену
участь у формуванні й обробці інформації в
мережі Інтернет. Функції комп'ютерів в основному
зводяться до збереження, відображення і пошуку
інформації. У той же час створення інформації, її
оцінка, класифікація й актуалізація — усе це як і
раніше виконує людина. Як включити комп'ютер у
ці процеси? Якщо комп'ютер поки не можна
навчити розуміти людську мову, то потрібно
використовувати мову, що була б зрозумілою
комп'ютеру. Тобто, в ідеальному варіанті, вся
інформація в Інтернеті повинна розміщуватись
двома мовами: людською мовою для людини і
комп'ютерною мовою для розуміння комп'ютера.
Семантична павутина — це концепція мережі, у
якій кожен ресурс людською мовою був би
доповнений описом, зрозумілим комп'ютеру.
7. Для створення зрозумілого комп'ютеру опису ресурсу в
семантичній павутині використовується формат RDF
(англ. Resource Description Framework), що заснований
на синтаксисі XML і використовує ідентифікатори URI для
позначення ресурсів. RDF був затверджений як стандарт
W3C у лютому 2004 року. RDF — це система опису
мережних ресурсів, зрозуміла комп'ютеру. Формат RDF
призначений для збереження метаданих (метадані —
це дані про дані). Відповідно до концепції семантичної
павутини, опис у форматі RDF повинен прикріплюватися
до кожного мережного ресурсу. Документи RDF
повинні оброблятися комп'ютером автоматично, RDF не
призначений для читання і використання людиною. На
сьогодні формат RDF вже сформувався й одержав
широке поширення, він служить каркасом для
створення семантичної павутини.
8. Наступним важливим напрямком концепції
семантичної павутини є мова OWL (англ. Web
Ontology Language, вимовляється), що стала
Рекомендацією W3C у лютому 2004 року. Ця мова
побудована на форматах RDF і RDFS, вона
призначена для обробки інформації в мережі.
Мова OWL має 3 ступені деталізації, що є новим
словом у комп'ютерних технологіях. Вона також
легко масштабується й узгоджується з
найсучаснішими мережними стандартами. У
2008 році було прийнято новий стандарт OWL 2.
Теоретичною основою OWL є Описова логіка.
10. RDFS (англ. RDF Schema) — це важлива надбудова над RDF,
що дозволяє створювати класи і властивості (як в об'єктно-
орієнтованому програмуванні).
SPARQL (англ. Protocol And RDF Query Language,
вимовляється) — нова мова запитів для швидкого
доступу до даних RDF. Використовуючи звичайний
протокол і мову SPARQL, програми можуть
аналізувати RDF-описи ресурсів і отримувати з
мережі необхідну інформацію.
RIF — формат обміну правилами (англ. Rule
Interchange Format).
11. Ідентифікується все за допомогою URI. Притому URI
хоч і схожий на звичайні URL посилання – трохи
інший, наприклад можна визначити ресурс -
реальну людини і задати для нього URI
«http://example.org/people#Вася Пупкін».
Тверження про ресурс має має вигляд “триплет
суб'єкт-предикат-об'єкт”
Приклад
“<Www.example.org/index.html>
<www.example.org/terms/creation-date>
«16 серпня 1999».
”
12. Web Ontology Language
Мова онтологій для Web - OWL (Web Ontology
Language), так само як RDF і RDFS розроблена для
опису даних і метаданих, а також відносин між
ними і призначена для використання в комп'ютерній
обробці даних семантичного Web.
Мова OWL визначена у групі з шести рекомендацій,
прийнятої консорціумом W3 в лютому 2004 року.
13. Види OWL
• OWL Lite (спрощена OWL) - найпростіший (для
розробників як програмних продуктів, так і додатків з
використанням OWL) вид мови;
• OWL DL (OWL Description Logics - OWL з описової
логікою) - вид, розроблений для використання в бізнес-
додатках на основі логіки першого порядку (описової
логіки);
• OWL Full (повний OWL) - вид для висококваліфікованих
розробників додатків, що забезпечує повну реалізацію,
виразність і синтаксичну свободу RDF але без гарантій
того, що комп'ютерна обробка даних приведе до
певного результату (крім того, цей вид дуже важкий для
реалізації розробниками програмних продуктів).
14. Структура документа OWL
Документ OWL - це документ на мові RDF / XML,
який може містити заголовок OWL, а також містить
визначення класів, властивостей і відомостей про
представників класів. Представники класів
(individuals) за термінологією OWL - це реалізації
(екземпляри) класів.
Як розширення файлу з документом OWL можна
використовувати розширення .owl або .rdf.
15. Клас owl: Ontology використовується для опису
заголовка OWL, який у мові RDF / XML має
наступний синтаксис:
<owl:Ontology rdf:about="ресурс">
…
</ >
16. Опис класу OWL
У мові OWL визначено шість типів описів класів:
• за допомогою ідентифікатора класу;
• за допомогою перерахування представників класу;
• за допомогою обмеження властивостей;
• за допомогою перетину двох і більше описів класів;
• за допомогою об'єднання двох і більше описів класів;
• за допомогою доповнення опису класу.
При використанні першого типу визначення клас
задається з певним ім'ям. В інших типах клас задається
як порожній вузол з властивістю rdf: type, чиє значення
дорівнює owl: Class.
17. Аксіоми класів
Описи класів утворюють компоненти для визначення
класів за допомогою аксіом класів. Найпростішою
формою аксіоми класу є опис класу за
допомогою ідентифікатора, проте зазвичай
аксіоми містять додаткові компоненти, що задають
необхідні та / або достатні характеристики класів.
Для комбінування опису класу в аксіому класу
використовуються наступні властивості: rdfs:
subClassOf, owl: equivalentClass і owl: disjointWith.
18. Властивості OWL
У мові OWL визначені наступні категорії
властивостей:
• властивості онтологій (ontology properties);
• властивості анотацій (annotation properties);
• властивості об'єктів (object properties);
• властивості типізованих даних (datatype
properties).
19. Представники класів в OWL
Представники класів у мові OWL визначаються за
допомогою спеціальних аксіом, також званих
фактами. В OWL для представників визначені два
типи фактів:
• факти про приналежність до класу і значеннях
властивостей;
• факти про тотожність представників.
20. Перелічувані дані в OWL
В OWL можна використовувати всі типи даних,
визначені в RDF. Крім цього, в OWL DL і OWL Full
можна використовувати перелічуваних дані, тобто
дані, які задаються списками своїх значень. Ці дані
задаються у OWL за допомогою властивості owl:
oneOf і класу rdf: List.
21. Спільний формати даних CDF
Сфера застосування – зберігання, маніпуляції і доступ до
багатовимірних наборів даних.
CDF є програмним інтерфейсом, який надає незалежний
погляд на моделіданих CDF. Останні ґрунтуються на
багатовимірних масивах, які класифікують дані за різними
змінними, відповідними одному із спостережуваних
параметрів. Набори даних CDF відповідають базовій структурі
(basic grid structure), в якій позиція кожної задається
індексами.