A lecture delivered for "Web Application Development" discipline (MSc studies at Faculty of Computer Science, 'Alexandru Ioan Cuza' University of Iasi, Romania): https://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html
14. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
potrivirea ontologiilor
Motive ale existenței nepotrivirilor – mismatches
conform (Noy, 2005)
existența diferitelor cerințe și workflow-uri
privitoare la (tipuri de) aplicații software
exemplificări:
e-business vs. e-learning vs. e-entertainment,
maniere diverse de interacțiune cu utilizatorul
21. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
potrivirea ontologiilor – exemplu
www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
specificare diferită a conceptelor:
Publication – restricții privitoare la citări, referințe biblio.
versus
Publication – restricții referitoare la rezumat
24. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
potrivirea ontologiilor – exemplu
www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
convenții de modelare și nivel de detaliere:
proprietatea address compusă
din alte fragmente de informație
versus
proprietatea address de tip șir de caractere (nestructurat)
41. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
potrivirea ontologiilor: utilizare
Geografie computațională (geo-information)
exemplu: planificarea urbană
bazată pe terminologii din arii diverse
(hidrologie, topografie) utilizate pentru a oferi
rezultate de interes conform cererilor utilizatorului
alinierile sunt (re)folosite la expandarea interogărilor
45. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
potrivirea ontologiilor
Tehnici de potrivire la nivel de termeni
pe baza șirurilor de caractere
prefixul: net ≡ network, pen ≡ penguin (?)
sufixul: ID ≡ PID, nail ≡ snail (?)
distanța editării (numărul de operații de inserare,
ștergere, substituție a caracterelor pentru transformarea
unui termen în altul): EditDistance (NKN, Nikon) = 4
46. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
potrivirea ontologiilor
Tehnici de potrivire la nivel de termeni
bazate pe limbaj
procesarea entităților (tokenization)
Hands-Free Kits → 〈 hands, free, kits 〉
analiza morfologică pentru găsirea
tuturor formelor de bază (lemmalization): Kits → Kit
utilizarea N-gram-elor
eliminarea cuvintelor nerelevante: “a”, “the”, “by” etc.
47. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
potrivirea ontologiilor
Tehnici de potrivire la nivel de termeni
pe baza sensurilor – cazul WordNet
hiponimie, meronimie: Brand ⊑ Name
hipernimie, holonimie: Software ⊒ WebFramework
sinonimie: Quantity ≡ Amount
antonimie sau relații de siblings: Microprocessors ⊥ PC Board
70. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
alinierea ontologiilor
Pasul 3: similarity computation
pentru descrierile date ale 2 entități din spațiul
de candidați ai alinierii, se indică o similaritate
măsura similarității poate fi dată de
una sau mai multe caracteristici (trăsături, features)
84. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
alinierea ontologiilor
Există mai mulți algoritmi propuși
competiția anuală OAC – Ontology Alignment Contest
(2004—2017)
oaei.ontologymatching.org
detalii în P. Shvaiko, J. Euzenat, “Ontology Matching:
State of the Art and Future Challenges”,
IEEE Transactions on Knowledge and Data Engineering (2013)
disi.unitn.it/~p2p/RelatedWork/Matching/SurveyOMtkde_SE.pdf
85. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
alinierea ontologiilor
De asemenea, se pot folosi cunoștințe anterioare
(background knowledge)
WordNet
ontologii de referință ale domeniului
ontologii de nivel superior – e.g., DOLCE, SUMO, UMBEL
resurse textuale on-line (Wikipedia – DBpedia, Wikidata)
vocabulare/ontologii disponibile on-line
86. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
pentru două entități provenind din vocabularele AGROVOC și NAL
(National Agricultural Library) se deduce automat
că termenul Food este mai general decât Beef
sistemul de efectuare a potrivirilor (matcher) a recurs la cunoștințe
anterioare (background knowledge) disponibile pe Web
89. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
implementări: S-Match
Utilizează scheme (e.g., specificații XML Schema, OWL,…)
calculează relații de similaritate: echivalență (≡),
mai general (⊒), mai puțin general (⊑), disjuncție (⊥)
transformă fiecare ontologie într-o teorie propozițională
folosind definiții WordNet + structura ontologică
procesele sunt rulate secvențial
91. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
implementări: LogMap
Acceptă scheme (TBox) + instanțe (ABox)
aplică partiționarea ontologiilor de mari dimensiuni
și eliminarea fragmentelor (pruning) incomparabile
„repararea asocierilor” (mapping repair)
via algoritmi de verificare a satisfiabilității
oferit și la nivel de Web,
incluzând acces și la diverse sisteme de reasoning
94. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
implementări: Alignment
Platformă Web open-source colaborativă
alinierile generate sunt disponibile via SPARQL
sau un API tradițional
implementare PHP + Java
detalii în S. Karampatakis et al., Alignment: A Collaborative, System
Aided, Interactive Ontology Matching Platform, OM 2017
disi.unitn.it/~pavel/om2017/papers/om2017_poster3.pdf
96. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
implementări
AgreementMaker – include o multitudine de sisteme
automate de potrivire, cu suport pentru extensii
ASMOV – integrarea informațiilor din aria bioinformaticii
CogZ – investighează interacțiunea cu utilizatorul în cadrul
proceselor de aliniere ontologică
eTuner – metamatcher, capabil să ajusteze automat
diverși parametri de control
Falcon – utilizează divide-et-impera și
algoritmi de clustering pentru alinieri de ontologii largi
SAMBO – focalizat asupra potrivirii și
fuziunii de ontologii biomedicale
RiMOM – framework ce folosește strategii multiple
conform unor algoritmi de decizie bayesiană
106. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
biomedicină
OBO – Open Biological and Biomedical Ontologies
e.g., PRO (PRotein Ontology), Anatomical Entity Ontology,
Common Anatomy Reference Ontology etc.
www.bioontology.org
108. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
comerț electronic
GoodRelations, FAB (Food and Beverage Ontology),
PTO (Product Types Ontology), TIO (Tickets Ontology),…
purl.org/goodrelations/
www.productontology.org
109. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
legislație
LKIF (Legal Knowledge Interchange Format),
OPJK (Ontology of Professional Judicial Knowledge),
IPROnto (Intellectual Property Rights Ontology) etc.
github.com/RinkeHoekstra/lkif-core
111. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
mass-media
Business News Ontology, Food Ontology, Journalism
Ontology, Politics Ontology, Programmes Ontology,
Wildlife Ontology,… create și folosite de BBC
www.bbc.co.uk/ontologies
112. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
cercetări ale spațiului cosmic
SWEET (Semantic Web for Earth and Environmental
Terminology) – github.com/nasa/dictionaries
Orbital Space Ontology & Terminology/Taxonomy Project
rrovetto.github.io/Orbital-Space-Ontology-Project/
113. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
preluarea datelor de la senzori
constituirea așa-numitelor semantic sensor networks
ce recurg la modele conceptuale – e.g., OntoSensor
www.slideshare.net/joshsh/semantics-and-sensors
www.slideshare.net/ocorcho/semantic-social-sensor-networks
114. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
Web of Things
modelare + interconectare a dispozitivelor
în contextul IoT (Internet of Things)
www.w3.org/TR/wot-architecture/
webofthings.org/category/research/
115. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
TD (Thing Description) se exprimă în RDF și
descrie meta-datele, plus interfețele unei entități
(sensor, servient, alt dispozitiv)
conform Web of Things (WoT) Thing Description
(în lucru la W3C, 19 decembrie 2017)
w3c.github.io/wot-thing-description/
117. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
ontology-based semantic search
se bazează pe structura/înțelesul datelor și
pe cunoștințe anterioare modelate explicit
schema.org – schema.org
dbonto.cs.ox.ac.uk/workshop16.html
118. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
ontology-based semantic search
diverse exemplificări:
S. Polavaram, G.A. Ascoli, An Ontology-based Search Engine for Digital
Reconstructions of Neuronal Morphology, Brain Informatics,
4 (2), 2017 – link.springer.com/article/10.1007/s40708-017-0062-x
M. Paredes-Valverde et al., ONLI: An Ontology-based System
for Querying DBpedia Using Natural Language Paradigm,
Expert Systems with Applications, 42 (12), 2015
www.sciencedirect.com/science/article/pii/S0957417415001414
K. Lee et al., Location-based Service Using Ontology-based Semantic
Queries: A Study with a Focus on Indoor Activities in a University
Context, Computers, Environment & Urban Systems, Vol. 62, 2017
www.sciencedirect.com/science/article/pii/S0198971516301259
A. Soylu et al., Ontology-based End-user Visual Query Formulation:
Why, what, who, how, and which?,
Universal Access in the Information Society, 16 (2), 2017
www.cs.ox.ac.uk/files/8116/Soylu_et_al_UAIS_2016.pdf
119. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
ingineria modelării cunoștințelor
provenance of a resource = a record that describes entities
and processes involved in producing and delivering
or otherwise influencing that resource
www.w3.org/2001/sw/wiki/ESWC2013ProvTutorial
120. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
contribuții autohtone: S. Buraga, C. Gheorghiu,
An Ontological Approach for Specifying Provenance
into SPARQL Service Descriptions, KSEM 2014
link.springer.com/chapter/10.1007%2F978-3-319-12096-6_28
PROV
Provenance Ontology
recomandare W3C (2013)
121. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având cunoștințe modelate via ontologii
question answering
utilizarea tehnologiilor Web-ului semantic pentru a obține
răspunsuri (exacte) la întrebări formulate în limbaj natural
instrumente open source: LODQA, YodaQA
proiect de cercetare recent: WDAqua – wdaqua.eu
www.slideshare.net/JensLehmann/question-answering-application-and-challenges
122. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
utilizare practică a ontologiilor
Domenii având
cunoștințe modelate
via ontologii
inginerie industrială
integrarea cunoștințelor,
detecția defectelor,
verificarea
constrângerilor,
automatizare,…
sssw.org/2016/?page_id=384
Software Eng.Mechanical Eng. Electrical Eng.
132. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
ce este web-ul semantic
Mit:
the semantic Web technology is Description Logic
OWL este doar un limbaj al Web-ului semantic
aplicațiile (dezvoltatorii) care doresc să exprime
diverse expresivități îl pot utiliza
135. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Via reguli, pot fi deduse noi aspecte de interes
e.g., dacă un membru al unei echipe e interesat
de un limbaj de programare, atunci echipa în ansamblu
e interesată de acel limbaj
?person interestedBy ?lang
?person member ?team
ce este web-ul semantic
?team interestedBy ?lang
139. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
RIF (Rule Interchange Format)
limitarea raționamentelor (ipoteza lumilor deschise)
prin reguli, se poate impune NAF – negation as failure
“If Cristina isn’t known to have a brother,
then assert she is brother-less.”
ce este web-ul semantic
140. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
RIF (Rule Interchange Format)
regulile pot fi utilizare și în cadrul medierilor ontologice
la nivel de TBox și/sau ABox
“If Ana knows Bogdan and Bogdan knows Carmen
and Carmen hasFamilyMember Dana,
then assert Dana canTrust Ana.”
ce este web-ul semantic
144. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
RIF (Rule Interchange Format)
RIF PRD – Production Rule Dialect
aserțiunile despre condiții + concluzii nu sunt monotone
valoarea de adevăr a predicatelor poate fi modificată
(similar situației de la limbajele de programare)
ce este web-ul semantic
146. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Studiu de caz (Amit Sheth)
utilizarea ontologiilor și regulilor
în contextul aplicațiilor financiare
scop:
automatizarea detectării inconsistențelor
și neregulilor financiare
ce este web-ul semantic
147. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Studiu de caz (Amit Sheth)
specificarea riguroasă a terminologiei
din sistemul financiar
integrarea datelor din surse multiple (semi)structurate
managementul și evaluarea formulelor analitice
asupra datelor financiare
ce este web-ul semantic
149. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Studiu de caz (Amit Sheth, 2006)
pasul II:
implementarea unor extractori software
pentru eliminarea ambiguităților privind datele
+ deducerea relațiilor relevante dintre acestea
ce este web-ul semantic
150. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Studiu de caz (Amit Sheth, 2006)
pasul III:
dezvoltarea unui cadru de lucru
pentru specificarea formulelor/regulilor
și pentru interogarea cunoștințelor modelate ontologic
ce este web-ul semantic
152. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Studiu de caz (Q. Zhu et al., 2010)
recurgerea la reguli pentru descoperirea
informațiilor privitoare la medicamente
scop:
detectarea relațiilor între componentele medicamentelor
și efecte biologice, în contextul diverselor afecțiuni
ce este web-ul semantic
153. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Studiu de caz (Q. Zhu et al., 2010)
date preluate via servicii Web:
PubChem Compound, Pubchem BioAssay, Drug Bank
agregarea informațiilor se realizează folosind
WENDI (Web Engine for Non-obvious Drug Information)
procesare – inclusiv a regulilor – folosind Apache Jena
ce este web-ul semantic
154. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Scenariu de recomandare de produse (S. Hawke, 2009)
utilizatorul se află într-un magazin și
dorește să cumpere un obiect
folosind telefonul mobil scanează produsul și poate obține
via sistem(e) de reguli descrise semantic
prețul în alte magazine din vecinătate, caracteristici de
interes – e.g., proveniență, componente, păreri,
pericole/maniere de utilizare,… –,
oferte ale producătorului, dacă prietenii îl dețin deja etc.
ce este web-ul semantic
155. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Mit:
semantic Web is about public data
tehnologiile Web-ului semantic se pot aplica
și în cazul datelor la nivel personal, de grup,
organizațional – inclusiv vizând mediile enterprise
ce este web-ul semantic
156. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Mit:
semantic Web is about public data
…dar nu trebuie ignorate așteptările utilizatorilor
acces public la informații/cunoștințe procesabile automat
open knowledge
open government, open culture, open science etc.
ce este web-ul semantic
157. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Diverse aspecte avute în vedere de Web-ul semantic
pot fi aplicații pe scară largă
(e.g., în cadrul cloud computing, în contextul big data)
căutare, regăsire, reutilizare de date/cunoștințe
data/relation/knowledge mining
sisteme de recomandare (socială) „inteligentă”
etc.
problematici avute în vedere de Web science
ce va fi web-ul semantic
158. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
ce va fi web-ul semantic
Open Source Algorithms for Distributed Data Processing
for Large-scale RDF Knowledge Graphs
SANSA (Scalable Semantic Analytics Stack) – sansa-stack.net
159. Dr.SabinBuragaprofs.info.uaic.ro/~busaco
Extragerea și înțelegerea informațiilor (textuale,
multimedia) disponibile în cadrul resurselor Web
Actualizarea automată și permanentă a cunoștințelor
(keep knowledge up-to-date)
Managementul cunoștințelor complexe
e.g., Most of the global warming in the last 50 years was
caused by human beings, to a high degree of certainty
context mai larg: deep understanding
ce va fi web-ul semantic: direcții majore
Xin Luna Dong, How Far Are We from Collecting the Knowledge in the World? (ICWE 2016)