Explorer des actualités multimédia dans le Web de données
Evaluation d'associations sémantiques dans une ontologie de domaine
1. Laboratoire de Recherche Opérationnelle, de DEcision et de Contrôle de processus
ISG Tunisie
Evaluation d’associations sémantiques
dans une ontologie de domaine
Thabet Slimani
Boutheina Ben Yaghlane
Khaled Mellouli
IC2009 Conférence d'Ingénierie des connaissances: 25- 29 mai 2009, Hammamet, Tunisie
2. Plan
Introduction
Travaux liés
Lien sémantique / Association sémantique
Degré d’un lien sémantique / d’une association
sémantique
Exemple d’évaluation d’associations sémantiques
Résultats expérimentaux
Conclusion
4. Introduction (2)
Des liens complexes significatifs et
Associations appropriés entre des entités, des
sémantiques événements et des concepts
Concepts
Entités
Extraction d’un chemin entre deux
Extraction entités reliées indirectement par des
Evénements Associations relations (propriétés) contenues dans
sémantiques un graphe RDF.
Mesurer les relations entre concepts
Comment ? basés sur différents types de liens
sémantiques dans une ontologie
Association sémantique
8. Travaux liés (1)
Approches intéressées par
les relations entre les
mots/concepts
Approches Approches orientées
orientées données structures (structure-
(data-driven) driven)
Watabe &
Cao et al. Kawaoka,
2005 2001
8
9. Travaux liés (2)
Notre approche dérive des approches statistiques
basées sur un modèle de langage statistique
Song & Croft (1999) → la pertinence d’un document
avec une requête est évaluée par la probabilité
d’association d’un document vis-à-vis d’une requête
bien déterminée.
Tian et al (2007) → une approche qui mesure les
relations sémantiques dans une ontologie.
9
10. Lien et association sémantique
Se rapporte à une relation
Lien directe entre deux entités
sémantique
Se rapporte à un chemin
Association connectant deux entités d’une
sémantique manière indirecte
10
11. Lien et association sémantique
Professor University Course Project
Degree_from Offers Related_to
Publication Student
Author_of
Author_of
P0 Degree_from U0 Offers C0 Related_to Pr0
Author_of Author_of St0
Pu0
11
12. Signature d’un lien sémantique
La signature d’un lien sémantique entre deux entités est définie
par les paires de concept/classe source et concept/classe cible.
Professor University
P0 Degree_from U0 Offers C0 Related_to Pr0
Author_of Author_of St0
Pu0
Signature du LS Degree_From (Professor , University )
12
13. Types d’un lien sémantique
Si A est défini comme une
Lien quot;SuperClassofquot; de B, alors B est B⊂A
hiérarchique contenu dans A
(LH)
Si A est défini comme une
Lien quot;EquivalentClassofquot; de B, alors A A≡B
d’équivalence est équivalent à B.
(LE)
Si A est défini comme ‘’PropertyOfquot;
de B ou B est défini comme
Lien
quot;PropertyOfquot; de A, on dit que A et B
A∝B
d’association
possèdent une AS directe
(LS)
13
14. Degré d’un lien sémantique
S’il y a un lien sémantique entre deux concepts A et B, le
degré d’un lien sémantique DLS est défini comme le poids
qui mesure le lien entre A et B.
14
15. Exemples des LS extraits à
partir de l’ontologie MeSH
LS Exemple dérivé Représentation
de MeSH graphique
A∝B L= Formalin Test ∝ {Pain, SL
A B
Intractable}
B⊂A Pain ⊂ Headache SubClassOf
B A
A≡B Pain ≡ Postoperative A B
15
16. Signature d’une association
sémantique (1/3)
Signature des propriétés d’une association sémantique
(SPAS) définie par les propriétés contenues dans le chemin
d’une association sémantique.
P0 Degree_from U0 Offers C0 Related_to Pr0
Author_of Author_of St0
Pu0
SPAS ( Degree_from , Offers , Related_to ) 16
17. Signature d’une association
sémantique (2/3)
Signature d’instances d’une association sémantique (SIAS)
définie par les instances contenues dans un lien
sémantique.
P0 Degree_from U0 Offers C0 Related_to Pr0
Author_of Author_of St0
Pu0
17
SIAS ( U0 , C0 )
18. Signature d’une association
sémantique (3/3)
Signature de classes d’une association sémantique (SCAS)
définie par les classes des entités intermédiaires dans une
AS.
University Course
P0 Degree_from U0 Offers C0 Related_to Pr0
Author_of Author_of St0
Pu0
Course 18
SCAS ( University , )
19. Degré d’une association
sémantique (DAS)
Cas 1: A ≡ B ou B ≡ A
DAS(A, B)=1
Cas 2: A ⊂ B ou A ∝ B
DAS(A, B)=DLSA(B,l)
Cas 3: A et B possèdent une AS
19
20. Degré d’une association
sémantique (DAS)
A B C D E
A 1 0 0 DLSA(D,L5) 0
B DLSB(A,L4) 1 0 DLSB(A,L4) 0 L5 D
DLSA(D,L5)
Log(4) A B
C DLSC(A,L3) 0 1 DLSC(A,L3) 0 L4
DLSA(D,L5) L3
Log(4)
D 0 0 0 1 0 C E
L2
E DLSE(C,L2) 0 DLSE(C,L2) DLSE(C,L2) 1
DLSC(A,L3) DLSC(A,L3)
Log(4) DLSA(D,L5)
20
Log(9)
21. Exemple d’évaluation
d’association sémantique
DAS-PE est le degré maximum des propriétés entrantes qui
relient une entité destination d’une association par un lien l
déjà connu
RE1 Has-Subject-Area
…. ResearchArea
RE1 ?
21
23. Résultats expérimentaux
Dragon Toolkit: paquet de développement Java utile pour
l’utilisation académique dans l’extraction sémantique
Expansion des requêtes: l’ontologie MeSH et l’ensemble
des données CFC (CFC data)
Nom du concept Pain
Type des liens Related-To Intractable
Subclass-Of Headache
SynonymOf Postoperative
23
25. Conclusion
DLS: permet de mesurer les liens sémantiques directs
entre des entités contenues dans une base de connaissance
DAS: permet d’évaluer le degré d’une association
sémantique entre deux entités qui sont liées d’une manière
indirecte.
Les mesures proposées pour l’évaluation des liens et des
associations sémantiques ont été appliquées sur une
ontologie de domaine et du corpus sous format des résumés.
Les résultats obtenus montrent une amélioration
remarquable au niveau de la précision dans le domaine de
l’extraction des documents approprié.
25
26. Perspective
Un travail conséquent reste à faire d’une part en amont sur
l’analyse théorique de ces mesures, et d’autre part sur leur
implémentation à grande échelle.
26
28. Résultats expérimentaux (2)
La valeur a été fixée à 0.5
MAP (Mean Average Precision): Outil d’évaluation
traditionnel qui est adopté dans le domaine de la recherche
documentaire
MAP (n): est employée dans notre travail pour évaluer n
documents recherchés
précision (n): bien connue pour l’examen de la qualité des
documents appropriés.
PM (Average Precision): tient en compte la moyenne des
scores de précision des documents appropriés parmi top-k
documents recherchés par une requête simple..
28
29. Résultats expérimentaux (3)
PMi(k): désigne la précision moyenne d’une requête i
ni: désigne le nombre des documents appropriés de
l’ième requête
k: désigne le nombre de documents extraits
Rij: est le rang du jème document approprié de l’ième
requête
29
30. Résultats expérimentaux (4)
MAP(k): permet de calculer le rang des k-premiers
documents recherchés avec une précision (n)
qn: désigne le nombre des requêtes exécutées
30
31. Estimation des expressions de DLS
Estimer PAi (Bj , l), P(B) et P(l|B) avec MLE method
Estimation de PAi (Bj , l)
T: l’ensemble de termes dérivés du corpus basé sur
l’ontologie de domaine et t le terme ayant un lien l avec Ai
et/ou Bj.
PAi (Bj , l) désigne la probabilité d’apparition du terme Ai
et Bj avec le lien l.
Si l est un lien sémantique (LS), il faut imposer une
portion de texte qui ne dépasse pas une certaine limite (TL :
Limite du texte en nombre de mots) et dans laquelle nous
pouvons calculer les co-occurrences de Ai et Bj.
31
32. Estimation de PAi (Bj , l)
(3)
Si l est un lien hiérarchique (LH), nous définissons le
modèle de co-occurrence TLS comme caractéristique
lexique-syntaxique du lien sémantique se produisant dans le
texte TL.
(4)
TL et TLS peuvent être différents lorsque les ontologies
varient d’un domaine à un autre.
32
33. Estimation de P(B) (1)
Structure de l’ontologie
5
|lB|: le nombre des liens du terme B
c: Désigne un concept dans l’ontologie de domaine
|lc| : désigne le nombre des liens du concept c.
33
34. Estimation de P(B) (2)
6
fq(c): désigne la fréquence de l’apparition des instances
du concept c dans le corpus C correspondant à l’ontologie
de domaine,
fqB :désigne la fréquence de l’apparition du terme B dans
le corpus C
34
35. Estimation de P(B) (3)
7
: est un coefficient permettant de combiner la structure
de l’ontologie avec le corpus. Ce coefficient est adopté pour
optimiser la performance de recherche de l’information.
Ce modèle mixte devient Pot(B) si =0 et Pst(B) si =1.
Nous avons attribué une valeur constante, par intuition,
comme valeur pour .
35
36. Estimation de P(l|B)
8
|lB|r désigne le nombre des liens des relations l avec B
|lB| désigne le nombre des tous les liens ayant des
relations avec le concept B.
36