Senior Researcher at INRAE (MISTEA) and University of Montpellier (LIRMM)
Sep. 7, 2017•0 likes•573 views
1 of 47
SIFR BioPortal : Un portail ouvert et générique d’ontologies et de terminologies biomédicales françaises au service de l’annotation sémantique
Sep. 7, 2017•0 likes•573 views
Download to read offline
Report
Health & Medicine
Presentation du SIFR BioPortal a la DSSIS lors de la réunion sur les serveurs mult terminologiques, Juin 2017. Présentation tirée de la presentation aux JFIM 2016 de Juin 2016 (+ nouveautées).
Similar to SIFR BioPortal : Un portail ouvert et générique d’ontologies et de terminologies biomédicales françaises au service de l’annotation sémantique
Similar to SIFR BioPortal : Un portail ouvert et générique d’ontologies et de terminologies biomédicales françaises au service de l’annotation sémantique(20)
2. ProjetSIFR:
Indexation
Sémantique de
Ressources
biomédicales
FRancophones
En collaboration
Laboratoire d’Informatique, de Robotique, de Microélectronique de
Montpellier
Stanford Center for BioMedical Informatics Research
Avec la participation du CISMeF (CHU de Rouen)
lirmm.fr/sifr github.com/sifrproject
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
2
3. SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
3
Young researchers
Clement Jonquet
Mathieu Roche
Sandra Bringay
Advisors
Stefano A. Cerri
MaguelonneTeisseire
Pascal Poncelet
Students
Amina Annane
Juan Antonio LossioVentura
Guillaume Surroca
~3 MSc students / year
Postdocs
AndonTchechmedjiev
Amine Abdaoui
Staff
Vincent Emonet
Close collaborators
Pierre Larmande (IRD / IBC)
Mark Musen (BMIR)
Stefan Darmoni (CISMEF)
Sebastien Harispe (LGI2P)
Zohra Bellahsene (LIRMM)
9. Les ontologies
et terminologies
(bio) médicales
ont adopté le
Web
sémantique
SNOMED-CT est une ontologie qui est maintenant développée (quasi
nativement) en OWL
ICD11 est développée grâce a l’outil iCat (Stanford) qui repose sur
Protégé l’éditeur de référence international pour les ontologies et
terminologies en santé
Le LIMICS (UMRS 1142) développe des ontologies dans chacun (ou
presque) de ses projets de recherche
Le NIH investi des millions de dollars sur l’interopérabilité des données
(BD2K program) et des ontologies (NCBO BioPortal)
FMA (Anatomie), HPO (Phénotypes), DO (Maladies), GO (Gene) sont
des ontologies OWL de références pour la gestion et l’annotation des
données
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
9
Sommes nous dedans ou en dehors ?
11. Explosion des
données en
biomédecine et
multilinguisme
La communauté biomédicale s’est tournée vers les ontologies et
les terminologies pour structurer ses données et les rendre
interopérables
Limite de l’indexation par mots clés
Créer des annotations sémantiques
Besoin vital d’outils pour la gestions des ontologies et l’annotation
de ressources en français
Challenge de l’intégration de données
Découvertes scientifiques cachées dans les données
Big / Open / Linked data
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
11
12. Indexer,
fouiller,
chercher des
ressources de
données en
français… à
l’aide des
ontologies
Développer un workflow d’annotation sémantique de
données textuelles francophones et l’offrir sous forme
de service ouvert et public à la communauté
biomédicale française
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
12
14. De l’importance des
terminologies et
ontologies en
(bio)médecine
• Portails d’ontologies/terminologies biomédicales
• Outils d’annotation sémantique pour le biomédical français
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
14
15. Un portail,
pourquoi faire ?
Si j’ai développé une ontologie, comment je la met à disposition
des autres à moindre coût ?
Si j’ai besoin d’une ontologie, où est-ce que je la récupère dans le
format de mon choix ou l’utilise en ligne ?
S’il existe plusieurs possibilités, comment savoir qu’elle ontologie
utiliser, laquelle est la plus appropriée pour ma tâche ?
Comment est-ce que je peux utiliser les ontologies pour
lier/annoter mes données ?
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
15
17. SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
17
Des projets
UMLF /VUMeF
InterSTIS (2007-2010)
Des recensements
Neveol et al.,LREC 2014
Rapport ASIP Santé 2015: 71 terminologies
recensées
Des ontologies publiées sur des thématiques
particulières (LIMICS)
Des plateformes
SMTS (ITM de Mondeca)
HeTOP et F-MTi/ECMT (CISMEF)
18. Lien aux outils
développés par
leCISMeF
Expertise médicale.
Ils intègrent les ontologies méthodiquement une par une, produisent
des traductions des termes et indexent (souvent manuellement) les
ressources de données du domaine
HealthTerminology/Ontology Portal - - www.hetop.eu
La référence pour l’intégration, l’alignement manuel, la curation et la
traduction de terminologies/ontologies médicales en France (?)
70 terminologies/ontologies (traduites ou en cours)
Multilingue
Approche « metathesaurus » (modèle spécifique et propriétaire)
Données indexées dans des plateformes telles que DocCISMeF
Pas d’API publique
Des outils d’annotation développés
F-MTi et ECMT
Non satisfaisants d’un point de vue usage, mais performants
Transférés au privé (Vidal & Alicante)
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
18
19. Sur qu’elle plateforme déposer et identifier facilement une
terminologie ou une ontologie dans le domaine de la santé en
France ?
Pas nécessairement des terminologies standards
Les petits vocabulaires fait dans le cadre d’un projet
Les alignements
Les projets, la communauté, etc.
Se rapprocher du web sémantique
Quels outils sont disponibles facilement pour annoter
sémantiquement du texte avec des concepts d’ontologies ?
Je donne mon texte
Je ne me soucie pas des aspects sémantiques ou linguistique
Importance des aspects pratiques: disponibilité, service, abstraction,
URI, paramétrables, etc.
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
19
21. NCBO
Bioportal :A
“one stop shop”
for Biomedical
Ontologies
Web repository for biomedical ontologies
Make ontologies accessible and usable – abstraction on format,
locations, structure, etc.
Users can publish, download, browse, search, comment, align
ontologies and use them for annotations both online and via a web
services API.
400+ ontologies (mainly in English)
http://bioportal.bioontology.org
Online support for ontology
Peer review
Notes (comments and discussion)
Versioning
Mapping
Search
Resources
Annotation
Recommendation
21
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
22. http://data.bioontology.org
Ontology
Services
• Search
• Traverse
• Comment
• Download
Widgets
• Tree-view
• Auto-complete
• Graph-view
Annotation
Data Access
Mapping
Services
• Create
• Upload
• Download
Term recognition
Search “data”
annotated with a
given term
http://bioportal.bioontology.org
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
22
23. SIFR BioPortal
Une plateforme ouverte et générique pour les ontologies françaises
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
23
http://bioportal.lirmm.fr
24. Elément
complémentaire
dans le paysage
français
Ouverte
N’importe qui peut soumettre du contenu
Générique
N’importe quel type de contenu et de format
Version spécifique du portail d’ontologie développé par le NCBO
Plateforme de rattachement pour le service d’annotation
25 (+4 privées) ontologies/terminologies médicales en français
Extraites de l’UMLS
Fournies par CISMeF (via export OWL)
Chargées directement par des utilisateurs
Construites a partir de format adhoc
255K classes
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
24
http://bioportal.lirmm.fr
26. La liste
complete
(juin 2016)
+àvenir:RIHN,Orphanet,
Cladimed,Adicap,ICECI,
OntoPsychia,HPO…
BHN Biologie Hors Nomenclature
CIF Classification Internationale du Fonctionnement, du handicap et de la santé
CIM-10 Classification Internationale des Maladies - 10ème révision
CISP-2 Classification Internationale des Soins Primaires, deuxième édition
MEDLINEPLUS MedlinePlus
SNMIFRE Systematized Nomenclature of MEDicine, version française
WHO-ARTFRE Terminologie des effets indésirables
MDRFRE Dictionnaire médical pour les activités règlementaires en matière de médicaments
MSHFRE Medical Subject Headings, version francaise
MTHMSTFRE Terminologie minimale standardisée en endoscopie digestive
STY Réseau sémantique UMLS
MUEVO Multi-expteriseVocabulary
INM Intervention Non Médicamenteuse
ONTOLURGENCES Ontologie des urgences
TOP-MENELAS Top ontologie de ONTOMENELAS
ONTOTOXNUC Ontology of NuclearToxicity
ONTOPNEUMO Ontology of Pneumology
HRDO Ontologie des maladies rares humaines
ONL-MSA Mental StateAssessment
ONL-DP Dataset processing
ONL-MR-DA Magnetic Resonance Dataset Acquisition Ontology
ATCFRE AnatomicalTherapeuticChemical classification
CCAM Classification Commune desActes Médicaux
LPP Liste des Produits et des Prestations
NABM Nomenclature desActes de Biologie Médicale
FR-NORM Base de données du médicamentsANSM
PDO Prenatal Diagnosis Ontology
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
26
37. Un nouvel outil
Détecter et localiser des concepts d’ontologies dans des données
textuelles
Utiliser la sémantique des ontologies pour étendre et exploiter ces
annotations
Service web
d’accès libre et public
facilement interconnectable
annotations aux formats standards comme JSON-LD ou RDF
paramétrable
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
37
43. API &SPARQL
access
(APIkey
required)
Search « mélanome » in Snomed International and MeSH:
http://data.bioportal.lirmm.fr/search?q=mélanome&ontologies=SNMIFR
E,MSHFRE
Get metadata information about MedDRA :
http://data.bioportal.lirmm.fr/ontologies/MDRFRE/latest_submission
Annotate the sentence « Le patient … »:
http://services.bioportal.lirmm.fr/annotator/?text=Le%20patient%20ne
%20montre%20aucun%20signe%20de%20fièvre.&ontologies=MSHFRE
&longest_only=true&negation=true&experiencer=true
Get all the mappings between MeSH and Snomed International:
http://data.bioportal.lirmm.fr/mappings?ontologies=MSHFRE,SNMIFRE
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
43
45. Plateforme ouverte et générique pour l’hébergement d’ontologies en
langue française (ou qui contiennent des labels français)
Un service d’annotation sémantique, un ‘recommender’, des
métadonnées, des alignements
Adoption du web sémantique, desAPIs, des standards
Des nouveaux outils qui doivent trouver leur place dans l’écosystème
français
Amélioration de l’Annotator (désambiguation)
Aider les organisations a passer a SKOS/OWL
Collaborations
ANR PratikPharma:Annotation de données cliniques de l’HEGP pour la
pharmacogénomique
CHU de Montpellier, CHU de Nancy, CHU de Bordeaux
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
45
46. Clement Jonquet, Amina Annane, Khedidja Bouarech,Vincent Emonet & Soumia
Melzi.SIFR BioPortal : Un portail ouvert et générique d’ontologies et de
terminologies biomédicales françaises au service de l’annotation sémantique,
In 16th Journées Francophones d'Informatique Médicale, JFIM'16. Genève, Suisse,
July 2016. pp. 16.
Amina Annane, Vincent Emonet, Faical Azouaou & Clement Jonquet.
Réconciliation d’alignements multilingues dans BioPortal, In 27èmes Journées
Francophones d'Ingénierie des Connaissances, IC'16. Montpellier, France, June 2016.
Clement Jonquet, Nigam H. Shah & Mark A. Musen. Un service Web pour
l'annotation sémantique de données biomédicales avec des ontologies, In
13èmes Journées Francophones d'Informatique Médicale, JFIM'09. Nice, France, April
2009. Informatique et Santé, Vol. 17
Juan-Antonio Lossio-Ventura, Clement Jonquet, Mathieu Roche & Maguelonne
Teisseire. Prédiction de la polysémie pour un terme biomédical, In 12ème
COnférence en Recherche d’Information et Applications, CORIA'15. March, Paris,
France 2015. pp. 437-452.
Juan Antonio Lossio-Ventura, Clement Jonquet, Mathieu Roche & Maguelonne
Teisseire. BIOTEX:A system for Biomedical Terminology Extraction, Ranking,
andValidation, In 13th International Semantic Web Conference, Demonstration,
ISWC'14. Riva del Garda, Italy, October 2014.Vol. 1272 pp. 157-160.
Julien Grosjean, Lina F. Soualmia, Khedidja Bouarech, Clement Jonquet & Stefan J.
Darmoni. Comparing BioPortal and HeTOP: towards a unique biomedical
ontology portal?, In 2nd International Work-Conference on Bioinformatics and
Biomedical Engineering, IWBBIO'14. Granada, Spain, April 2014. pp. 11.
SIFRBioPortal-C.Jonquet-RéunionDSSIS-Juin2017
46