SlideShare a Scribd company logo
1 of 124
1
Ph.D Thesis
Application of Information Extraction
techniques to pharmacological domain:
Extracting drug-drug interactions.
Isabel Segura Bedmar
Advisor: Paloma Martínez Fernández
April, 23th
2010 Title:logo_uc3m.eps
Creator:GIMP PostScript f
CreationDate:Mon Feb 8
LanguageLevel:2
2
Outline
Introduction
I
State of the Art
Proposal
Evaluation
Conclusions
DrugDDI Corpus
IE processes for DDI Extraction.
Future Work
3
What is a Drug-Drug Interaction (DDI)?
Introduction
4
Beneficial
Introduction
Ritonavir + Lopinavir → Effective antiretroviral
Nifedipine + propranolol → Antianginal drug
5
Dangerous
Introduction
Aspirin + Heparin → Bleeding
Aspirin + Acetazolamide → Death
6
 47.8% of adverse events
are due to drugs, of
which 3.5% result from
DDI1.
 Medication errors kill
7,000 patients per
annum in USA2.
 High incidence in certain
patient groups (3-20%).
 Increase the Healthcare
costs
Things can get complicated...
1. APEAS Estudio sobre la seguridad de los pacientes en Atención primaria de salud.
Madrid: Ministerio de Sanidad y Consumo, 2008
2. Kohn et al., 2000. “To Err is Human”.
Introduction
7
Drug interaction Resources
Most effective source:
Medical Literature.
Introduction
8
Drug interaction Resources
Introduction
Drug Interactions Resources
Medical and Pharmaceutical Research 
Publications
? ?
9
How does Information Extraction help?
Triamterene, metformin and amiloride
should be co-administered with care
as they might increase dofetilide levels.
DDI ( TRIAMTERENE, DOFETILIDE)
DDI ( METFORMIN, DOFETILIDE)
DDI ( AMILORIDE, DOFETILIDE)
Introduction
10
Thesis approach goals
Introduction
Create an
annotated corpus
to study the
extraction of DDI
An Information
Extraction (IE)
System for DDI
11
Thesis specific goals
Creation of an annotated corpus of DDI.
Introduction
Study the main approaches for biomedical IE.
Develop a framework that allows the study
and combination of different techniques IE.
Propose a method to resolve the anaphoric
expressions involving drugs.
Integration of biomedical resources and
nomenclature standards.
Propose a method to identify and classify
drugs.
12
Thesis specific goals
Introduction
Combine the resolution of complex syntactic
constructions and a set of lexical patterns
defined by a pharmacist in order to extract
DDIs.
Study the performance of a machine
learning method to detect DDIs.
Compare both previous approaches and
analyze the results.
State of the Art
State of the Art
Approaches
14
State of the Art
Relation 
Extraction
In biomedicine
1
Linguistic­based 
approaches
2
3
Pattern­based 
approaches
Machine Learning­
based approaches
4
Hybrid approaches
State of the Art
Approaches
15
State of the Art
Relation 
Extraction
In biomedicine
1
Linguistic­based 
approaches
2
3
Features­based 
approaches
Kernels­based 
approaches
Pattern­based 
approaches
Machine Learning­
based approaches
State of the Art
Unsolved Issues in BNER
16
State of the Art
Few approaches dealing with Drug Name
recognition.
New drugs are continually approved.
Synonyms.
Anaphoric expressions.
Ambiguity.
Abbreviations.
State of the Art
Unsolved Issues in Biomedical RE
17
State of the Art
No approaches for DDI extraction.
No annotated corpus for DDI.
Abstracts MedLine.
Sentence Level.
State of the Art
Unsolved Issues in Biomedical RE
18
State of the Art
Modality and negation are usually ignored.
Clauses, adverbial and prepositional
phrases are not usually addressed.
Performance depends heavily on results
from previous.
Huge gap among life science researches,
healthcare professionals and computer
scientists.
Proposal
20
Proposal
Proposal
Create an
annotated corpus
to study the
extraction of DDI
An Information
Extraction System
for DDI
21
Text Analysis by MetaMap program
Corpus TXT
XML annotated with shallow
syntactic and semantic
information from UMLS
UMLS MetaMap
(MMTx):
Text analysis
Unified
Medical
Language
System
(UMLS)
Proposal: Corpus DrugDDI
DrugBank
22
Example of annotation
Proposal: Corpus DrugDDI
23
Example of annotation
Proposal: Corpus DrugDDI
24
Annotation of Corpus DrugDDI
Total
Avg . 
per 
doc
DDIs 3,160 5.5
Sentences  5,806 10.2
Sentences with 
at least one DDI
2,044
3.5
Drugs 14,930 25.7
Documents 579
Proposal: Corpus DrugDDI
27597 90%
3160 10%
Non-DDI
DDIs
25
Proposal
Proposal
Create an
annotated corpus
to study the
extraction of DDI
An Information
Extraction (IE)
System for DDI
26
IE System for DDI
Corpus TXT
Text analysis
XML annotated 
with shallow 
syntactic and 
semantic 
information
Drug Name 
Recognition
Anaphora 
Resolution
DDI Extraction
+
drugs and other 
biomedical 
concepts 
+
anaphoras
+
Drug 
interactions
Biomedical Resources
Proposal: DrugDDI system
27
Text Analysis
Corpus TXT
XML annotated 
with shallow 
syntactic and 
semantic 
information
Drug Name 
Recognition
Anaphora 
Resolution
DDI Extraction
+
drugs and other 
biomedical 
concepts 
+
anaphoras
+
Drug 
interactions
Biomedical Resources
Text analysis
Proposal: DrugDDI system
28
Drug Name Recognition (DrugNer)
Corpus TXT
+
drugs and other 
biomedical 
concepts 
+
anaphoras
+
Drug­Drug 
interactions
WHOINN
affixes
UMLS
XML annotated 
with shallow 
syntactic and 
semantic 
information
Proposal: DrugDDI system
Drug Name 
Recognition
Anaphora 
Resolution
DDI Extraction
Text analysis
29
WHO affixes
for identifying and classifying drugs
Affixes 
WHOINN
Drug Family  Pattern Drugs
­pristin Antibacterials,
pristinamycin
derivatives
[A­Za­z0­9]*[pristin] Efepristin
­gatran  Antithrombotic
agents
[A­Za­z0­9]*[gatran] Dabigatran
-tinib Antineoplastic
agents
[A­Za­z0­9]*[tinib] Dasatinib,
Sunitinib,
Nilotinib
-mycin -Antibiotics [A­Za­z0­9]*[mycin] Tanespimycin
Proposal: DrugDDI system
30
Evaluation of DrugNer
Precision Recall F-measure
0.9
0.91
0.92
0.93
0.94
0.95
0.96
0.97
0.98
0.99
1
MMTx
MMTx + affixes
Affix-based classification obtains an accuracy
rate of 75%
Number of drugs in the DrugNer 
corpus (849 Medline abstracts)
Detected by MMTx
8,093 
(97.6%)
Only detected by affixes 181 (2.2%)
Detected neither by 
MMTx nor affixes
20 (0,2%)
Total 8,294
Proposal: DrugDDI system
31
Drug Anaphora Resolution
Corpus TXT
Biomedical Resources
Proposal: DrugDDI system
Drug Name 
Recognition
Anaphora 
Resolution
DDI Extraction
Text analysis
+
drugs and other 
biomedical 
concepts 
+
anaphoras
+
Drug­Drug 
interactions
XML annotated 
with shallow 
syntactic and 
semantic 
information
32
Levofloxacin is one of the most commonly prescribed
antibiotics in clinical practice.
Several case reports have indicated that this drug may
signicantly potentiate the anticoagulation effect of
warfarin.
DDI MAY POTENTIATE( LEVOFLOXACIN , WARFARIN )
How does Anaphora Resolution help?
Proposal: DrugDDI system
Corpus DrugNerAr
Personals
Reflexives (it)
Relatives (which)
Distributives (both)
Demonstratives (these)
Indefinites (some)
0 20 40 60 80 100 120 140
Definites (the)
Possessives (its)
Distributives (both)
Demonstratives (these)
Indefinites
0 10 20 30 40 50 60 70
Proposal: DrugDDI system
49 documents, 1,976 sentences, 331
anaphoric expressions.
Pronominal Anaphora Nominal Anaphora
34
Approaches for Drug anaphora resolution
Baseline
Scoring-based method
Linguistic rules-based
method (Centering theory)
Proposal: DrugDDI system
35
Drug anaphora resolution results
Pronominal Nominal
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Baseline
Scoring-based approach
Linguistic Rules-based
approach
Proposal: DrugDDI system
F-measure
36
Drug-Drug Interaction Extraction
Corpus TXT
Biomedical Resources
Proposal: DrugDDI system
Drug Name 
Recognition
Anaphora 
Resolution
DDI Extraction
Text analysis
+
drugs and other 
biomedical 
concepts 
+
anaphoras
+
Drug­Drug 
interactions
XML annotated 
with shallow 
syntactic and 
semantic 
information
37
Approaches for DDI Detection
DDI Extraction Drug interactions
Proposal: DrugDDI system
Syntactic Information 
+ Lexical Patterns
Machine Learning
1
2
38
Approaches for DDI Detection
DDI Extraction Drug interactions
Proposal: DrugDDI system
Syntactic Information 
+ Lexical Patterns
Machine Learning
1
2
39
Pharmacological patterns
Patterns defined by our pharmacist.
<DRUG>  INTERACT(S) WITH <DRUG>.
<DRUG> (INCREASE(S)|DECREASE(S)|...) <DRUG EFFECTS>
<DRUG> INTERFERE(S) WITH <DRUG PROPERTIES>
CONCURRENT USE OF <DRUG> WITH <DRUG> (INCREASE(S)|
DECREASE(S)|...) <DRUG PROPERTIES>
<DRUG> INHIBIT(S) <DRUG PROPERTIES>
CO­ADMINISTRATION OF <DRUG> AND <DRUG> RESULT IN 
<DRUG PROPERTIES>
<DRUG EFFECTS> OF <DRUG> BE (ENHANCED|REDUCED|...) BY 
<DRUG>
Proposal: DrugDDI system
40
1st approximation: Syntactic
Information + Lexical Patterns
Proposal: DrugDDI system
XML annotated with 
shallow syntactic and 
semantic information, 
drugs and other 
biomedical concepts, 
anaphoras
Drug­Drug  
interactions
Detection of 
coordinate structures
Detection of 
appositions
Pattern 
Matching
Clause Splitting
Rules for sentence 
simplification
Allopurinol interacts with anisindione, azathioprine and cyclosporine
How does syntactic information help?
Detecting coordinate structures
Proposal: DrugDDI system
Allopurinol interacts with anisindione, azathioprine and cyclosporine
Detection of
Coordinate structures
COORD := ([NP|PP|AJD|UNK],)* [NP|PP|
ADJ|UNK] CONJ [NP|PP|ADJ|UNK]
Allopurinol interact with COORD
Detecting coordinate structures
Proposal: DrugDDI system
How does syntactic information help?
Allopurinol interacts with anisindione, azathioprine and cyclosporine
Detection of
Coordinate structures
COORD := ([NP|PP|AJD|UNK],)* [NP|PP|
ADJ|UNK] CONJ [NP|PP|ADJ|UNK]
Allopurinol interacts with COORD
Drug Name Recognition
DRUG.1 interacts with COORD
Detecting coordinate structures
Proposal: DrugDDI system
How does syntactic information help?
Allopurinol interacts with anisindione, azathioprine and cyclosporine
DDI := <DRUG1|COORD|APPOSITION>
INTERACTS WITH
<DRUG2|COORD|APPOSITION>.
Detection of
Coordinate structures
Pattern Matching
COORD := ([NP|PP|AJD|UNK],)* [NP|PP|
ADJ|UNK] CONJ [NP|PP|ADJ|UNK]
Allopurinol interacts with COORD
Drug Name Recognition
DRUG.1 interacts with COORD
Detecting coordinate structures
Proposal: DrugDDI system
How does syntactic information help?
Allopurinol interacts with anisindione, azathioprine and cyclosporine
DDI := <DRUG1|COORD|APPOSITION>
INTERACTS WITH
<DRUG2|COORD|APPOSITION>.
Detection of
Coordinate structures
Pattern Matching
DRUG-DRUG INTERACTION:
Drug 1: Allopurinol
Drug 2: anisindione
COORD := ([NP|PP|AJD|UNK],)* [NP|PP|
ADJ|UNK] CONJ [NP|PP|ADJ|UNK]
Allopurinol interacts with COORD
Drug Name Recognition
DRUG.1 interacts with COORD
DRUG-DRUG INTERACTION:
Drug 1: Allopurinol
Drug 2: azathioprine
DRUG-DRUG INTERACTION:
Drug 1: Allopurinol
Drug 2: cyclosporine
Detecting coordinate structures
Proposal: DrugDDI system
How does syntactic information help?
46
Evaluation 1st
approach
for DDI extraction
Precision Recall F-measure
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.67
0.14
0.23
0.48
0.26
0.34
0.49
0.25
0.33
Lexical Patterns (baseline)
Coordinatives & Appositions
Coordinatives & Appositions &
Clauses
Proposal: DrugDDI system
Experiments:
47
Approaches for DDI Detection
DDI Extraction Drug interactions
Proposal: DrugDDI system
Machine Learning
Syntactic information 
+ lexical patterns1
2
Training Texts
Text analysis
Drug Name 
Recognition
DDI  learning
Examples 
Generator
DDI model
Testing Texts
Text analysis
Drug Name 
Recognition
DDI classification
Examples 
Generator
Classification Problem
Proposal: DrugDDI system
Training 
dataset
Testing 
dataset
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Proposal: DrugDDI system
Generating examples (relation instances)
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Generating examples (relation instances)
Proposal: DrugDDI system
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Generating examples (relation instances)
Proposal: DrugDDI system
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Generating examples (relation instances)
Proposal: DrugDDI system
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Generating examples (relation instances)
Proposal: DrugDDI system
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Generating examples (relation instances)
Proposal: DrugDDI system
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Generating examples (relation instances)
Proposal: DrugDDI system
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Aspirin may decrease the effects of probenecid, sulfinpyrazone and phenylbutazone
Generating examples (relation instances)
Proposal: DrugDDI system
Positive examples
Negative examples
57
Imbalanced dataset
Proposal: DrugDDI system
27597 90%
3160 10%
Non-DDI
DDIs
Dataset Docs  Sents. Drugs
Training 437 4,578 2,650
Testing 142 1,228 753
Total 579 5,806 3,313
Dataset Exa. Pos. Neg.
Training 25,209 2,433 22,776
Testing 5,548 726 4,821
Total 30,757 3,160 27,597
58
Shallow Linguistic Relational kernel
(Giuliano et al., 2006)
Proposal: DrugDDI system
Shallow representation of sentences (no syntax)
Global Context Kernel.
Local Context Kernel.
59
Global Context: Fore-Between
Concurrent administration of a TNF antagonist with ORENCIA
has been associated with an increased risk of serious
infections and no significant additional efficacy over use of the
TNF antagonists alone.
KGlobalContext
(R1
,R2
)=KFore-Between
(R1
,R2
)
Proposal: DrugDDI system
60
Global Context: Between
Concurrent administration of a TNF antagonist with ORENCIA
has been associated with an increased risk of serious
infections and no significant additional efficacy over use of the
TNF antagonists alone.
Proposal: DrugDDI system
KgoblalContext
(R1
,R2
)=KFore-Between
(R1
,R2
) +
KBetween
(R1
,R2
)
61
Global Context: Between-After
Concurrent administration of a TNF antagonist with ORENCIA
has been associated with an increased risk of serious
infections and no significant additional efficacy over use of the
TNF antagonists alone.
Proposal: DrugDDI system
KGlobalContext
(R1
,R2
)=KFore-Between
(R1
,R2
) +
KBetween
(R1
,R2
) +
KBetween-After
(R1
,R2
)
KGlobal context
(R1
, R2
)=?
KGlobal context(
“Coadministration of DRUG with DRUG may increase the risk of
toxicity”,
“Coadministration of DRUG with DRUG may increase OTHER
exposure”)
=
How many ngrams do both examples share?
Proposal: DrugDDI system
Global Context Kernel (n-gram)
KGlobal context
(R1
, R2
)=?
KGlobal context(
“Coadministration of DRUG with DRUG may increase the risk of
toxicity”,
“Coadministration of DRUG with DRUG may increase OTHER
exposure”)
= KFore-Between
(R1
,R2
) + KBetween
(R1
,R2
) + Kbetween-After
(R1
,R2
)
= 2
Proposal: DrugDDI system
Global Context Kernel (n-gram=2)
KGlobal context
(R1
, R2
)=?
KGlobal context(
“Coadministration of DRUG with DRUG may increase the risk of
toxicity”,
“Coadministration of DRUG with DRUG may increase OTHER
exposure”)
= KFore-Between
(R1
,R2
) +
KBetween
(R1
,R2
) +
KBetween-After
(R1
,R2
)
Proposal: DrugDDI system
Global Context Kernel (n-gram=1)
KGlobal context
(R1
, R2
)=?
KGlobal context(
“Coadministration of DRUG with DRUG may increase the risk of
toxicity”,
“Coadministration of DRUG with DRUG may increase OTHER
exposure”)
=7
Proposal: DrugDDI system
Global Context Kernel (n-gram=1)
with
with
with
with
Aspirin may decrease the effects of probenecid, sulfinpyrazone
and phenylbutazone
Local Context Kernel (window-size =2 )
Proposal: DrugDDI system
LEFT
Aspirin may decrease the effects of probenecid, sulfinpyrazone
and phenylbutazone
Proposal: DrugDDI system
Local Context Kernel (window-size =2 )
LEFT
Aspirin&Aspirin&noun&Aspirin&DRUG&A|
may&may&verb&may&O&O|
decrease&decrease&verb&decrease&O&O|
Aspirin may decrease the effects of probenecid, sulfinpyrazone
and phenylbutazone
CLEFT
Proposal: DrugDDI system
Local Context Kernel (window-size =2 )
RIGHTLEFT
Aspirin&Aspirin&noun&Aspirin&DRUG&A|
may&may&verb&may&O&O|
decrease&decrease&verb&decrease&O&O|
Aspirin may decrease the effects of probenecid, sulfinpyrazone
and phenylbutazone
CLEFT
Proposal: DrugDDI system
Local Context Kernel (window-size =2 )
RIGHTLEFT
Aspirin&Aspirin&noun&Aspirin&DRUG&A|
may&may&verb&may&O&O|
decrease&decrease&verb&decrease&O&O|
effects&effect&noun&effect&O&O|
probenecid&probenecid&noun&probenecid&DRUG&T|
,&,&comma&,&O&O|
sulfinpyrazone&sulfinpyrazone&noun&sulfinpyrazone&O&O|
Aspirin may decrease the effects of probenecid, sulfinpyrazone
and phenylbutazone
CLEFT
CRIGHT
Proposal: DrugDDI system
Local Context Kernel (window-size =2 )
RIGHTLEFT
Aspirin&Aspirin&noun&Aspirin&DRUG&A|
may&may&verb&may&O&O|
decrease&decrease&verb&decrease&O&O|
effects&effect&noun&effect&O&O|
probenecid&probenecid&noun&probenecid&DRUG&T|
,&,&comma&,&O&O|
sulfinpyrazone&sulfinpyrazone&noun&sulfinpyrazone&O&O|
Aspirin may decrease the effects of probenecid, sulfinpyrazone
and phenylbutazone
CLEFT
CRIGHT
Proposal: DrugDDI system
KLocalContext
(R1
,R2
)=KLeft
(R1
,R2
) + KRight
(R1
,R2
)
Local Context Kernel (window-size =2 )
72
Claudio Giuliano, Alberto Lavelli, Lorenza Romano. Exploiting
Shallow Linguistic Information for Relation Extraction from
Biomedical Literature, EACL 2006
KSL
(R1
,R2
)= KGlobalContext
(R1
,R2
) + KLocalContext
(R1
,R2
)
DDI classification using Shallow
Linguistic kernel
Proposal: DrugDDI system
73
Evaluation 2nd
approach
for DDI extraction
Precision Recall
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.57
0.72
0.55
0.76
n=3, w=1
n=1, w=2
n=2, w=3
n=3, w=3
n=4, w=3
n=5, w=3
Proposal: DrugDDI system
F­measure = 0,64
Parameters for 
Shallow  Linguistic 
Kernel
n = n­gram 
w = window­size 
74
Evaluation 2nd
approach
for DDI extraction
Precision Recall F-measure
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.53
0.72
0.61
0.51
0.68
0.580.57
0.72
0.64
0.55
0.76
0.64
Global Context (n-gram=3)
Local Context (window-size=2)
Shallow Linguistic (n-gram=3,
window-size=1)
Shallow Linguistic (n-gram=1,
window-size=2)
Proposal: DrugDDI system
75
Experiment results on imbalanced
and balanced datasets
Proposal: DrugDDI system
F-mesure
0
0.2
0.4
0.6
0.8
1
Baseline
Balanced Training
& Imbalanced
Testing
Imbalanced
Training and
Testing
F-mesure
0
0.2
0.4
0.6
0.8
1
Baseline
Balanced Training
and Testing
Evaluation
77
Patterns vs Kernels
Precision Recall F-measure
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.48
0.26
0.34
0.55
0.82
0.66
Syntactic + Patterns Approach
Shallow Kernel
Evaluation
Conclusions
Thesis contributions: Problem
79
Conclusions
Initial problem definition.
First approach for DDI extraction.
Multidisciplinary research group
Thesis contributions: Corpora
80
Conclusions
Creation of several biomedical corpora:
DrugNer, DrugNerAr.
First annotated corpus with DDI.
Thesis contributions: Biomedical
Named Entity Recognition
Conclusions
Drug Name Recognition and Classification.
Thesis contributions: Language
82
Conclusions
Drug Anaphora resolution.
Complex syntactic constructions:
coordinate and appositive structures, clauses.
Thesis contributions: Relational
Kernels
83
Conclusions
Comparative analysis: patterns vs kernels.
Relational Kernels applied to
pharmacological domain.
Future Work
Future Work: DrugDDI corpus
85
Future Work
Increase the quality of the DrugDDI corpus.
Future Work: Drug Classification
86
Future Work
Improve the drug classification considering the
ATC system.
Future Work: Language
87
Future Work
Handle the mistakes made by MMTx.
Improve the clause splitting process.
Treatment of negation and modality.
Use the drug families to resolve nominal
anaphora.
Future Work: DDI Extraction
88
Future Work
Integrate the drug anaphora resolution in
the DDI extraction.
Use the SPINDEL [De Pablo-Sánchez et al.,
2009] system to acquire new patterns.
Extract relevant information about each
DDI.
Future Work: Relational Kernel
89
Future Work
Semantic Kernel (drug family, semantic
types, WordNet, etc).
Parse tree or dependency graph kernels.
Study other solutions for imbalanced
learning.
Future Work: Application
90
Future Work
Improve Drug interaction resources.
User-oriented evaluation.
Projects
91
Projects
This work has been partially supported by the Spanish research
projects:
MAVIR consortium (S-0505/TIC-0267, www.mavir.net), a network
of excellence funded by the Madrid Regional Government.
ISSE: Semantic Interoperability in Electronic Healthcare (FIT-
350300-2007-75).
BRAVO: Advanced Multimodal and Multilingual Question
Answering. (TIN2007-67407-C03-01).
MULTIMEDICA: Multilingual Information Extraction in Health
domain and application to scientific and informative
documents. Propuesta Plan Nacional de I+D 2009. UC3M, UPM,
UAM.
Dissemination
92
Dissemination
Isabel Segura-Bedmar, Mario Crespo, Cesar de Pablo-Sánchez,
Paloma Martínez. (2010). Resolving anaphoras for the
extraction of drug-drug interactions in pharmacological
documents. BMC BioInformatics, 11(Suppl 2):S1.
César de Pablo-Sanchez, Juan Perea, Isabel Segura-Bedmar,
Paloma Martinez. (2009). The UC3M team at the Knowledge
Base Population task. TAC 2009.
Isabel Segura-Bedmar, Mario Crespo, Cesar de Pablo-Sánchez,
Paloma Martínez. (2009) DrugNerAR: Linguistic Rule-Based
Anaphora Resolver for Drug-Drug Interaction Extraction
in Pharmacological Documents. ACM DTMBIO 09.
Isabel Segura-Bedmar, Mario Crespo, Cesar de Pablo-Sánchez.
(2009) Score-based approach for Anaphora Resolution in
Drug-Drug Interactions Documents. NLDB 2009.
Dissemination
93
Dissemination
Isabel Segura-Bedmar, Paloma Martínez, María Segura-
Bedmar. (2008). Drug Name Recognition and classification
in biomedical texts. Drug Discovery Today. 2008 Sep;13(17-
18).
Isabel Segura-Bedmar, Paloma Martínez, Doaa Samy. (2008) A
preliminary approach to recognize generic drug names
by combining UMLS resources and USAN naming
conventions. ACL BIONLP'08.
Isabel Segura-Bedmar, Paloma Martínez, Doaa Samy. (2008)
Detección de fármacos genéricos en textos biomédicos.
Revista SEPLN.
Dissemination
94
Dissemination
Isabel Segura Bedmar, Doaa Samy, José L. Martínez-
Fernández, Paloma Martínez. (2007) Detecting Semantic
Relations between Nominals using Support Vector
Machines and Linguistic-Based Rules. OTM 2007.
Isabel Segura Bedmar, Doaa Samy y José L. Martínez-
Fernández. (2007) UC3M: Classification of Semantic
Relations between Nominals using Sequential Minimal
Optimization. ACL SEMEVAL 2007.
Isabel Segura Bedmar, José L. Martínez-Fernández, Paloma
Martínez. (2006) Including deeper semantic information in
the Lexical Markup Framework: a aproposal. Fifth
Slovenian and First International Language Technologies
Conference, IS-LTC 2006.
Isabel Segura Bedmar, José L. Martínez-Fernández, Paloma
Martínez. (2006) Una Propuesta para el Etiquetado
Automático de Roles Semánticos. Revista SEPLN.
Dissemination
95
Dissemination
Isabel Segura-Bedmar, Paloma Martínez, Cesar de Pablo-
Sánchez (2010). Extracting drug-drug interactions from
biomedical texts. Accepted at BioTM 2010 (Workshop on
Advances in Bio Text Mining). BMC BioInformatics.
Roxana Danger, Isabel Segura-Bedmar, Paloma Martínez,
Paolo Rosso. (2009). A comparison of machine learning
techniques for detection of drug target articles..
Submitted to Journal of Biomedical Informatics.
96
Drug Drug Interaction detection is a
promising application for IE and NLP
97
Ph.D Thesis
Application of Information Extraction
techniques to pharmacological domain:
Extracting drug-drug interactions.
Isabel Segura Bedmar
Advisor: Paloma Martínez Fernández
April, 23th
2010 Title:logo_uc3m.eps
Creator:GIMP PostScript f
CreationDate:Mon Feb 8
LanguageLevel:2
98
Learning Curves
99
The pressor effects of [catecholamines
such as dopamine or norepinephrine]_APOS
are enhanced by Bretylium Tosylate.
which can be interpreted as:
1) The pressor effects of catecholamines are enhanced by Bretylium
2) The pressor effects of dopamine are enhanced by Bretylium
3) The pressor effects of norepinephrine are enhanced by Bretylium
How syntactic information helps?
<DRUG EFFECT> OF (DRUG|APOS) BE
<INTERACT_VERB> BY (DRUG|APOS)
1) DDI increase ( BRETYLIUM TOSYLATE, CATECHOLAMINES )
2) DDI increase (BRETYLIUM TOSYLATE, DOPAMINE)
3) DDI increase (BRETYLIUM TOSYLATE, NOREPINEPHRINE)
Detecting appositive structures
Proposal: DrugDDI prototype
Catecholamine-depleting drugs, such as reserpine, may have an additive
effect when given with beta-blocking agents.
DDI := <DRUG1|APPOSITION>
(HAVE|INCREASE|...) <EFFECT>
WHEN GIVEN WITH
<DRUG2|APPOSITION>.
Detection of
Appositions
Pattern Matching
DRUG-DRUG INTERACTION:
Drug 1: Catecholamine-depleting drugs
Drug 2: beta-blocking agents
Property|Effect: additive
DRUG-DRUG INTERACTION:
Drug 1: Reserpine
Drug 2: beta-blocking agents
Property|Effect: additive
APPOSITION may have an additive effect when given with DRUG.
APPOSITION := <APPOSITIVE>
MARKER <APOSITIVE>
How syntactic information helps?
Proposal: DrugDDI prototype
Detecting appositions
Concomitant administration of corticosteroids with Aspirin may increase the risk of
gastrointestinal ulceration and may reduce serum salicylate levels.
Concomitant administration of
corticosteroids with Aspirin may
increase the risk of
gastrointestinal ulceration
Concomitant administration of
corticosteroids with Aspirin may
reduce serum salicylate levels.
PATTERN: ADMINISTRATION
OF <DRUG1> WITH
<DRUG2>
MAY (INCREASE|REDUCE)...
Clause splitting
Pattern Matching
DRUG-DRUG INTERACTION:
Drug 1: Corticosteroids
Drug 2: Aspirin
Action: increase
Property|Effect: Gastrointestinal
ulceration
DRUG-DRUG INTERACTION:
Drug 1: Corticosteroids
Drug 2: Aspirin
Action: reduce
Property|Effect: serum salicylate
levels
Proposal: DrugDDI prototype
Detecting clauses
How syntactic information helps?
102
Evaluation:
Syntactic structures resolution
Appositions Coordinatives Relatives Clauses
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Precision
Recall
F-measure
Proposal: DrugDDI prototype
RIGHT
Aspirin may decrease the effects of probenecid, sulfinpyrazone
and phenylbutazone
ΦRIGHT(R)=
Local Context Kernel
Proposal: DrugDDI prototype
104
[The Cmax of norethindrone was 13% higher] when
[it was coadministered with gabapentin]
What is the problem?
Complex sentences: Interactions could
span several clauses
In a pharmacokinetic substudy in patients with
congestive heart failure receiving
furosemide or digoxin in whom therapy with FLOLAN
was initiated, apparent oral clearance values
for furosemide (n = 23) and digoxin (n= 30)
were decreased by 13% and 15%, respectively,
on the second day of therapy and had returned
to baseline values by day 87.
Proposal: DrugDDI prototype
105
Therefore,
[when MIDAMOR and non-steroidal
anti-inflammatory agents
are used concomitantly],
[the patient should be observed closely to determine
if thedesired effect of the diuretic is obtained].
Interactions could span several clauses
What is the problem?
The most sentenses are complex
sentences.
106
In subjects who had received 21 days of
40 mg/day racemic citalopram, com-
bined administration of 400 mg/day cimetidine
for 8 days resulted in an
increase in citalopram AUC and
Cmax of 43% and 39%, respectively.
What is the problem?
Patterns are not enough for detecting
other interactions
KGlobal context
(R1
, R2
)=?
KGlobal context(“DRUG may interact with DRUG”,
“DRUG may interact with DRUG, OTHER, OTHER”)=2
KGlobal context(“DRUG may interact with DRUG”,
“DRUG may decrease the effect of DRUG, OTHER, and OTHER”)=0
KGlobal context(“Coadministration of DRUG with DRUG may increase the
risk of toxicity”, “Coadministration of DRUG with DRUG may increase
OTHER exposure”, )=2
Proposal: DrugDDI prototype
Global Context Kernel (n-gram=2)
108
Example of parsed sentence
Proposal: Corpus DrugDDI
109
Example of parsed sentence
Proposal: Corpus DrugDDI
110
Example of parsed sentence
Proposal: Corpus DrugDDI
111
Example of parsed sentence
Proposal: Corpus DrugDDI
112
Experiments
Proposal: DrugDDI system
XML annotated with 
shallow syntactic and 
semantic information, 
drugs and other 
biomedical concepts, 
anaphoras
Drug­Drug  
interactions
Detection of 
coordinate structures
Detection of 
appositions
Pattern 
Matching
Clause Splitting
Rules for sentence 
simplification
113
1st
Experiment: Baseline
Proposal: DrugDDI system
XML annotated with 
shallow syntactic and 
semantic information, 
drugs and other 
biomedical concepts, 
anaphoras
Drug­Drug  
interactions
Pattern 
Matching
114
2nd Experiment: Coordinate structures
and appositions
Proposal: DrugDDI system
XML annotated with 
shallow syntactic and 
semantic information, 
drugs and other 
biomedical concepts, 
anaphoras
Drug­Drug  
interactions
Detection of 
coordinate structures
Detection of 
appositions
Pattern 
Matching
Clause Splitting
Rules for sentence 
simplification
115
3th Experiment: Coordinate structures,
appositions and clauses
Proposal: DrugDDI prototype
XML annotated with 
shallow syntactic and 
semantic information, 
drugs and other 
biomedical concepts, 
anaphoras
Drug­Drug  
interactions
Detection of 
coordinate structures
Detection of 
appositions
Pattern 
Matching
Clause Splitting
Rules for sentence 
simplification
116
Evaluation 2nd
Approximation
(n=3, w=1)
(n=1, w=2)
(n=2, w=3)
(n=3, w=3)
(n=4, w=3)
(n=5, w=3)
0
2000
4000
6000
8000
10000
12000
14000
16000
sg.
Proposal: DrugDDI prototype
n­gram=3, window­size=1
minimizes the training time 
and maximizes the precision 
n­gram=1, window­size=2
minimizes the training time 
and maximizes the recall 
Training Time
RIGHTLEFT
Aspirin&Aspirin&noun&Aspirin&DRUG&A|
may&may&verb&may&O&O|
decrease&decrease&verb&decrease&O&O|
the&the&det&the&O&O|
effects&effect&noun&effect&O&O|
probenecid&probenecid&noun&probenecid&DRUG&T|
,&,&comma&,&O&O|
sulfinpyrazone&sulfinpyrazone&noun&sulfinpyrazone&O&O|
and&and&conj&and&O&O|
phenylbutazone&phenylbutazone&noun&phenylbutazone&O&O|
Aspirin may decrease the effects of probenecid, sulfinpyrazone
and phenylbutazone
CLEFT
CRIGHT
Local Context Kernel (window-size =2 )
Proposal: DrugDDI system
KLocalContext
(R1
,R2
)=KLeft
(R1
,R1
) + KRight
(R1
,R2
)
118
Experiment results on imbalanced
and balanced datasets
Precision Recall F-measure
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.55
0.82
0.66
0.36
0.91
0.52
0.82
0.91
0.86
Imbalanced datasets
Balanced training dataset &
Imbalanced testing dataset
Balanced training and testing
datasets
Proposal: DrugDDI prototype
119
Rules for syntactic simplification
Rules based on [Shiddahartan, 2006]:
Rules for Appositive Clause Simplification
S = [V][W][X apos of V][Z] => S1=[V][W][Z],
S2=[V] is/are [X apos of V]
Rules for Coordinative Clause Simplification
S=CONJ [X], [Y] => S1 = X, S2 = Y
S = [IF] [X] [THEN|,] [Y] => S1 = X, S2 = Y
S = [X] [,]? [CONJ] [Y] => S1 = X, S2 = Y
Rules for Relative Clause Simplification
S = [W] [X][Y relative W] [Z].=>S1 = W X Z.
S2 = W Y.
....
120
2nd
approximation: Machine Learning
Proposal: DrugDDI system
Classification problem.
Every drug pair is a relation instance.
Relation is reciprocal, drug order is not
important.
121
Relation Instances (examples)
Proposal: DrugDDI system
122
123
Experiment results on imbalanced
and balanced datasets
F-measure Recall F-measure
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.66
0.82
0.66
0.52
0.91
0.52
0.82
0.91
0.86
Baseline
Imbalanced datasets
Balanced training dataset &
Imbalanced testing dataset
Balanced training and testing
datasets
Proposal: DrugDDI system
124
Experiment results on imbalanced
and balanced datasets
Precision Recall F-measure
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0.55
0.82
0.66
0.36
0.91
0.52
0.82
0.91
0.86
Imbalanced datasets
Balanced training dataset &
Imbalanced testing dataset
Balanced training and testing
datasets
Proposal: DrugDDI system

More Related Content

Viewers also liked

Sulfonated perfluorocyclopentenyl polymers and uses thereof
Sulfonated perfluorocyclopentenyl polymers and uses thereofSulfonated perfluorocyclopentenyl polymers and uses thereof
Sulfonated perfluorocyclopentenyl polymers and uses thereofBabloo Sharma, Ph.D.
 
16juni16 Programma Seminar Aanpak Ouderenmishandeling (3)
16juni16 Programma Seminar Aanpak Ouderenmishandeling (3)16juni16 Programma Seminar Aanpak Ouderenmishandeling (3)
16juni16 Programma Seminar Aanpak Ouderenmishandeling (3)Oscar Balkenende
 
Bis-perfluorocycloalkenyl (PFCA) aryl ether monomers towards a versatile clas...
Bis-perfluorocycloalkenyl (PFCA) aryl ether monomers towards a versatile clas...Bis-perfluorocycloalkenyl (PFCA) aryl ether monomers towards a versatile clas...
Bis-perfluorocycloalkenyl (PFCA) aryl ether monomers towards a versatile clas...Babloo Sharma, Ph.D.
 
morphima.image.sml
morphima.image.smlmorphima.image.sml
morphima.image.smlHans Verleur
 
Untitled Presentation
Untitled PresentationUntitled Presentation
Untitled Presentationwantwushu
 
An approach to User Interface Design of an accessible user agent
An approach to User Interface Design of an accessible user agent An approach to User Interface Design of an accessible user agent
An approach to User Interface Design of an accessible user agent Grupo HULAT
 
Media Homework Article Analysis
Media Homework Article Analysis Media Homework Article Analysis
Media Homework Article Analysis Molly Dickerson
 
Lessons from the Drug-Drug Interaction Extraction Task
Lessons from the Drug-Drug Interaction Extraction TaskLessons from the Drug-Drug Interaction Extraction Task
Lessons from the Drug-Drug Interaction Extraction TaskGrupo HULAT
 
A study of accessibility requirements for media players on the Web
A study of accessibility requirements for media players on the WebA study of accessibility requirements for media players on the Web
A study of accessibility requirements for media players on the Web Grupo HULAT
 
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...Grupo HULAT
 

Viewers also liked (20)

Sulfonated perfluorocyclopentenyl polymers and uses thereof
Sulfonated perfluorocyclopentenyl polymers and uses thereofSulfonated perfluorocyclopentenyl polymers and uses thereof
Sulfonated perfluorocyclopentenyl polymers and uses thereof
 
16juni16 Programma Seminar Aanpak Ouderenmishandeling (3)
16juni16 Programma Seminar Aanpak Ouderenmishandeling (3)16juni16 Programma Seminar Aanpak Ouderenmishandeling (3)
16juni16 Programma Seminar Aanpak Ouderenmishandeling (3)
 
Bis-perfluorocycloalkenyl (PFCA) aryl ether monomers towards a versatile clas...
Bis-perfluorocycloalkenyl (PFCA) aryl ether monomers towards a versatile clas...Bis-perfluorocycloalkenyl (PFCA) aryl ether monomers towards a versatile clas...
Bis-perfluorocycloalkenyl (PFCA) aryl ether monomers towards a versatile clas...
 
morphima.image.sml
morphima.image.smlmorphima.image.sml
morphima.image.sml
 
Nsw compensation lawyers
Nsw compensation lawyersNsw compensation lawyers
Nsw compensation lawyers
 
Untitled Presentation
Untitled PresentationUntitled Presentation
Untitled Presentation
 
9. los valores
9.  los valores9.  los valores
9. los valores
 
Media: Music video
Media: Music video Media: Music video
Media: Music video
 
Dedico Network
Dedico NetworkDedico Network
Dedico Network
 
1Lezione inventor
1Lezione inventor1Lezione inventor
1Lezione inventor
 
An approach to User Interface Design of an accessible user agent
An approach to User Interface Design of an accessible user agent An approach to User Interface Design of an accessible user agent
An approach to User Interface Design of an accessible user agent
 
Q4 and 5
Q4 and 5 Q4 and 5
Q4 and 5
 
9. los valores
9.  los valores9.  los valores
9. los valores
 
RERA
RERARERA
RERA
 
Media Homework Article Analysis
Media Homework Article Analysis Media Homework Article Analysis
Media Homework Article Analysis
 
Lessons from the Drug-Drug Interaction Extraction Task
Lessons from the Drug-Drug Interaction Extraction TaskLessons from the Drug-Drug Interaction Extraction Task
Lessons from the Drug-Drug Interaction Extraction Task
 
Personal Injury Claim
Personal Injury ClaimPersonal Injury Claim
Personal Injury Claim
 
A study of accessibility requirements for media players on the Web
A study of accessibility requirements for media players on the WebA study of accessibility requirements for media players on the Web
A study of accessibility requirements for media players on the Web
 
Pm assignment
Pm assignmentPm assignment
Pm assignment
 
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
 

Similar to Application of Information Extraction techniques to pharmacological domain: Extracting drug-drug interactions

Combining Syntactic Information and domain-specific Lexical Patterns to Extra...
Combining Syntactic Information and domain-specific Lexical Patterns to Extra...Combining Syntactic Information and domain-specific Lexical Patterns to Extra...
Combining Syntactic Information and domain-specific Lexical Patterns to Extra...Grupo HULAT
 
Detecting Drugs and Adverse Events from Spanish Health Social Media Streams
Detecting Drugs and Adverse Events from Spanish Health Social Media StreamsDetecting Drugs and Adverse Events from Spanish Health Social Media Streams
Detecting Drugs and Adverse Events from Spanish Health Social Media StreamsGrupo HULAT
 
Acquiring and representing drug-drug interaction knowledge and evidence, Litm...
Acquiring and representing drug-drug interaction knowledge and evidence, Litm...Acquiring and representing drug-drug interaction knowledge and evidence, Litm...
Acquiring and representing drug-drug interaction knowledge and evidence, Litm...jodischneider
 
Score-based Approach for Anaphora Resolution in Drug-Drug Interaction Documents
Score-based Approach for Anaphora Resolution in Drug-Drug Interaction DocumentsScore-based Approach for Anaphora Resolution in Drug-Drug Interaction Documents
Score-based Approach for Anaphora Resolution in Drug-Drug Interaction DocumentsGrupo HULAT
 
RxpredictPresentation.pdf
RxpredictPresentation.pdfRxpredictPresentation.pdf
RxpredictPresentation.pdfDanikaGupta
 
Data Science Meets Drug Discovery
Data Science Meets Drug DiscoveryData Science Meets Drug Discovery
Data Science Meets Drug DiscoveryPhilip Bourne
 
Acquiring and representing drug-drug interaction knowledge and evidence, TRIA...
Acquiring and representing drug-drug interaction knowledge and evidence, TRIA...Acquiring and representing drug-drug interaction knowledge and evidence, TRIA...
Acquiring and representing drug-drug interaction knowledge and evidence, TRIA...jodischneider
 
Role of bioinformatics in drug designing
Role of bioinformatics in drug designingRole of bioinformatics in drug designing
Role of bioinformatics in drug designingW Roseybala Devi
 
New drug + Pharmacogenetics F22 TMSUc.pptx
New drug + Pharmacogenetics F22 TMSUc.pptxNew drug + Pharmacogenetics F22 TMSUc.pptx
New drug + Pharmacogenetics F22 TMSUc.pptxDrNabanitKumarJha1
 
Towards Personalized Medicine
Towards Personalized MedicineTowards Personalized Medicine
Towards Personalized MedicineMichel Dumontier
 
Extraction of Drug-Drug Interactions from Biomedical Texts
Extraction of Drug-Drug Interactions from Biomedical TextsExtraction of Drug-Drug Interactions from Biomedical Texts
Extraction of Drug-Drug Interactions from Biomedical TextsGrupo HULAT
 
Introduction to the drug discovery process
Introduction to the drug discovery processIntroduction to the drug discovery process
Introduction to the drug discovery processThanh Truong
 
Antti haapalinna 10th december 08 oulu1
Antti haapalinna 10th december 08 oulu1Antti haapalinna 10th december 08 oulu1
Antti haapalinna 10th december 08 oulu1Antti Haapalinna
 
Extending the "Web of Drug Identity" with knowledge extracted from United Sta...
Extending the "Web of Drug Identity" with knowledge extracted from United Sta...Extending the "Web of Drug Identity" with knowledge extracted from United Sta...
Extending the "Web of Drug Identity" with knowledge extracted from United Sta...Richard Boyce, PhD
 
Role of bioinformatics and pharmacogenomics in drug discovery
Role of bioinformatics and pharmacogenomics in drug discoveryRole of bioinformatics and pharmacogenomics in drug discovery
Role of bioinformatics and pharmacogenomics in drug discoveryArindam Chakraborty
 
Towards a foundational representation of potential drug-drug interaction know...
Towards a foundational representation of potential drug-drug interaction know...Towards a foundational representation of potential drug-drug interaction know...
Towards a foundational representation of potential drug-drug interaction know...Mathias Brochhausen
 
Presentation "Spanish Resources in Trendminer Project"
Presentation "Spanish Resources in Trendminer Project"Presentation "Spanish Resources in Trendminer Project"
Presentation "Spanish Resources in Trendminer Project"Grupo HULAT
 
Bioinformatica 15-12-2011-t9-t10-bio cheminformatics
Bioinformatica 15-12-2011-t9-t10-bio cheminformaticsBioinformatica 15-12-2011-t9-t10-bio cheminformatics
Bioinformatica 15-12-2011-t9-t10-bio cheminformaticsProf. Wim Van Criekinge
 
Unc slides on computational toxicology
Unc slides on computational toxicologyUnc slides on computational toxicology
Unc slides on computational toxicologySean Ekins
 

Similar to Application of Information Extraction techniques to pharmacological domain: Extracting drug-drug interactions (20)

Combining Syntactic Information and domain-specific Lexical Patterns to Extra...
Combining Syntactic Information and domain-specific Lexical Patterns to Extra...Combining Syntactic Information and domain-specific Lexical Patterns to Extra...
Combining Syntactic Information and domain-specific Lexical Patterns to Extra...
 
Detecting Drugs and Adverse Events from Spanish Health Social Media Streams
Detecting Drugs and Adverse Events from Spanish Health Social Media StreamsDetecting Drugs and Adverse Events from Spanish Health Social Media Streams
Detecting Drugs and Adverse Events from Spanish Health Social Media Streams
 
Acquiring and representing drug-drug interaction knowledge and evidence, Litm...
Acquiring and representing drug-drug interaction knowledge and evidence, Litm...Acquiring and representing drug-drug interaction knowledge and evidence, Litm...
Acquiring and representing drug-drug interaction knowledge and evidence, Litm...
 
Score-based Approach for Anaphora Resolution in Drug-Drug Interaction Documents
Score-based Approach for Anaphora Resolution in Drug-Drug Interaction DocumentsScore-based Approach for Anaphora Resolution in Drug-Drug Interaction Documents
Score-based Approach for Anaphora Resolution in Drug-Drug Interaction Documents
 
RxpredictPresentation.pdf
RxpredictPresentation.pdfRxpredictPresentation.pdf
RxpredictPresentation.pdf
 
Data Science Meets Drug Discovery
Data Science Meets Drug DiscoveryData Science Meets Drug Discovery
Data Science Meets Drug Discovery
 
Acquiring and representing drug-drug interaction knowledge and evidence, TRIA...
Acquiring and representing drug-drug interaction knowledge and evidence, TRIA...Acquiring and representing drug-drug interaction knowledge and evidence, TRIA...
Acquiring and representing drug-drug interaction knowledge and evidence, TRIA...
 
Drug repurposing
Drug repurposingDrug repurposing
Drug repurposing
 
Role of bioinformatics in drug designing
Role of bioinformatics in drug designingRole of bioinformatics in drug designing
Role of bioinformatics in drug designing
 
New drug + Pharmacogenetics F22 TMSUc.pptx
New drug + Pharmacogenetics F22 TMSUc.pptxNew drug + Pharmacogenetics F22 TMSUc.pptx
New drug + Pharmacogenetics F22 TMSUc.pptx
 
Towards Personalized Medicine
Towards Personalized MedicineTowards Personalized Medicine
Towards Personalized Medicine
 
Extraction of Drug-Drug Interactions from Biomedical Texts
Extraction of Drug-Drug Interactions from Biomedical TextsExtraction of Drug-Drug Interactions from Biomedical Texts
Extraction of Drug-Drug Interactions from Biomedical Texts
 
Introduction to the drug discovery process
Introduction to the drug discovery processIntroduction to the drug discovery process
Introduction to the drug discovery process
 
Antti haapalinna 10th december 08 oulu1
Antti haapalinna 10th december 08 oulu1Antti haapalinna 10th december 08 oulu1
Antti haapalinna 10th december 08 oulu1
 
Extending the "Web of Drug Identity" with knowledge extracted from United Sta...
Extending the "Web of Drug Identity" with knowledge extracted from United Sta...Extending the "Web of Drug Identity" with knowledge extracted from United Sta...
Extending the "Web of Drug Identity" with knowledge extracted from United Sta...
 
Role of bioinformatics and pharmacogenomics in drug discovery
Role of bioinformatics and pharmacogenomics in drug discoveryRole of bioinformatics and pharmacogenomics in drug discovery
Role of bioinformatics and pharmacogenomics in drug discovery
 
Towards a foundational representation of potential drug-drug interaction know...
Towards a foundational representation of potential drug-drug interaction know...Towards a foundational representation of potential drug-drug interaction know...
Towards a foundational representation of potential drug-drug interaction know...
 
Presentation "Spanish Resources in Trendminer Project"
Presentation "Spanish Resources in Trendminer Project"Presentation "Spanish Resources in Trendminer Project"
Presentation "Spanish Resources in Trendminer Project"
 
Bioinformatica 15-12-2011-t9-t10-bio cheminformatics
Bioinformatica 15-12-2011-t9-t10-bio cheminformaticsBioinformatica 15-12-2011-t9-t10-bio cheminformatics
Bioinformatica 15-12-2011-t9-t10-bio cheminformatics
 
Unc slides on computational toxicology
Unc slides on computational toxicologyUnc slides on computational toxicology
Unc slides on computational toxicology
 

More from Grupo HULAT

Interaccion 2019 lourdes moreno
Interaccion 2019 lourdes morenoInteraccion 2019 lourdes moreno
Interaccion 2019 lourdes morenoGrupo HULAT
 
Low vision interaccion2018v4
Low vision interaccion2018v4Low vision interaccion2018v4
Low vision interaccion2018v4Grupo HULAT
 
Exploring language technologies to provide support to WCAG 2.0 and E2R guidel...
Exploring language technologies to provide support to WCAG 2.0 and E2R guidel...Exploring language technologies to provide support to WCAG 2.0 and E2R guidel...
Exploring language technologies to provide support to WCAG 2.0 and E2R guidel...Grupo HULAT
 
Babelfy: Entity Linking meets Word Sense Disambiguation.
Babelfy: Entity Linking meets Word Sense Disambiguation.Babelfy: Entity Linking meets Word Sense Disambiguation.
Babelfy: Entity Linking meets Word Sense Disambiguation.Grupo HULAT
 
Integration of Accessibility Requirements in the Design of Multimedia User Ag...
Integration of Accessibility Requirements in the Design of Multimedia User Ag...Integration of Accessibility Requirements in the Design of Multimedia User Ag...
Integration of Accessibility Requirements in the Design of Multimedia User Ag...Grupo HULAT
 
New Approaches to Interactive Multimedia Content Retrieval from different Sou...
New Approaches to Interactive Multimedia Content Retrieval from different Sou...New Approaches to Interactive Multimedia Content Retrieval from different Sou...
New Approaches to Interactive Multimedia Content Retrieval from different Sou...Grupo HULAT
 
Mujeres, ciencia y tecnología. Encuesta sobre la percepción de las dificultad...
Mujeres, ciencia y tecnología. Encuesta sobre la percepción de las dificultad...Mujeres, ciencia y tecnología. Encuesta sobre la percepción de las dificultad...
Mujeres, ciencia y tecnología. Encuesta sobre la percepción de las dificultad...Grupo HULAT
 
BioSEPLN 2010 Workshop on Language Technology applied to biomedical and heal...
BioSEPLN 2010 Workshop on Language Technology applied to biomedical and heal...BioSEPLN 2010 Workshop on Language Technology applied to biomedical and heal...
BioSEPLN 2010 Workshop on Language Technology applied to biomedical and heal...Grupo HULAT
 
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...Grupo HULAT
 
Accessibility to mobile interfaces for older people
Accessibility to mobile interfaces for older peopleAccessibility to mobile interfaces for older people
Accessibility to mobile interfaces for older peopleGrupo HULAT
 
Toward an integration of Web accessibility into testing processes
Toward an integration of Web accessibility into testing processesToward an integration of Web accessibility into testing processes
Toward an integration of Web accessibility into testing processesGrupo HULAT
 
Revisión de los requisitos de accesibilidad en la interacción del usuario anc...
Revisión de los requisitos de accesibilidad en la interacción del usuario anc...Revisión de los requisitos de accesibilidad en la interacción del usuario anc...
Revisión de los requisitos de accesibilidad en la interacción del usuario anc...Grupo HULAT
 
Formación y tecnologías en accesibilidad para la Universidad
Formación y tecnologías en accesibilidad para la UniversidadFormación y tecnologías en accesibilidad para la Universidad
Formación y tecnologías en accesibilidad para la UniversidadGrupo HULAT
 
Requisitos de accesibilidad web en los reproductores multimedia
Requisitos de accesibilidad web en los reproductores multimediaRequisitos de accesibilidad web en los reproductores multimedia
Requisitos de accesibilidad web en los reproductores multimediaGrupo HULAT
 
Integrating HCI in a Web accessibility engineering approach
Integrating HCI in a Web accessibility engineering approachIntegrating HCI in a Web accessibility engineering approach
Integrating HCI in a Web accessibility engineering approachGrupo HULAT
 
A MDD approach for modelling web accessibility
A MDD approach for modelling web accessibilityA MDD approach for modelling web accessibility
A MDD approach for modelling web accessibilityGrupo HULAT
 
Inclusive Usability Techniques in Requirements Analysis of Accessible Web App...
Inclusive Usability Techniques in Requirements Analysis of Accessible Web App...Inclusive Usability Techniques in Requirements Analysis of Accessible Web App...
Inclusive Usability Techniques in Requirements Analysis of Accessible Web App...Grupo HULAT
 
Adaptation Rules for Accessible Media Player Interface
Adaptation Rules for Accessible Media Player Interface Adaptation Rules for Accessible Media Player Interface
Adaptation Rules for Accessible Media Player Interface Grupo HULAT
 
DINTO An Ontology for Drug-Drug Interactions
DINTO An Ontology for Drug-Drug InteractionsDINTO An Ontology for Drug-Drug Interactions
DINTO An Ontology for Drug-Drug InteractionsGrupo HULAT
 
A Metamodelo for the integration of lexical resources in the Semantic Role La...
A Metamodelo for the integration of lexical resources in the Semantic Role La...A Metamodelo for the integration of lexical resources in the Semantic Role La...
A Metamodelo for the integration of lexical resources in the Semantic Role La...Grupo HULAT
 

More from Grupo HULAT (20)

Interaccion 2019 lourdes moreno
Interaccion 2019 lourdes morenoInteraccion 2019 lourdes moreno
Interaccion 2019 lourdes moreno
 
Low vision interaccion2018v4
Low vision interaccion2018v4Low vision interaccion2018v4
Low vision interaccion2018v4
 
Exploring language technologies to provide support to WCAG 2.0 and E2R guidel...
Exploring language technologies to provide support to WCAG 2.0 and E2R guidel...Exploring language technologies to provide support to WCAG 2.0 and E2R guidel...
Exploring language technologies to provide support to WCAG 2.0 and E2R guidel...
 
Babelfy: Entity Linking meets Word Sense Disambiguation.
Babelfy: Entity Linking meets Word Sense Disambiguation.Babelfy: Entity Linking meets Word Sense Disambiguation.
Babelfy: Entity Linking meets Word Sense Disambiguation.
 
Integration of Accessibility Requirements in the Design of Multimedia User Ag...
Integration of Accessibility Requirements in the Design of Multimedia User Ag...Integration of Accessibility Requirements in the Design of Multimedia User Ag...
Integration of Accessibility Requirements in the Design of Multimedia User Ag...
 
New Approaches to Interactive Multimedia Content Retrieval from different Sou...
New Approaches to Interactive Multimedia Content Retrieval from different Sou...New Approaches to Interactive Multimedia Content Retrieval from different Sou...
New Approaches to Interactive Multimedia Content Retrieval from different Sou...
 
Mujeres, ciencia y tecnología. Encuesta sobre la percepción de las dificultad...
Mujeres, ciencia y tecnología. Encuesta sobre la percepción de las dificultad...Mujeres, ciencia y tecnología. Encuesta sobre la percepción de las dificultad...
Mujeres, ciencia y tecnología. Encuesta sobre la percepción de las dificultad...
 
BioSEPLN 2010 Workshop on Language Technology applied to biomedical and heal...
BioSEPLN 2010 Workshop on Language Technology applied to biomedical and heal...BioSEPLN 2010 Workshop on Language Technology applied to biomedical and heal...
BioSEPLN 2010 Workshop on Language Technology applied to biomedical and heal...
 
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
Building a Graph of Names and Contextual Patterns for Named Entity Classifica...
 
Accessibility to mobile interfaces for older people
Accessibility to mobile interfaces for older peopleAccessibility to mobile interfaces for older people
Accessibility to mobile interfaces for older people
 
Toward an integration of Web accessibility into testing processes
Toward an integration of Web accessibility into testing processesToward an integration of Web accessibility into testing processes
Toward an integration of Web accessibility into testing processes
 
Revisión de los requisitos de accesibilidad en la interacción del usuario anc...
Revisión de los requisitos de accesibilidad en la interacción del usuario anc...Revisión de los requisitos de accesibilidad en la interacción del usuario anc...
Revisión de los requisitos de accesibilidad en la interacción del usuario anc...
 
Formación y tecnologías en accesibilidad para la Universidad
Formación y tecnologías en accesibilidad para la UniversidadFormación y tecnologías en accesibilidad para la Universidad
Formación y tecnologías en accesibilidad para la Universidad
 
Requisitos de accesibilidad web en los reproductores multimedia
Requisitos de accesibilidad web en los reproductores multimediaRequisitos de accesibilidad web en los reproductores multimedia
Requisitos de accesibilidad web en los reproductores multimedia
 
Integrating HCI in a Web accessibility engineering approach
Integrating HCI in a Web accessibility engineering approachIntegrating HCI in a Web accessibility engineering approach
Integrating HCI in a Web accessibility engineering approach
 
A MDD approach for modelling web accessibility
A MDD approach for modelling web accessibilityA MDD approach for modelling web accessibility
A MDD approach for modelling web accessibility
 
Inclusive Usability Techniques in Requirements Analysis of Accessible Web App...
Inclusive Usability Techniques in Requirements Analysis of Accessible Web App...Inclusive Usability Techniques in Requirements Analysis of Accessible Web App...
Inclusive Usability Techniques in Requirements Analysis of Accessible Web App...
 
Adaptation Rules for Accessible Media Player Interface
Adaptation Rules for Accessible Media Player Interface Adaptation Rules for Accessible Media Player Interface
Adaptation Rules for Accessible Media Player Interface
 
DINTO An Ontology for Drug-Drug Interactions
DINTO An Ontology for Drug-Drug InteractionsDINTO An Ontology for Drug-Drug Interactions
DINTO An Ontology for Drug-Drug Interactions
 
A Metamodelo for the integration of lexical resources in the Semantic Role La...
A Metamodelo for the integration of lexical resources in the Semantic Role La...A Metamodelo for the integration of lexical resources in the Semantic Role La...
A Metamodelo for the integration of lexical resources in the Semantic Role La...
 

Recently uploaded

Schema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdfSchema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdfLars Albertsson
 
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM TRACKING WITH GOOGLE ANALYTICS.pptx
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM  TRACKING WITH GOOGLE ANALYTICS.pptxEMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM  TRACKING WITH GOOGLE ANALYTICS.pptx
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM TRACKING WITH GOOGLE ANALYTICS.pptxthyngster
 
Dubai Call Girls Wifey O52&786472 Call Girls Dubai
Dubai Call Girls Wifey O52&786472 Call Girls DubaiDubai Call Girls Wifey O52&786472 Call Girls Dubai
Dubai Call Girls Wifey O52&786472 Call Girls Dubaihf8803863
 
Kantar AI Summit- Under Embargo till Wednesday, 24th April 2024, 4 PM, IST.pdf
Kantar AI Summit- Under Embargo till Wednesday, 24th April 2024, 4 PM, IST.pdfKantar AI Summit- Under Embargo till Wednesday, 24th April 2024, 4 PM, IST.pdf
Kantar AI Summit- Under Embargo till Wednesday, 24th April 2024, 4 PM, IST.pdfSocial Samosa
 
Brighton SEO | April 2024 | Data Storytelling
Brighton SEO | April 2024 | Data StorytellingBrighton SEO | April 2024 | Data Storytelling
Brighton SEO | April 2024 | Data StorytellingNeil Barnes
 
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...Suhani Kapoor
 
B2 Creative Industry Response Evaluation.docx
B2 Creative Industry Response Evaluation.docxB2 Creative Industry Response Evaluation.docx
B2 Creative Industry Response Evaluation.docxStephen266013
 
代办国外大学文凭《原版美国UCLA文凭证书》加州大学洛杉矶分校毕业证制作成绩单修改
代办国外大学文凭《原版美国UCLA文凭证书》加州大学洛杉矶分校毕业证制作成绩单修改代办国外大学文凭《原版美国UCLA文凭证书》加州大学洛杉矶分校毕业证制作成绩单修改
代办国外大学文凭《原版美国UCLA文凭证书》加州大学洛杉矶分校毕业证制作成绩单修改atducpo
 
Industrialised data - the key to AI success.pdf
Industrialised data - the key to AI success.pdfIndustrialised data - the key to AI success.pdf
Industrialised data - the key to AI success.pdfLars Albertsson
 
Log Analysis using OSSEC sasoasasasas.pptx
Log Analysis using OSSEC sasoasasasas.pptxLog Analysis using OSSEC sasoasasasas.pptx
Log Analysis using OSSEC sasoasasasas.pptxJohnnyPlasten
 
Building on a FAIRly Strong Foundation to Connect Academic Research to Transl...
Building on a FAIRly Strong Foundation to Connect Academic Research to Transl...Building on a FAIRly Strong Foundation to Connect Academic Research to Transl...
Building on a FAIRly Strong Foundation to Connect Academic Research to Transl...Jack DiGiovanna
 
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdfMarket Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdfRachmat Ramadhan H
 
Call Girls In Mahipalpur O9654467111 Escorts Service
Call Girls In Mahipalpur O9654467111  Escorts ServiceCall Girls In Mahipalpur O9654467111  Escorts Service
Call Girls In Mahipalpur O9654467111 Escorts ServiceSapana Sha
 
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...Suhani Kapoor
 
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130Suhani Kapoor
 
Predicting Employee Churn: A Data-Driven Approach Project Presentation
Predicting Employee Churn: A Data-Driven Approach Project PresentationPredicting Employee Churn: A Data-Driven Approach Project Presentation
Predicting Employee Churn: A Data-Driven Approach Project PresentationBoston Institute of Analytics
 
Delhi Call Girls CP 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
Delhi Call Girls CP 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip CallDelhi Call Girls CP 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
Delhi Call Girls CP 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Callshivangimorya083
 

Recently uploaded (20)

E-Commerce Order PredictionShraddha Kamble.pptx
E-Commerce Order PredictionShraddha Kamble.pptxE-Commerce Order PredictionShraddha Kamble.pptx
E-Commerce Order PredictionShraddha Kamble.pptx
 
Schema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdfSchema on read is obsolete. Welcome metaprogramming..pdf
Schema on read is obsolete. Welcome metaprogramming..pdf
 
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM TRACKING WITH GOOGLE ANALYTICS.pptx
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM  TRACKING WITH GOOGLE ANALYTICS.pptxEMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM  TRACKING WITH GOOGLE ANALYTICS.pptx
EMERCE - 2024 - AMSTERDAM - CROSS-PLATFORM TRACKING WITH GOOGLE ANALYTICS.pptx
 
Dubai Call Girls Wifey O52&786472 Call Girls Dubai
Dubai Call Girls Wifey O52&786472 Call Girls DubaiDubai Call Girls Wifey O52&786472 Call Girls Dubai
Dubai Call Girls Wifey O52&786472 Call Girls Dubai
 
Decoding Loan Approval: Predictive Modeling in Action
Decoding Loan Approval: Predictive Modeling in ActionDecoding Loan Approval: Predictive Modeling in Action
Decoding Loan Approval: Predictive Modeling in Action
 
Kantar AI Summit- Under Embargo till Wednesday, 24th April 2024, 4 PM, IST.pdf
Kantar AI Summit- Under Embargo till Wednesday, 24th April 2024, 4 PM, IST.pdfKantar AI Summit- Under Embargo till Wednesday, 24th April 2024, 4 PM, IST.pdf
Kantar AI Summit- Under Embargo till Wednesday, 24th April 2024, 4 PM, IST.pdf
 
Brighton SEO | April 2024 | Data Storytelling
Brighton SEO | April 2024 | Data StorytellingBrighton SEO | April 2024 | Data Storytelling
Brighton SEO | April 2024 | Data Storytelling
 
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
VIP High Profile Call Girls Amravati Aarushi 8250192130 Independent Escort Se...
 
B2 Creative Industry Response Evaluation.docx
B2 Creative Industry Response Evaluation.docxB2 Creative Industry Response Evaluation.docx
B2 Creative Industry Response Evaluation.docx
 
代办国外大学文凭《原版美国UCLA文凭证书》加州大学洛杉矶分校毕业证制作成绩单修改
代办国外大学文凭《原版美国UCLA文凭证书》加州大学洛杉矶分校毕业证制作成绩单修改代办国外大学文凭《原版美国UCLA文凭证书》加州大学洛杉矶分校毕业证制作成绩单修改
代办国外大学文凭《原版美国UCLA文凭证书》加州大学洛杉矶分校毕业证制作成绩单修改
 
VIP Call Girls Service Charbagh { Lucknow Call Girls Service 9548273370 } Boo...
VIP Call Girls Service Charbagh { Lucknow Call Girls Service 9548273370 } Boo...VIP Call Girls Service Charbagh { Lucknow Call Girls Service 9548273370 } Boo...
VIP Call Girls Service Charbagh { Lucknow Call Girls Service 9548273370 } Boo...
 
Industrialised data - the key to AI success.pdf
Industrialised data - the key to AI success.pdfIndustrialised data - the key to AI success.pdf
Industrialised data - the key to AI success.pdf
 
Log Analysis using OSSEC sasoasasasas.pptx
Log Analysis using OSSEC sasoasasasas.pptxLog Analysis using OSSEC sasoasasasas.pptx
Log Analysis using OSSEC sasoasasasas.pptx
 
Building on a FAIRly Strong Foundation to Connect Academic Research to Transl...
Building on a FAIRly Strong Foundation to Connect Academic Research to Transl...Building on a FAIRly Strong Foundation to Connect Academic Research to Transl...
Building on a FAIRly Strong Foundation to Connect Academic Research to Transl...
 
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdfMarket Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
Market Analysis in the 5 Largest Economic Countries in Southeast Asia.pdf
 
Call Girls In Mahipalpur O9654467111 Escorts Service
Call Girls In Mahipalpur O9654467111  Escorts ServiceCall Girls In Mahipalpur O9654467111  Escorts Service
Call Girls In Mahipalpur O9654467111 Escorts Service
 
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
VIP High Class Call Girls Jamshedpur Anushka 8250192130 Independent Escort Se...
 
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
VIP Call Girls Service Miyapur Hyderabad Call +91-8250192130
 
Predicting Employee Churn: A Data-Driven Approach Project Presentation
Predicting Employee Churn: A Data-Driven Approach Project PresentationPredicting Employee Churn: A Data-Driven Approach Project Presentation
Predicting Employee Churn: A Data-Driven Approach Project Presentation
 
Delhi Call Girls CP 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
Delhi Call Girls CP 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip CallDelhi Call Girls CP 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
Delhi Call Girls CP 9711199171 ☎✔👌✔ Whatsapp Hard And Sexy Vip Call
 

Application of Information Extraction techniques to pharmacological domain: Extracting drug-drug interactions

Editor's Notes

  1. Buenos días, señor presidente, señora secretaria, señores miembros del tribunal. Mi nombre es Isabel Segura y voy a presentar la defensa de mi tesis doctoral dirigida por la Dra. Paloma Martínez. Está tesis trata sobre la aplicación de técnicas de EI al dominio farmacológico, en particular, a la extracción de DDI.
  2. En esta presentación, comenzaré con una introducción al problema tratado en la tesis. A continuación, presentaré los principales enfoques en Extracción de Información en el dominio biomédico. Y pasaré a describir la propuesta presentada en esta tesis junto con su evaluación. Finalmente, daré las principales conclusiones y líneas de trabajo futuro.
  3. Debo comenzar explicándo que es una DDI. Una DDI ocurre cuando los efectos de un fármaco son alterados por la presencia de otro fármaco. Es decir, es una reacción entre dos o más fármacos tomados en el mismo periodo de tiempo.
  4. Algunas de estas interacciones son beneficiosas, de hecho, una practica generalizada es la combinación de dos o más fármacos para obtener fármacos más potentes, como es el caso de los antirretrovirales.
  5. Pero desgraciadamente, en muchas ocasiones, estas interacciones producen efectos adversos, llegando incluso a causar la muerte del paciente.
  6. De hecho, numerosos estudios han demostrado que las DDIs son un grave problema para la seguridad del paciente. En españa, el estudio APEAS demostró que casi la mitad de los eventos adversos son errores de medicación, de los cuales el 3.5% son DDIs. Otro estudio relevante en el área de la seguridad del paciente, Errar es humano, muestra que al año mueren 7000 pacientes debido a estos errores. Las DDIs no son eventos aislados, sino que tienen una gran incidencia, sobre todo en ciertos grupos de la población como los ancianos y enfermos polimédicados. Además, las DDI no solo afectan a la seguridad del paciente, sino que también conllevan un incremento en el gasto médico, debido a que muchos pacientes deben recibir un tratamiento paliativo o incluso permanecer más tiempo ingresados.
  7. El personal médico tiene a su disposición un gran número de bases de datos sobre interacciones, sin embargo estas BD presentan varios problemas. Uno de ellos es la inconsistencia de información, es decir, no siempre presentan la misma información sobre una determinada interaccción. Esta inconsistencia lo que provoca es que el médico no siempre sea capaz de determinar la verdadera importancia clínica de una determinada interacción. Sin embargo, el principal problema es que estas bd no están completas. ¿Por qué?. Cuando se descubre una nueva interacción, en primer lugar, es publicada en alguna revista del dominio, y pasa un tiempo hasta que las bases de datos registran esta interacción. El problema es que las bases de datos tienen periodos de actualización de hasta 3 años. Así médicos y farmacéuticos también deben revisar las publicaciones, la literatura médica para estar al día en el área de DDI.
  8. Aquí El principal problema es que El personal médico está desbordado en el manejo de la gran cantidad de información contenida en las bases de datos y en la literatura médica. Citar aquí que sólo al año 300.000 artículo son publicados en el dominio farmacológico.
  9. Así nuestra principal hipótesis es que la aplicación de técnicas de EI para el desarrollo de herramientas automáticas puede reducir notablemente el tiempo que médicos y farmacéuticos utilizar en revisar los textos médicos. Por otro lado, estas herramientas automáticas también pueden facilitar la actualización de las BD sobre interacciones.
  10. Por tanto, en esta tesis hemos abordado dos grandes retos. En primer lugar, hemos tratado la construcción del primer sistema para la extracción de interacciones farmacológicas. Ningún grupo de investigación ha dirigido este problema, lo que lo convierte en un problema interesante y atractivo, sin embargo, también nos plantea algunos retos, como por ejemplo, es la escasez de recursos para construir nuestra solución, en particular, que no existe ningún corpus anotados con este tipo de relaciones. Por este motivo, el segundo gran reto planteado en esta tesis es la construcción del primer corpus anotado con interacciones farmacológicas.
  11. Los objetivos específicos de esta tesis son: Como decía la creación del primer corpus sobre DDI. Estudiar los principales enfoque en la EI en biomedicina. Desarrollar un marco de trabajo que nos permita estudiar y combinar las distintas técnicas propuestas en esta tesis. Entre estas técnicas, esta tesis propone una seria de procesos auxiliares que son necesarios para la posterior extracción de interacciones, como es el reconocimiento de nombres de fármacos y la resolución de expresiones anafóricas que se refieren a fármacos. Además, en esta tesis hemos estudidado e integrado distintos recursos terminológicos y estandares del dominio que nos proporcionan información semántica necesaria útil para abordar nuestro problema.
  12. Centrandonos en la extracción de interacciones, en esta tesis hemos propuesto dos aproximaciones distintas, la primera basada en el uso de patrones y el tratamiento de la información sintáctica, y una seguna aproximación basada en aprendizaje automático. Por supuesto, también hemos comparado ambos enfoques para ver cuál es el que obtiene mejores resultados.
  13. No decir que es por falta de tiempo. Aunque en esta tesis hemos revisado los principales corpus en biomedicina, así como los principales enfoque en reconocimiento de entidades biomédicas y resolución de anaforas. En esta presentación, nos centraremos únicamente en la extracción de relaciones. Nosotros al igual que otros muchos autores clasificamos los trabajos en tres distintos enfoques: linguisticos, basados en patrones y basados en aprendizaje automático. Sin embargo, muchos de estos trabajos combinan varias técnicas aprovechando los beneficios de cada una de ellas, así que también podríamos hablar de enfoques híbridos.
  14. Los enfoques linguisticos utilizan analizadores sintácticos que en la mayoría de los casos son entrenados sobre textos del dominio general, siendo incapaces de abordar las peculiaridades del lenguaje biomédico, en el cual la terminología es completamente distinta, y las oraciones compuestas y complejas son muy frecuentes. Los enfoques basados en patrones consiguen buena precisión, sin embargo, obtienen una cobertura limitada debido a que los patrones no son capaces de capturar todas las posibles expresiones de una relación. Los enfoques basados en aprendizaje automático consiguen buenos resultados pero dependen de la existencia de corpus anotados.
  15. Aquí podemos distinguir dos tipos de enfoques, basados en características, en los cuales los ejemplos son representados con vectores formados por elementos con información léxica, morfosintáctica y semántica. El problema de estos enfoques es que no siempre son capaces de representar de forma óptima la información estructural de los ejemplos, por ejemplo, la información en un árbol sintáctico o de algunas representaciones secuenciales de los ejemplos. Como alternativa a este tipo de enfoques, en los últimos años han aparecido los métodos kernels. Estos métodos kernels son funciones que intentan mediar la similitud entre dos ejemplos, de esta forma, no es necesario construir una representación de los ejemplos basada en características, y los ejemplos pueden ser representados conservando su información estructural.
  16. Ojo se dice abreviaturas Solo en el mes de marzo se han aprobado más de 20 fármacos. Aspirina tiene 25 sinónimos y 95 marcas comerciales. Si nos centramos en cuestiones directamente relacionadas con el problema que tratamos en esta tesis. Decir que aunque muchos trabajos han abordado el reconocimiento de genes y proteínas, no es el caso de los fármacos. Sin embargo, su reconocimiento plantea ciertas retos no resueltos, como la constante creación y aprobación de nuevos fármacos, el problema de la sinonimia, el problema de la ambigüedad, muchas marcas comerciales utilizan nombres comunes en inglés para nombrar sus productos, por ejemplo, advantage o because que son anticonceptivos. Otro problema relacionado con la resolución de la ambigüedad, esta provocado por el abundate uso de abreviaturas. También es muy habitual el uso de expresiones anafóricas en este tipo de textos científicos.
  17. Respecto a la extracción de relaciones, volver a repetir que no existen trabajos que hayan abordado la extracción de DDI. Ni existen corpus anotados con DDI. La mayoría de los corpus en biomedicina están compuestos por abstracts, y por tanto, la mayoría de los trabajos se centran en este tipo de documentos. Además, aunque una relación puede expresarse en varias oraciones, todos los trabajos se limitan en la extracción de relaciones que ocurren en la misma oración. Por otro lado, aunque el dominio biomédico dispone de buenas ontologías, los enfoques han utilizado estas ontologías como simples diccionarios, sin aprovechar su información sobre relaciones.
  18. Respecto al tratamiento de los fenómenos linguisticos frecuentes en los texots biomédicos, como por ejemplo, las oraciones complejas y su división en clausulas, o el tratamiento de la información contenida en las frases adverbiales y preposicioness, la mayoría de los enfoques no ha abordado este tipo de problemas, y lo mismo ocurren con la modadlidad y la negación en las oraciones. También resaltar que los resultados obtenidos en la extracciónde relaciones son afectados directamente por resultados obtenidos en procesos anteriores como el recnocimiento de entidades. Finalizar, resaltando que la mayoría de los trabajos son desarrollados por ingenieros, sin contar con la ayuda de expertos del dominino. Nosotros creemos que es imprescindible crear grupos multidisciplinares, como ha sido nuestro caso, y sobre es imprescindible contar con la ayuda de expertos del dominio que nos aportan el conocimiento, y lo más importante de todo es que nos marcan cuales son sus necesidades reales.
  19. A continuación, describiré la solución que hemos propuesto en esta tesis.
  20. Empezaré describiendo la construcción del corpus.
  21. Nosotros hemos utilizado la base de datos farmacológica DrugBank, que es un recurso que de libre acceso y está online. Esta bd contiene textos que describen interacciones farmacológicas. Nosotrso desarrollamos un robot para descargar estos textos y recopilar asi una colección de documentos. Una vez que tenemos el corpus textual, hemos utilizado la herramienta MetaMap para analizar cada uno de los textos. Esta herramiento proporciona información sintáctica y semántica obtenida del sistema UMLS. UMLS es un cto de recursos, en particular, una ontología que integra un gran número de diccionarios biomédicos cubriendo distintas áreas como la biología, medicina, química, entre otras muchas. Nosotros representamos esta información proporcionada por MetaMap en el formato XML. Vamos a ver un ejemplo.
  22. Además, MMTx proporciona para cada una de las frases información semántica de UMLS como su identificador o sus tipos semánticos, por ejemplo, por ejemplo, la frasse Aspirin es clasificada con el tipo semántico sustancia farmacológica.
  23. Un.a vez que los textos estan analizados. Nosotros desarrollamos una aplicación que facilitaba la anotación manual de las interacciones en los textos. La anotación fue realizada con la ayuda de una farmacéutica, y aquí podemos ver un ejemplo, en el que han anotado las 3 interacciones presentes en la primera oración. Decir nosotros al igual que los trabajos en extracción de relaciones en el dominio biomédico, también nos hemos limitado a anotar, y posteriormente extraer, las interacciones a nivel de oración.
  24. Cuales son las principales características dl corpus DrugDDI. E lcorpus está formado por 579 documentos, casi 6000 oraciones y 3160 interacciones anotadas. Basándosno en estos datos, podemos afirmar que nuestro corpus es uno de los más grandes tanto en un número de relaciones anotadas como en número de oraciones. Por otro lado, también quiero resaltar que el número medio de oraciones por documento es de 10 oraciones. Esta cifra nos indica que nuestro tipo de texto tienen un tamaño similar al de los abstracts utilizados en otros corpus. Finalmente, si consideramos todos los posibles pares de fármacos que ocurren en la misma oración, en total tendríamos unos 30,000 pares, de los cuales son el 10% son DDI.
  25. Una vez descrito el corpus, paso a describir las principales técnicas propuestas en esta tesis para abordar la extracción de DDI
  26. Como dije dentro de los objetivos de la tesis, uno de ellos era el desarrollo de un marco de trabajo en el que combinar los distintos procesos propuestos en la tesis. En particular, en nuestra solución se combinan distintos procesos como el análisis de los textos, el reconocimiento de fármacos, la resolución de anáforas y la extracción de DDI. Voy a describir cada uno de estos procesos.
  27. En la construcción del corpus, acabamos de describir el proceso dedicado al análisis de los textos, así que no le dedicaré maś tiempo
  28. El siguiente proceso que hemos abordado en esta tesis, ha sido el reconocimiento de nombres de fármacos. Para ello hemos utilizado la herramienta MMTx que nos permite detectar no solo los fármacos sino también otros conceptos biomédicos, y también hemos usado estándares utilizados por los farmacéuticos para nombrar y clasificar nuevos fármacos.
  29. En particular, estoy hablando de estandar recomendado por la WHO. Este estandar está compusto por un conjunto de afijos. Nuestra hipótesis es que estos afijos nos permitan detectar fármacos que no están aún en UMLS, y que por tanto, no son ser por MMTx. Pero además, estos afijos van a permitir clasificar los fármacos en familias. MMTx no es capaz de distinguir entre un anágesico y un antibiotico o un antiinflamatorio. Las familias pueden ser una pista importante a la hora de detectar una interacción, ya que fármacos de la misma familia suelen presentar las mismas interacciones.
  30. Hemos realizado dos experimentos uno utilizando solo metamap y otro usando también los afijos. Como principal conclusión decir que MetaMap es un recursos robusto que obtiene altos resultados tanto en la precisión como en la cobertura. En la evaluación de estos experimentos creamos un corpus formado por 879 abstracts de Medline que contenían casi 8300 fármacos. De los cuáles la gran mayoría son detectados por MetaMap, y 181 son reconocidos únicamente gracias a los afijos. Donde verdaderamente, está la contribución de los afijos es en la clasificación en familias, consiguiendo un 75% de precision.
  31. El siguiente proceso propuesto en la tesis sería la resolución de anaforas que se refieren a fármacos.
  32. En primer lugar, voy a explicar por que es importante resolver este tipo de expresiones?. En el texto podemos ver dos oraciones, en la primrea se prsenta el fármaco levofloxación, mientras que en la segunda se describe que este fármacos puede potenciar el efecto anticoagulante de warfarin, es decir, se describe un posible DDI entre levofloxacin y warfarin. Para poder extraer esta interacción, es necesario que identificar primero la expresión anafórica this drug, y además, resolver que su antecedente es levofloxaciń.
  33. Para el estudio de la resoluciónd e anaforas en textos farmacológicos, creamo un subcorpus de DrugDDI formado por 49 doc, casi 2000 oraciones y fue anotado con por un lingüista detectando 331 anaforas. Los dos gráficos muestran su distribución según los tipos en el corpus, podemos ver que respecto a la anafora pronominal, el tipo más común es el relativo, mientras que para la anafora nominal, el más comun es el demostrativo.
  34. En esta tesis hemos propuesto 3 enfoques distintos para la resolución de la anafora, un enfoque baseline que simplemente selecciona el sintagma nominal más cercano a la anafora, Los dos enfoque han sido tradicionalmente utilizados en dominio como el biológico. El primero asigna una puntuación a cada uno de los posibles antecedentes de una anafora teniendo en cuenta información sintáctica, semántica y también la distancia entre el candidato y la anáfora. El segundo enfoque utiliza un conjunto de reglas, en concreto restricciones semánticas y sintácticas y también principios de la teoría del centering que determinan el orden de preferencia a la hora de seleccionar un antecedente.
  35. Este gráfico muestra los resultados de los tres enfoques. Podemos que el enfoque que obtiene mejores resultados es el enfoque basado en reglas. También podemos ver que en el caso de la anafora pronominal llegamos a obtener una medida-f del 90%. Así este enfoque obtiene resultados superiores al de otros enfoques en resolución de anafora en el dominio biomédico. Sin embargo, no obtenemos resultados tan buenos para la resolución nominal, ninguno de los enfoque supera el 60% de la medida F. Esto se debe a que los 3 enfoques priman la cercanía entre el antecedente y la anafora. Esto funciona para la pronominal, que son anaforas que se resuelven en contextos próximos, normalmente en la misma oración, pero no para la anafóra nominal que puede resolverse en contextos más amplios, es decir, en oraciones anteriores. Así nos planteamos la mejora de la resolución de la anafora nominal, utilizando más información semántica, en particular, las familias de los fármacos. Si por ejemplo, tenemos una anafora como &amp;apos;este análgesico&amp;apos;, entre todos sus posibles antecedentes, nos será muy útil saber cual de todo ellos es un análgesico, para tomar una decisión final.
  36. LLegamos al proces principal de la tesis, la extracción de interacciones farmacológicas en textos biomédicos.
  37. En esta tesis hemos propuesto dos aproximaciones diferentes para tratar la extracción de interacciones: el primero basado en el uso de patrones léxicos e información sintáctica, y el segundo basado en aprendizaje automático.
  38. Paso a describir la primera aproximación
  39. Nuestro experto del dominio, basándose en su experiencia profesional y en la obserrvación de los textos, propuso un conjunto de patrones léxicoos que son los más representativos a la hora de expresar las interacciones farmacológicas en el texto. En particular, propuso 12 patrones, y algunos de ellos podemos verlos en esta tabla.
  40. Antes de aplicar los patrones sobre el texto para detectar las DDI, nuestra aproximación propone la resolución de ciertas estructuras sintácticas que otros trabajos de investigación han mostrado que son muy frecuentes en el lenguaje biomédico, como son las las estructuras coordinadas y apositivas. Nuestro enfoque utiliza patrones sintácticos para reconocer este tipo de estructuras. Y la aproximación también detecta las oraciones complejas y compuestas, muy frecuentes también en la literatura biomédica, y las descomponen mediante un algorimo que recorre las oraciones buscando pistas que permiten detectar los límites de las clausulas. Una vez detectadas, también aplicamos un conjunto de reglas que nos permiten descomponer las oraciones complejas en oraciones simples, sobre las cuales, finalmente son aplicados los patroens léxicos para extraer las DDI.
  41. Vamos a ver un ejemplo que nos ayudará a entender porque es importante detectar este tipo de estructuras. En particular, nos centramos en las estructuras coordinadas. Esta oración como pueden ver contiene una coordinación de tres fármacos disintos.
  42. Nuestro enfoque en primer lugar detecta esta estructura gracias al patrón sintáctico que pueden ver a la derecha y la reemplaza con la etiqueta coord.
  43. Además, también aplicamos el proceso de reconocimiento de fármacos y etiquetamos los fármacos que ocurran en la oración.
  44. Y finalmente, un último proceso se encarga de emparejar el texto de la oración con los patrones propuestos por el experto.
  45. En nuestro caso, el patrón léxico que vemos a la derecha nos permite detectar las tres interacciones contenidas en la oración.
  46. Para evaluar esta primera aproximación, hemos realizado tres experimentos distintos. El primero azul (que sería nuestro baseline y en el que solo hemos aplicado los patrones léxicos directamente sobre los textos), consigue una precisión del 67%, que es comparable a lo que obtienen otros sistemas en el dominio biológico. Sin embargo, obtiene un recall bastante bajo, es debido principalmente, a que los patroens propuestos aunque son los más representativos, no son sufciientes para detectar todas las posibles expresiones. En el segundo experimento, detectamos las estructuras apositivas y coordinativas previo a la aplicación de patrones, y podemos que el recall aumenta, pero disminuye la precisión. El tercer experimento, incluímos también la división de las oraciones compuestas y complejas en cláusulas. Podemos ver que los resultados son bastante similares. Esto es debido principalmente a que muchas interacciones son descritas en varias clausulas y la generación de oracioens simples y el uso de patrones no trata adecuadamente este fenómeno. La división de cláusulas, es un problema de extrema dificultad que nuestro enfoque, que utiliza un procedimiento bastante simple, no es capaz de resolver de forma eficiente. Por tanto, en lo que se refiere a este enfoque tenemos que mejorar el tratamiento de estos fenómenos lingüísticos, y tenemos mucho campo por delante en el que mejorar.
  47. Paso a explicar la segunda de las aproximaciones propuesta en esta tesis para la extracción de interacciones pr
  48. En esta aproximación, hemos utilizando un enfoque basado en aprendizaje automático supervisado. En este caso, nuestro problema de extracción, se plantea como un problema de clasificación. Es decir, vamos a tener un fase de aprendizaje y una fase de evaluación. Para ello vamos a dividir el corpus en dos partes distintas para cada una de estas fases. En la fase de aprendizaje, a partir de los documentos extraemos los ejemplos positivos y negativos que nos permitiran aprender, construir un modelo, que posteriormente, nos permita clasificar los ejemplos del conjunto de evaluación.
  49. Lo primero que tenemos que hacer es generar el conjunto de ejemplos (de instancias de interacioens, es decir, relaciones), que nos ayuden a construir nuestro clasificador.
  50. Para ello, en cada oración, cada par de fármacos es considerado como un posible ejemplo. El primero ejemplo estaría formado aspirin y probenecid
  51. Y así sucesivamente iríamos formando los ejemplos de la oración
  52. Es decir, a partri de la oración, hemos generado 6 ejemplos distintos. El orden no se tiene en cuenta, es decir, nosotros consideramos que la relación es simétrica, aunque a decir verdad, en farmacología las interacciones no tienen porque ser simétricas, pero nosotros hemos decidido como priemra aproximación no abordarlo en este trabajo de tesis.
  53. Por supuesto, como nuestro corpus está etiquetado, lo que hacemos también etiquetar cada uno de los ejemplos como positivo o negativo. En este caso, las trse primeras instancias son ejemplos positivos, y las tres últimas son negativos.
  54. El conjunto total de ejemplos fue dividido en dos conjuntos: training y testing, y para el testing dedicamos el 25% de los documentos del corpus. El número total e ejemplo son 30,757, de los cuales sólo el 10% son ejemplos positivos. Así que estamos antes un problema de aprendidaje con un conjunt ode datos completametne desbalanceado, lo que por otro lado es bastante frecuente, en los problema
  55. Centrándonos ya en la técnica utilizada para construir nuestro clasificador, nosotros decidimos utilizar el método kernel propuesto por Giuliano que ha sido usado en el dominio general y en el dominio biólogico, para estudiar que resultados obtenía en el dominio farmacológico. Nuestra decisión está basada principalmente al tipo de informació nque usa este kernel: información sintáctica superficial y entidades. Basándonos en el estado del arte, parece que los kernels consiguen mejores resultados que los enfoques basados en características, aunque debo decir, que nosotros también estamos estudiando la aplicación de el enflque más clásico, aunque no lo hemos incluido en la tesis. El kernel utilizado en esta tesis, está basado en dos kernels distintos, Voy a explicar cada uno de estos kernels
  56. Bunescuy Mooney, en su momento demostraron que a la hora de detectar una relación entre dos entidades, las partes de la oración que más información aportaban era el texto antes y entre ambas entidades.
  57. El texto que ocurre entre ambas entidades, en este caso, sólo with.
  58. El texto que ocurre entre ambas y después de la segunda entidad.
  59. Pero cómo se cálcula el kernel. Recordar que el kernel es una función de similitud entre dos ejemplos. La idea principal de este kernel es contar cuantas cadenas de una determinada longitud (marcada por el parámetro n-gram) tienen en común ambos ejemplos.
  60. Nosotros hemos realizado varios experimentos modificando el valor del parámetro n-gram para el contexto global y el valor del parámetro window-size para el contexto local. Este gráfico muestra los resultados para aquellas configuraciones que obtienen mejores resultados (todas ellas consigue una medida f de 64%). Resaltar que el primer model (n=3, w=1) obtiene la precisión más alta. Este modelo nos interesará utilizarlo cuando queramos dar un mejor filtrado de la información al médico, es decir, menos falsos positivos. Sin embargo, debido a que las interacciones son un tema delicado porque afecta a la seguridad del paciente, si lo queremos asegurar es una mayor cobertura tendremos que utilizar el segundo modelo (n-gram = 1, window-size=3). De todas formas debo decir que que los resultados varían muy poco de una configuración a otra. No hemos hecho test de significación estadística.
  61. Por otro lado, también queríamos mirar la contribución particular del kernel global (verde) y del kernel local (local). Parece que el contexto global obtiene mejores resultados, tampoco con una diferencia muy marcada. Los resultados del kernel global son ligeramente inferiores a lso que obtenemos con el método shallow linguistic kernel.
  62. Como dije anteriormente, nuestro conjunto de ejemplos presenta una gran desproporcion entre número de ejemplos positivos y negativos. Para estudiar el efecto que tiene sobre el aprendizaje, hemos realizado varios experimento. En el primer gráfico (en el que se comparan tres valores), lo que hicimos fue evaluar un baseline que clasifica todos los ejemplos como positivos, y que obtiene una medida F de 19% (precision 10% y recall 100%), un segundo experimento en el que balanceamos el dataset de entrenamiento utilizando la técnica de undersampling, es decir, eliminamos aleatoriamente ejemplos negativos, y evaluamos el modelo sore el testing (que está desbalanceado) Y otros experimento en el cual entrenamos y evaluamos con los conjunstos originales, que obtiene los mejores resultados. También un experimento (marcado en la segunda gráfica de naranaj) en el cual balanceamos el conjunto inicial de ejemplos, y posteriormente creamos el conjunto de testing). En este caso el baseline, como el conjunto de testing está balanceado, obtenemos una medida F del 60%, frente a un 80% del
  63. This table shows the performance of the system The first row shows the resuls obtained using only the patterns. The patterns achieve a high precision, but a very low recall. The second row shows the results obtained using the syntactic information and the patterns. This approach achieves to improve the recall at 25%, but the precision descreses to the 49%.
  64. Como dije en la introducción de la tésis, las interacciones farmacológicas son un grave problema para la seguridad del paciente y además conllevan un incremento en el gasto médico, y por tanto, la sanidad tiene un gran interés en mejorar la detección temprana de este tipo de interacciones. Nosotros en esta tesis hemos intentado contribuir en este mejora proponiendo una solución basada en técnicas de extracción de información aplicada sobre textos biomédicos.
  65. Cuáles son las principales contribuciones de la tesis.
  66. Solo en el mes de marzo se han aprobado más de 20 fármacos. Aspirina tiene 25 sinónimos y 95 marcas comerciales. Common english words have often been used as brand names for drugs: Because, Advantage (contraceptives), Duration (spray). Abbreviations: ASA (Aspirin), ABS (Acrylonitrile Butadiene Styrene), etc.
  67. Solo en el mes de marzo se han aprobado más de 20 fármacos. Aspirina tiene 25 sinónimos y 95 marcas comerciales. Common english words have often been used as brand names for drugs: Because, Advantage (contraceptives), Duration (spray). Abbreviations: ASA (Aspirin), ABS (Acrylonitrile Butadiene Styrene), etc.
  68. Solo en el mes de marzo se han aprobado más de 20 fármacos. Aspirina tiene 25 sinónimos y 95 marcas comerciales. Common english words have often been used as brand names for drugs: Because, Advantage (contraceptives), Duration (spray). Abbreviations: ASA (Aspirin), ABS (Acrylonitrile Butadiene Styrene), etc.
  69. Solo en el mes de marzo se han aprobado más de 20 fármacos. Aspirina tiene 25 sinónimos y 95 marcas comerciales. Common english words have often been used as brand names for drugs: Because, Advantage (contraceptives), Duration (spray). Abbreviations: ASA (Aspirin), ABS (Acrylonitrile Butadiene Styrene), etc.
  70. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  71. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  72. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  73. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  74. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  75. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  76. Debo decir que este proyecto se ha desarrollado en el marco de dos proyectos de investigación: el proyecto ISSE sobre interoperabilidad semántica en el dominio de la salud y el proyecto BRAVO. También agradecer al consorcio MAVIR su apoyo durante este trabajo.
  77. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  78. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  79. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  80. Calidad del corpus: incrementando su tamaño, anotandolo por varios anotadores para medir el acuerdo entre ellos, proporcionar gaidlines para la anotación, anotar las interaciones a nivel de documento.
  81. Hello, We are talking about information extraction in the pharmacological domain. In particular, we are interestid in the automatic detection of drug-drug interactions from biomedical texts.
  82. We already have patterns. But we think that these patterns are not enough to extract the drug interactions. And that it is necessary to use syntacticinformation. Why? Because the biomedical sentences are very long. Structures /strukchors/ such as appositive or coordinations /coordineisons/ are very often in this kind of sentence. For this reason, we decided to identify this kind of structures.
  83. This table shows the performance of the system The first row shows the resuls obtained using only the patterns. The patterns achieve a high precision, but a very low recall. The second row shows the results obtained using the syntactic information and the patterns. This approach achieves to improve the recall at 25%, but the precision descreses to the 49%.
  84. The main problem is that most sentences are complex, and therefore, many interactions could span several clauses. In this sentence, the first clause means the modfication of a drug property While the second one means that this modification occurs when these drugs are taken concurrently. Our system is not able to deal with this kind of complex sentences. In addition, many times, the patterns are not enough to detect the interactions, because the these can be described in many different ways.
  85. TWell, we can see this compound sentence that has been simplified in two sentences. Then, we can apply the pattern ``drag interact with drug&amp;apos;&amp;apos;, and then, we can extract its two interactons.
  86. TWell, we can see this compound sentence that has been simplified in two sentences. Then, we can apply the pattern ``drag interact with drug&amp;apos;&amp;apos;, and then, we can extract its two interactons.
  87. Finally, for each phrase, MetaMap tries to look for a concept in the UMLS ontology. For example, for the phrase &amp;apos;Aspirin&amp;apos;. MetaMap found the UMLS concept with the identifier C0004057. MetaMap uses the UMLS semantic types to classify the phrases, for example, the phrase &amp;apos;Aspirin&amp;apos; was classified by MetaMap as a pharmacological substance and as organic chemical. These words are the abbreviations.
  88. MetaMap divide el texto en oraciones.
  89. También divide las oraciones en frases y proporciona información como su tipos sintáctico. Y también obtenemos
  90. Finally, for each phrase, MetaMap tries to look for a concept in the UMLS ontology. For example, for the phrase &amp;apos;Aspirin&amp;apos;. MetaMap found the UMLS concept with the identifier C0004057. MetaMap uses the UMLS semantic types to classify the phrases, for example, the phrase &amp;apos;Aspirin&amp;apos; was classified by MetaMap as a pharmacological substance and as organic chemical. These words are the abbreviations.
  91. We want to work in three different approaches: First, we have developed a system that uses syntactic information and pattern-matching. Currently, we are developing a system that use a kernel method for relation extraction developed by Claudio Giuliano from FBK in Trento. Third, we would like to apply a bootstrapping algorithm developed by Cesar de Pablo and Paloma Martínez. But today, we are only talking about our first approach.
  92. We want to work in three different approaches: First, we have developed a system that uses syntactic information and pattern-matching. Currently, we are developing a system that use a kernel method for relation extraction developed by Claudio Giuliano from FBK in Trento. Third, we would like to apply a bootstrapping algorithm developed by Cesar de Pablo and Paloma Martínez. But today, we are only talking about our first approach.
  93. We want to work in three different approaches: First, we have developed a system that uses syntactic information and pattern-matching. Currently, we are developing a system that use a kernel method for relation extraction developed by Claudio Giuliano from FBK in Trento. Third, we would like to apply a bootstrapping algorithm developed by Cesar de Pablo and Paloma Martínez. But today, we are only talking about our first approach.
  94. We want to work in three different approaches: First, we have developed a system that uses syntactic information and pattern-matching. Currently, we are developing a system that use a kernel method for relation extraction developed by Claudio Giuliano from FBK in Trento. Third, we would like to apply a bootstrapping algorithm developed by Cesar de Pablo and Paloma Martínez. But today, we are only talking about our first approach.
  95. This table shows the performance of the system The first row shows the resuls obtained using only the patterns. The patterns achieve a high precision, but a very low recall. The second row shows the results obtained using the syntactic information and the patterns. This approach achieves to improve the recall at 25%, but the precision descreses to the 49%.
  96. This table shows the performance of the system The first row shows the resuls obtained using only the patterns. The patterns achieve a high precision, but a very low recall. The second row shows the results obtained using the syntactic information and the patterns. This approach achieves to improve the recall at 25%, but the precision descreses to the 49%.
  97. We want to work in three different approaches: First, we have developed a system that uses syntactic information and pattern-matching. Currently, we are developing a system that use a kernel method for relation extraction developed by Claudio Giuliano from FBK in Trento. Third, we would like to apply a bootstrapping algorithm developed by Cesar de Pablo and Paloma Martínez. But today, we are only talking about our first approach.
  98. We want to work in three different approaches: First, we have developed a system that uses syntactic information and pattern-matching. Currently, we are developing a system that use a kernel method for relation extraction developed by Claudio Giuliano from FBK in Trento. Third, we would like to apply a bootstrapping algorithm developed by Cesar de Pablo and Paloma Martínez. But today, we are only talking about our first approach.
  99. DrugBank also provides pharmacological information such as its dosage forms /dosich forms/ or the list of drug interactions.
  100. This table shows the performance of the system The first row shows the resuls obtained using only the patterns. The patterns achieve a high precision, but a very low recall. The second row shows the results obtained using the syntactic information and the patterns. This approach achieves to improve the recall at 25%, but the precision descreses to the 49%.
  101. This table shows the performance of the system The first row shows the resuls obtained using only the patterns. The patterns achieve a high precision, but a very low recall. The second row shows the results obtained using the syntactic information and the patterns. This approach achieves to improve the recall at 25%, but the precision descreses to the 49%.