athena-neuroinformatics-2018

Automating annotations of the cognitive
neuroimaging literature using ATHENA
Riedel MC, Salo T, Hays J, Turner MD, Sutherland MT, Turner
JA, & Laird AR
Neuroinformatics and
Brain Connectivity Lab

Neuroimaging Research
• Increasing in volume and scope
• Embedded in this literature is knowledge capturing a system-level probing of
functional brain organization
• The challenge for cognitive neuroscience is harnessing this knowledge and
translating it into improved neurocognitive models
0
2000
4000
6000
8000
10000
12000
14000
2000 2002 2004 2006 2008 2010 2012 2014
Published Neuroimaging Studies

Cognitive Paradigm Ontology
• Knowledge modeling effort to study the relationship between
brain structure and function
• Seeks to represent stimuli, responses, and instructions that
define conditions of an fMRI experiment in a standardized
format
• System of labels for annotating neuroimaging articles

Cognitive Paradigm Ontology
Behavioral Domain
Paradigm Class
Diagnosis
Instruction
Context
Stimulus Modality
Stimulus Type
Response Modality
Response Type
Action
Cognition
Emotion
Interoception
Perception
Anger
Fear
Happiness
Sadness
n-back
Face Monitor/Discrimination
Classical conditioning
Delay discounting
Film viewing
Go/No-Go
Autism Spectrum Disorders
Bipolar Disorders
Depression
Normal
Schizophrenia
Attend
Count
Detect
Discriminate
Recall
Disease Effects
Drug Effects
Normal Mapping
Auditory
Tactile
Visual
Digits
Faces
Letters
Pictures
Shapes
Hand
None
Oral/Facial
Button Press
None
Speech

Goals
• Develop framework for automated annotations of neuroimaging articles
• Evaluate classifier performance across variable parameters:
• corpus
• feature space
• classification algorithm
• Characterize relationships between labels by assessing similar vocabularies used
for classification
Problem
• Manual annotation is time-limiting, field is too large
• Bias/human error

Classification Features
• Property or characteristic of something being measured
• Related to explanator variables in linear regression
• Examples:
• Speech recognition: noise ratios, length of sounds, relative power, filter
matches
• Spam detection: email headers, email structure, language, term frequency
• Character recognition: histogram counts of black pixels in horizontal and
vertical direction, number of internal holes, stroke detection

Background-Studies incorporating direct
comparisons across all phases of bipolar
(BP) disorder are needed to elucidate the
pathophysiology of bipolar disorder.
However functional, neuroimaging studies
that differentiate bipolar mood states from
each other and from healthy subjects are
few and have yielded inconsistent
findings.
Feature Spaces
bag-of-words
Cognitive Atlas
bipolar
bipolar disorder
disorder
bipolar
bipolar mood
bipolar mood states
mood states
mood
states
bipolar disorder
mood

Classification Procedure
neuroimaging
article
n = 2,633
Behavioral Domain
Context
Diagnosis
Instruction
Paradigm Class
Response Modality
Response Type
Stimulus Modality
Stimulus Type
abstracts-only
full-text
CogPO Labels
corpora
text extraction
bag-of-words
Cognitive Atlas
feature spaces
training/test
dataset splits
k = 5
80%/20%
feature
vectorization
and reduction
f = 1,754
parameter
tuning
k = 2
classification
Bernoulli naïve Bayes
k-nearest neighbors
logistic regression
support vector classifier
cross-validation
100 iterations

Assessing Classifier Performance
• Classifier performance evaluated using F1-score
• 𝐹1 = 2 ×
𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛×𝑟𝑒𝑐𝑎𝑙𝑙
𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛+𝑟𝑒𝑐𝑎𝑙𝑙
, 𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 =
𝑡𝑝
𝑡𝑝+𝑓𝑝
, 𝑟𝑒𝑐𝑎𝑙𝑙 =
𝑡𝑝
𝑡𝑝+𝑓𝑛
• Ranges from 0 to 1
• F1-scores averaged across labels for overall performance

Classifier Performance
F1-score

Representation of Classification Features
• bag-of-words features used to classify each label for Behavioral
Domain and Paradigm Class
• Used distributions of feature representation to calculate correlation
matrix
• Regressed co-occurrence of labels from correlation coefficients
• Performed hierarchical clustering on resulting matrix to assess
similarity of classification features between labels

ParadigmClass_Reward
BehavioralDomain_Cognition_SocialCognition
BehavioralDomain_Cognition_Memory_Explicit
BehavioralDomain_Cognition_Attention
BehavioralDomain_Perception_Vision_Shape
BehavioralDomain_Perception_Vision
BehavioralDomain_Perception_Audition
ParadigmClass_WordGeneration
BehavioralDomain_Cognition_Language_Speech
BehavioralDomain_Cognition_Language_Semantics
BehavioralDomain_Cognition_Language
ParadigmClass_Reading
BehavioralDomain_Action_Execution_Speech
BehavioralDomain_Perception
ParadigmClass_Stroop
ParadigmClass_GoNoGo
BehavioralDomain_Action_Inhibition
ParadigmClass_EmotionInduction
BehavioralDomain_Emotion_Happiness
ParadigmClass_FaceMonitorDiscrimination
BehavioralDomain_Emotion_Fear
BehavioralDomain_Emotion
ParadigmClass_SemanticMonitorDiscrimination
BehavioralDomain_Cognition_Memory_Working
ParadigmClass_PassiveViewing
ParadigmClass_nback
ParadigmClass_DelayedMatchtoSample
BehavioralDomain_Cognition_Reasoning
ParadigmClass_Encoding
ParadigmClass_CuedExplicitRecognitionRecall
BehavioralDomain_Cognition_Memory
ParadigmClass_FingerTappingButtonPress
ParadigmClass_VisuospatialAttention
BehavioralDomain_Action_Execution
BehavioralDomain_Action
BehavioralDomain_Interoception
BehavioralDomain_Cognition
BehavioralDomain_Perception_Vision_Motion
ParadigmClass_Rest
BehavioralDomain_Action_Rest
BehavioralDomain_Perception_Somesthesis
ParadigmClass_PainMonitorDiscrimination
BehavioralDomain_Perception_Somesthesis_Pain
0.10.20.30.40.50.60.70.80.9
LanguageEmotionMemoryPain

Conclusions and Future Works
• full-text, bag-of-words performed best
• Cognitive Atlas features outperform bag-of-words when only using text from abstracts
• Anatomical terms dominate features for classification when using bag-of-words
• Test on independent dataset
• Validate by replicating existing meta-analyses
• Specify Cognitive Atlas
• Integrate with existing frameworks

Acknowledgements
External Collaborators
Dr. Angela Laird
Dr. Matthew Sutherland
Dr. Michael Tobia
Dr. Veronica Del Prete
Jessica Bartley
Katherine Bottenhorn
Jessica Flannery
Ranjita Poudel
Taylor Salo
Lauren Hill
Chelsea Greaves
Rosario Pintos Lobo
Laura Ucros
Diamela Arencibia
Jennifer Foreman
Ariel Gonzalez
Neuroinformatics and Brain Connectivity Lab
Jessica Turner
Matthew Turner
Neuroinformatics and
Brain Connectivity Lab
NSF 1631325
NSF REAL DRL1420627
NSF CNS 1532061
NIH R01 DA041353
NIH U01 DA041156
NIH K01 DA037819
NIH U54 MD012393

Classifiers
• Bernoulli naïve Bayes
• Trains on binary word occurrence vectors instead of word counts
• logistic regression
• Linear model for classification
• k-nearest neighbors
• Identifies nearest k articles in distance and uses majority vote to
determine if its about a label
• support vector machine
• Creates high-dimensional decision hyper-plane

athena-neuroinformatics-2018

Recommended

Recommended

More Related Content

Similar to athena-neuroinformatics-2018

Similar to athena-neuroinformatics-2018 (20)

Recently uploaded

Recently uploaded (20)

athena-neuroinformatics-2018

Editor's Notes