Feature selection: A Data Perspective

Feature Selection: A Data
Perspective
Παρουσίαση Δημοσίευσης
Li, J., Cheng, K., Wang, S.,
Morstatter, F., Trevino, R. P.,
Tang, J., & Liu, H. (2018). Feature
Selection: A Data Perspective.
ACM Computing Surveys, 50 (6),
1–45. doi:10.1145/3136625
Γρηγόριος Δαβράζος

Περιεχόμενα Παρουσίασης
Εισαγωγή στην Επιλογή Χαρακτηριστικών (Feature Selection)
• Curse Of Dimensionality
• Παραδοσιακή Κατηγοριοποίηση Αλγορίθμων Feature Selection
• Κατηγοριοποίηση Αλγορίθμων Feature Selection από την Οπτική των Δεδομένων
Feature Selection οn Conventional Data
Feature Selection with Structured Features
Feature Selection with Heterogeneous Data
Feature Selection with Streaming Data
Evaluation, Open Problems and Summary

Curse Of Dimensionality (1)
Συνέπειες:
• Αύξηση Αναγκών Αποθήκευσης
& Χρόνου Επεξεργασίας
• Yπερπροσαρμογή Μοντέλων
(Overfitting)
• Απαίτηση για Περισσότερα
Δεδομένα
DNA
fMRI
Texts
https://www.visiondummy.com/2014/04/curse-dimensionality-affect-
classification/

Curse Of Dimensionality (2)
Cure
to
Feature Selection
Feature Extraction
Dimensionality
Reduction
Algorithms

Feature Selection
Επιλογή «Βέλτιστου» υποσυνόλου χαρακτηριστικών (features) από το
αρχικό σύνολο υψηλής διάστασης χρησιμοποιώντας συγκεκριμένα
κριτήρια

Παραδοσιακή Κατηγοριοποίηση Αλγορίθμων Feature
Selection
Label Perspective
Supervised Unsupervised
Semi-
Supervised
Selection Strategy
Perspective
Wrapper
methods
Filter
methods
Embedded
methods

Κατηγοριοποίηση Αλγορίθμων Feature Selection από την
Οπτική των Δεδομένων

Περιεχόμενα Παρουσίασης
Εισαγωγή στην Επιλογή Χαρακτηριστικών (Feature Selection)
Feature Selection οn Conventional Data
Evaluation, Open Problems and Summary

Feature Selection on Conventional Data
Conventional
Feature
Selection
Similarity based methods
Laplacian Score
SPEC
Fisher Score
Trace Ratio Criterion
ReliefF
Information theoretical
based methods
Mutual Information Maximization (Information Gain) / Mutual Information Feature
Selection
Minimum Redundancy Maximum Relevance, / Conditional Infomax Feature Extraction
Joint Mutual Information, / Conditional Mutual Information Maximization
Informative Fragments, / Interaction Capping
Double Input Symmetrical Relevance, / Fast Correlation-Based Filter
Sparse learning-based
methods
Feature Selection with Lp-Norm Regularizer
Feature Selection with Lp,q -Norm Regularizer
Efficient and Robust Feature Selection
Multi-Cluster Feature Selection
l2,1-Norm Regularized Discriminative Feature Selection
Feature Selection Using Nonnegative Spectral Analysis
Statistical based methods
Low Variance
T-Score
Chi-Square Score
Gini Index
CFS
Other methods
Hybrid Methods
Deep Learning Based Methods
Reconstruction based Methods

Similarity based methods
Similarity
based
methods
Laplacian Score
SPEC
Fisher Score
Trace Ratio Criterion
ReliefF
Πλεονεκτήματα:
• Εξαιρετική Απόδοση σε προβλήματα μάθησης
Supervised & Unsupervised,
• Ανεξάρτητες από τους Αλγόριθμους Μάθησης.
Μειονεκτήματα:
• Δεν μπορούν να διαχειριστούν
την Feature Redundancy.

Information theoretical based methods
Information
theoretical
based
methods
Mutual Information Maximization
Mutual Information Feature Selection
Minimum Redundancy Maximum Relevance
Conditional Infomax Feature Extraction
Joint Mutual Information
Conditional Mutual Information Maximization
Informative Fragments Interaction Capping
Double Input Symmetrical Relevance
Fast Correlation-Based Filter
Linear
Combination
of Shannon
terms
NonLinear
Combination
of Shannon
terms
• Ενοποιούν με πιθανοτικό τρόπο και τα δυο στοιχεία
“feature relevance” και “feature redundancy.”
• Δεν εξαρτώνται από τους Αλγόριθμους Μάθησης
• Αφορούν μόνο προβλήματα Supervised μάθησης.
• Διαχειρίζονται μόνο Διακριτά Δεδομένα

Sparse learning-based methods
Sparse learning-
based methods
Feature Selection with lp-Norm Regularizer
Feature Selection with lp,q -Norm Regularizer
Efficient and Robust Feature Selection
Multi-Cluster Feature Selection
l2,1-Norm Regularized Discriminative Feature Selection
Feature Selection Using Nonnegative Spectral Analysis
• Πολύ καλή Απόδοση σε Συγκεκριμένους
Αλγόριθμους Μάθησης
• Καλή Επεξηγηματικότητα του Μοντέλου
• Εξαρτώνται από τους Αλγόριθμους Μάθησης
• Απαιτούν την Λύση Προβλήματος
Βελτιστοποίησης Non-smooth με αυξημένο
Υπολογιστικό Κόστος

Statistical based methods
Statistical
based
methods
Low Variance
T-Score
Chi-Square Score
Gini Index
CFS
Low Variance eliminates features whose variance are below a
predefined threshold.
Αφορά προβλήματα binary classification.
Σε αντίθεση με τις προηγούμενες μεθόδους ο συγκεκριμένος
δείκτης απαιτείται να είναι πιο μικρός
• Απλές Μέθοδοι
• Μικρό Υπολογιστικό Κόστος
• Χρησιμοποιούνται σε στάδιο Preprocessing πριν από
πιο σοφιστικέ αλγορίθμους
• Δεν μπορούν να διαχειριστούν την
Feature Redundancy.
• Διαχειρίζονται μόνο Διακριτά
Δεδομένα

Other methods
Other
methods
Hybrid Methods
Deep Learning Based Methods
Reconstruction based Methods
construct a group of feature subsets from different feature selection
algorithms and then produce an aggregated result out of the group
Using deep neural networks to learn new
feature representations
feature relevance = capability of features
to approximate the original data via a
reconstruction function

Feature
Selection
with
Structured
Features
Feature Selection with
Group Feature Structures
Group Lasso
Sparse Group Lasso
Overlapping Sparse Group Lasso
Tree Feature Structures
Tree-Guided Group Lasso
Graph Feature Structures
Graph Lasso
GFLasso
GOSCAR

Feature Selection with Group Feature Structures
Feature
Selection
with Group
Feature
Structures
Group Lasso
Sparse Group Lasso
Overlapping Sparse Group Lasso
Διαφορές

Feature Selection with Tree Feature Structures
Feature Selection
with Tree Feature
Structures
Tree-Guided Group Lasso
Τhe structure over the features can be represented as a
tree with leaf nodes as features.

Feature Selection with Graph Feature Structures
Feature
Selection
with Graph
Feature
Structures
Graph Lasso
GFLasso
GOSCAR
Απαιτούν την λύση πολύπλοκων αλγορίθμων βελτιστοποίησης με υψηλό υπολογιστικό κόστος
Η δομή των feature δίνεται και δεν συνεπάγεται από τα διαθέσιμα δεδομένα

Feature Selection
with Heterogeneous
Data
Feature Selection
Algorithms with Linked
Data
Feature Selection on Networks
Feature Selection for Social Media Data (LinkedFS)
Unsupervised Feature Selection for Linked Data
Robust Unsupervised Feature Selection for
Networked Data
Multi-Source Feature
Selection
Multi-Source Feature Selection via Geometry-
Dependent Covariance Analysis (GDCOV)
Feature Selection Algorithms
with Multi-View Data
Adaptive Multi-View Feature Selection
Unsupervised Feature Selection for Multi-View
Data
Multi-View Clustering and Feature Learning via
Structured Sparsity

Feature Selection Algorithms with Linked Data
Feature
Selection
Algorithms
with Linked
Data
Feature Selection on Networks
Feature Selection for Social Media Data (LinkedFS)
Unsupervised Feature Selection for Linked Data
Robust Unsupervised Feature Selection for Networked Data

Multi-View Data / Multi-Source Feature Selection

Feature Selection Algorithms with Multi-Source / Multi-
View Data
Multi-Source
Feature Selection
Multi-Source Feature Selection via Geometry-Dependent Covariance
Analysis (GDCOV)
GPCOVspca
Feature Selection
Algorithms with
Multi-View Data
Adaptive Multi-View Feature Selection
Unsupervised Feature Selection for Multi-View Data
Multi-View Clustering and Feature Learning via Structured Sparsity
Πλεονεκτήματα
Διαχείριση διαφορετικών τύπων δεδομένων
ταυτόχρονα.
Επίλυση πολύπλοκου υπολογιστικά
προβλήματος βελτιστοποίησης
Ανοικτό Θέμα Έρευνας η Εύρεση Αποδοτικών Αλγορίθμων

Feature
Selection with
Streaming Data
Feature
Selection
Algorithms with
Feature Streams
Grafting
Alpha-Investing Algorithm
Online Streaming Feature Selection Algorithm
Unsupervised Streaming Feature Selection in Social
Media
Feature Selection
Algorithms with
Data Streams
Online Feature
Selection
Unsupervised Feature Selection on
Data Streams

Feature Selection Algorithms with Feature Streams
Feature Selection
Algorithms with
Feature Streams
Grafting
Alpha-Investing Algorithm
Online Streaming Feature Selection Algorithm
Unsupervised Streaming Feature Selection in Social Media

Feature Selection Algorithms with Data Streams
Feature Selection
Algorithms with
Data Streams
Online Feature Selection
Unsupervised Feature Selection on Data Streams

Web Site http://featureselection.asu.edu/
Interactive Graphical User Interface
for Feature Selection
Feature Selection
Repository Scikit-feature
in
Python
40 Popular Feature
Selection Algorithms
Για κάθε dataset, αξιολογούν όλους τους
εφαρμόσιμους αλγόριθμους σε αυτό

Evaluation Methods & Metrics
Supervised Methods
Διαχωρισμός dataset σε ΔΥΟ μέρη:
• training set
• test set
Οι Αλγόριθμοι Feature selection
εφαρμόζονται στο training set και μετά
ελέγχονται στο test set.
Χρησιμοποιείται η τεχνική classification
accuracy και τα μοντέλα Linear SVM,
Decision Tree, and Naïve Bayes.
Για μεγαλύτερη αξιοπιστία χρησιμοποιούν
10-fold cross-validation
Unsupervised Methods
Χρησιμοποιούνται τα εξής clustering
performance metrics
• Normalized Mutual Information
(NMI)
• Accuracy (ACC)
Εφαρμόζεται ο αλγόριθμος feature
selection algorithm και στη συνέχεια
η τεχνική k-means clustering η οποία
επαναλαμβάνεται 20 φορές

ΛίσταΑλγορίθμων

Open Problems
Scalability
Εφαρμογή των
Αλγορίθμων σε μεγάλης
κλίμακας δεδομένα
Stability
Ευαισθησία του Αλγορίθμους
σε διαταραχή στα training
data
Model Selection
Επιλογή του Βέλτιστου αριθμού
features.
Οι λύσεις μέχρι τώρα είναι Ευρετικές
Στην Unsupervised περίπτωση είναι
ακόμα πιο δύσκολα.
Ανάγκη Για Καλύτερους Αλγορίθμους

Συμπεράσματα
Η επιλογή Features είναι:
• αποτελεσματική για data preprocessing και για την μείωση της dimensionality
των data.
• βασική για εφαρμογές data-mining και machine-learning
• προάγει την δημιουργία πιο απλών και κατανοητών μοντέλων
Δημιουργία Πολλών Αλγορίθμων Επιλογής Features
Συγκεκριμένο Survey Paper

Links & Video
• Recent Advances in Feature Selection: A Data
Perspective
Perspective part 1 (Video)
Perspective part 2
Perspective part 3
• https://machinelearningmastery.com/feature-
selection-with-real-and-categorical-data/

Σας ευχαριστώ Πολύ!

Feature selection: A Data Perspective

Recommended

Recommended

More Related Content

More from Gregory Davrazos

More from Gregory Davrazos (12)

Recently uploaded

Recently uploaded (20)

Feature selection: A Data Perspective

Editor's Notes