SlideShare a Scribd company logo
1 of 55
Επιχειρηματική Ευφυΐα και Ανάλυση Μεγάλων
Δεδομένων
Λίγα λόγια για το dataset
Αμερικάνικη κυβέρνηση, Bureau of Consumer Financial
Protection - CFPB
Παράπονα Αμερικανών Πολιτών
Ένα παράπονο ανεβαίνει όταν απαντάει η εταιρία ή όταν
περάσουν 15 μέρες χωρίς να έχει απαντήσει η εταιρία
Επίσημη σελίδα διαχείρισης παραπόνων
Στοιχεία για το dataset
Περιεχόμενα dataset
Sub-
Issue
Issue
Sub-
Product
Company Zip CodeState
Data
Received
Date Sent
Timely
Company
Response
Product
Timely Disputed
Submitted
Via
Date
Received
Star Schema
Ενδεικτικός κώδικας υλοποίησης πινάκων
E
• Λήψη αρχείου
T
• Μετατροπή του αρχείου σε excel από csv
• Εισαγωγή καθέτων γραμμών (στηλών)
• Διαγραφή ορισμένων στηλών
• Αλλαγή τιμών στα δύο binary πεδία
• Αλλαγή τιμών στις ημερομηνίες
• Remove Duplicates
• Change nulls to “” (με τη βοήθεια Stored Procedures)
L
• Δημιουργία δύο “στιγμιότυπων” του πίνακα DATE_S (δύο Views δηλαδή)
• Δημιουργία πίνακα temp
• Import/Export wizard SQL Server
Ενδεικτικός κώδικας για Transform/Load του dataset
Ένα ακόμα παράδειγμα για το Load του dataset
Cube Deployment
Πολυδιάστατη
Ανάλυση - Tableau
Παράδειγμα σε Excel
Complaints per Year, Month and Submitted Via
Complaints by State
Complaints by State and ZIP Code
Company Response and Disputed
Complaints per Product Per Year
Companies with the most Complaints
Issue Names and Disputed
Data received and Submitted Via
Complaints per Product Name per Year, Month
Complaints per Product Name per Year, Month
Εκτέλεση ερωτήματος σε SQL Server
Εκτέλεση του ίδιου ερωτήματος σε Tableau
Εκτέλεση ενός ακόμα ερωτήματος σε SQL Server
Εκτέλεση του ίδιου ερωτήματος σε Tableau
Data Mining Tasks
Data Mining
Temp_test
Καταλληλότητα
Dataset
Decision Tree Suggest
Χρόνος
1η Περίπτωση Λειτουργίας Εξόρυξης Δεδομένων
Model Viewer
Model Viewer - Association Rules
Συμπεράσματα 1ης περίπτωσης
Στοιχεία για
την
κυβέρνηση
Βοήθεια για
τις Εταιρίες
Τι γίνεται με
την χρηματική
αποζημίωση?
1 2 3
2η Περίπτωση Λειτουργίας Εξόρυξης Δεδομένων
Model Viewer - Naïve Bayes (dependency network)
Model Viewer - Naïve Bayes
Model Viewer - Neural Networks
Συμπεράσματα 2ης περίπτωσης
Κανάλι
παραπόνου
Όγκος
παραπόνων
Κατάλληλη
προετοιμασία
1 2 3
3η Περίπτωση Λειτουργίας Εξόρυξης Δεδομένων
Model Viewer - Naïve Bayes (dependency network)
Συμπεράσματα 3ης περίπτωσης
Ποιος έχει την
ευθύνη
παραπόνων?
Τι γίνεται σε
αργοπορίες στις
πιστωτικές?
Τι γίνεται με τα
στεγαστικά
δάνεια?
1 2 3
4η Περίπτωση Λειτουργίας Εξόρυξης Δεδομένων
Συμπεράσματα 4ης περίπτωσης
Ποιος είναι ο
πιθανότερος τρόπος
υποβολής
παραπόνων ?
1
Map/Reduce Jobs
Κώδικας MapReduce
Success message
Localhost:8088
Localhost:50070
MapReduce - States
MapReduce - States
and Submitted Via
Consumer Complaints: Analyzing an US Government's dataset
Consumer Complaints: Analyzing an US Government's dataset

More Related Content

Similar to Consumer Complaints: Analyzing an US Government's dataset

Konstantinos Papadopoulos Diploma Thesis presenation
Konstantinos Papadopoulos Diploma Thesis presenationKonstantinos Papadopoulos Diploma Thesis presenation
Konstantinos Papadopoulos Diploma Thesis presenationISSEL
 
Anastasiadis manosmsc2014present
Anastasiadis manosmsc2014presentAnastasiadis manosmsc2014present
Anastasiadis manosmsc2014presentManos Anastasiadis
 
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...ISSEL
 
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...ISSEL
 
08 - Λογαριασμοί και Δικαιώματα σε Database Server
08 - Λογαριασμοί και Δικαιώματα σε Database Server08 - Λογαριασμοί και Δικαιώματα σε Database Server
08 - Λογαριασμοί και Δικαιώματα σε Database ServerFotis Kokkoras
 
C6 1 Introduction to Data Base
C6 1 Introduction to Data BaseC6 1 Introduction to Data Base
C6 1 Introduction to Data Basepapettas
 
Olympiacos MS CRM 3 Microsoft EMEA Case Study
Olympiacos MS CRM 3 Microsoft EMEA Case StudyOlympiacos MS CRM 3 Microsoft EMEA Case Study
Olympiacos MS CRM 3 Microsoft EMEA Case StudyDimitris Vayenas
 
θέματα διπλωματικών εργασιών - 2015/09
θέματα διπλωματικών εργασιών - 2015/09θέματα διπλωματικών εργασιών - 2015/09
θέματα διπλωματικών εργασιών - 2015/09Yannis Charalabidis
 
Jumbo case study - Modus AE
Jumbo case study - Modus AEJumbo case study - Modus AE
Jumbo case study - Modus AEModus AE
 
Το Azure δεν είναι χορτοφάγο! - 59ο DotNetZone Event
Το Azure δεν είναι χορτοφάγο! - 59ο DotNetZone EventΤο Azure δεν είναι χορτοφάγο! - 59ο DotNetZone Event
Το Azure δεν είναι χορτοφάγο! - 59ο DotNetZone EventPanagiotis Kanavos
 
Narlis Eystratios
Narlis EystratiosNarlis Eystratios
Narlis EystratiosISSEL
 
Dontsios Dimitris
Dontsios DimitrisDontsios Dimitris
Dontsios DimitrisISSEL
 
Cloud storage greek_municipalities
Cloud storage greek_municipalitiesCloud storage greek_municipalities
Cloud storage greek_municipalitiesNiki Kyriakou
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...ISSEL
 
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...ISSEL
 
Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...ISSEL
 
εικονικά κέντρα δεδομένων και η δημιουργία ενος εικονικού κέντρου δεδομένων
εικονικά κέντρα δεδομένων και η δημιουργία ενος εικονικού κέντρου δεδομένωνεικονικά κέντρα δεδομένων και η δημιουργία ενος εικονικού κέντρου δεδομένων
εικονικά κέντρα δεδομένων και η δημιουργία ενος εικονικού κέντρου δεδομένωνStelios Vaiou
 
Thesis.Net - Training
Thesis.Net - TrainingThesis.Net - Training
Thesis.Net - TrainingAnna Tsolakou
 

Similar to Consumer Complaints: Analyzing an US Government's dataset (20)

Konstantinos Papadopoulos Diploma Thesis presenation
Konstantinos Papadopoulos Diploma Thesis presenationKonstantinos Papadopoulos Diploma Thesis presenation
Konstantinos Papadopoulos Diploma Thesis presenation
 
NoSQL Databases
NoSQL DatabasesNoSQL Databases
NoSQL Databases
 
Anastasiadis manosmsc2014present
Anastasiadis manosmsc2014presentAnastasiadis manosmsc2014present
Anastasiadis manosmsc2014present
 
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
Εφαρμογή Τεχνικών Εξόρυξης Δεδομένων για την Εξαγωγή Προτύπων Διόρθωσης σε Σφ...
 
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
Applying Data Mining Techniques to Extract Fix Patterns for Static Analysis V...
 
08 - Λογαριασμοί και Δικαιώματα σε Database Server
08 - Λογαριασμοί και Δικαιώματα σε Database Server08 - Λογαριασμοί και Δικαιώματα σε Database Server
08 - Λογαριασμοί και Δικαιώματα σε Database Server
 
C6 1 Introduction to Data Base
C6 1 Introduction to Data BaseC6 1 Introduction to Data Base
C6 1 Introduction to Data Base
 
Olympiacos MS CRM 3 Microsoft EMEA Case Study
Olympiacos MS CRM 3 Microsoft EMEA Case StudyOlympiacos MS CRM 3 Microsoft EMEA Case Study
Olympiacos MS CRM 3 Microsoft EMEA Case Study
 
θέματα διπλωματικών εργασιών - 2015/09
θέματα διπλωματικών εργασιών - 2015/09θέματα διπλωματικών εργασιών - 2015/09
θέματα διπλωματικών εργασιών - 2015/09
 
Jumbo case study - Modus AE
Jumbo case study - Modus AEJumbo case study - Modus AE
Jumbo case study - Modus AE
 
Το Azure δεν είναι χορτοφάγο! - 59ο DotNetZone Event
Το Azure δεν είναι χορτοφάγο! - 59ο DotNetZone EventΤο Azure δεν είναι χορτοφάγο! - 59ο DotNetZone Event
Το Azure δεν είναι χορτοφάγο! - 59ο DotNetZone Event
 
Narlis Eystratios
Narlis EystratiosNarlis Eystratios
Narlis Eystratios
 
Dontsios Dimitris
Dontsios DimitrisDontsios Dimitris
Dontsios Dimitris
 
Bi Tools Study Innovatia 03122008
Bi Tools Study Innovatia 03122008Bi Tools Study Innovatia 03122008
Bi Tools Study Innovatia 03122008
 
Cloud storage greek_municipalities
Cloud storage greek_municipalitiesCloud storage greek_municipalities
Cloud storage greek_municipalities
 
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
Ανάπτυξη Εφαρµογής Προφίλ Μηχανικών Λογισµικού από ∆εδοµένα Αποθετηρίων Λογισ...
 
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
Εφαρµογή τεχνικών µηχανικής µάθησης και ευφυούς διαχείρισης πληροφορίας για τ...
 
Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...Employing Machine Learning and Intelligent Information Management Techniques ...
Employing Machine Learning and Intelligent Information Management Techniques ...
 
εικονικά κέντρα δεδομένων και η δημιουργία ενος εικονικού κέντρου δεδομένων
εικονικά κέντρα δεδομένων και η δημιουργία ενος εικονικού κέντρου δεδομένωνεικονικά κέντρα δεδομένων και η δημιουργία ενος εικονικού κέντρου δεδομένων
εικονικά κέντρα δεδομένων και η δημιουργία ενος εικονικού κέντρου δεδομένων
 
Thesis.Net - Training
Thesis.Net - TrainingThesis.Net - Training
Thesis.Net - Training
 

Consumer Complaints: Analyzing an US Government's dataset