Based on a public dataset made available by the US Gov, we created a Data Warehouse, an OLAP Cube and on top of these, we applied OLAP Analysis and four Data Mining tasks along with two Map/Reduce jobs.
2. Λίγα λόγια για το dataset
Αμερικάνικη κυβέρνηση, Bureau of Consumer Financial
Protection - CFPB
Παράπονα Αμερικανών Πολιτών
Ένα παράπονο ανεβαίνει όταν απαντάει η εταιρία ή όταν
περάσουν 15 μέρες χωρίς να έχει απαντήσει η εταιρία
11. E
• Λήψη αρχείου
T
• Μετατροπή του αρχείου σε excel από csv
• Εισαγωγή καθέτων γραμμών (στηλών)
• Διαγραφή ορισμένων στηλών
• Αλλαγή τιμών στα δύο binary πεδία
• Αλλαγή τιμών στις ημερομηνίες
• Remove Duplicates
• Change nulls to “” (με τη βοήθεια Stored Procedures)
L
• Δημιουργία δύο “στιγμιότυπων” του πίνακα DATE_S (δύο Views δηλαδή)
• Δημιουργία πίνακα temp
• Import/Export wizard SQL Server