Temat obejmuje wybrane aspekty zasilania hurtowni danych za pomocą SSIS (SQL Server Integration Services).
I choć na pewno nie omawia wszystkiego to pozwala zwrócić uwagę na kilka istotnych szczegółów mogących
zadecydować o czasochłonności, a więc koszcie, a więc terminowości i w rezultacie sukcesie projektu zasilania hurtowni danych.
Prezentacja po raz pierwszy została przedstawiona na 45. spotkaniu wrocławskiej grupy PLSSUG - 23 października 2014r.
2. Kamil Nowiński
• Konsultant, freelancer SQL Server
• Obecnie jako architekt w projekcie hurtowni danych
„Ari@dna2” programu e-Cło dla Ministerstwa Finansów
• Programista > 20 lat (VB6, VB.NET, C#, .NET Framework)
• Ponad 10-letnie doświadczenie w SQL Server (DEV/DBA)
• Bazy danych: Microsoft SQL 2000 – 2012+
• Członek komisji rewizyjnej Stowarzyszenia PLSSUG,
• Współorganizator konferencji SQLDay
• Certyfikaty SQL Server: MCITP, MCP, MCTS, MCSA, MCSE
• Zainteresowania:
• Optymalizacja baz danych, Hurtownie danych, SSIS
• Fotografia cyfrowa (Nikon D-90, Adobe Lightroom)
3. Agenda
Źródła zasileń hurtowni danych
Częstotliwość zasilania hurtowni
Sposoby zasilania hurtowni
Demo
Więzy integralności w hurtowni
4. Nie powiem o…
Projektowaniu hurtowni
SCD (Slowly Changing Dimension)
Przechwytywaniu zdarzeń
Checkpoint
…tym co Roman w listopadzie ;)
Dlaczego?
Bo to nie 8-godzinny warsztat SQLDay!
5. Źródła zasileń hurtowni danych
• Systemy bazodanowe (operacyjne)
– Microsoft SQL Server
– Oracle
– PostgreSQL
– SyBase
– DB2
– …
• Pliki płaskie
– CSV
– Excel
• Bazy Microsoft Access
• Pliki XML
• WebServices
10. Więzy integralności w hurtowni
• Dobra, jedna tabela została zasilona – co z pozostałymi?
• Pytanie: czy istotna jest kolejność zasilania?
• Odpowiedź brzmi: to zależy
– Nie, gdy zasilamy „Staging”
– Tak*, gdy zasilamy hurtownię (bazę docelową)
• Od czego zależy kolejność?
– CONSTRAINTS typu FOREIGN KEY