SQLServer dla Programistów

WWW.HIGHWHEELSOFTWARE.COM 1
© High Wheel Software All rights reserved
RDBMS dla programistów
Przemysław Dzierżak

O prowadzącym
• Programista .NET od 2005 roku
• Architekt hurtowni danych (Microsoft SQL Server)
• Współwłaściciel
• Miłośnik:
• Automatyzacji
• Czytelnego kodu
• LEAN Software Development / Agile

Agenda
• Tabele
• Indeksy
• Partycje
• Statystyki
• Utrzymanie bazy danych (maintenance)

Tabele

Nośnik danych
• Dane na dysku
• Zapis / odczyt stronami (page) – 8kB
• Typy stron:
• dane,
• indeksy,
• ‚blob’ – dane binarne, długie teksty,
• (oraz różne techniczne)
Plik
Grupa
plików
Baza
Pole Wiersz Strona Partycja
Obiekt
BD
Baza

Dwa ułożenia danych
Sterta (Heap)
LinkedList<Row>
ICollection<Row>
B-drzewo
SortedDictionary<Key,LinkedList<Row>>
IDictionary<Key,ICollection<Row>>
http://guide.couchdb.org/draft/btree.html

Dwa ułożenia danych (2)
Sterta
+ Brak narzutu, prostota
+ Zrównoleglenie operacji
- Wyszukanie elementu O(n)
B-drzewo
http://guide.couchdb.org/draft/btree.html
+Wyszukanie po kluczu O(log n)
- Ograniczone zrównoleglenie
- Dodatkowe strony

Ograniczenie wydajności zapisu B-drzewa
B-drzewo, klucz = Primary Key (identity)

Indeksy

Czym jest indeks?
Indeks to B-drzewo ☺
• Klastrowany (clustered)
• główna struktura przechowywania danych jest B-drzewem
• Nieklastrowany (nonclustered)
• dodatkowa struktura obok głównej sterty / B-drzewa
• zawiera kopię części danych

Tabelka – przykład C#
CREATE TABLE Customers (
nr int not null,
name nvarchar(50),
country nvarchar(50)
);
public class Customer {
public int nr;
public string name;
public string country;
}
public interface CustomersTable {
ICollection<Customer> Data { get; }
}

Indeksy – NONCLUSTERED i sterta
nr int not null,
name nvarchar(50),
);
CREATE NONCLUSTERED INDEX ByCountry
ON Customers (Country);
public int nr;
public string name;
}
ICollection<Customer> Data { get; }
IDictionary<string,ICollection<int>>
ByCountry { get; }
}

Indeksy - CLUSTERED
nr int not null,
name nvarchar(50),
);
CREATE CLUSTERED INDEX Data
ON Customers (name);
public int nr;
public string name;
}
IDictionary<string, ICollection<Customer>>
Data { get; }
}

Indeksy – CLUSTERED + NONCLUSTERED
nr int not null,
name nvarchar(50),
);
CREATE CLUSTERED INDEX Data
ON Customers (name);
CREATE NONCLUSTERED
INDEX ByCountry
ON Customers (Country);
public int nr;
public string name;
}
IDictionary<string, ICollection<Customer>>
Data { get; }
IDictionary<string, ICollection<string>>
ByCountry { get; }
}
* W zasadzie Tuple<string,RowId> chyba że
UNIQUE(name)

Indeksy – PRIMARY KEY
CREATE TABLE Customer (
nr int not null IDENTITY(1,1) PRIMARY KEY,
name nvarchar(50),
);
 Niejawna deklaracja CLUSTERED INDEX (nr)
 PRIMARY KEY NONCLUSTERED
niejawne: NONCLUSTERED INDEX (nr)

Sterta vs B-Drzewo - dogrywka
• CLUSTERED INDEX
• Wszystkie inne indeksy odwołują się do klucza tego indeksu
• min. 1 odczyt więcej
• Przenoszenie rekordu – bez zmiany indeksów nieklastrowanych
• Sterta
• Indeksy odwołują się do położenia rekordu
• odczyt od razu danych
• Przenoszenie rekordu – zmiana w indeksach

Partycje

Partycje w C#
• Tabela bez partycji – ICollection<Row>
• Tabela partycjonowana:
• IDictionary<PartitionId, ICollection<Row>>
• // partitionId = Func( row.PartitionKey )

Partycje cechy
• Dane fizycznie w wielu tabelach o tej samej strukturze,
logicznie połączone w jedną kolekcję
• Partition1.Concat(Partition2).Concat(Partition3)…
• Partycje można niezależnie:
• Podmienić / dodać / usunąć
• Umieszczać w różnych plikach (wydajność/koszt/backup)
• Kompresować
• Utrzymywać (działania administracyjne)
• Każdy obiekt można partycjonować inaczej

Statystyki

Statystyki
[DEMO]

Utrzymanie (maintenance)

Kompresja
• Procesory się nudzą
• Mogą kompresować dane
• Ucieszy adminów,
• Może przyspieszyć działanie.
• Kompresja
• per wiersz
• per strona
• BTW: kompresja backupu

Utrzymanie obiektów bazodanowych
• Sterty – tylko w skrajnych przypadkach
• B-drzewa:
• Równoważenie – REORGANIZE (fragmentacja 5-30%)
• Przebudowa – REBUILD (fragmentacja > 30%)
• Brak automatu w SQL Server!
• Statystyki
• Przeliczanie
• Automat – 20% zmian
• SQL Server 2016 lub trace flag – malejący %
• [Demo]

Podsumowanie - złożoność „tabeli” MSSQL
• 1 tabela – wiele struktur
• Dane, indeksy, statystyki (…)
• Nowy indeks =
• Szybszy odczyt (wybrane zapytania)
• Wolniejszy zapis
• Więcej zajętego miejsca
• Struktury żyją długo – wymagają opieki

Zapraszamy do kontaktu
ul. Al. Zwycięstwa 96/98, 81-451 Gdynia
www.highwheelsoftware.com
przemyslaw.dzierzak@highwheelsoftware.com

SQLServer dla Programistów

Recommended

Recommended

More Related Content

Similar to SQLServer dla Programistów

Similar to SQLServer dla Programistów (20)

SQLServer dla Programistów