1. Лекция 5
Бинарные деревья поиска
Курносов Михаил Георгиевич
к.т.н. доцент Кафедры вычислительных систем
Сибирский государственный университет
телекоммуникаций и информатики
http://www.mkurnosov.net/teaching
2. Структура данных “Словарь” (Dictionary)
Словарь (ассоциативный массив, associative array, map,
dictionary) – структура (контейнер) данных для хранения
пар вида “ключ – значение” (key – value)
Ключ (Key)
Значение (Value)
890
Слон
1200
Кит
260
Лев
530
Жираф
2
3. Словарь
Операция
Add(map, key, value)
Описание
Помещает в словарь map
пару (key, value)
Lookup(map, key)
Возвращает из словаря map значение
ассоциированное с ключом key
Remove(map, key)
Удаляет из словаря map значение
ассоциированное с ключом key
Min(map)
Возвращает из словаря map
минимальное значение
Max(map)
Возвращает из словаря map
максимальное значение
3
4. Реализация АТД “Словарь”
Реализации словарей отличаются вычислительной
сложностью операций добавления, поиска и удаления
элементов
Наибольшее распространение получили следующие
реализации:
1. Деревья поиска (Search trees)
2. Хэш-таблицы (Hash tables)
3. Связные списки
4. Массивы
4
5. Реализация словаря на основе массива
Операция
Неотсортированный
массив
Отсортированный
массив
Add
(map, key, value)
O(1)
(добавление в конец)
O(n)
(поиск позиции)
Lookup
(map, key)
O(n)
O(logn)
(бинарный поиск)
Remove
(map, key)
O(n)
(поиск элемента и
перенос последнего
на место удаляемого)
O(n)
(перенос элементов)
Min(map)
O(n)
O(1)
(элемент v[1])
Max(map)
O(n)
O(1)
(элемент v[n])
5
6. Реализация словаря на основе связного списка
Операция
Неотсортированный
связный список
Отсортированный
связный список
Add
(map, key, value)
O(1)
(добавление
в начало)
O(n)
(поиск позиции)
Lookup
(map, key)
O(n)
O(n)
Remove
(map, key)
O(n)
(поиск элемента)
O(n)
(перенос элементов)
Min(map)
O(n)
O(1)
O(n)
O(n) или O(1), если
поддерживать указатель
на последний элемент
Max(map)
6
7. Бинарные деревья (Binary trees)
Двоичное дерево (Binary tree) – это дерево
(структура данных), в которой каждый узел (node) имеет
не более двух дочерних узлов (child nodes)
Root node
Depth 0
Parent node
Child node
Depth 1
Depth 2
Leaf node
Depth 3
7
8. Бинарные деревья поиска (Binary search trees)
Двоичное дерево поиска (Binary search tree, BST) –
это двоичное дерево, в котором:
1) каждый узел x (node) имеет не более двух дочерних
узлов (child nodes) и содержит ключ (key) и значение
(value)
2) ключи всех узлов левого поддерева
узла x меньше значения его ключа
3) ключи всех узлов правого поддерева
узла x больше значения его ключа
Key: 530
Value: Жираф
Left
Right
8
9. Двоичные деревья поиска (Binary search trees)
Словарь
Двоичное дерево поиска
Key: 530
Ключ
(Key)
Значение
(Value)
530
Жираф
260
Лев
Key: 260
Key: 890
890
Слон
Value: Лев
Value: Слон
1200
Кит
Left
Left
Value: Жираф
Left
Right
Right
Right
Key: 1200
Value: Кит
Left
Right
9
15. Добавление элемента в BST
void bstree_add(struct bstree *tree,
int key, char *value)
{
struct bstree *parent, *node;
if (tree == NULL)
return;
/* Отыскиваем листовой узел */
for (parent = tree; tree != NULL; ) {
parent = tree;
if (key < tree->key)
tree = tree->left;
else if (key > tree->key)
tree = tree->right;
else
return;
}
15
16. Добавление элемента в BST (продолжение)
/* Создаем элемент и связываем с узлом */
node = bstree_create(key, value);
if (key < parent->key)
parent->left = node;
else
parent->right = node;
}
TAdd = O(h)
При добавлении элемента необходимо спуститься от корня
дерева до листа – это требует количества операций порядка
высоты h дерева
Поиск листа – O(h), создание элемента и корректировка
указателей – O(1)
16
17. Поиск элемента в BST
1. Сравниваем ключ корневого
узла с искомым. Если совпали,
то элемент найден
2. Переходим к левому или
правому дочернему узлу и
повторяем шаг 1
180
Тигр
15
200
Барсук
Лев
60
Волк
Возможны рекурсивная и не рекурсивная реализации
17
18. Поиск элемента в BST
struct bstree *bstree_lookup(struct bstree *tree,
int key)
{
while (tree != NULL) {
if (key == tree->key) {
return tree;
} else if (key < tree->key) {
tree = tree->left;
} else {
tree = tree->right;
}
}
return tree;
TLookup = O(h)
}
18
19. Поиск минимального элемента в BST
Минимальный элемент всегда
расположен в левом поддереве
корневого узла
Требуется найти самого левого
потомка корневого узла
180
Тигр
15
200
Барсук
Лев
60
Волк
19
20. Поиск минимального элемента в BST
struct bstree *bstree_min(struct bstree *tree)
{
if (tree == NULL)
return NULL;
while (tree->left != NULL)
tree = tree->left;
return tree;
}
TMin = O(h)
20
21. Поиск максимального элемента в BST
Максимальный элемент всегда
расположен в правом поддереве
корневого узла
Требуется найти самого правого
потомка корневого узла
180
Тигр
15
200
Барсук
Лев
60
Волк
21
22. Поиск максимального элемента в BST
struct bstree *bstree_max(struct bstree *tree)
{
if (tree == NULL)
return NULL;
while (tree->right != NULL)
tree = tree->right;
return tree;
}
TMax = O(h)
22
23. Пример
int main()
{
struct bstree *tree, *node;
tree = bstree_create(180, "Tigr");
bstree_add(tree, 200, "Lev");
bstree_add(tree, 60, "Volk");
node = bstree_lookup(tree, 200);
printf(“Value = %sn", node->value);
node = bstree_min(tree);
printf("Min: value = %sn", node->value);
return 0;
}
23
24. Удаление элемента из BST
180
1. Находим узел z с заданным
ключом – O(n)
Тигр
2. Возможны 3 ситуации:
o узел z не имеет дочерних узлов
15
200
Барсук
Лев
o узел z имеет 1 дочерний узел
o узел z имеет 2 дочерних узла
10
60
Заяц
Волк
90
Кабан
24
25. Удаление элемента из BST
180
Удаление узла “Лев” (случай 1)
Тигр
1. Находим и удаляем узел “Лев”
из памяти (free)
15
2. Родительский указатель
(left или right) устанавливаем
в зачение NULL
“Тигр”->right = NULL
200
Барсук
Лев
10
60
Заяц
Волк
90
Кабан
25
26. Удаление элемента из BST
180
Удаление узла “Волк” (случай 2)
Тигр
1. Находим узел “Волк”
2. Родительский указатель
узла “Волк” (left или right)
устанавливаем на его дочерний
элемент
3. Удаляем узле “Волк” из памяти
“Барсук”->right = “Волк”->right
15
200
Барсук
Лев
10
60
Заяц
Волк
90
Кабан
26
27. Удаление элемента из BST
180
Удаление узла “Барсук” (случай 3)
Тигр
1. Находим узел “Барсук”
2. Находим узел с минимальным
ключом в правом поддереве
узла “Барсук” – самый
левый лист в поддереве
(узел “Рысь”)
15
200
Барсук
Лев
10
60
Заяц
Волк
90
45
Кабан
Рысь
3. Заменяем узел “Барсук”
узлом “Рысь”
55
70
150
Кабарга
Тапир
Марал
27
29. Анализ эффективность BST
1. Операции имеют трудоемкость
пропорциональную высоте h дерева
1
Value
2. В худшем случае высота дерева O(n)
(вставка элементов в отсортированной
последовательности)
NULL
2
Value
3. В среднем случае высота дерева O(logn)
NULL
3
Value
NULL
bstree_add(tree,
bstree_add(tree,
bstree_add(tree,
bstree_add(tree,
“Item”,
“Item”,
“Item”,
“Item”,
1);
2);
3);
4);
4
Value
Дерево вырождается
в связный список
29
30. Реализация словаря на основе BST
Операция
Средний случай
(average case)
Худший случай
(worst case)
Add
(map, key, value)
O(logn)
O(n)
Lookup
(map, key)
O(logn)
O(n)
Remove
(map, key)
O(logn)
O(n)
Min(map)
O(logn)
O(n)
Max(map)
O(logn)
O(n)
30
31. Сбалансированные деревья поиска
Сбалансированное по высоте дерево поиска
(self-balancing binary search tree) – дерево поиска,
в котором высоты поддеревьев узла различаются не более
чем на заданную константу k
Баланс высоты поддерживается при выполнении операций
добавления и удаления элементов
Типы сбалансированных деревьев поиска:
Красно-черные деревья (Red-black tree): ℎ ≤ 2 log 2 (𝑛 + 1)
АВЛ-деревья (AVL-tree): ℎ ≤ 1.44 ∙ log 2 𝑛;
B-деревья
Деревья Ван Эмде Боаса
…
Все операции на красно-черном дереве в худшем случае
выполняются за время O(logn)
31
32. Домашнее чтение
Прочитать в “практике программирования”
[KR, С. 67] “2.8 Деревья”
Прочитать в [CLRS, С. 325] раздел об удалении узла
из бинарного дерева поиска
32