Garbage collection in V8 VM

Кто я такой?
• Студент факультета кибернетики КНУ им.
Шевченка.
2

Шевченка.
• Пишу на C++, Java/Scala/Kotlin(JVM) и JS(V8).
2

Шевченка.
• Люблю копаться в движках и писать фронтенд.
2

Шевченка.
• Люблю копаться в движках и писать фронтенд.
• Компиляторов, если что.
2

Вся мудрость тут

Вся мудрость тут
Все основные
алгоритмы GC
пользуют наработки
этой книги

GC в V8
• Как и во всех виртуальных машинах,
существует система управления
памятью :
5

GC в V8
памятью :
• Аллокатор.
5

GC в V8
памятью :
• Аллокатор.
• Сборщик мусора (он же GC).
5

Модель памяти в JS (V8)
6

6
• Отдельно представлены целые числа на
стеке

6
• Все остальные объекты, аллоцирующиеся в
хипе, неявно наследуются от HeapObject.

• Все объекты выровнены на 4 байта.
• Отдельно представлены целые числа на
стеке

Как устроен Heap
• New Space (aka YoungGen): Большинство
объектов живут именно здесь. Умирают тоже.
7

• Old Space (aka OldGen) : Объекты, пережившие
одну и больше фаз сборки.
7

• Old Space (aka OldGen) : Объекты, пережившие
одну и больше фаз сборки.
• Code Space: Здесь размещаются объекты кода,
содержащие инструкции JIT-компилятора. Это
единственное пространство с исполняемой
памятью.
7

Слабая гипотеза о поколениях
8

• Объекты чаще всего не переживают
следующей сборки после их рождения.
8

• Объекты чаще всего не переживают
следующей сборки после их рождения.
• Объекты чаще всего умирают
молодыми.
8

Внезапная польза
10

• Подобная гипотеза, подтвержденная частыми
наблюдениями (не только в V8), позволяет
разработчикам виртуальных машин делать
некоторые спекулятивные операции.
10

• Подобная гипотеза, подтвержденная частыми
наблюдениями (не только в V8), позволяет
разработчикам виртуальных машин делать
некоторые спекулятивные операции.
• А именно - разделять сборки в регионах хипа, и
разрабатывать разные алгоритмы для них.
10

Подходы к сборке
11

• Stop-the-world (город main-thread приложения
засыпает, GC работает, после окончания
приложение опять просыпается).
11

• Concurrent (сборщик (частями) работает
параллельно с приложением).
11

• Concurrent (сборщик (частями) работает
параллельно с приложением).
• Важно : конкурентными могут быть несколько
из фаз сборки!
11

Стратегии сборки
12

Всего существует аж 3 стратегии сборки мусора :
12

• No operations: считаем все объекты мусором, и
творим тотальный экстерминатус всем обитателям
хипа, вырубая работающую VM.
12

• Mark-Sweep/Compact: помечаем все живые объекты,
удаляем недостижимые (и делаем перемещение
живых регионов).
12

• Mark-Sweep/Compact: помечаем все живые объекты,
удаляем недостижимые (и делаем перемещение
живых регионов).
• Pointer counting: присобачиваем к каждому объекту
счетчик ссылок на него и удаляем его, когда счетчик
равен нулю.
12

Немного недоумения
13

• Вообще-то, настоящим, на мой вкус, сборщиком
мусора, является подход с подсчетом ссылок.
13

• Вообще-то, настоящим, на мой вкус, сборщиком
мусора, является подход с подсчетом ссылок.
• В Mark-* мы помечаем и перемещаем
достижимые объекты, а не мусор!
13

Сборка в YoungGen
• Два субрегиона : «From Space» и «To Space»
14

• «From Space» изначально пустой.
14

• К GC прилетел сигнал, что в «To Space»
переполнение.
14

• К GC прилетел сигнал, что в «To Space»
переполнение.
• Также существует специальный Pointer Map на
все объекты из Young Generation.
14

Scavenger, Part 1
1. To Space переполнился*,
GC начинает работу.
15

Scavenger, Part 1
1. To Space переполнился*,
GC начинает работу.
2. To Space и From Space
обмениваются своим
содержимым.
15

Scavenger, Part 2
3. Проходимся линейно по
From Space, помечаем
живые объекты.
16

Scavenger, Part 2
4. Перемещаем живые
объекты в To Space,
удаляем лишнее из From
Space.
16

Scavenger, Part 2
4. Перемещаем живые
объекты в To Space,
удаляем лишнее из From
Space.
5. To Space отдает эти
данные в OldGen.
16

Сборка в OldGen
Сборка в OldGen является классическим
алгоритмом Mark-Compact:
17

1. Сначала, начиная из rootset, проходимся по
всему графу объектов и помечаем
достижимые. (Mark*)
17

2. Чистим хип. (Sweep)
17

2. Чистим хип. (Sweep)
3. Сжимаем хип. (Compact)
17

Стадия : Mark
Алгоритм маркировки представляет собой (главным образом)
обход графа в глубину с использованием стека и трехцветной
абстракцией :
18

Стадия : Mark
• Черные - вершины с посещенными и просканированными
ссылками.
18

Стадия : Mark
ссылками.
• Серые - посещенные вершины с непросмотренными ссылками.
18

Стадия : Mark
ссылками.
• Белые - непосещенные вершины.
18

Стадия : Mark
ссылками.
• Белые - непосещенные вершины.
Используется стек указателей, а не рекурсия. (Привет,
StackOverﬂow), и им является From Space из YoungGen.
18

Incremental Mark
31
• Начинается, когда куча становится больше
некоего порогового значения, а не заполняется.

Incremental Mark
31
• Пауз становится больше, но они становятся
короче.

Incremental Mark
31
короче.
• За паузу сканируется часть хипа.

Incremental Mark
31
короче.
• За паузу сканируется часть хипа.
• Но взамен на эту всю красоту появляются
проблемы с консистентностью графа объектов.

32
Incremental Mark : трабла раз
Аллоцирование нового объекта в черном
объекте / указание ссылки на «мусорный»
объект.

33
Incremental Mark : трабла два
Удаление ссылки на черный объект.

Write Barriers уже выехали!

35
Write Barriers
• Существует специальный буфер, в который
помещаются перехваченные записи в хип.

35
Write Barriers
• Существует специальный буфер, в который
помещаются перехваченные записи в хип.
• Удаления при этом обрабатываются.  
То есть, удаленные ссылки не считаются
удаленными до конца текущей раскраски
объектов. После они спокойно удаляются.

36
Порешаем траблы
Оставляем удаленную ссылку

37
А давайте-ка покрасим родителя зеленой
ссылки в серый, и снова пройдемся по
его дочерним объектам и ссылкам.
ОПЯТЬ РАБОТАТЬ?

38
ссылки в серый, и снова пройдемся по его
дочерним объектам и ссылкам.

39

40

41
Готово!  
И да, это не настолько дорого, как Вы подумали. 
Эвристики нам в помощь :)

Стадия : Sweep
• Sweep чрезвычайно прост: он просто
выполняет линейный поиск мёртвых
объекты в каждой странице хипа, очищает
память, и передает ее в специальный
список свободной памяти.
42

• В каждой странице хранятся отдельные списки
свободной памяти для небольших регионов
(< 2^8 слов), средние регионы (< 2^11 слов),
большие регионы (< 2^14 слова) и огромные
регионы.
43

• В каждой странице хранятся отдельные списки
свободной памяти для небольших регионов
(< 2^8 слов), средние регионы (< 2^11 слов),
большие регионы (< 2^14 слова) и огромные
регионы.
• Свободные списки в основном используются
алгоритмом Scavenge для перемещения выживших
объектов в OldGen, a также используются
алгоритмом уплотнения для перемещения объектов.
43

Sweep наглядно
44
Фаза первая. Произошел GC reason. 
Хип не помаркан – маркаем.

45
Фаза вторая. Mark отработал, хип размечен.

46
Фаза третья. В каждом регионе sweeper удалил
объекты и отдал память под повторную аллокацию.

Parallel Sweep
• Так как хип размечен по регионам, выделить
N-ное количество потоков на уборку этих самых
регионов не составляет труда.
47

Parallel Sweep
• Так как хип размечен по регионам, выделить
N-ное количество потоков на уборку этих самых
регионов не составляет труда.
• Время паузы при этом заметно сокращается.
47

Стадия : Compact
• Самая сложная, на мой вкус, функция сборщика
мусора.
48

мусора.
• Главная проблема здесь - обеспечить
дефрагментацию страниц.
48

мусора.
• Главная проблема здесь - обеспечить
дефрагментацию страниц.
• Порождает N-нное количество головняка у
разработчиков GC.
48

Как справился Google?

Как справился Google?
• Google может выдохнуть, так как на самом
деле JS не является многопоточным, и большое
количество нюансов, которые надо
предусмотреть в многопоточной среде языка,
исчезают.
• Но перенос внутри VM все равно происходит в
критической секции.

Compact крупно
• Compact переносит объекты из фрагментированных
регионов (содержащих много небольших свободных
пространств) в свободные места на других регионах.
50

• Для каждого живого объекта в эвакуируемом
регионе выделяется место из списка свободной
памяти другой страницы.
50

• Для каждого живого объекта в эвакуируемом
регионе выделяется место из списка свободной
памяти другой страницы.
• Каждый объект копируется в выделенное место, а в
еще не удаленном объекте появляется так
называемый «forwarding pointer», указывающий на
настоящий объект.
50

Как Compact работает
51

51
Фаза раз : Есть фрагментированный хип.  
Сожмем?

52

52
Фаза два-с. Размечаем фрагментированные регионы.
Определяем для каждого объекта его новое место.

Compact работу закончил!
57

Compact работу закончил!
57
Готово!

Перенос объектов
58

Перенос объектов
59
Как только эвакуация завершена, V8 выполняет итерацию по
списку записанных мест указателя и обновляет их, указывая на
новые копии.

Перенос завершён!
60

После уборки
• Все объекты снова маркируются как «белые».
• GC прибирается в кэшах и деоптимизрует
отмеченные для деоптимизиации объекты.
• Отпускает паузу.
62

Выводы
• Гуглу удалось создать коллектор, который балансирует
между средним временем паузы и оверхэдом на сборку.
При этом разработчики (большинство) довольны, так как
у них не возникает с ним проблем.
• Если уж приложение и тормозит, то вам стоит
покопаться в собственном коде и посмотреть на вкладку
«Performance», и проверить, а поэтому ли тормозит?
• Если да, то попросить приложение меньше мусорить.
63

Garbage collection in V8 VM

Recommended

Recommended

More Related Content

Similar to Garbage collection in V8 VM

Similar to Garbage collection in V8 VM (20)

Garbage collection in V8 VM