Дипломная_Презентация_TensрачмorFlow.pptx

Проектирование и
обучение нейронной сети
для генерации с
использованием TensorFlow
ДИПЛОМНЫЙ ПРОЕКТ
СВИТНЕВ А.С.
РУКОВОДИТЕЛЬ: ЛАДЫГИН Н.С.
Мокшан 2025

Введение
С момента своего появления искусственные
нейронные сети (ИНС) используются для решения
различных прикладных задач. ИНС успешно
применяются в распознавании образов,
прогнозировании, выявлении зависимостей,
сжатии данных, управлении и других. У
нейронных сетей большой потенциал благодаря
их нелинейности, что делает их более выгодными,
нежели обычные программы.

Цель и задачи проекта
Цель:
Разработка и обучение нейронной сети для
генерации изображений с использованием
TensorFlow, включая проектирование архитектуры и
настройку обучения.
– Анализ методов и архитектур генеративных
нейронных сетей с акцентом на TensorFlow.
– Проектирование и реализация архитектуры
нейронной сети для генерации изображений.
– Реализация процесса обучения модели и
подготовка данных.
– Оценка качества генерируемых изображений с
использованием стандартных метрик.

Понятие нейрона
Искусственный нейрон – математическая модель
биологического нейрона, выполняющая функции
сумматора. На вход поступают данные X1...Xn,
которые преобразуются весами w1...wn,
суммируются и проходят через функцию
активации F(u).

Виды нейронных сетей
Основные типы ИНС:
– Сети прямого распространения и персептроны
– Сеть Хопфилда
– Машина Больцмана
– Свёрточные нейронные сети (CNN)
– Рекуррентные нейронные сети (RNN)
– Сети Кохонена (SOM)

Методы обучения
нейронных сетей
Алгоритмы обучения:
– Обучение с учителем
– Обучение без учителя
– Параметрическое обучение
– Непараметрическое обучение

Архитектуры
генеративных моделей
Основные семейства генеративных моделей:
– Автокодировщики (Autoencoders)
– Вариационные автокодировщики (VAE)
– Генеративно-состязательные сети (GAN)
– VQ-VAE и VQGAN

Обзор TensorFlow
TensorFlow — платформа для машинного
обучения от Google. Обеспечивает
высокоуровневый API Keras и низкоуровневое
управление вычислениями, поддерживает eager и
graph режимы, автоматическое
дифференцирование, распределённое
обучение и TensorBoard.

Подход к выбору
архитектуры
 Для генерации изображений выбрана модель
VQGAN, обеспечивающая лучшее сочетание
FID и SSIM за счёт дискретного латентного
пространства и состязательного обучения,
несмотря на повышенные вычислительные
затраты.

Архитектура VQGAN
Компоненты VQGAN:
1. Энкодер: извлечение признаков
2. Квантайзер: дискретизация признаков
3. Декодер: восстановление изображения
4. Дискриминатор: оценка реалистичности

Использование GAN
Генератор (декодер) создаёт изображения,
дискриминатор отличает реальные и
синтетические. Состязательная потеря улучшает
фотореализм и текстуру, снижая эффект
размытия.

Функции потерь и
метрики
Функции потерь:
– Reconstruction (MSE)
– VQ loss и commitment loss
– Adversarial loss
Метрики качества:
– SSIM
– FID

Общий алгоритм
обучения
 1. Предобучение автоэнкодера
 2. Подключение дискриминатора
 3. Попеременное обновление генератора и
дискриминатора
 4. Мониторинг FID и сохранение лучшей
модели

Заключение
Использование VQGAN на базе TensorFlow
позволило разработать модель генерации
изображений с высоким качеством
реконструкции и реалистичностью,
подтверждаемой метриками SSIM и FID.

Список литературы
 Основные источники:
 – Goodfellow I. et al. Generative Adversarial
Networks. 2014.
 – Kingma D., Welling M. Auto-Encoding Variational
Bayes. 2013.
 – Oord A. v. d. et al. Neural Discrete Representation
Learning. 2017.

Дипломная_Презентация_TensрачмorFlow.pptx

More Related Content

Similar to Дипломная_Презентация_TensрачмorFlow.pptx

Дипломная_Презентация_TensрачмorFlow.pptx