Deep convolution networks with caffe

Глубокие нейронные сети.
Инструментарий.
Быстрый старт
Бабий А.С. - apratster@gmail.com

Deep learning
1. Что такое deep learning.
набор алгоритмов машинного обучения, которые пытаются моделировать
высокоуровневые абстракции в данных, используя архитектуры,
состоящие из множества нелинейных трансформаций.[1]
2. Комбинирование обучения «с учителем» и «без учителя»
3. Недостатки?
4. Deep convolutional neural networks, CAFFE implementation

Deep convolutional neural networks
ConvNet configuration by Krizhevsky [2]

Наборы признаков (Features sets:)
Convolution Neural Network Architecture Model[3]
На каком этапе формируются карты признаков? Для чего?

Наборы признаков:
Карта признаков [4]
Накладываем друг на друга
но, с «коэффициентом
прозрачности»

Pooling
Пример работы pooling слоя [5]
Из нескольких соседних нейронов карты признаков выбирается максимальный
и принимается за один нейрон.

Библиотеки для работы с deep learning
http://deeplearning.net/software_links/
Caffe – deep convolutional neural network framework
http://caffe.berkeleyvision.org
ConvNetJS – JS based deep learning framework
http://cs.stanford.edu/people/karpathy/convnetjs/
DL4J - Java based deep learning framework
http://deeplearning4j.org/
Theano – CPU/GPU symbolic expression compiler in python
http://deeplearning.net/software/theano
Cuda-Convnet – A fast C++/CUDA implementation of convolutional
(or more generally, feed-forward) neural networks
http://code.google.com/p/cuda-convnet/
Torch – provides a Matlab-like environment for state-of-the-art machine
learning algorithms in lua
http://www.torch.ch/
Accord.NET - C# deep learning
http://accord-framework.net/,
tutorial:http://whoopsidaisies.hatenablog.com/entry/2014/08/19/015420

Бабий А.С. - apratster@gmail.com
CAFFE
1. GPU (CUDA) and CPU support
2. Caffe can be accelerated by NVIDIA cuDNN
3. Python and/or MATLAB wrappers
4. Config paradigm vs Coding paradigm. Command line tools.
*CPU-only Caffe:
Uncomment the CPU_ONLY := 1 flag in Makefile.config
http://caffe.berkeleyvision.org/installation.html

Работа с CAFFE
Начинать лучше с утилит командной строки:
build/tools
Наиболее доступный пример на базе MNIST – распознавания рукописных цифр
http://caffe.berkeleyvision.org/gathered/examples/mnist.html
cd $CAFFE_ROOT
./data/mnist/get_mnist.sh
./examples/mnist/create_mnist.sh
cd $CAFFE_ROOT
./examples/mnist/train_lenet.sh

В каком виде подаются входные и выходные данные?
- databases (LevelDB or LMDB)
- directly from memory
- from files on disk in HDF5
- common image formats.
http://symas.com/mdb/ http://leveldb.org/
Input data
Output data
-snapshot file with mode
-snapshot file with solver state
Solver? Yes, we can continue breacked training from snapshot

Виды слоев CAFFE
Caffe stores and communicates data in 4-dimensional arrays called blobs
name: "LogReg"
layers {
name: "mnist"
type: DATA
top: "data"
top: "label"
data_param {
source: "input_leveldb"
batch_size: 64
}
} layers {
name: "ip"
type: INNER_PRODUCT
bottom: "data"
top: "ip"
inner_product_param {
num_output: 2
}
} layers {
name: "loss"
type: SOFTMAX_LOSS
bottom: "ip"
bottom: "label"
top: "loss"
}

Виды слоев
Convolutional layer
Required field
num_output (c_o): the number of filters
kernel_size (or kernel_h and kernel_w): specifies height and width of each filter
Pooling layer
Required
kernel_size (or kernel_h and kernel_w): specifies height and width of each filter
Loss Layers, Activation / Neuron Layers, Data Layers, Common Layers
How to configure?
Ready to use models in folder: examples

Решение своей задачи
1. Заботимся о корректности, размере и покрытии выборок.
2. Компилируем Caffe с поддержкой GPU.
3. Конфигурируем сеть, отталкиваясь от примеров.
4. Тренируем, смотрим на результат тестовой выборки.
5. Если результат не устраивает- настраиваем и тренируем до получения
достаточного результата
6. Для использования натренированной сети для одиночных
Изображений необходимо написать конфиг и воспользоваться
C++, Python или Mathlab.

Литература
1. L. Deng and D. Yu, "Deep Learning: Methods and Applications“
http://research.microsoft.com/pubs/209355/DeepLearning-NowPublishing-Vol7-
SIG-039.pdf
2. ConvNet configuration by Krizhevsky et al
http://books.nips.cc/papers/files/nips25/NIPS2012_0534.pdf
3. Efficient mapping of the training of Convolutional Neural Networks to a CUDA-based
cluster http://parse.ele.tue.nl/education/cluster2
4. http://www.cs.toronto.edu/~ranzato/research/projects.html
5. http://www.amolgmahurkar.com/classifySTLusingCNN.html
Спасибо за внимание !

Deep convolution networks with caffe

Recommended

Recommended

More Related Content

Similar to Deep convolution networks with caffe

Similar to Deep convolution networks with caffe (20)

More from Andrew Babiy

More from Andrew Babiy (6)

Deep convolution networks with caffe