This document presents a texture-driven approach for visible spectrum fire detection on mobile robots. It uses random forests to classify regions as fire or non-fire based on color, texture, and temporal features. The approach is evaluated on a dataset of 24 videos containing over 28,000 frames with annotated fire regions. Experimental results show the approach achieves an accuracy of 92% and an F1 score of 90%, outperforming previous methods. Texture features are found to improve performance over color features alone.
2. About
Challenges:
Clutter and scene background,
Uncontrolled fire flames can assume a variety of characteristics
Can hardly be described using any of the feature descriptors
that are widely used for object recognition.
Approach:
Color spectroscopy
Texture
Spatial information.
10/10/2016 A Texture Driven Approach for Visible Spectrum Fire Detection on Mobile Robots 2
3. A brief
overview on
the state-of-
the-art
10/10/2016 A Texture Driven Approach for Visible Spectrum Fire Detection on Mobile Robots 3
Phillips (2002)
Chen (2004)
Toreyin (2005)
Çelik (2007, 2008, 2010)
Li (2011, 2012)
Kolesov (2010)
Mueller (2013)
4. A brief
overview on
the state-of-
the-art
10/10/2016 A Texture Driven Approach for Visible Spectrum Fire Detection on Mobile Robots 4
Borges (2010)
Chenebert (2011)
5. Dataset
Videos
24 videos
28k frames (51.37% contain fire)
17k annotated regions
Creative Commons 3.0 license
Variety of fire sources
Uneven illumination
Camera movement
Different color accuracy settings
Clutter
Partial Occlusion
Motion blur
Scale and projection
Reflection
10/10/2016 A Texture Driven Approach for Visible Spectrum Fire Detection on Mobile Robots 5
6. Dataset
Annotations
Rectangle that embraces the whole fire region
Very small fire sparkles left out
One frame may present zero or many annotations
XML files
Each video file has its corresponding annotation file
Average flame area is 61512px (~250×250px square)
Fire region size/frame size = 8,92%
10/10/2016 A Texture Driven Approach for Visible Spectrum Fire Detection on Mobile Robots 6
7. Our Proposal
10/10/2016 A Texture Driven Approach for Visible Spectrum Fire Detection on Mobile Robots 7
8. Random
Forests
10/10/2016 A Texture Driven Approach for Visible Spectrum Fire Detection on Mobile Robots 8
RFs are o combination of tree classifiers
Proposed by Breiman et al. (2001)
Attributes are randomly chosen
Each tree classifies the sample independently
The final class is given by pooling
Each tree is built using 2/3 random samples of the training set
Can deal with many attributes
Are easy to understand
Have a linear complexity (after training)
Each tree can be executed in parallel
9. Results
10/10/2016 A Texture Driven Approach for Visible Spectrum Fire Detection on Mobile Robots 12
Gren – Only color
Blue – Color +Texture andTemporal
14. Thank you!
ATexture Driven Approach forVisible Spectrum Fire Detection on
Mobile Robots
CristianoSteffens@furg.br
Thanks to:
10/10/2016 A Texture Driven Approach for Visible Spectrum Fire Detection on Mobile Robots 17
Editor's Notes
Depending on the scene background, oxidizer and fuel,uncontrolled fire flames can assume a variety of characteristicsthat may not be described using any of the feature descriptorsthat are widely used for object recognition. Therefore, wepresent an alternative that relies on color spectroscopy, textureand spatial information.
The majority of the previous video based fire detections systems is designed to work with stationary videos.
Doing a survey on the research topic, we can quickly identify a pattern among the proposed solutions.
They all combine, in a cascade/sequential mode a aquisition system, a color based pixel wise classification and the pulsation patterns.
Geralmente utilizam-se câmeras fixas em torres de vigilância a partir das quais é obtido um stream de vídeo.
A primeira parte do processo é a classificação individual, pixel-a-pixel da imagem definindo regiões com a coloração de fogo.
A segunda etapa do processo varia entre os trabalhos estudados, partindo de uma abordagem que avalia apenas a variância individual de cada pixel conforme proposto em PHILLIPS (2002) até modelos baseados em fluxo óptico conforme proposto por MUELLER (2013).
Here, I highlight two applications that are similar to what we were trying to do: BORGES (2010) e CHENEBERT (2011).
BORGES creates a statistical color classification model. For the color classification, it initially applies a Gaussian filter to smooth the image. The filter size is defined according to the variance in each color component (aka channel). A thresholding, which also considers the position of the pixel in the frame is then used to separate fire from non-fire pixels.
The pixels that are classified as fire in this early step usually form regions. Borges that extracts the color, luminosity, texture (GLCM) and contour descriptors and uses a Naive Bayes classifier to decide whether a video contains fire frames or not.
Chenebert (2011)
Já o trabalho de CHENEBERT, apresentado na ICIP 2011 também se aproxima do trabalho proposto, ao tentar utilizar informações da textura para a classificação de regiões como fogo ou não fogo.
A primeira etapa consiste na classificação dos pixels individualmente utilizando uma equação proposta por Chen(2004), que utiliza thresholds fixos.
Para a classificação das regiões utiliza-se a extração de histogramas de 10 bins para os canais “Matiz” e “Saturação” do colorspace HSV resultando em 20 atributos.
Ainda para a classificação das texturas os autores utilizam GLCM, também conhecidos como descritores de Haralick, extraindo energia, entropia, contraste, homoegeniedade e correlação dos valores de pixel em H e S.
Cada região é então classificada com base nestes 30 atributos que são testados em um classificador de árvore e em uma rede neural. Os resultados obtidos mostram que o algorítmo CART é o que fornece os melhores resultados.
Os autores tentaram ainda reduzir o números de atributos, de forma a encontrar os mais discriminantes, mas os rersultados mostraram que não houve uma melhora significativa.
Quando o detector é avaliado frame a frame, pode-se avalia-lo da mesma forma que se avalia um classificador binários.
Neste caso, os frames que contém fogo são considerados como 1’s e os frames sem fogo são considerados como 0’s.
O recall, ou revocação, é a fração dos frames de fogo que foram corretamente classificados pelo detector. TPR = TP/P
A especifidade é a medida análoga ao recall, mas aplicado aos frames que não apresentam fogo. SPC = TN/N
A precisão é a métrica que mostra qual o percentual dos frames classificados como fogo pelo detector são realmente fogo. PPV = TP/ (TP+FP)
Já o valor preditivo negativo, é o equivalente à precisão para aplicada às saídas negativas do detector. NPV = TN/(TN+FN)
Já a métrica fall-out dá a razão dos falsos positivos para o total de negativos. FPR = FP/N
Enquanto estas métricas nos permitem avaliar os resultados do detector individualmente, elas não oferecem medidas combinadas.
Neste sentido, a acurácia pode ser útil ao fornecer a proporção dos frames que foram corretamente classificados. No entanto, não é uma métrica balanceada, podendo induzir ao erro, ao desconsiderar a matriz de confusão.
A métrica F1 Score, proposta por Chinchor (1992), é a média harmônica entre a precisão e o recall. Por este motivo, a F1 Score tende a punir sistemas que que apresentem um desequilíbrio entre estas medidas.
Já o coeficiente de correlação de Matheus é a correlação linear entre os resultados esperados e os resultados fornecidos pelo detector. A escala varia de -1 até 1, onde -1 representa correlação negativa, 0 é o equivalente à uma predição aleatória e 1 representa que os resultados obtidos são exatamente iguais aos esperados.
Enquanto estas métricas nos permitem avaliar os resultados do detector individualmente, elas não oferecem medidas combinadas.
Neste sentido, a acurácia pode ser útil ao fornecer a proporção dos frames que foram corretamente classificados. No entanto, não é uma métrica balanceada, podendo induzir ao erro, ao desconsiderar a matriz de confusão.
A métrica F1 Score, proposta por Chinchor (1992), é a média harmônica entre a precisão e o recall. Por este motivo, a F1 Score tende a punir sistemas que que apresentem um desequilíbrio entre estas medidas.
Já o coeficiente de correlação de Matheus é a correlação linear entre os resultados esperados e os resultados fornecidos pelo detector. A escala varia de -1 até 1, onde -1 representa correlação negativa, 0 é o equivalente à uma predição aleatória e 1 representa que os resultados obtidos são exatamente iguais aos esperados.