Unconstrained Dataset Non-stationary Video Fire Detection

•Download as PPTX, PDF•

0 likes•393 views

Cristiano Rafael Steffens

Presented on the 12th Latin American Robotics Symposium - Uberlândia - MG - Brazil

Science

An Unconstrained Dataset for
Non-stationary Video Based Fire
Detection
Cristiano Rafael Steffens, Ricardo Nagel Rodrigues and Silvia Silva da Costa Botelho
Latin American Robotics Symposium (LARS)
Federal University of Rio Grande – FURG
Computational Sciences Center – C3
October 2015

Motivation I
“Proprietary ground truth data is a barrier to independent
evaluation of metrics and algorithms”
Krig, 2014

Motivation II
First publicaly available non-stationary dataset
First publicaly available dataset that is annotated

About
Source: TheBackyardScientist at https://youtu.be/FvLfDpTONNk

A brief overview on the state-of-the-art
 Phillips (2002)
 Chen (2004)
 Toreyin (2005)
 Çelik (2007, 2008, 2010)
 Li (2011, 2012)
 Kolesov (2010)
 Mueller (2013)

A brief overview on the state-of-the-art
 Borges (2010)
 Chenebert (2011)

Our contribution
• An algorithm to find correspondences between a fire
detector output and the annotated fire regions;
• Two separated rigorous and precise methods for evaluating
any algorithms performance on the proposed
dataset.
o Fire location;
o Frame-by-frame classification;
• C++ source code that implements these procedures.

About the Videos
• 24 videos
• 28k frames (51.37% contain fire)
• 17k annotated regions
• Creative Commons 3.0 license

About the Videos
• Variety of fire sources
• Uneven illumination
• Camera movement
• Different color accuracy settings
• Clutter
• Partial Occlusion
• Motion blur
• Scale and projection
• Reflection

About the Annotations
• Rectangle that embraces the whole fire region
• Very small fire sparkles left out
• A fire-frame may present one or more annotations
• XML files
(each video file has its corresponding annotation file)
• Average flame area is 61512px
(aprox. 250×250px square)
• Fire region size/frame size = 8,92%

Frame-by-frame metrics
• Recall
• Specificity
• Precision
• Negative Predictive Value
• Fall-out

Frame-by-frame metrics
• False Discovery rate
• False Negative rate
• Accuracy
• F1 Score
• Matthews Correlation Coeficient

Location-based metrics
• Considers 1-N relations;
• Metrics:
o Precision
o Recall
o Mean Similarity

Frame by frame results
Metrics Çelik (2010) Zhou (2010) Chenebert (2011)
TPR 0.739 0.987 0.990
SPC 0.317 0.022 0.724
PPV 0.654 0.638 0.857
NPV 0.410 0.501 0.979
FPR 0.682 0.977 0.275
FDR 0.345 0.361 0.142
FNR 0.260 0.012 0.009
ACC 0.585 0.635 0.890
F1 Score 0.694 0.775 0.919
MCC 0.060 0.036 0.773

Location Based Results
Metrics Çelik (2010) Zhou (2010) Chenebert (2011)
PPV 0.251 0.019 0.832
TPR 0.732 0.440 0.979
F1 Score 0.384 0.037 0.902
S 0.250 0.020 0.801

What's hot

Open Backscatter Toolchain (OpenBST) Project - A Community-vetted Workflow fo...Giuseppe Masetti

AI and Deep Learning for On-Board Satellite Image Analysis, OW2con'19, June 1...OW2

MediaEval 2015 - CERTH at MediaEval 2015 Synchronization of Multi-User Event ...multimediaeval

Data analysis for effective monitoring of partially shaded residential PV systemSandia National Laboratories: Energy & Climate: Renewables

MediaEval 2015 - JRS at Synchronization of Multi-user Event Media Taskmultimediaeval

NASA's Movement Towards Cloud ComputingSoftware & Information Industry Association

MediaEval 2015 - Synchronization of Multi-User Event Media at MediaEval 2015:...multimediaeval

15 sengupta next_generation_satellite_modellingSandia National Laboratories: Energy & Climate: Renewables

Mask R-CNNJaehyun Jun

Combining remote sensing earth observations and in situ networks: detection o...Integrated Carbon Observation System (ICOS)

What's hot (10)

Open Backscatter Toolchain (OpenBST) Project - A Community-vetted Workflow fo...

AI and Deep Learning for On-Board Satellite Image Analysis, OW2con'19, June 1...

MediaEval 2015 - CERTH at MediaEval 2015 Synchronization of Multi-User Event ...

Data analysis for effective monitoring of partially shaded residential PV system

MediaEval 2015 - JRS at Synchronization of Multi-user Event Media Task

NASA's Movement Towards Cloud Computing

MediaEval 2015 - Synchronization of Multi-User Event Media at MediaEval 2015:...

15 sengupta next_generation_satellite_modelling

Mask R-CNN

Combining remote sensing earth observations and in situ networks: detection o...

Recently uploaded (20)

Spermiogenesis or Spermateleosis or metamorphosis of spermatid

Chromatin Structure | EUCHROMATIN | HETEROCHROMATIN

GBSN - Microbiology (Unit 1)

Unlocking the Potential: Deep dive into ocean of Ceramic Magnets.pptx

9953056974 Young Call Girls In Mahavir enclave Indian Quality Escort service

Hire 💕 9907093804 Hooghly Call Girls Service Call Girls Agency

Natural Polymer Based Nanomaterials

Chemistry 4th semester series (krishna).pdf

Botany krishna series 2nd semester Only Mcq type questions

Zoology 4th semester series (krishna).pdf

PossibleEoarcheanRecordsoftheGeomagneticFieldPreservedintheIsuaSupracrustalBe...

Recombinant DNA technology (Immunological screening)

GBSN - Biochemistry (Unit 1)

Traditional Agroforestry System in India- Shifting Cultivation, Taungya, Home...

Animal Communication- Auditory and Visual.pptx

GBSN - Microbiology (Unit 2)

Cultivation of KODO MILLET . made by Ghanshyam pptx

Raman spectroscopy.pptx M Pharm, M Sc, Advanced Spectral Analysis

Disentangling the origin of chemical differences using GHOST

Botany 4th semester series (krishna).pdf

Unconstrained Dataset Non-stationary Video Fire Detection

1. An Unconstrained Dataset for Non-stationary Video Based Fire Detection Cristiano Rafael Steffens, Ricardo Nagel Rodrigues and Silvia Silva da Costa Botelho Latin American Robotics Symposium (LARS) Federal University of Rio Grande – FURG Computational Sciences Center – C3 October 2015

2. Motivation I “Proprietary ground truth data is a barrier to independent evaluation of metrics and algorithms” Krig, 2014

3. Motivation II First publicaly available non-stationary dataset First publicaly available dataset that is annotated

4. About Source: TheBackyardScientist at https://youtu.be/FvLfDpTONNk

5. A brief overview on the state-of-the-art  Phillips (2002)  Chen (2004)  Toreyin (2005)  Çelik (2007, 2008, 2010)  Li (2011, 2012)  Kolesov (2010)  Mueller (2013)

6. A brief overview on the state-of-the-art  Borges (2010)  Chenebert (2011)

7. Our contribution • An algorithm to find correspondences between a fire detector output and the annotated fire regions; • Two separated rigorous and precise methods for evaluating any algorithms performance on the proposed dataset. o Fire location; o Frame-by-frame classification; • C++ source code that implements these procedures.

8. About the Videos • 24 videos • 28k frames (51.37% contain fire) • 17k annotated regions • Creative Commons 3.0 license

9. About the Videos • Variety of fire sources • Uneven illumination • Camera movement • Different color accuracy settings • Clutter • Partial Occlusion • Motion blur • Scale and projection • Reflection

10. About the Annotations • Rectangle that embraces the whole fire region • Very small fire sparkles left out • A fire-frame may present one or more annotations • XML files (each video file has its corresponding annotation file) • Average flame area is 61512px (aprox. 250×250px square) • Fire region size/frame size = 8,92%

11. About the Annotations

12. Frame-by-frame metrics • Recall • Specificity • Precision • Negative Predictive Value • Fall-out

13. Frame-by-frame metrics • False Discovery rate • False Negative rate • Accuracy • F1 Score • Matthews Correlation Coeficient

14. Location-based metrics • Considers 1-N relations; • Metrics: o Precision o Recall o Mean Similarity

15. Using it!

16. Frame by frame results Metrics Çelik (2010) Zhou (2010) Chenebert (2011) TPR 0.739 0.987 0.990 SPC 0.317 0.022 0.724 PPV 0.654 0.638 0.857 NPV 0.410 0.501 0.979 FPR 0.682 0.977 0.275 FDR 0.345 0.361 0.142 FNR 0.260 0.012 0.009 ACC 0.585 0.635 0.890 F1 Score 0.694 0.775 0.919 MCC 0.060 0.036 0.773

17. Location Based Results Metrics Çelik (2010) Zhou (2010) Chenebert (2011) PPV 0.251 0.019 0.832 TPR 0.732 0.440 0.979 F1 Score 0.384 0.037 0.902 S 0.250 0.020 0.801

18. An Unconstrained Dataset for Non-stationary Video Based Fire Detection Cristiano Rafael Steffens, Ricardo Nagel Rodrigues and Silvia Silva da Costa Botelho Latin American Robotics Symposium (LARS) Federal University of Rio Grande – FURG Computational Sciences Center – C3 October 2015

Editor's Notes

First, let me talk a little about why this dataset was created. At FURG we are working on a surveillance robot. It follows a predetermined path, reconizes and tracks people, car plates, reports diferente kinds of incidentes AND one of its features is the fire detection using color images. It all started with frustration and anger! When I started the bibliography review I came accross many publications that did not provide a source code neither the dataset that has been used to evaluate it. In the same way, the evaluations were also nuclear, ignoring many importante metrics. It becomes very hard to evaluate a detector using only the recall or precision information.
The majority of the previous video based fire detections systems is designed to work with stationary videos. Doing a survey on the research topic, we can quickly identify a pattern among the proposed solutions. They all combine, in a cascade/sequential mode a aquisition system, a color based pixel wise classification and the pulsation patterns. Geralmente utilizam-se câmeras fixas em torres de vigilância a partir das quais é obtido um stream de vídeo. A primeira parte do processo é a classificação individual, pixel-a-pixel da imagem definindo regiões com a coloração de fogo. A segunda etapa do processo varia entre os trabalhos estudados, partindo de uma abordagem que avalia apenas a variância individual de cada pixel conforme proposto em PHILLIPS (2002) até modelos baseados em fluxo óptico conforme proposto por MUELLER (2013).
Dentre todas as publicações revisadas, as que mais se aproximam com os objetivos propostos no nosso trabalho são BORGES (2010) e CHENEBERT (2011). BORGES cria um modelo de aproximação estatística. Para a classificação de cor, aplica-se inicialmente um filtro gaussiano cujo desvio padrão (tamanho do filtro) é obtido a partir da variância em cada canal. Os valores de pixel, já suavizados, são utilizados para aplicação de um threshold que dá maior probabilidade para os pixels no centro da imagem. A classificação dos pixels pela cor permite definer regiões de interesse e extrair características. Borges propões o uso de informações da área, rugosidade do contorno, variância e inclinação no canal vermelho. A Classificação utilizando estes atributos é dada através de um classificador Naive Bayes. O trabalho foi publicado na IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY. Já o trabalho de CHENEBERT, apresentado na ICIP 2011 também se aproxima do trabalho proposto, ao tentar utilizar informações da textura para a classificação de regiões como fogo ou não fogo. A primeira etapa consiste na classificação dos pixels individualmente utilizando uma equação proposta por Chen(2004), que utiliza thresholds fixos. Para a classificação das regiões utiliza-se a extração de histogramas de 10 bins para os canais “Matiz” e “Saturação” do colorspace HSV resultando em 20 atributos. Ainda para a classificação das texturas os autores utilizam GLCM, também conhecidos como descritores de Haralick, extraindo energia, entropia, contraste, homoegeniedade e correlação dos valores de pixel em H e S. Cada região é então classificada com base nestes 30 atributos que são testados em um classificador de árvore e em uma rede neural. Os resultados obtidos mostram que o algorítmo CART é o que fornece os melhores resultados. Os autores tentaram ainda reduzir o números de atributos, de forma a encontrar os mais discriminantes, mas os rersultados mostraram que não houve uma melhora significativa.
Quando o detector é avaliado frame a frame, pode-se avalia-lo da mesma forma que se avalia um classificador binários. Neste caso, os frames que contém fogo são considerados como 1’s e os frames sem fogo são considerados como 0’s. O recall, ou revocação, é a fração dos frames de fogo que foram corretamente classificados pelo detector. TPR = TP/P A especifidade é a medida análoga ao recall, mas aplicado aos frames que não apresentam fogo. SPC = TN/N A precisão é a métrica que mostra qual o percentual dos frames classificados como fogo pelo detector são realmente fogo. PPV = TP/ (TP+FP) Já o valor preditivo negativo, é o equivalente à precisão para aplicada às saídas negativas do detector. NPV = TN/(TN+FN) Já a métrica fall-out dá a razão dos falsos positivos para o total de negativos. FPR = FP/N Enquanto estas métricas nos permitem avaliar os resultados do detector individualmente, elas não oferecem medidas combinadas. Neste sentido, a acurácia pode ser útil ao fornecer a proporção dos frames que foram corretamente classificados. No entanto, não é uma métrica balanceada, podendo induzir ao erro, ao desconsiderar a matriz de confusão. A métrica F1 Score, proposta por Chinchor (1992), é a média harmônica entre a precisão e o recall. Por este motivo, a F1 Score tende a punir sistemas que que apresentem um desequilíbrio entre estas medidas. Já o coeficiente de correlação de Matheus é a correlação linear entre os resultados esperados e os resultados fornecidos pelo detector. A escala varia de -1 até 1, onde -1 representa correlação negativa, 0 é o equivalente à uma predição aleatória e 1 representa que os resultados obtidos são exatamente iguais aos esperados.
Enquanto estas métricas nos permitem avaliar os resultados do detector individualmente, elas não oferecem medidas combinadas. Neste sentido, a acurácia pode ser útil ao fornecer a proporção dos frames que foram corretamente classificados. No entanto, não é uma métrica balanceada, podendo induzir ao erro, ao desconsiderar a matriz de confusão. A métrica F1 Score, proposta por Chinchor (1992), é a média harmônica entre a precisão e o recall. Por este motivo, a F1 Score tende a punir sistemas que que apresentem um desequilíbrio entre estas medidas. Já o coeficiente de correlação de Matheus é a correlação linear entre os resultados esperados e os resultados fornecidos pelo detector. A escala varia de -1 até 1, onde -1 representa correlação negativa, 0 é o equivalente à uma predição aleatória e 1 representa que os resultados obtidos são exatamente iguais aos esperados.
As métricas frame a frame são, no entanto, incapazes de mensurar adequadamente se o detector encontrou corretamente as regiões que apresentam chama na imagem. Por este motivo utilizaram-se também métricas de avaliação da localização das chamas detectadas. Levou-se em consideração que pode existir uma relação 1 para N, onde várias saídas do detector podem ser associadas à uma única anotação de ground-truth. Neste caso, é possível calcular somente as métricas que não dependem de valores negativos, o que inclui a precisão, recall e similaridade média. Na avaliação, a função de similaridade é dada pela intersecção da área detectada com a anotação de groundtruth correspondente, dividido pela área da detecção. Neste caso, sempre que a região detectada não extrapolar a região anotada, a similaridade é igual a 1. S = (Dt intersec Gt)/ Dt

Unconstrained Dataset Non-stationary Video Fire Detection

Recommended

Recommended

More Related Content

What's hot

What's hot (10)

Similar to Unconstrained Dataset Non-stationary Video Fire Detection

Similar to Unconstrained Dataset Non-stationary Video Fire Detection (20)

More from Cristiano Rafael Steffens

More from Cristiano Rafael Steffens (20)

Recently uploaded

Recently uploaded (20)

Unconstrained Dataset Non-stationary Video Fire Detection

Editor's Notes