SlideShare a Scribd company logo
HAICon 2020 평가 척도 (TaPR) 설명
황원석
hws23@nsr.re.kr
*TaPR: W.-Hwang et al. “Time-Series Aware Precision and Recall for Anomaly Detection: Considering Variety of Detection Result and
Addressing Ambiguous Labeling,” In Proc. of CIKM, pp. 2241-2244, 2019.
배경 설명
• 탐지의 목표: 정상 중 공격의 영향을 받은 범위를 탐지
– HAI 데이터는 오른쪽 표와 같이 구성됨
• 공격인 구간에 해당하는 11~12, 16~19초 사이의 데이터를 탐지
– 이 표는 아래와 같은 그림으로 표현됨
• 각 범위는 서로 다른 공격의 영향
2020-07-28 2
Index Label
10 0
11 1
12 1
13 0
14 0
15 0
16 1
17 1
18 1
19 1
20 0
21 0
……
범위 1
범위 2
0: 정상
1: 공격
Index
𝑎1
11 12 16 19
공격1 수행 공격2 수행
𝑎2
범위 1 범위 2
공격1 영향 종료 공격2 영향 종료
평가 목표
• 목표 1. 탐지된 공격의 다양성 평가
– 아래 그림의 예
• 두 결과 모두 4초의 데이터를 탐지
• 결과 1을 더 높게 평가함
– 결과 1은 두 가지 공격의 영향을 탐지
– 결과 2는 한 가지 공격의 영향만을 탐지
2020-07-28 3
Index
𝑎1
11 12 16 19
𝑎2
𝑝3 : 탐지 결과 2
𝑝1 𝑝2 : 탐지 결과 1
평가 목표 (cont.)
• 목표 2. 탐지의 정확성
– 범위 1과 2에 해당하는 시각(6초)을 모두 탐지할수록 높은 점수 부여
– 오른쪽 그림에서 결과 3이 4보다 높게 평가
• 목표 3. 낮은 오탐
– 정답 외의 시각을 탐지하지 않을수록 높은 점수 부여
– 오른쪽 그림에서 결과 5가 6보다 높게 평가
2020-07-28 4
Index
𝑎1
11 12 16 19
𝑎2
𝑝4 : 탐지 결과 4
𝑝1 𝑝2 : 탐지 결과 3
𝑝3
Index
𝑎1
11 12 16 19
𝑎2
𝑝4 : 탐지 결과 6
𝑝1 𝑝2 : 탐지 결과 5
𝑝3
TaPR
• TaPR은 상기 목표들을 만족하는 평가를 제공
– TaP와 TaR로 구성
• TaP: 예측 결과가 오탐 없이 이상 징후를 찾아내는가? (점수: 0 ~ 1)
• TaR: 얼마나 다양한 공격 범위를 찾아내는가? (점수: 0 ~ 1)
• 각 점수에 대해서는 아래 그림과 표 참고
• 본 대회에서는 TaP와 TaR의 F1 점수로 최종 평가
2020-07-28 5
예측 결과 TaP TaR
𝑝1 High High
𝑝2 High Low
𝑝3 Low High
𝑝4 Low Low
• 평가 척도의 자세한 내용은 다음 논문 참고
– W.-Hwang et al. “Time-Series Aware Precision and Recall for Anomaly Detection: Considering Variety of
Detection Result and Addressing Ambiguous Labeling,” In Proc. of CIKM, pp. 2241-2244, 2019.
• HAICon 2020에 사용하는 TaPR은 상기 논문에서 제안한 방법을 개선한 버전
– 대회 홈페이지에서 제공하는 버전만을 사용!
• 제공되는 whl파일을 설치 (예제 참고)
• 그 외의 경로에서 찾은 TaPR은 다른 결과를 도출할 수 있음
2020-07-28 6
기타
• Precision 과 recall은 널리 사용되는 평가 방법 중 하나
• Precision 과 recall은 다양한 공격을 탐지 하였는지 평가하는데 부적합
– 방법 2는 가장 긴 시간 동안 영향을 준 공격 𝑎1만을 탐지하였으나, 높은 점수를 받음
2020-07-28 7
추가: Precision 및 Recall을 사용하지 않는 이유
Method
Metric
Precision Recall
1 0.67 0.40
2 1.00 0.67
• TaPR의 파라미터는 제공된 whl 파일에 설정하여 제공
– 원본 TaPR에는 세팅할 파라미터들이 존재
– 파라미터는 대회 목적에 맞도록 설정
• 공격 범위 중 일부만 찾아도 높은 점수 부여 (TaR 점수는 후하게 측정)
• 오탐은 조금만 발생해도 큰 감점 (TaP 점수는 박하게 측정)
• 그 결과, 아래 그림의 방법 2도 높은 점수를 받을 수 있음
2020-07-28 8
추가: TaPR의 파라미터

More Related Content

More from DACON AI 데이콘

K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
DACON AI 데이콘
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
DACON AI 데이콘
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
DACON AI 데이콘
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
DACON AI 데이콘
 
20200923
2020092320200923
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
DACON AI 데이콘
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 8위 수상작
생체 광학 데이터 분석 AI 경진대회 8위 수상작생체 광학 데이터 분석 AI 경진대회 8위 수상작
생체 광학 데이터 분석 AI 경진대회 8위 수상작
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 7위 수상작
생체 광학 데이터 분석 AI 경진대회 7위 수상작생체 광학 데이터 분석 AI 경진대회 7위 수상작
생체 광학 데이터 분석 AI 경진대회 7위 수상작
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 6위 수상작
생체 광학 데이터 분석 AI 경진대회 6위 수상작생체 광학 데이터 분석 AI 경진대회 6위 수상작
생체 광학 데이터 분석 AI 경진대회 6위 수상작
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작
DACON AI 데이콘
 
생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작
DACON AI 데이콘
 

More from DACON AI 데이콘 (20)

K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션K-Fashion 경진대회 2등 수상자 솔루션
K-Fashion 경진대회 2등 수상자 솔루션
 
K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션K-Fashion 경진대회 3등 수상자 솔루션
K-Fashion 경진대회 3등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 2등 수상자 솔루션
 
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
아리랑 위성영상 AI 객체 검출 경진대회 1등 수상자 솔루션
 
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등진동데이터 활용 충돌체 탐지 AI 경진대회 2등
진동데이터 활용 충돌체 탐지 AI 경진대회 2등
 
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등진동데이터 활용 충돌체 탐지 AI 경진대회 1등
진동데이터 활용 충돌체 탐지 AI 경진대회 1등
 
20200923
2020092320200923
20200923
 
포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상포스트 코로나 데이터 시각화 경진대회 - 대상
포스트 코로나 데이터 시각화 경진대회 - 대상
 
포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상포스트 코로나 데이터 시각화 경진대회 - 최우수상
포스트 코로나 데이터 시각화 경진대회 - 최우수상
 
포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상포스트 코로나 데이터 시각화 경진대회 - 우수상
포스트 코로나 데이터 시각화 경진대회 - 우수상
 
포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2포스트 코로나 데이터 시각화 경진대회 - 장려상2
포스트 코로나 데이터 시각화 경진대회 - 장려상2
 
포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상포스트 코로나 데이터 시각화 경진대회 - 장려상
포스트 코로나 데이터 시각화 경진대회 - 장려상
 
생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작생체 광학 데이터 분석 AI 경진대회 10위 수상작
생체 광학 데이터 분석 AI 경진대회 10위 수상작
 
생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작생체 광학 데이터 분석 AI 경진대회 9위 수상작
생체 광학 데이터 분석 AI 경진대회 9위 수상작
 
생체 광학 데이터 분석 AI 경진대회 8위 수상작
생체 광학 데이터 분석 AI 경진대회 8위 수상작생체 광학 데이터 분석 AI 경진대회 8위 수상작
생체 광학 데이터 분석 AI 경진대회 8위 수상작
 
생체 광학 데이터 분석 AI 경진대회 7위 수상작
생체 광학 데이터 분석 AI 경진대회 7위 수상작생체 광학 데이터 분석 AI 경진대회 7위 수상작
생체 광학 데이터 분석 AI 경진대회 7위 수상작
 
생체 광학 데이터 분석 AI 경진대회 6위 수상작
생체 광학 데이터 분석 AI 경진대회 6위 수상작생체 광학 데이터 분석 AI 경진대회 6위 수상작
생체 광학 데이터 분석 AI 경진대회 6위 수상작
 
생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작생체 광학 데이터 분석 AI 경진대회 5위 수상작
생체 광학 데이터 분석 AI 경진대회 5위 수상작
 
생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작생체 광학 데이터 분석 AI 경진대회 4위 수상작
생체 광학 데이터 분석 AI 경진대회 4위 수상작
 
생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작생체 광학 데이터 분석 AI 경진대회 1위 수상작
생체 광학 데이터 분석 AI 경진대회 1위 수상작
 

eTaPR

  • 1. HAICon 2020 평가 척도 (TaPR) 설명 황원석 hws23@nsr.re.kr *TaPR: W.-Hwang et al. “Time-Series Aware Precision and Recall for Anomaly Detection: Considering Variety of Detection Result and Addressing Ambiguous Labeling,” In Proc. of CIKM, pp. 2241-2244, 2019.
  • 2. 배경 설명 • 탐지의 목표: 정상 중 공격의 영향을 받은 범위를 탐지 – HAI 데이터는 오른쪽 표와 같이 구성됨 • 공격인 구간에 해당하는 11~12, 16~19초 사이의 데이터를 탐지 – 이 표는 아래와 같은 그림으로 표현됨 • 각 범위는 서로 다른 공격의 영향 2020-07-28 2 Index Label 10 0 11 1 12 1 13 0 14 0 15 0 16 1 17 1 18 1 19 1 20 0 21 0 …… 범위 1 범위 2 0: 정상 1: 공격 Index 𝑎1 11 12 16 19 공격1 수행 공격2 수행 𝑎2 범위 1 범위 2 공격1 영향 종료 공격2 영향 종료
  • 3. 평가 목표 • 목표 1. 탐지된 공격의 다양성 평가 – 아래 그림의 예 • 두 결과 모두 4초의 데이터를 탐지 • 결과 1을 더 높게 평가함 – 결과 1은 두 가지 공격의 영향을 탐지 – 결과 2는 한 가지 공격의 영향만을 탐지 2020-07-28 3 Index 𝑎1 11 12 16 19 𝑎2 𝑝3 : 탐지 결과 2 𝑝1 𝑝2 : 탐지 결과 1
  • 4. 평가 목표 (cont.) • 목표 2. 탐지의 정확성 – 범위 1과 2에 해당하는 시각(6초)을 모두 탐지할수록 높은 점수 부여 – 오른쪽 그림에서 결과 3이 4보다 높게 평가 • 목표 3. 낮은 오탐 – 정답 외의 시각을 탐지하지 않을수록 높은 점수 부여 – 오른쪽 그림에서 결과 5가 6보다 높게 평가 2020-07-28 4 Index 𝑎1 11 12 16 19 𝑎2 𝑝4 : 탐지 결과 4 𝑝1 𝑝2 : 탐지 결과 3 𝑝3 Index 𝑎1 11 12 16 19 𝑎2 𝑝4 : 탐지 결과 6 𝑝1 𝑝2 : 탐지 결과 5 𝑝3
  • 5. TaPR • TaPR은 상기 목표들을 만족하는 평가를 제공 – TaP와 TaR로 구성 • TaP: 예측 결과가 오탐 없이 이상 징후를 찾아내는가? (점수: 0 ~ 1) • TaR: 얼마나 다양한 공격 범위를 찾아내는가? (점수: 0 ~ 1) • 각 점수에 대해서는 아래 그림과 표 참고 • 본 대회에서는 TaP와 TaR의 F1 점수로 최종 평가 2020-07-28 5 예측 결과 TaP TaR 𝑝1 High High 𝑝2 High Low 𝑝3 Low High 𝑝4 Low Low
  • 6. • 평가 척도의 자세한 내용은 다음 논문 참고 – W.-Hwang et al. “Time-Series Aware Precision and Recall for Anomaly Detection: Considering Variety of Detection Result and Addressing Ambiguous Labeling,” In Proc. of CIKM, pp. 2241-2244, 2019. • HAICon 2020에 사용하는 TaPR은 상기 논문에서 제안한 방법을 개선한 버전 – 대회 홈페이지에서 제공하는 버전만을 사용! • 제공되는 whl파일을 설치 (예제 참고) • 그 외의 경로에서 찾은 TaPR은 다른 결과를 도출할 수 있음 2020-07-28 6 기타
  • 7. • Precision 과 recall은 널리 사용되는 평가 방법 중 하나 • Precision 과 recall은 다양한 공격을 탐지 하였는지 평가하는데 부적합 – 방법 2는 가장 긴 시간 동안 영향을 준 공격 𝑎1만을 탐지하였으나, 높은 점수를 받음 2020-07-28 7 추가: Precision 및 Recall을 사용하지 않는 이유 Method Metric Precision Recall 1 0.67 0.40 2 1.00 0.67
  • 8. • TaPR의 파라미터는 제공된 whl 파일에 설정하여 제공 – 원본 TaPR에는 세팅할 파라미터들이 존재 – 파라미터는 대회 목적에 맞도록 설정 • 공격 범위 중 일부만 찾아도 높은 점수 부여 (TaR 점수는 후하게 측정) • 오탐은 조금만 발생해도 큰 감점 (TaP 점수는 박하게 측정) • 그 결과, 아래 그림의 방법 2도 높은 점수를 받을 수 있음 2020-07-28 8 추가: TaPR의 파라미터