디지털 카메라와 모바일 카메라가 널리 보급되면서 우리는 언제 어디서나 디지털 이미지를 촬영할 수 있게 되었고, 촬영한 디지털 이미지를 소셜 네트워크 서비스, 모바일 메신저 등 다양한 인터넷 서비스들을 이용하여 전송하거나 공유하며 살고 있다. 우리는 디지털 이미지를 볼 때 우리는 그것이 사실이라고 믿는 경향이 있지만 많은 디지털 이미지는 가짜이며 실제 일어나지 않은 장면을 담고 있다. 이러한 가짜 이미지는 가짜 뉴스, 보고서 조작 등 다양한 곳에서 악용되어 다양한 사회 문제를 야기시킨다. 가짜 이미지로 발생하는 여러 사회 문제를 예방하거나 해결하기 위해 많은 연구자들은 이미지의 조작을 탐지하는 기술을 제안하였지만 기존의 이미지 조작 탐지 기술은 제한적인 특정 이미지 환경에서만 작동하기 때문에 실제 이미지 유통 환경에서 사용하기가 거의 불가능한 실정이다. 본 발표에서는 약 2년동안 이미지 조작 탐지 서비스에서 의뢰된 다양한 실제 이미지들에 대해 소개한 뒤, 의뢰된 JPEG 이미지로부터 추출한 1120개의 quantization table을 이용해 생성한 데이터셋에 대해서 설명한다. 또한 single JPEG과 double JPEG을 구분할 수 있는 네트워크 구조를 제안한 뒤, 이를 이용하여 JPEG 이미지에서 발생하는 다양한 조작을 탐지하는 방법에 대해 소개한다.
Imagination-Augmented Agents for Deep Reinforcement Learning성재 최
I will introduce a paper about I2A architecture made by deepmind. That is about Imagination-Augmented Agents for Deep Reinforcement Learning
This slide were presented at Deep Learning Study group in DAVIAN LAB.
Paper link: https://arxiv.org/abs/1707.06203
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016Taehoon Kim
발표 영상 : https://goo.gl/jrKrvf
데모 영상 : https://youtu.be/exXD6wJLJ6s
Deep Q-Network, Double Q-learning, Dueling Network 등의 기술을 소개하며, hyperparameter, debugging, ensemble 등의 엔지니어링으로 성능을 끌어 올린 과정을 공유합니다.
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...Gyubin Son
1. Eye in the Sky: Real-time Drone Surveillance System (DSS) for Violent Individuals Identification using ScatterNet Hybrid Deep Learning Network
https://arxiv.org/abs/1806.00746
2. 3D human pose estimation in video with temporal convolutions and semi-supervised training
https://arxiv.org/abs/1811.11742
디지털 카메라와 모바일 카메라가 널리 보급되면서 우리는 언제 어디서나 디지털 이미지를 촬영할 수 있게 되었고, 촬영한 디지털 이미지를 소셜 네트워크 서비스, 모바일 메신저 등 다양한 인터넷 서비스들을 이용하여 전송하거나 공유하며 살고 있다. 우리는 디지털 이미지를 볼 때 우리는 그것이 사실이라고 믿는 경향이 있지만 많은 디지털 이미지는 가짜이며 실제 일어나지 않은 장면을 담고 있다. 이러한 가짜 이미지는 가짜 뉴스, 보고서 조작 등 다양한 곳에서 악용되어 다양한 사회 문제를 야기시킨다. 가짜 이미지로 발생하는 여러 사회 문제를 예방하거나 해결하기 위해 많은 연구자들은 이미지의 조작을 탐지하는 기술을 제안하였지만 기존의 이미지 조작 탐지 기술은 제한적인 특정 이미지 환경에서만 작동하기 때문에 실제 이미지 유통 환경에서 사용하기가 거의 불가능한 실정이다. 본 발표에서는 약 2년동안 이미지 조작 탐지 서비스에서 의뢰된 다양한 실제 이미지들에 대해 소개한 뒤, 의뢰된 JPEG 이미지로부터 추출한 1120개의 quantization table을 이용해 생성한 데이터셋에 대해서 설명한다. 또한 single JPEG과 double JPEG을 구분할 수 있는 네트워크 구조를 제안한 뒤, 이를 이용하여 JPEG 이미지에서 발생하는 다양한 조작을 탐지하는 방법에 대해 소개한다.
Imagination-Augmented Agents for Deep Reinforcement Learning성재 최
I will introduce a paper about I2A architecture made by deepmind. That is about Imagination-Augmented Agents for Deep Reinforcement Learning
This slide were presented at Deep Learning Study group in DAVIAN LAB.
Paper link: https://arxiv.org/abs/1707.06203
딥러닝과 강화 학습으로 나보다 잘하는 쿠키런 AI 구현하기 DEVIEW 2016Taehoon Kim
발표 영상 : https://goo.gl/jrKrvf
데모 영상 : https://youtu.be/exXD6wJLJ6s
Deep Q-Network, Double Q-learning, Dueling Network 등의 기술을 소개하며, hyperparameter, debugging, ensemble 등의 엔지니어링으로 성능을 끌어 올린 과정을 공유합니다.
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...Gyubin Son
1. Eye in the Sky: Real-time Drone Surveillance System (DSS) for Violent Individuals Identification using ScatterNet Hybrid Deep Learning Network
https://arxiv.org/abs/1806.00746
2. 3D human pose estimation in video with temporal convolutions and semi-supervised training
https://arxiv.org/abs/1811.11742
Our GOAL
해외에는 이런 데이터 경쟁 플랫폼이 있습니다. 한국에는 없죠. 국내 공공기관 또는 개별 기업들이 스팟성으로 불투명한 대회를 벗어나 지속적으로 대회를 운영하는 플랫폼이 있으면 좋겠다고 생각했습니다. 우리는 지금 Fintech 기업들과 함께 금융 데이터와 상금을 제공하며, 데이터 과학자 와 데이터 엔지니어링을 포함하는 데이터 대회를 운영합니다.
There are these data competition platforms overseas, but in Korea, Domestic public organizations or individual companies are out of the opaque temporary contest I wanted to have a platform that consistently runs the competition. We now provide financial data and cash prizes with Fintech companies, we run the Data Competition included in Data Engineer and Data Scientists.
4. https://dacon.io 4
1. EDA
1. 반사파 추측
2. 표준화
• 반사파를 추적하기 위해 다양한 방법을 사용하였지만, 유의미한 방법은 없었고,
일정 시간 뒤의 부분(200이후)을 제거하는 것이 가장 효율적이었습니다.
(실험 : Kalman Filter, clipping, 300이후 제거, 150이후 제거 etc…)
• 변수를 추가하면서 기존의 S1~S4와 스케일이 크게 차이가 나서 취해주었습니다.
5. https://dacon.io 5
1. EDA
3. Agg Feature
4. 속도 피쳐
• 특정 구간별로(30, 50) mean, std, var, max, min 등의 통계량으로 집계하여 변수로
사용했습니다.
• 각 센서를 누적합과 절대값을 이용하여 속도를 만들었습니다.
7. https://dacon.io 7
2. 모델링
1. CNN Model
• 주신 모델을 그대로 사용하였습니다.
2. Wavenet
• 초기에 진행하던 모델로 Kaggle의 Ion Switching 에서 수상한 모델입니다.
• 시뮬레이션 데이터란 점과 sequential한 데이터라는 점에서 채택한 모델입니다.
• 자세한 사항은 https://www.kaggle.com/mobassir/understanding-ion-switching-with-modeling
위의 링크를 가시면 볼 수 있습니다.
3. 앙상블
• CNN + Model 을 진행했습니다.(5대 5)
8. https://dacon.io 8
2. 모델링
4. Pseudo Labeling(CNN Model)
• Test의 분포를 넣어주고자 시도하였습니다.
• Test를 5분할하여 Kfold(K=5)로 모델링을 진행할 때, 각 폴드당 Test data를 넣어 학습
했습니다.
• X와 Y, 좌표에 대해서만 진행했습니다.
Train Data Test Data
4. Post Process
• XY(-400, 400), M(25, 175), V(0.2, 1.0) 으로 맞춰주었습니다.
9. https://dacon.io 9
3. 결과 및 결언
• 너무 낮은 metrics로 인해서 검증이 힘들었던 대회라고 생각됩니다.
• Test 데이터의 Upper, Lower를 대회 종료 3일 전에 알았던 것이 아쉽습니다.
제가 제출한 값들을 보면, 대부분 M기준 21이상, V기준 0.15 이상 인 경우가 많았습니다.
• CNN 모델이 잘 되는 것을 알고, 좀더 깊은 모델들(Pretrained) 을 사용해 보려고 했으나,
Colab으로 진행했기 때문에 할 수 없었던 것이 아쉽습니다.
• 재밌는 대회를 열어주신 데이콘과, 박사님께 감사의 인사를 드립니다.
10. https://dacon.io 10
3. 결과 및 결언
41 - Time 피쳐 추가
40 - 190 스플릿
39 - 180 스플릿
38 - 225 스플릿
37 - 150 스플릿(220에폭)
36 - 150 스플릿(200에폭)
35 - 200 스플릿
34 - s5678 만듬(짝수index제거)
33 - s2 제거
32 - window 30추가
31 - window max-min
30 - var 제거
29 - median 추가
28 - 속력 123
27 - window 123
26 - post process(x,y : -400, 400)
25 - 플레처/배치사이즈=256
24 - rolling feature quantile 추가
23 - all 0 제거 후 364개 row로 맞춰줌. 최소값(최대 시간을 제외하는 방법)
22 - 속력 diff 추가
21 - mean feature 제거
20 - stat 10 제거
19 - 400에폭 도전
18 - speed ratio(변화량)추가
17 - 거리(변위X) 통게량 사용(거리변수 제거)
16 - 가속도(abs) = 가속력 으로 변환
15 - speed statistic(속력=abs(속도))
14 - s1,2,3,4 remove
13 - speed statistic(속도)
12 - distance
11 - speed feature
10 - lag X, lag stat only 10
9 - lag X, lag stat neg add
8 - lag stat add 30
7 - flip aug
6 - lag x
79이후로 앙상블 실험
78 - 8 : 8 : 2(origin, flie, wavenet)
77 - swa 추가
71 - 앙상블 (no pleatue, pleatu, wavent)
70 - 그냥 모든거 앙상블(가장좋은것들..)= 62 + (65 + (41+69))
69 - multistratified
68 - 200 스플릿 , 375 raw 앙상블
67 - 0 sum 변수
66 - cnn + wavenet(7:3 앙상블)
65 - cnn 10폴드
64 - xym pseudo labeling
63 - xymv pseudo labeling
62 - xy pseudo labeling
61 - 200이후 모델과 200이전 모델 앙상블
60 - 변위 다시추가...
59 - xy만 S round
58 - S round
57 - 모델 densenet512 로 좀 확장
56 - 텐폴드....
55 - v칼만 적용
54 - xym10폴드
53 - kalman fliter
52 - 300에폭...
51 - cnn best + wavenet
50 - kfold
49 - kfold
48 - cv안좋은 단일
47 - 적절한 조절
46 - -400, 400
45 - 적당한 점수(300에폭 overfit..?)
44 - cnn cv 로 변경
43 - cnn, wavenet 앙상블
42 - cnn 첫적용(fe..., 플레처... 적용)
41 - wavenet
1. 실험내용