SlideShare a Scribd company logo
1 of 20
Download to read offline
21-1 DSL
Modeling
Project
의료데이터
모델링
폐렴 감별 CNN 모델 제작
김도언
임낙준
차지수
한영웅
허유진
폐렴(pneumonia)
폐포속에 염증이 생기는 질환으로서
세균이나 바이러스에 의해 발생, 다양한
합병증 통해 사망까지 이르게 하는 질병
최근 코로나를 진단하는데 CNN모델이
활용될 수 있는 방안이 연구되고 있으며
폐렴 뿐만 아니라 암, 종양 판별 등
다양한 의료분야에서 CNN 모델이 활발
하게 연구되고 있음
개요 데이터 VGGNet ResNet EfficientNet 모델링 결과
폐렴 데이터 셋
데이터
개요 VGGNet ResNet EfficientNet 모델링 결과
Kaggle에 있는 폐렴 데이터셋
폐렴에 걸린 폐와 정상 폐의 사진이 5876장
있으며 train, validation, test dataset이
나누어져 있음.
모델링 목표
TrainDataset으로 모델을 학습시켜 폐렴에 걸린
폐와 정상 폐의 X-ray 사진이 섞여있는 Test
Dataset 사진중 정상 폐와 폐렴인 폐를 정확히
골라내는 모델 제작
* 왼쪽 이미지에서 푸르게 불타는 부분이 염증,
보다시피 육안으로 식별해 진단하기 매우 어려움!
작은 크기의 3x3 컨볼루션 필터(filter)를 이용해 레이어의 깊이를 늘려 우수한 성능을 보여줌
직관적이고 단순한 구조
VGGNet
개요 데이터 ResNet EfficientNet 모델링 결과
단순한 구조, 높은 성능 VGGNet
VGGNet에 있는 13개의 컨볼루션 레이어 중 첫 번째레이어 (위), 마지막 레이어(아래) 를 통과한 16개의 채널 이미지
VGGNet
개요 데이터 ResNet EfficientNet 모델링 결과
VGGNet – Convolution layer
VGG의 한계
성능을 높이기 위해 레이어를 많이
쌓는 것이 안 좋은 성능을 보일때가
많음
BackFoward과정에서
Gradient Degradation 발생
ResNet
개요 데이터 VGGNet EfficientNet 모델링 결과
전에 배운 것을 잊지말자 ResNet
ResNet
개요 데이터 VGGNet EfficientNet 모델링 결과
전에 배운 것을 잊지말자 ResNet
전에 학습한 특성을 새로 학습한
것에 더함으로써 전에 배운것을
잊지 않게 하는 것이 포인트.
이 과정 하나가 Residual Block
Residual Block을 여러 개
쌓아서 만든 모델이 ResNet
Efficient
Net
개요 데이터 VGGNet ResNet 모델링 결과
하이퍼 파라미터들의 황금비율 EfficientNet
기존의 모델 성능 향상방법
width scaling
- filter의 개수를 늘려 성능향상
depth scaling
- layer의 개수를 늘려 성능향상
resolution scaling
- input image 해상도를 높여 성능향상
EfficientNet (Compound Scaling)
세가지 요소를 적절한 비율로 동시에 늘려 성능을
향상시킨 모델
모델링
개요 데이터 VGGNet ResNet EfficientNet 결과
기본 모델 EfficientNet
EfficientNet
depth, width, resolution의 황금비율로
만들어진 모델
Depth(# of layer)
Width(# of filter)
Resolution(pixel intensity)
따로 따로 조절되는 것이 아닌
Base모델에서 동일하게 phi 의 제곱 씩
늘어나는 것이 가장 효율적!
Efficientb0 ,b1, b2 …
(input의 크기에 따라 결정)
모델링
개요 데이터 VGGNet ResNet EfficientNet 결과
기본 모델 EfficientNet
그 결과, 더 적은 수의 파라미터를
사용하면서도 매우 향상된 성능을
보여줌
프로젝트 기본 모델로
‘Efficient Net b0’ 를 채택
기본 모델
Weight parameter가 사전에
학습되어 있는 Efficient-b0 load
맨 마지막에 output node가 하나인
fully connected layer 추가
Normal->0
Pneumonia->1 으로
라벨링을 했기 때문에 마지막 oupt
node의 개수가 하나임
모델링
개요 데이터 VGGNet ResNet EfficientNet 결과
성능 향상 작업 1. DataAugmentation
성능 향상 작업 2. Class weight 부여
성능 향상 작업 3. optimizer 와 학습률 조정
모델링
개요 데이터 VGGNet ResNet EfficientNet 결과
성능 향상 작업 1. DataAugmentation
Data Augmentation (데이터증강)
모델이 학습하는 동안 인풋데이터에
랜덤한 방법으로 다양한 변형을
가하는 것으로써,
결국 모델이 학습하는 데이터 양이
늘어나는 것과 동일한 효과를 갖게 됌
이를 통해 과대적합을 방지하고 모델
성능 향상 모색
모델링
개요 데이터 VGGNet ResNet EfficientNet 결과
성능 향상 작업 1. DataAugmentation
- RandomHorizontalFlip(수평반전)
- RandomAffine
추가적으로, Normalization을 수행함
Data Augmentation 에 따라 최종
모델의 성능은 0.11 가량 차이를 보임
모델링
개요 데이터 VGGNet ResNet EfficientNet 결과
성능 향상 작업 2. Class weight 부여
정상 폐 사진과 폐렴 사진의 비율이
다름
해당 class의 가중치를 loss에 부여하여
성능저하를 방지
정상 폐렴
약 세 배 차이!
모델링
개요 데이터 VGGNet ResNet EfficientNet 결과
성능 향상 작업 2. Class weight 부여
모델링
개요 데이터 VGGNet ResNet EfficientNet 결과
성능 향상 작업 3. optimizer 와 학습률조정
Optimizer
ADAM 을 이용해서 OPTIMIZING
진행함
학습률 조정
Loss가 낮아질수록 학습률이
조금씩 낮아지는 learning late
scheduler를 세팅함
모델링
개요 데이터 VGGNet ResNet EfficientNet 결과
모델 훈련 결과
EfficientNET을 활용한 데이터 분류 학습의
Test Score
Accuracy가 93점, F1 score가 약 95점
앞서 말한 레지던트 수련의들의 정확도 66%
를 아득히 넘어서는 결과
결과
개요 데이터 VGGNet ResNet EfficientNet 모델링
요약
Data Augmentation ,
Class weighting ,
학습률 조정
-> 학습의 성능 향상
<모델간 비교>
Accuracy는 VGG가 가장 높지만
컴퓨팅 리소스 / 학습시간 면에서
EfficientNET이 VGG보다 efficient!

More Related Content

What's hot

한글 언어 자원과 R: KoNLP 개선과 활용
한글 언어 자원과 R: KoNLP 개선과 활용한글 언어 자원과 R: KoNLP 개선과 활용
한글 언어 자원과 R: KoNLP 개선과 활용r-kor
 
高位合成におけるC++テンプレートメタプログラミングの効果
高位合成におけるC++テンプレートメタプログラミングの効果高位合成におけるC++テンプレートメタプログラミングの効果
高位合成におけるC++テンプレートメタプログラミングの効果Kenichiro MITSUDA
 
Xamarin で ReactiveUI を使ってみた
Xamarin で ReactiveUI を使ってみたXamarin で ReactiveUI を使ってみた
Xamarin で ReactiveUI を使ってみたHironov OKUYAMA
 
[PR12] Capsule Networks - Jaejun Yoo
[PR12] Capsule Networks - Jaejun Yoo[PR12] Capsule Networks - Jaejun Yoo
[PR12] Capsule Networks - Jaejun YooJaeJun Yoo
 
Cilium - Network and Application Security with BPF and XDP Thomas Graf, Cova...
Cilium - Network and Application Security with BPF and XDP  Thomas Graf, Cova...Cilium - Network and Application Security with BPF and XDP  Thomas Graf, Cova...
Cilium - Network and Application Security with BPF and XDP Thomas Graf, Cova...Docker, Inc.
 
Cilium - Bringing the BPF Revolution to Kubernetes Networking and Security
Cilium - Bringing the BPF Revolution to Kubernetes Networking and SecurityCilium - Bringing the BPF Revolution to Kubernetes Networking and Security
Cilium - Bringing the BPF Revolution to Kubernetes Networking and SecurityThomas Graf
 
クロージャデザインパターン
クロージャデザインパターンクロージャデザインパターン
クロージャデザインパターンMoriharu Ohzu
 
OpenvSwitch Deep Dive
OpenvSwitch Deep DiveOpenvSwitch Deep Dive
OpenvSwitch Deep Diverajdeep
 
IoT 개발자를 위한 Embedded C에서 TDD를 해보자
IoT 개발자를 위한 Embedded C에서 TDD를 해보자IoT 개발자를 위한 Embedded C에서 TDD를 해보자
IoT 개발자를 위한 Embedded C에서 TDD를 해보자Taeyeop Kim
 
Kubernetes Controller for Pull Request Based Environment
Kubernetes Controller for Pull Request Based EnvironmentKubernetes Controller for Pull Request Based Environment
Kubernetes Controller for Pull Request Based EnvironmentVishal Banthia
 
デザインパターン(初歩的な7パターン)
デザインパターン(初歩的な7パターン)デザインパターン(初歩的な7パターン)
デザインパターン(初歩的な7パターン)和明 斎藤
 
Using eBPF for High-Performance Networking in Cilium
Using eBPF for High-Performance Networking in CiliumUsing eBPF for High-Performance Networking in Cilium
Using eBPF for High-Performance Networking in CiliumScyllaDB
 
The Tofu Interconnect D for the Post K Supercomputer
The Tofu Interconnect D for the Post K SupercomputerThe Tofu Interconnect D for the Post K Supercomputer
The Tofu Interconnect D for the Post K Supercomputerinside-BigData.com
 
Transfer Learning -- The Next Frontier for Machine Learning
Transfer Learning -- The Next Frontier for Machine LearningTransfer Learning -- The Next Frontier for Machine Learning
Transfer Learning -- The Next Frontier for Machine LearningSebastian Ruder
 
파이콘 한국 2019 튜토리얼 - LRP (Part 2)
파이콘 한국 2019 튜토리얼 - LRP (Part 2)파이콘 한국 2019 튜토리얼 - LRP (Part 2)
파이콘 한국 2019 튜토리얼 - LRP (Part 2)XAIC
 
HTML5でオフラインWebアプリケーションを作ろう
HTML5でオフラインWebアプリケーションを作ろうHTML5でオフラインWebアプリケーションを作ろう
HTML5でオフラインWebアプリケーションを作ろうyoshikawa_t
 
高負荷に耐えうるWeb application serverの作り方
高負荷に耐えうるWeb application serverの作り方高負荷に耐えうるWeb application serverの作り方
高負荷に耐えうるWeb application serverの作り方yuta-ishiyama
 
Module 1: ConfD Technical Introduction
Module 1: ConfD Technical IntroductionModule 1: ConfD Technical Introduction
Module 1: ConfD Technical IntroductionTail-f Systems
 
Generative models (Geek hub 2021 lecture)
Generative models (Geek hub 2021 lecture)Generative models (Geek hub 2021 lecture)
Generative models (Geek hub 2021 lecture)Vitaly Bondar
 
Mikrotik® MPLS/VPN Lab Part 1
Mikrotik® MPLS/VPN Lab Part 1Mikrotik® MPLS/VPN Lab Part 1
Mikrotik® MPLS/VPN Lab Part 1Kaveh Khosravi
 

What's hot (20)

한글 언어 자원과 R: KoNLP 개선과 활용
한글 언어 자원과 R: KoNLP 개선과 활용한글 언어 자원과 R: KoNLP 개선과 활용
한글 언어 자원과 R: KoNLP 개선과 활용
 
高位合成におけるC++テンプレートメタプログラミングの効果
高位合成におけるC++テンプレートメタプログラミングの効果高位合成におけるC++テンプレートメタプログラミングの効果
高位合成におけるC++テンプレートメタプログラミングの効果
 
Xamarin で ReactiveUI を使ってみた
Xamarin で ReactiveUI を使ってみたXamarin で ReactiveUI を使ってみた
Xamarin で ReactiveUI を使ってみた
 
[PR12] Capsule Networks - Jaejun Yoo
[PR12] Capsule Networks - Jaejun Yoo[PR12] Capsule Networks - Jaejun Yoo
[PR12] Capsule Networks - Jaejun Yoo
 
Cilium - Network and Application Security with BPF and XDP Thomas Graf, Cova...
Cilium - Network and Application Security with BPF and XDP  Thomas Graf, Cova...Cilium - Network and Application Security with BPF and XDP  Thomas Graf, Cova...
Cilium - Network and Application Security with BPF and XDP Thomas Graf, Cova...
 
Cilium - Bringing the BPF Revolution to Kubernetes Networking and Security
Cilium - Bringing the BPF Revolution to Kubernetes Networking and SecurityCilium - Bringing the BPF Revolution to Kubernetes Networking and Security
Cilium - Bringing the BPF Revolution to Kubernetes Networking and Security
 
クロージャデザインパターン
クロージャデザインパターンクロージャデザインパターン
クロージャデザインパターン
 
OpenvSwitch Deep Dive
OpenvSwitch Deep DiveOpenvSwitch Deep Dive
OpenvSwitch Deep Dive
 
IoT 개발자를 위한 Embedded C에서 TDD를 해보자
IoT 개발자를 위한 Embedded C에서 TDD를 해보자IoT 개발자를 위한 Embedded C에서 TDD를 해보자
IoT 개발자를 위한 Embedded C에서 TDD를 해보자
 
Kubernetes Controller for Pull Request Based Environment
Kubernetes Controller for Pull Request Based EnvironmentKubernetes Controller for Pull Request Based Environment
Kubernetes Controller for Pull Request Based Environment
 
デザインパターン(初歩的な7パターン)
デザインパターン(初歩的な7パターン)デザインパターン(初歩的な7パターン)
デザインパターン(初歩的な7パターン)
 
Using eBPF for High-Performance Networking in Cilium
Using eBPF for High-Performance Networking in CiliumUsing eBPF for High-Performance Networking in Cilium
Using eBPF for High-Performance Networking in Cilium
 
The Tofu Interconnect D for the Post K Supercomputer
The Tofu Interconnect D for the Post K SupercomputerThe Tofu Interconnect D for the Post K Supercomputer
The Tofu Interconnect D for the Post K Supercomputer
 
Transfer Learning -- The Next Frontier for Machine Learning
Transfer Learning -- The Next Frontier for Machine LearningTransfer Learning -- The Next Frontier for Machine Learning
Transfer Learning -- The Next Frontier for Machine Learning
 
파이콘 한국 2019 튜토리얼 - LRP (Part 2)
파이콘 한국 2019 튜토리얼 - LRP (Part 2)파이콘 한국 2019 튜토리얼 - LRP (Part 2)
파이콘 한국 2019 튜토리얼 - LRP (Part 2)
 
HTML5でオフラインWebアプリケーションを作ろう
HTML5でオフラインWebアプリケーションを作ろうHTML5でオフラインWebアプリケーションを作ろう
HTML5でオフラインWebアプリケーションを作ろう
 
高負荷に耐えうるWeb application serverの作り方
高負荷に耐えうるWeb application serverの作り方高負荷に耐えうるWeb application serverの作り方
高負荷に耐えうるWeb application serverの作り方
 
Module 1: ConfD Technical Introduction
Module 1: ConfD Technical IntroductionModule 1: ConfD Technical Introduction
Module 1: ConfD Technical Introduction
 
Generative models (Geek hub 2021 lecture)
Generative models (Geek hub 2021 lecture)Generative models (Geek hub 2021 lecture)
Generative models (Geek hub 2021 lecture)
 
Mikrotik® MPLS/VPN Lab Part 1
Mikrotik® MPLS/VPN Lab Part 1Mikrotik® MPLS/VPN Lab Part 1
Mikrotik® MPLS/VPN Lab Part 1
 

More from DataScienceLab

21-1 세종시 부동산데이터 시각화 모델링 공모전
21-1 세종시 부동산데이터 시각화 모델링 공모전21-1 세종시 부동산데이터 시각화 모델링 공모전
21-1 세종시 부동산데이터 시각화 모델링 공모전DataScienceLab
 
2021빅콘테스트 스포츠테크 부문 TOP16
2021빅콘테스트 스포츠테크 부문 TOP162021빅콘테스트 스포츠테크 부문 TOP16
2021빅콘테스트 스포츠테크 부문 TOP16DataScienceLab
 
21-2 Air Bnb Review Data EDA 5조
21-2 Air Bnb Review Data EDA 5조21-2 Air Bnb Review Data EDA 5조
21-2 Air Bnb Review Data EDA 5조DataScienceLab
 
21-2 Covid19 Data EDA 4조
21-2 Covid19 Data EDA 4조21-2 Covid19 Data EDA 4조
21-2 Covid19 Data EDA 4조DataScienceLab
 
21-1 Covid 19 데이터 EDA 3조
21-1 Covid 19 데이터 EDA 3조21-1 Covid 19 데이터 EDA 3조
21-1 Covid 19 데이터 EDA 3조DataScienceLab
 
21-2 말레이시아 스타벅스 EDA 2조
21-2 말레이시아 스타벅스 EDA 2조21-2 말레이시아 스타벅스 EDA 2조
21-2 말레이시아 스타벅스 EDA 2조DataScienceLab
 
21-2 에어비앤비 리뷰평점 EDA 1팀
21-2 에어비앤비 리뷰평점 EDA 1팀21-2 에어비앤비 리뷰평점 EDA 1팀
21-2 에어비앤비 리뷰평점 EDA 1팀DataScienceLab
 
2021호주 오픈 순위예측 프로젝트
2021호주 오픈 순위예측 프로젝트2021호주 오픈 순위예측 프로젝트
2021호주 오픈 순위예측 프로젝트DataScienceLab
 
음원 사재기 판별 시스템 모델링
음원 사재기 판별 시스템 모델링음원 사재기 판별 시스템 모델링
음원 사재기 판별 시스템 모델링DataScienceLab
 
악플분류 모델링 프로젝트
악플분류 모델링 프로젝트악플분류 모델링 프로젝트
악플분류 모델링 프로젝트DataScienceLab
 
영화 어벤져스 내 네트워크 분석
영화 어벤져스 내 네트워크 분석영화 어벤져스 내 네트워크 분석
영화 어벤져스 내 네트워크 분석DataScienceLab
 
통신사 고객 이탈분석
통신사 고객 이탈분석통신사 고객 이탈분석
통신사 고객 이탈분석DataScienceLab
 
건강식품리뷰데이터분석
건강식품리뷰데이터분석건강식품리뷰데이터분석
건강식품리뷰데이터분석DataScienceLab
 
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석DataScienceLab
 
Covid19 데이터로 선진국 및 저개발국 피해규모 분석
Covid19 데이터로 선진국 및 저개발국 피해규모 분석 Covid19 데이터로 선진국 및 저개발국 피해규모 분석
Covid19 데이터로 선진국 및 저개발국 피해규모 분석 DataScienceLab
 
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언 에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언 DataScienceLab
 
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가DataScienceLab
 
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안DataScienceLab
 
Reinforcement Learning on Mine Sweeper
Reinforcement Learning on Mine SweeperReinforcement Learning on Mine Sweeper
Reinforcement Learning on Mine SweeperDataScienceLab
 

More from DataScienceLab (20)

21-1 세종시 부동산데이터 시각화 모델링 공모전
21-1 세종시 부동산데이터 시각화 모델링 공모전21-1 세종시 부동산데이터 시각화 모델링 공모전
21-1 세종시 부동산데이터 시각화 모델링 공모전
 
2021빅콘테스트 스포츠테크 부문 TOP16
2021빅콘테스트 스포츠테크 부문 TOP162021빅콘테스트 스포츠테크 부문 TOP16
2021빅콘테스트 스포츠테크 부문 TOP16
 
21-2 Air Bnb Review Data EDA 5조
21-2 Air Bnb Review Data EDA 5조21-2 Air Bnb Review Data EDA 5조
21-2 Air Bnb Review Data EDA 5조
 
21-2 Covid19 Data EDA 4조
21-2 Covid19 Data EDA 4조21-2 Covid19 Data EDA 4조
21-2 Covid19 Data EDA 4조
 
21-1 Covid 19 데이터 EDA 3조
21-1 Covid 19 데이터 EDA 3조21-1 Covid 19 데이터 EDA 3조
21-1 Covid 19 데이터 EDA 3조
 
21-2 말레이시아 스타벅스 EDA 2조
21-2 말레이시아 스타벅스 EDA 2조21-2 말레이시아 스타벅스 EDA 2조
21-2 말레이시아 스타벅스 EDA 2조
 
21-2 에어비앤비 리뷰평점 EDA 1팀
21-2 에어비앤비 리뷰평점 EDA 1팀21-2 에어비앤비 리뷰평점 EDA 1팀
21-2 에어비앤비 리뷰평점 EDA 1팀
 
2021호주 오픈 순위예측 프로젝트
2021호주 오픈 순위예측 프로젝트2021호주 오픈 순위예측 프로젝트
2021호주 오픈 순위예측 프로젝트
 
음원 사재기 판별 시스템 모델링
음원 사재기 판별 시스템 모델링음원 사재기 판별 시스템 모델링
음원 사재기 판별 시스템 모델링
 
악플분류 모델링 프로젝트
악플분류 모델링 프로젝트악플분류 모델링 프로젝트
악플분류 모델링 프로젝트
 
영화 어벤져스 내 네트워크 분석
영화 어벤져스 내 네트워크 분석영화 어벤져스 내 네트워크 분석
영화 어벤져스 내 네트워크 분석
 
광고 CTR 예측
광고 CTR 예측광고 CTR 예측
광고 CTR 예측
 
통신사 고객 이탈분석
통신사 고객 이탈분석통신사 고객 이탈분석
통신사 고객 이탈분석
 
건강식품리뷰데이터분석
건강식품리뷰데이터분석건강식품리뷰데이터분석
건강식품리뷰데이터분석
 
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
Airbnb 리뷰데이터 분석을 통한 좋은 숙소의 조건 분석
 
Covid19 데이터로 선진국 및 저개발국 피해규모 분석
Covid19 데이터로 선진국 및 저개발국 피해규모 분석 Covid19 데이터로 선진국 및 저개발국 피해규모 분석
Covid19 데이터로 선진국 및 저개발국 피해규모 분석
 
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언 에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
에어비앤비 리뷰데이터 분석을 통한 지역별 호스트 전략 제언
 
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
말레이시아 스타벅스 데이터 분석을 통한 현지 마케팅 전략 평가
 
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
Covid19 데이터분석을 통한 국내 코로나 대응방향 제안
 
Reinforcement Learning on Mine Sweeper
Reinforcement Learning on Mine SweeperReinforcement Learning on Mine Sweeper
Reinforcement Learning on Mine Sweeper
 

폐렴이미지 분류 모델링 프로젝트

  • 1. 21-1 DSL Modeling Project 의료데이터 모델링 폐렴 감별 CNN 모델 제작 김도언 임낙준 차지수 한영웅 허유진
  • 2. 폐렴(pneumonia) 폐포속에 염증이 생기는 질환으로서 세균이나 바이러스에 의해 발생, 다양한 합병증 통해 사망까지 이르게 하는 질병 최근 코로나를 진단하는데 CNN모델이 활용될 수 있는 방안이 연구되고 있으며 폐렴 뿐만 아니라 암, 종양 판별 등 다양한 의료분야에서 CNN 모델이 활발 하게 연구되고 있음 개요 데이터 VGGNet ResNet EfficientNet 모델링 결과
  • 3. 폐렴 데이터 셋 데이터 개요 VGGNet ResNet EfficientNet 모델링 결과 Kaggle에 있는 폐렴 데이터셋 폐렴에 걸린 폐와 정상 폐의 사진이 5876장 있으며 train, validation, test dataset이 나누어져 있음. 모델링 목표 TrainDataset으로 모델을 학습시켜 폐렴에 걸린 폐와 정상 폐의 X-ray 사진이 섞여있는 Test Dataset 사진중 정상 폐와 폐렴인 폐를 정확히 골라내는 모델 제작 * 왼쪽 이미지에서 푸르게 불타는 부분이 염증, 보다시피 육안으로 식별해 진단하기 매우 어려움!
  • 4. 작은 크기의 3x3 컨볼루션 필터(filter)를 이용해 레이어의 깊이를 늘려 우수한 성능을 보여줌 직관적이고 단순한 구조 VGGNet 개요 데이터 ResNet EfficientNet 모델링 결과 단순한 구조, 높은 성능 VGGNet
  • 5. VGGNet에 있는 13개의 컨볼루션 레이어 중 첫 번째레이어 (위), 마지막 레이어(아래) 를 통과한 16개의 채널 이미지 VGGNet 개요 데이터 ResNet EfficientNet 모델링 결과 VGGNet – Convolution layer
  • 6. VGG의 한계 성능을 높이기 위해 레이어를 많이 쌓는 것이 안 좋은 성능을 보일때가 많음 BackFoward과정에서 Gradient Degradation 발생 ResNet 개요 데이터 VGGNet EfficientNet 모델링 결과 전에 배운 것을 잊지말자 ResNet
  • 7. ResNet 개요 데이터 VGGNet EfficientNet 모델링 결과 전에 배운 것을 잊지말자 ResNet 전에 학습한 특성을 새로 학습한 것에 더함으로써 전에 배운것을 잊지 않게 하는 것이 포인트. 이 과정 하나가 Residual Block Residual Block을 여러 개 쌓아서 만든 모델이 ResNet
  • 8.
  • 9. Efficient Net 개요 데이터 VGGNet ResNet 모델링 결과 하이퍼 파라미터들의 황금비율 EfficientNet 기존의 모델 성능 향상방법 width scaling - filter의 개수를 늘려 성능향상 depth scaling - layer의 개수를 늘려 성능향상 resolution scaling - input image 해상도를 높여 성능향상 EfficientNet (Compound Scaling) 세가지 요소를 적절한 비율로 동시에 늘려 성능을 향상시킨 모델
  • 10. 모델링 개요 데이터 VGGNet ResNet EfficientNet 결과 기본 모델 EfficientNet EfficientNet depth, width, resolution의 황금비율로 만들어진 모델 Depth(# of layer) Width(# of filter) Resolution(pixel intensity) 따로 따로 조절되는 것이 아닌 Base모델에서 동일하게 phi 의 제곱 씩 늘어나는 것이 가장 효율적! Efficientb0 ,b1, b2 … (input의 크기에 따라 결정)
  • 11. 모델링 개요 데이터 VGGNet ResNet EfficientNet 결과 기본 모델 EfficientNet 그 결과, 더 적은 수의 파라미터를 사용하면서도 매우 향상된 성능을 보여줌 프로젝트 기본 모델로 ‘Efficient Net b0’ 를 채택
  • 12. 기본 모델 Weight parameter가 사전에 학습되어 있는 Efficient-b0 load 맨 마지막에 output node가 하나인 fully connected layer 추가 Normal->0 Pneumonia->1 으로 라벨링을 했기 때문에 마지막 oupt node의 개수가 하나임
  • 13. 모델링 개요 데이터 VGGNet ResNet EfficientNet 결과 성능 향상 작업 1. DataAugmentation 성능 향상 작업 2. Class weight 부여 성능 향상 작업 3. optimizer 와 학습률 조정
  • 14. 모델링 개요 데이터 VGGNet ResNet EfficientNet 결과 성능 향상 작업 1. DataAugmentation Data Augmentation (데이터증강) 모델이 학습하는 동안 인풋데이터에 랜덤한 방법으로 다양한 변형을 가하는 것으로써, 결국 모델이 학습하는 데이터 양이 늘어나는 것과 동일한 효과를 갖게 됌 이를 통해 과대적합을 방지하고 모델 성능 향상 모색
  • 15. 모델링 개요 데이터 VGGNet ResNet EfficientNet 결과 성능 향상 작업 1. DataAugmentation - RandomHorizontalFlip(수평반전) - RandomAffine 추가적으로, Normalization을 수행함 Data Augmentation 에 따라 최종 모델의 성능은 0.11 가량 차이를 보임
  • 16. 모델링 개요 데이터 VGGNet ResNet EfficientNet 결과 성능 향상 작업 2. Class weight 부여 정상 폐 사진과 폐렴 사진의 비율이 다름 해당 class의 가중치를 loss에 부여하여 성능저하를 방지 정상 폐렴 약 세 배 차이!
  • 17. 모델링 개요 데이터 VGGNet ResNet EfficientNet 결과 성능 향상 작업 2. Class weight 부여
  • 18. 모델링 개요 데이터 VGGNet ResNet EfficientNet 결과 성능 향상 작업 3. optimizer 와 학습률조정 Optimizer ADAM 을 이용해서 OPTIMIZING 진행함 학습률 조정 Loss가 낮아질수록 학습률이 조금씩 낮아지는 learning late scheduler를 세팅함
  • 19. 모델링 개요 데이터 VGGNet ResNet EfficientNet 결과 모델 훈련 결과 EfficientNET을 활용한 데이터 분류 학습의 Test Score Accuracy가 93점, F1 score가 약 95점 앞서 말한 레지던트 수련의들의 정확도 66% 를 아득히 넘어서는 결과
  • 20. 결과 개요 데이터 VGGNet ResNet EfficientNet 모델링 요약 Data Augmentation , Class weighting , 학습률 조정 -> 학습의 성능 향상 <모델간 비교> Accuracy는 VGG가 가장 높지만 컴퓨팅 리소스 / 학습시간 면에서 EfficientNET이 VGG보다 efficient!