SlideShare a Scribd company logo
1 of 29
Download to read offline
Adjuvant of
Breast Cancer Diagnosis - ABCD
박정수 박혜진 연혜민 이예은 홍예림
Adjuvant of Breast Cancer Diagnosis - ABCD
CONTENTS 1
주제 선정 배경
CONTENTS 3
전처리
CONTENTS 2
데이터 소개
CONTENTS 4
모델링
CONTENTS 5
결과
CONTENTS 1
주제 선정 배경
CONTENTS 1
주제 선정 배경
5대 암 검진 오진율 중 유방암 오진이 매우 높은 편,
부적합한 유방 촬영 장비와 전문성, 경험 미비가 문제
유방에서 아주 작은 종양은 눈으로 발견하기 어려움
모든 암과 마찬가지로 조기진단이 중요함
CONTENTS 1
주제 선정 배경
유방암 진단 주요 방법
CONTENTS 1
주제 선정 배경
Mammography
- 유방에 발생하는 종양의 크기와 모양, 유선의 확장
등을 진단할 수 있도록 도와주는 X선 촬영술
- 증상이 잘 나타나지 않는 여성의 유방암 검진에
매우 효과적인 방법
Domain Knowledge
유방암 진단에 있어서 Abnormality를
측정하는 척도는 여러가지 존재
- Mass : Breast Tissue의 Distortion(기형)
- Calcification : 석회의 존재 유무
중요한 것은 조직 뭉침의 존재 유무,
석회의 존재 유무만으로 유방암을 진단 X
더 복합적인 요인을 생각해야함
(조직의 Distortion 정도, Microcalcification)
Mammography 촬영 각도의 따라
MLO&CC로 구분하여 분류CC 기법 MLO 기법
CONTENTS 1
주제 선정 배경
모형 도식화 Model Schematic
Preprocessing
Abnormality
Detection DB
Train data
Test data
Malignant
CNN
Classification
Benign
CBIS-
DDSM
Occlusion
CONTENTS 2
데이터 소개
The Source of Data
- CBIS DDSM(Curated Breast Imaging Subset of DDSM) dataset 사용
- mass_case_train_set : 1319장 , mass_case_test_set : 327장을 사용하여 모델링 진행
CONTENTS 2
데이터 소개
Data Format
- DICOM 형태로 저장
- 전문가들에 의해 ROI Segmentation 작업 완료
- Label 값에 해당하는 pathology (malignant or benign) 분류 완료 by 조직검사
CONTENTS 3
전처리
Median Filter
- Non Linear Filter :
Linear Filter의 결점
(Denosing시 Blurring Effect) 극복
- salt and pepper noise나
Gaussian Noise의 제거에 효과적
- 이미지 선명도를 유지하면서
이상치(Outlier)를 제거Before After
CONTENTS 3
전처리
작동 원리
인접한 모든 픽셀들을 오름차순으로 나열, 중앙값으로 대체
CONTENTS 3
전처리
CLAHE (Contrast Limited Adaptive
Histogram Equalization)
- Histogram Equalization의 한 종류로,
한 이미지를 여러 개의 블록으로 나누어
블록마다 따로 Histogram Equalization을
시행
Before After
Histogram Equalization?
의학 이미지의 특징
: 관심 영역과 배경 사이의 대비가 크지 않음
이미지의 대비를 크게 하여 배경과 관심영역
을 잘 구분할 수 있도록 처리가 필요함
-> 이 때 사용하는 것이
Histogram Equalization
CONTENTS 3
전처리
작동원리
Histogram Equalization : 특정 밝기
level에 집중되어 있는 것을 균일화하여
이미지 전체의 대비를 키우는 방법
- 단순히 이미지 전체의 대비를 늘리다
보면 관심 영역의 대비가 오히려 줄어들
수 있음
CONTENTS 3
전처리
Original Data Histogram Equalization CLAHE
CONTENTS 3
전처리
Otsu’s Binarization
Otsu의 이진화 방법은 임계값 T를 기준으
로 영상 픽셀들을 두 클래스로 분류했을 때
두 클래스간의 intra-class variance를 최
소화하거나 또는 inter-class variance를
최대화하는 T를 찾는 이진화 방법이다.
Before After
CONTENTS 3
전처리
원본 영상 픽셀들의 밝기값 Histogram 결과값
작동원리
In Histogram
배경영역은 밝기 값 100정도, 물체는
150의 분포, 임계 값을 T=125주고
binarization 진행하면 가장 좋은 결과값
기대
CONTENTS 3
전처리
Median Filter : 이미지 상의 노이즈를 제거
CLAHE(Contrast Limited Adaptive Histogram Equalization) : mass의 중요한 특징들을 강조
Otsu’s Binarization :
근육을 없애(muscle removal) 의사들에게 육안으로 판단하는 데 보조해주는 역할
Image Enhancement Technique
CONTENTS 3
전처리
Augmentation
Data Size 늘리기 위해서 다음과 같은 방법을
랜덤 적용하여 변형한 이미지를 생성
<좌우반전/상하반전/회전/가우시안블러>
Classification CNN Retrain Inception
Retraining 과정 : Transfer Learning(전이학습)
Transfer learning: 성능이 입증된 CNN을 가져다 Feature를 추출하고, 이를 바탕으로 Classification 수행
Classification : Malignant Vs. Benign
Classification CNN Retrain Inception
Inception : 암 진단을 위해 전이학습에 사용한 모델
진단의 정확도를 높이기 위해 layer를 깊게 쌓고자 함
이 때 발생하는 문제점 :
1. 연산량이 늘어남
2. Vanishing Gradient
1 * 1 conv layer
- 연산량 감소
- 비선형적 함수의 원활한 도입
auxiliary classifier
- softmax를 통해 결과를 뽑아내는 부분을 중간 중간에 배치, vanishing gradient 문제 해결
Classification CNN Retrain Inception
Bottleneck
가장 마지막 CNN 블록, 즉 Fully-connected layer
직전의 CNN 블록의 결과를 Bottleneck feature
CNN 모델은 각 CNN 블록의 pooling layer를 지나면서
Feature size가 줄어들기 때문에
Feature size를 기준으로 생각하면 병을 뒤집은 모양과 비슷하다.
(차원을 줄였다 뒤에서 늘리기 때문)
CONTENTS 5
결과
AUC: 0.685
출처 : Whole mammogram image classification with CNN,
2017 IEEE International Conference on Bioinformatics and Biomedicine (BIBM), Kansas City, MO, USA
augmentation을 한 test의 AUC = 0.73
augmentation을 하지 않은 test의 AUC = 0.62
Baseline :
CONTENTS 5
결과
Occlusion Sensitivity
*Occluder : 사진 속 검정색 박스
Classification prediction 결과 설명에 도움
Occluder 위치에 따른 함수로
Correct class에 대한
확률 값을 그림으로 표현
즉, 주어진 이미지에서 Occluder의 위치를
옮기기를 반복하면서 class의 확률 값을 구하고,
이를 2차원 heatmap으로 시각화
CONTENTS 5
결과
ex) benign
ex) malignant
*Occluder : 사진 속 하늘색 박스
Correct class에 해당하는 object가
가려지게 될 때, 확률 값 현저히 하락
heatmap에서, 종양에 해당하는 부분의
색깔이 가장 어두운 파란색에 해당
Occlusion Sensitivity
부록
모델링 – Patch Detection
Fast F-CNN
RPN
Faster R-CNN (RPN + Fast R-CNN)
외부의 느린 selective search(CPU로 계산) 대신,
내부의 빠른 RPN(GPU로 계산)을 사용
-> RPN이 핵심
Labeling 작업한 Patch 사진전체 사진 Detect
부록
모델링 – Patch Detection
Labeling 작업한 Patch 사진
Labeling을 진행한 이유
분류 모델 학습시킬 때,
패치에 대한 좌표가 있어야 하는데
가지고 있는 데이터 패치에 대한
좌표가 없었기 때문
부록
모델링 – Patch Detection
Thank you

More Related Content

More from BOAZ Bigdata

제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack BotBOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News DetectionBOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발BOAZ Bigdata
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘BOAZ Bigdata
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스BOAZ Bigdata
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...BOAZ Bigdata
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템BOAZ Bigdata
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [AutoCar죠] : 자율주행 로봇 층간 이동을 위한 인지 기능 구현
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [AutoCar죠] : 자율주행 로봇 층간 이동을 위한 인지 기능 구현제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [AutoCar죠] : 자율주행 로봇 층간 이동을 위한 인지 기능 구현
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [AutoCar죠] : 자율주행 로봇 층간 이동을 위한 인지 기능 구현BOAZ Bigdata
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축BOAZ Bigdata
 

More from BOAZ Bigdata (20)

제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [투니버스] : 스파크 기반 네이버 웹툰 댓글 수집 및 분석
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [ztyle] : 손그림 의류 검색 서비스
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SiZoAH] : 리뷰 기반 의류 사이즈 추천시스템
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [AutoCar죠] : 자율주행 로봇 층간 이동을 위한 인지 기능 구현
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [AutoCar죠] : 자율주행 로봇 층간 이동을 위한 인지 기능 구현제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [AutoCar죠] : 자율주행 로봇 층간 이동을 위한 인지 기능 구현
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [AutoCar죠] : 자율주행 로봇 층간 이동을 위한 인지 기능 구현
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Catch, Traffic!] : 지하철 혼잡도 및 키워드 분석 데이터 파이프라인 구축
 

제 8회 BOAZ 빅데이터 컨퍼런스 -06 ABCD(Adjuvant of Breast Cancer Diagnosis)

  • 1. Adjuvant of Breast Cancer Diagnosis - ABCD 박정수 박혜진 연혜민 이예은 홍예림
  • 2. Adjuvant of Breast Cancer Diagnosis - ABCD CONTENTS 1 주제 선정 배경 CONTENTS 3 전처리 CONTENTS 2 데이터 소개 CONTENTS 4 모델링 CONTENTS 5 결과
  • 4. CONTENTS 1 주제 선정 배경 5대 암 검진 오진율 중 유방암 오진이 매우 높은 편, 부적합한 유방 촬영 장비와 전문성, 경험 미비가 문제 유방에서 아주 작은 종양은 눈으로 발견하기 어려움 모든 암과 마찬가지로 조기진단이 중요함
  • 5. CONTENTS 1 주제 선정 배경 유방암 진단 주요 방법
  • 6. CONTENTS 1 주제 선정 배경 Mammography - 유방에 발생하는 종양의 크기와 모양, 유선의 확장 등을 진단할 수 있도록 도와주는 X선 촬영술 - 증상이 잘 나타나지 않는 여성의 유방암 검진에 매우 효과적인 방법
  • 7. Domain Knowledge 유방암 진단에 있어서 Abnormality를 측정하는 척도는 여러가지 존재 - Mass : Breast Tissue의 Distortion(기형) - Calcification : 석회의 존재 유무 중요한 것은 조직 뭉침의 존재 유무, 석회의 존재 유무만으로 유방암을 진단 X 더 복합적인 요인을 생각해야함 (조직의 Distortion 정도, Microcalcification) Mammography 촬영 각도의 따라 MLO&CC로 구분하여 분류CC 기법 MLO 기법 CONTENTS 1 주제 선정 배경
  • 8. 모형 도식화 Model Schematic Preprocessing Abnormality Detection DB Train data Test data Malignant CNN Classification Benign CBIS- DDSM Occlusion
  • 9. CONTENTS 2 데이터 소개 The Source of Data - CBIS DDSM(Curated Breast Imaging Subset of DDSM) dataset 사용 - mass_case_train_set : 1319장 , mass_case_test_set : 327장을 사용하여 모델링 진행
  • 10. CONTENTS 2 데이터 소개 Data Format - DICOM 형태로 저장 - 전문가들에 의해 ROI Segmentation 작업 완료 - Label 값에 해당하는 pathology (malignant or benign) 분류 완료 by 조직검사
  • 11. CONTENTS 3 전처리 Median Filter - Non Linear Filter : Linear Filter의 결점 (Denosing시 Blurring Effect) 극복 - salt and pepper noise나 Gaussian Noise의 제거에 효과적 - 이미지 선명도를 유지하면서 이상치(Outlier)를 제거Before After
  • 12. CONTENTS 3 전처리 작동 원리 인접한 모든 픽셀들을 오름차순으로 나열, 중앙값으로 대체
  • 13. CONTENTS 3 전처리 CLAHE (Contrast Limited Adaptive Histogram Equalization) - Histogram Equalization의 한 종류로, 한 이미지를 여러 개의 블록으로 나누어 블록마다 따로 Histogram Equalization을 시행 Before After Histogram Equalization? 의학 이미지의 특징 : 관심 영역과 배경 사이의 대비가 크지 않음 이미지의 대비를 크게 하여 배경과 관심영역 을 잘 구분할 수 있도록 처리가 필요함 -> 이 때 사용하는 것이 Histogram Equalization
  • 14. CONTENTS 3 전처리 작동원리 Histogram Equalization : 특정 밝기 level에 집중되어 있는 것을 균일화하여 이미지 전체의 대비를 키우는 방법 - 단순히 이미지 전체의 대비를 늘리다 보면 관심 영역의 대비가 오히려 줄어들 수 있음
  • 15. CONTENTS 3 전처리 Original Data Histogram Equalization CLAHE
  • 16. CONTENTS 3 전처리 Otsu’s Binarization Otsu의 이진화 방법은 임계값 T를 기준으 로 영상 픽셀들을 두 클래스로 분류했을 때 두 클래스간의 intra-class variance를 최 소화하거나 또는 inter-class variance를 최대화하는 T를 찾는 이진화 방법이다. Before After
  • 17. CONTENTS 3 전처리 원본 영상 픽셀들의 밝기값 Histogram 결과값 작동원리 In Histogram 배경영역은 밝기 값 100정도, 물체는 150의 분포, 임계 값을 T=125주고 binarization 진행하면 가장 좋은 결과값 기대
  • 18. CONTENTS 3 전처리 Median Filter : 이미지 상의 노이즈를 제거 CLAHE(Contrast Limited Adaptive Histogram Equalization) : mass의 중요한 특징들을 강조 Otsu’s Binarization : 근육을 없애(muscle removal) 의사들에게 육안으로 판단하는 데 보조해주는 역할 Image Enhancement Technique
  • 19. CONTENTS 3 전처리 Augmentation Data Size 늘리기 위해서 다음과 같은 방법을 랜덤 적용하여 변형한 이미지를 생성 <좌우반전/상하반전/회전/가우시안블러>
  • 20. Classification CNN Retrain Inception Retraining 과정 : Transfer Learning(전이학습) Transfer learning: 성능이 입증된 CNN을 가져다 Feature를 추출하고, 이를 바탕으로 Classification 수행 Classification : Malignant Vs. Benign
  • 21. Classification CNN Retrain Inception Inception : 암 진단을 위해 전이학습에 사용한 모델 진단의 정확도를 높이기 위해 layer를 깊게 쌓고자 함 이 때 발생하는 문제점 : 1. 연산량이 늘어남 2. Vanishing Gradient 1 * 1 conv layer - 연산량 감소 - 비선형적 함수의 원활한 도입 auxiliary classifier - softmax를 통해 결과를 뽑아내는 부분을 중간 중간에 배치, vanishing gradient 문제 해결
  • 22. Classification CNN Retrain Inception Bottleneck 가장 마지막 CNN 블록, 즉 Fully-connected layer 직전의 CNN 블록의 결과를 Bottleneck feature CNN 모델은 각 CNN 블록의 pooling layer를 지나면서 Feature size가 줄어들기 때문에 Feature size를 기준으로 생각하면 병을 뒤집은 모양과 비슷하다. (차원을 줄였다 뒤에서 늘리기 때문)
  • 23. CONTENTS 5 결과 AUC: 0.685 출처 : Whole mammogram image classification with CNN, 2017 IEEE International Conference on Bioinformatics and Biomedicine (BIBM), Kansas City, MO, USA augmentation을 한 test의 AUC = 0.73 augmentation을 하지 않은 test의 AUC = 0.62 Baseline :
  • 24. CONTENTS 5 결과 Occlusion Sensitivity *Occluder : 사진 속 검정색 박스 Classification prediction 결과 설명에 도움 Occluder 위치에 따른 함수로 Correct class에 대한 확률 값을 그림으로 표현 즉, 주어진 이미지에서 Occluder의 위치를 옮기기를 반복하면서 class의 확률 값을 구하고, 이를 2차원 heatmap으로 시각화
  • 25. CONTENTS 5 결과 ex) benign ex) malignant *Occluder : 사진 속 하늘색 박스 Correct class에 해당하는 object가 가려지게 될 때, 확률 값 현저히 하락 heatmap에서, 종양에 해당하는 부분의 색깔이 가장 어두운 파란색에 해당 Occlusion Sensitivity
  • 26. 부록 모델링 – Patch Detection Fast F-CNN RPN Faster R-CNN (RPN + Fast R-CNN) 외부의 느린 selective search(CPU로 계산) 대신, 내부의 빠른 RPN(GPU로 계산)을 사용 -> RPN이 핵심
  • 27. Labeling 작업한 Patch 사진전체 사진 Detect 부록 모델링 – Patch Detection
  • 28. Labeling 작업한 Patch 사진 Labeling을 진행한 이유 분류 모델 학습시킬 때, 패치에 대한 좌표가 있어야 하는데 가지고 있는 데이터 패치에 대한 좌표가 없었기 때문 부록 모델링 – Patch Detection