(독서광) 책 vs 책: 정형 vs 비정형 딥러닝

책 vs 책:
정형 vs 비정형 딥러닝

책 vs 책
책 vs책:정형vs비정형딥러닝
vs
실제 데이터를 활용해 당면한 문제를 푼다는 점에서 두 책은 유사점이 많다!

한 페이지 요약
딥러닝을 이용한 정형 데이터 분석 파이토치 딥러닝 마스터
다루는 데이터 정형 데이터(숫자) 비정형 데이터(이미지)
기반 기술 케라스 파이토치
도메인 경전철 지연 분석 의료 영상(CT 이미지)에서 폐 결절
찾기
분석 과정에서 다루는
구간
데이터 전처리부터 모델 배포까지 데이터 전처리부터 모델 배포까지
데이터 토론토 경전철(Tram) 지연 데이터
(TTC Streetcar Delay Data)
LUNA(LUng Nodule Analysis) 2016
데이터셋
시각화 도구 텐서보드 텐서보드
모델 복잡도 낮음 높음

무엇이 두 책을 흥미롭게 만드는가?(1)
정형 데이터 분석에는 딥러닝을 적용할 수 없을까?
• 기존에 출간된 딥러닝 책들은 이미지와 텍스트 같은 비정형 데이터에 집중
• 많은 데이터 확보의 용이성
• 기존에 범용으로 구축된 모델을 재활용
• 하지만 이 책은 오직 정형 데이터에만 집중
• 실제로 우리가 비즈니스 가치를 창출하고 있는 많은 데이터는 정형임을 명심할 필요가 있음 → 현실적인 문제 해결에 꼭 필요
• 정말로 정형 데이터 분석에 딥러닝을 적용하면 효과가 있을까?
• 이 책에서는 XGBoost 머신러닝 기법과 비교해 성능, 모델 훈련 시간, 코드 복잡도, 유연성을 비교 ***

정형 데이터 분석에는 딥러닝을 적용할 수 없을까?
• XGBoost는 정형 데이터 처리에 있어 발군의 실력을 자
랑함
• 그렇더라도, 유연성 측면에서 딥러닝 모델의 우월성
을 따라가기는 쉽지 않음
• 여기서 질문 한 가지: 복합적인 데이터 소스를 다룰
필요가 있을까?

데이터 사전 분석/가공과 케라스 모델 매핑

엔드 투 엔드 흐름
• 구슬이 서말이라도 꿰어야 보배다
• 데이터셋 가공
• 모델 훈련
• 모델 배포(웹, 페이스북 메신저)
• 전과정을 모두 다루고 있음

우리는 실 세계 문제 해결에 나서야 한다
https://howardchen.substack.com/p/this-amateur-programmer-fought-cancer
https://news.hada.io/topic?id=6642
2018년, X-Ray 이미지를 올리면 AI로 유방암을 진단해주는 사
이트를 공개한 coolwulf에 대한 이야기
• 자신의 돈으로 50개의 Nvidia GTX 1080 Ti 로 로컬 GPU
클러스터를 구성
• 완전히 무료. 정확도가 90%에 달함
• "암 환자와 가족들은 너무 많은 것을 견뎌왔기에, 모
두가 그들을 돕고 싶어 한다고 생각합니다. 나에게는
그럴 수 있는 능력이 있고요"
레딧에 소개된 이후 한 사용자의 댓글
• 모든 영웅이 망토를 입는 것은 아닙니다.
“Not all heroes wear capes”

건초 더미에서 바늘 찾기
도대체 악성 종양 판별 문제가 개 vs 고양이 문제와
다른 이유가 무엇일까?
• 거의 대부분의 환자의 몸은 건강한 세포로 이뤄
져 있기 때문에 악성 종양이 있는 경우를 봐도 CT
에 있는 99.9999%의 복셀은 암 세포가 아니다.
• 비율로 따지면 고해상도TV(HDTV) 어딘가에 색이
이상한 2개 픽셀 정도에 해당한다.
• 결절을 찾는 일은 책으로 가득한 서가에서 철자
가 틀린 단어 하나를 찾는 것과 비슷하다.

엔드 투 엔드 흐름
• 결절 분석과 진단을 위해
• 세그멘테이션, 그룹화, 분류라는 세 가지 단위 문제로 나눔
• 각각에 대해 집중하고
• 결과를 엮는 파이프라인을 구성하는 방법을 사용

모델 평가를 위한 방안

대상 독자
어느 정도 머신러닝과 딥러닝 기초를 알고 있는 분들…
• 조금 더 체계적으로 업무를 수행하고 싶은 현업 데이터 사이언티스트와 데이터 엔지니어
• 딥러닝이 현업에서 무엇을 의미하는지 구체적인 도메인과 연계해 실전 사례를 보고 싶은 입문자
• 데이터 확보부터 모델 서빙에 이르기까지 엔드 투 엔드로 프로젝트 진행 과정을 배우고 싶은 분

결론
***** 학습을 위한 학습을 넘어서 인공지능 기술로 현실의 문제를 풀고 싶은 모든 분들께
• 실제 현업에서 어떤 점에 주목하고 어떤 과정을 밟는지 구경하는 재미가 쏠쏠함
• “이 책에서 전달하고자 하는 딥러닝 프로젝트의 진실은 모닝커피 한잔을 곁들인 멋진 논문 읽기가 아니라, 손과 신발에 흙을 잔뜩 묻
혀가며 제대로 동작하기 전까지 무수한 잘못을 시행착오 끝에 찾아내야 하는 무척 고된 작업이다.” - <파이토치 딥러닝 마스터> 추천
사에서
• 이 두 책을 읽고 나면 딥러닝 관련해 세미나를 듣거나 책을 읽거나 프로젝트를 하거나 머리 속에 참조가 가능한 프레임이 생겨서 상당
히 유리한 위치를 점유할 수 있을 것이다

발표자 소개
기술 배경
전문 검색 엔진, 임베디드 시스템(리눅스 커널 디바이스 드라이버), 빅데이터/인공지능 연구 개발,
고성능 고가용성 데이터베이스
주요활동
IT 전문서 번역 (클린 코드, 피플웨어, 해커: 광기의 랩소디, 게임 엔진 블랙 북 등)
개발강의 (삼성전자, SK C&C, 삼성SDC, 현대자동차 기술 세미나와 교육)
활동채널
블로그: https://jhrogue.blogspot.com
슬라이드 셰어: https://www.slideshare.net/jrogue/presentations
유튜브: https://www.youtube.com/c/박재호dev
문의 jrogue@gmail.com
박재호

(독서광) 책 vs 책: 정형 vs 비정형 딥러닝

Recommended

Recommended

More Related Content

Similar to (독서광) 책 vs 책: 정형 vs 비정형 딥러닝

Similar to (독서광) 책 vs 책: 정형 vs 비정형 딥러닝 (20)

More from Jay Park

More from Jay Park (20)

(독서광) 책 vs 책: 정형 vs 비정형 딥러닝