[YBIGTA Open Session] 데이터로 바라본 독버섯
- 1. By 김범수 손진원 김지중 박주연
데이터로 바라본 독버섯
함부로 먹지 마요
함부로 먹지 마요
데이터로 바라본 독버섯
YBIGTA 김범수, 손진원, 김지중, 박주연
- 3. By 김범수 손진원 김지중 박주연
데이터로 바라본 독버섯
함부로 먹지 마요
문 제 제 기
- 7. By 김범수 손진원 김지중 박주연
데이터로 바라본 독버섯
함부로 먹지 마요
데이터 수집
- 9. Data Collection
• 버섯 소개 페이지를 활용
• 버섯 이미지와 학술명 혹은 일반명 크롤
• Wikipedia를 통해 버섯 사전 구축
• 버섯 사진 – 식용 여부 맵핑
• 약 2,700개의 데이터
- 10. 2. 종류와 무관하게 수집
Data Collection
• Shutterstock 페이지 활용
• edible fungi / toadstool 등 키워드
• 장점 : 많은 이미지 데이터
• 단점 : 데이터의 정확성
• 약 80,000개의 데이터 (4GB)
- 11. By 김범수 손진원 김지중 박주연
데이터로 바라본 독버섯
함부로 먹지 마요
데이터 전처리
- 14. 2. 버섯이 아닌 이미지
Data Preprocessing
• 학습하기 좋은 버섯이란..?
• 해결 방안
• 픽셀간 상관계수
• 픽셀간 Euclidean Distance
- 16. 70 * 70 * 3 = 가로, 세로, RGB
14,700 * 1 벡터로 평탄화
학습하기 좋은 이미지로 기준벡터 만들기
- 17. 70 * 70 * 3 = 가로, 세로, RGB
70 * 70 * 3 = 가로, 세로, RGB
70 * 70 * 3 = 가로, 세로, RGB
14,700 * 1 벡터로 평탄화
14,700 * 1 벡터로 평탄화
14,700 * 1 벡터로 평탄화
- 18. 양질 버섯 평균백터
검증이 필요한 버섯 1
검증이 필요한 버섯 2
검증이 필요한 버섯 3
검증이 필요한 버섯 4
피어슨 상관계수
상관계수 : 0.9023
상관계수 : 0.223
상관계수 : 0.403
상관계수 : 0.7518만 개 2만 개
- 19. By 김범수 손진원 김지중 박주연
데이터로 바라본 독버섯
함부로 먹지 마요
데이터 모델링
- 43. By 김범수 손진원 김지중 박주연
데이터로 바라본 독버섯
함부로 먹지 마요
EPILOGUE
- 46. By 김범수 손진원 김지중 박주연
데이터로 바라본 독버섯
함부로 먹지 마요
Thank you