SlideShare a Scribd company logo
브랜딧(Brandeat)
: 외식 프랜차이즈 창업 추천 솔루션
파이썬을 활용한
빅데이터 청년인재 양성 프로그램
세종대학교 세캉스조
곽현석, 권혜인, 민두홍, 박원준, 이재랑, 최태호, 홍영현
Index
하나. 분석 배경
둘. 활용 데이터
셋. 데이터 처리 및 분석
넷. 서비스 활용
다섯. 기대효과 및 한계점
3
DATE
하나. 분석 배경
어떻게 하면 돈을 벌 수 있을까?
분석배경
5
하나
창업에
관심이 있다
69%
45.9%
선호하는 창업방식
프랜차이즈
출처 프랜차이즈산업연구원
출처 LG Challengers
창업 선호 분야
음식점 15%
카페 36%
외식업
51%
출처 LG Challengers
대학생 대상
6
출처 맥세스컨설팅 전수조사
외식 프랜차이즈 폐업수
매년 ‘증가’ 하는 폐업수
어려움과 실패
분석배경
하나
10500
11000
9000
7350
2017
2016
2014 2015
해결 할 수는 없을까?
분석배경
하나
7
DATE
둘. 활용 데이터
프랜차이즈 데이터 수집 : 웹 크롤링
활용 데이터
둘
9
브랜드 DATA
출처
공정거래위원회
수집데이터
정보공개서
가맹본부별 비교정보
브랜드별 비교정보
기간
2017년
총 4332개
SNS DATA
출처
소상공인마당
수집데이터
인지도
감성분석
기간
최근 3개월
총 4332개
상권 데이터 수집 : 공공데이터
활용 데이터
둘
10
상권 DATA
출처
서울 열린 데이터 광장
API
수집데이터
서울시 우리마을가게
상권분석 서비스
(14개 항목)
기간
17년 1월 ~ 18년 5월
약 30,000 개
업소 DATA
출처
공공데이터포탈
수집데이터
상가 업소 정보
기간
2018년 6월
약 100,000개
DATE
셋. 데이터 처리 및 분석
데이터 활용 : 파생변수
데이터 처리 및 분석
셋
안정적인
시장 집입
해지율
매출액
증가율
개업률
창업비 대비
매출
본사
부채
비율
데이터 처리 및 분석
파생변수
1. 평판
=
긍정 언급수+1
소셜 언급수+1
2. 성장성
개업률 =
신규 점포수
전체 점포수
매출액 증가율
3. 본사의 신용도
부채비율
법 위반 유무
5. 창업비 대비 매출
=
평균 매출액
비용합계
본사의
안정성
4. 안정성
안정적인 시장진입 =
가맹점 수
60
해지율 =
계약 해지
신규 점포수
본사의 안정성 = 자기 자본 비율
부채비율
평판
12
본사
법위반
13
데이터 탐색 : 분포
데이터 처리 및 분석
셋
평판 성장성
본사의
신용도
안정성
창업대비
매출
개월 수
mean 0.89 8.82 0.70 6.00 3.37 90.04
min 0.03 0.00 0.00 0.00 0.02 20.00
25% 0.86 0.26 0.04 4.02 1.74 45.00
50% 0.93 1.20 0.34 6.91 2.79 73.00
75% 1.00 5.95 0.79 8.00 4.05 115.50
max 1.00 69.50 2.71 10.20 142.62 493.00
안정성 : 전체적으로 고르지만 들쭉날쭉하게 분포함
성장성, 창업대비매출 : 분포가 고르지 않고 한쪽으로 치우친 모양
안정성 창업대비매출
성장성
14
데이터 탐색 : 상관관계
데이터 처리 및 분석
셋
본사의신용도와 안정성
상관계수 : 0.45
scatterplot : 비선형적 상관관계
성장성과 개월수
상관계수 ; -0.43
scatterplot : 뚜렷한 관계확인
어려움
전처리 : 활용 데이터 처리 및 통합
데이터 처리 및 분석
셋
* Naver와 Kakao API를 이용해 구한 각 프랜차이즈 별 실제 점포데이터와 주변시설(지하철, 병원 등)과 인구수(유동,상주)데이터를 결합해
각 점포별 매출액을 예측해보았으나 수도권 위주의 데이터가 수집되어 비수도권 프랜차이즈가 추천대상에 포함되지 않음
게다가 기존 데이터에 비해 개수의 차이가 미미함
하지만 ‘가맹점 수‘와 ‘가맹점 매출액’이 없어 누락되는 데이터 수가 많음
파생변수 생성에 사용되는 변수들 위주로 전처리
내용
재무제표 정보가 없고
‘부채’가 ‘0’보다 작은
데이터 삭제
‘가맹점 수’가
‘0’인 데이터 삭제
‘가맹점 매출액’이
‘0’인 데이터 삭제
데이터 수 4324개 -> 3303개 3303개 -> 2489개 2489개 -> 1555개
15
프랜차이즈 데이터 분석 : K-means군집분석
데이터 처리 및 분석
셋
16
본사의 신용도
안정성
창업대비매출
성장성
사업개월수
평판
12개
프랜차이즈 데이터 분석 : 군집분석
데이터 처리 및 분석
셋
17
N0.1 Long-run형 N0.2 슈퍼루키형
프랜차이즈 데이터 분석 : 군집분석
데이터 처리 및 분석
셋
18
N0.3 본사신뢰형 N0.4 High risk High return형
상권 추천 서비스
데이터 처리 및 분석
셋
19
10개의 업종별
상권 추천/비추천 분류 모델
서울시 주요 상권 총 1744길
상권 관련정보 68개
2017년 1월~ 2018년 5월
총 27005개 데이터
매출 건수를 A,B,C,F 평가 등급로 나누어 분류
B 등급 (안전) 초록색
F 등급 (위험) 빨간색
A 등급 (추천) 파란색
C 등급 (주의) 노란색
상권 데이터 분석 : 랜덤 포레스트
데이터 처리 및 분석
셋
20
Why?
연령대_20_유동인구_수
연령대_10_유동인구_수
연령대_30_유동인구_수
남성_유동인구_수
연령대_60_이상_유동인구_수
연령대_50_유동인구_수
여성_유동인구_수
아파트_평균_시가
연령대_40_유동인구_수
숙박_시설_수
1 트리 개수
30개
2 Variable importance Top 10
• 모델에 대한 설명력을 위한 트리기반모형
변동감소
• 상권 분석에서 사용되는 독립변수 58개, 다중 공선성을 고려해야함
상권 데이터 분석 : 랜덤 포레스트 성능
데이터 처리 및 분석
셋
훈련데이터 70% 분류 모델 적합
검증데이터 30% 분류 모델 평가
21
Grade A Grade B Grade C Grade F
Grade A 1521 207 12 0
Grade B 235 1898 315 7
Grade C 16 267 1885 163
Grade F 1 8 197 1370
훈련 accuracy 0.99
검증 accuracy 0.82
precision recall f1-score support
Grade A 0.86 0.87 0.87 1740
Grade B 0.8 0.77 0.79 2455
Grade C 0.78 0.81 0.8 2331
Grade F 0.89 0.87 0.88 1576
avg 0.82 0.82 0.82 8102
여러 성능 지표에서 준수한 성능을 보여줌
상권 데이터 분석 : 딥러닝 다중분류
데이터 활용 및 분석
셋
22
Input_dim 58
Hidden layer node 3
Output layer node 1
Learning algorithm Gradient Descent
Transfer function Softmax
Loss function Categorical_Crossentropy
Optimizer Adam
향상된 모델을 만들기 위하여 딥러닝을 활용한 모델 구축
1 MLP Binary Classification 2 Loss
상권 데이터 분석 : 딥러닝 성능
데이터 처리 및 분석
셋
훈련데이터 70% 분류 모델 적합
검증데이터 30% 분류 모델 평가
23
Grade A Grade B Grade C Grade F
Grade A 1495 234 9 20
Grade B 213 1874 359 90
Grade C 16 267 1880 1680
Grade F 4 3 234 1335
precision recall f1-score support
Grade A 0.87 0.86 0.86 1740
Grade B 0.79 0.76 0.78 2455
Grade C 0.76 0.81 0.78 2331
Grade F 0.88 0.85 0.86 1576
avg 0.81 0.81 0.81 8102
훈련 accuracy 0.832
검증 accuracy 0.8126
랜덤 포레스트와 비교할때
예측력에 큰 차이 無
DATE
넷. 서비스 활용 (Tableau)
고객 페르소나
서비스 활용
넷
25
열정적인 고객 김율곡씨
나이 : 31세
선호지역 : 성북구
고용주가 되고 싶어 창업을 생각
특징
서류 100회 탈락
면접 20회 탈락
선호업종 : 카페
대기만성형
고객 페르소나
서비스 활용
넷
26
노후 대비 고객 최군자씨
나이 : 62세
선호지역 : 영등포
안정적인 노후 대비를 위해 창업을 생각
특징
회사 정년퇴임
자식들 모두 독립
선호업종 : 한식
Long-run형
상권 추천 김율곡씨
서비스 활용
넷
27
카페 추천 등급
및 메가엠지씨 매장 맵핑
선호지역 성북구 확대
및 지역 확인
STEP 1 STEP 2
매장지역 A (추천) B (안전) C (주의) F (위험)
상권 추천 김율곡씨
서비스 활용
넷
28
매장지역 A (추천) B (안전) C (주의) F (위험)
STEP 3
상권 추천 최군자씨
서비스 활용
넷
29
한식 추천 등급
및 돌배기집 매장 맵핑
선호지역 영등포구 확대
및 지역 확인
STEP 1 STEP 2
매장지역 A (추천) B (안전) C (주의) F (위험)
상권 추천 최군자씨
서비스 활용
넷
30
매장지역 A (추천) B (안전) C (주의) F (위험)
STEP 3
추천 결과
서비스 활용
넷
31
열정적인 김율곡씨 노후 대비 최군자씨
추천 브랜드 : 메가엠지씨
추천 상권 : 도봉로10다길 외 상권
추천 브랜드 : 돌배기집
추천 상권 : 영신로 19길 외 상권
서비스 프로세스
서비스 활용
넷
32
DATE
다섯. 기대효과 및 한계
경쟁 업체와 비교분석
기대효과 및 한계
다섯
34
주요 특징
프랜차이즈 정보공개서를
바탕으로 필터링하여 상위에 있는
프랜차이즈를 추천해주는 서비스
예비창업자가 원하는 업종, 프랜차이즈
를 선택하고 가맹점 별 비용 등을
고려해 조건에 맞는
상권을 추천해주는 서비스
업종 선택부터 프랜차이즈 선택,
입지 추천까지 원스톱으로
진행되는 서비스
장 점
유망 창업 아이템 순위
신규 브랜드 랭킹 등 다양한 지표 활용한
랭킹시스템 제공
업종, 창업비용, 임대료,
희망 입지 등의 정보를 입력하면 해당
아이템의 종합적인
경쟁분석제공
정부에서 제공하는 무료서비스임
경쟁업체 서비스 제공 및
예비창업자가 최소한의
배경지식만 갖추어도
상황에 맞는
프랜차이즈를 선택가능
단 점
예비 창업자 자신이 어떤 프랜차이즈를 어떤 위치에 할 것인지,
비용은 얼마나 드는지. 사전에 알아야하는 정보가 많음
프랜차이즈와 예비창업자의 직접적인
매칭에는 관여하지 않음
BRANDEAT
창업경영신문 소상공인마당
외식 프랜차이즈 창업 솔루션
기대효과 및 한계점
다섯
기대 효과
1.프랜차이즈 창업 정보의 격차 완화
→ 프랜차이즈 창업에 대한 장벽이 낮아짐
2.예비 창업자들의 실패율 감소
3. 일반 기업에서 제공하는 데이터에 대한
접근이 가능하다면 발전된 서비스 제공 가능
한계점
35
1. 결측데이터
2. 민간데이터 활용 불가
3. 소셜미디어 분석 신뢰도
분석 Tool
분석 Tool
여섯
36
- 분석 tool
크롤링 및 전처리, 파생변수 생성
머신러닝(군집분석, 랜덤포레스트) 및 딥러닝(MLP)
EDA
- 분석 tool
R : 군집분석 최적화 및 시각화
Tableau : 서비스 활용 시연
- 분석 tool
서울특별시 지도 표시
업종별 추천등급, 프랜차이즈 매장 맵핑
37
감사합니다
38
데이터 활용 : 파생변수
데이터 활용 및 분석
셋
안정적인
시장 집입
해지율
매출액
증가율
개업률
창업비 대비
매출
본사
부채
비율
데이터 활용 및 분석
파생변수
1. 평판
=
긍정 언급수+1
총 소셜 언급수+1
2. 성장성
개업률 =
신규 점포수
전체 점포수
※ 전체 점포수 = 가맹점수 + 계약해지 + 계약종료
3. 본사의 신용도
= 𝑒
− 부채비율+법위반횟수∗0.001
※ 부채비율 =
𝑄3 + 1.5𝐼𝑄𝑅 , 부채비율 ≥ 𝑄3
부채비율 , 부채비율 < 𝑄3
5. 창업비 대비 매출
=
평균 매출액
비용합계
본사의
안정성
4. 안정성
= 가맹점 수 – 해지율 + 본사의 안정성
※ 안정적인 시장진입 =
2 , 가맹점 수 ≥ 120
가맹점수
60 , 가맹점 수 < 120
※ 해지율 =
𝑥−min(𝑥)
max 𝑥 −min(𝑥)
, 𝑥 =
계약해지+1
신규개점+1
※ 본사의 안정성 = 자기자본 비율 – 부채비율
※ 자기자본비율 =
𝑄3 + 1.5𝐼𝑄𝑅 , 자기자본비율 ≥ 𝑄3
자기자본비율 , 자기자본비율 < 𝑄3
평판
39
본사
법위반

More Related Content

Similar to 브랜딧) 창업 프랜차이즈 추천 솔루션

Graph Database Meetup in Korea #8. Graph Database 5 Offerings_ DecisionTutor ...
Graph Database Meetup in Korea #8. Graph Database 5 Offerings_ DecisionTutor ...Graph Database Meetup in Korea #8. Graph Database 5 Offerings_ DecisionTutor ...
Graph Database Meetup in Korea #8. Graph Database 5 Offerings_ DecisionTutor ...
bitnineglobal
 
23기 110406 a team_kdk_수합_ver1.1
23기 110406 a team_kdk_수합_ver1.123기 110406 a team_kdk_수합_ver1.1
23기 110406 a team_kdk_수합_ver1.1Eunhwa Yang
 
Enjoyurlife
EnjoyurlifeEnjoyurlife
Enjoyurlife
김 규영
 
디지털 데이터분석에 관한 관점
디지털 데이터분석에 관한 관점디지털 데이터분석에 관한 관점
디지털 데이터분석에 관한 관점
준완 박
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
K data
 
마케팅 인사이트를 위한 데이터 분석
마케팅 인사이트를 위한 데이터 분석마케팅 인사이트를 위한 데이터 분석
마케팅 인사이트를 위한 데이터 분석
ACE Trader
 
한국형 리테일의 오늘과 미래
한국형 리테일의 오늘과 미래한국형 리테일의 오늘과 미래
한국형 리테일의 오늘과 미래
ibmrep
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [MarketIN팀] : 디지털 마케팅 헬스체킹 서비스
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [MarketIN팀] : 디지털 마케팅 헬스체킹 서비스제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [MarketIN팀] : 디지털 마케팅 헬스체킹 서비스
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [MarketIN팀] : 디지털 마케팅 헬스체킹 서비스
BOAZ Bigdata
 
모비데이즈_디지털마케팅환경조사
모비데이즈_디지털마케팅환경조사모비데이즈_디지털마케팅환경조사
모비데이즈_디지털마케팅환경조사
Mobidays
 
빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.
Byounghee Kim
 
[창업자&예비창업자] 스타트업 사업계획서 샘플
[창업자&예비창업자] 스타트업 사업계획서 샘플[창업자&예비창업자] 스타트업 사업계획서 샘플
[창업자&예비창업자] 스타트업 사업계획서 샘플
더게임체인저스
 
Bigdata analysis team 5
Bigdata analysis team 5Bigdata analysis team 5
Bigdata analysis team 5
fhshsjxj
 
Bigdata analysis Team 5
Bigdata analysis Team 5Bigdata analysis Team 5
Bigdata analysis Team 5
fhshsjxj
 
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
K data
 
온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석
수보 김
 
비즈스프링과 함께하는 앱전문 분석 솔루션 - 와이즈트래커
비즈스프링과 함께하는 앱전문 분석 솔루션 - 와이즈트래커비즈스프링과 함께하는 앱전문 분석 솔루션 - 와이즈트래커
비즈스프링과 함께하는 앱전문 분석 솔루션 - 와이즈트래커
BizSpring Inc.
 
[Partner TechForum] Alternative Data 기반의 대안 신용평가 플랫폼 소개
[Partner TechForum] Alternative Data 기반의 대안 신용평가 플랫폼 소개[Partner TechForum] Alternative Data 기반의 대안 신용평가 플랫폼 소개
[Partner TechForum] Alternative Data 기반의 대안 신용평가 플랫폼 소개
Amazon Web Services Korea
 
온라인 마케팅 대행사 ADMAN 회사소개서
온라인 마케팅 대행사 ADMAN 회사소개서온라인 마케팅 대행사 ADMAN 회사소개서
온라인 마케팅 대행사 ADMAN 회사소개서
Do Hyung Kim
 
온라인 마케팅 대행사 ADMAN 회사소개서
온라인 마케팅 대행사 ADMAN 회사소개서온라인 마케팅 대행사 ADMAN 회사소개서
온라인 마케팅 대행사 ADMAN 회사소개서
Do Hyung Kim
 
데이터 블렌딩으로 더빠른 Insight 획득
데이터 블렌딩으로 더빠른 Insight 획득데이터 블렌딩으로 더빠른 Insight 획득
데이터 블렌딩으로 더빠른 Insight 획득
Pikdata Inc.
 

Similar to 브랜딧) 창업 프랜차이즈 추천 솔루션 (20)

Graph Database Meetup in Korea #8. Graph Database 5 Offerings_ DecisionTutor ...
Graph Database Meetup in Korea #8. Graph Database 5 Offerings_ DecisionTutor ...Graph Database Meetup in Korea #8. Graph Database 5 Offerings_ DecisionTutor ...
Graph Database Meetup in Korea #8. Graph Database 5 Offerings_ DecisionTutor ...
 
23기 110406 a team_kdk_수합_ver1.1
23기 110406 a team_kdk_수합_ver1.123기 110406 a team_kdk_수합_ver1.1
23기 110406 a team_kdk_수합_ver1.1
 
Enjoyurlife
EnjoyurlifeEnjoyurlife
Enjoyurlife
 
디지털 데이터분석에 관한 관점
디지털 데이터분석에 관한 관점디지털 데이터분석에 관한 관점
디지털 데이터분석에 관한 관점
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
 
마케팅 인사이트를 위한 데이터 분석
마케팅 인사이트를 위한 데이터 분석마케팅 인사이트를 위한 데이터 분석
마케팅 인사이트를 위한 데이터 분석
 
한국형 리테일의 오늘과 미래
한국형 리테일의 오늘과 미래한국형 리테일의 오늘과 미래
한국형 리테일의 오늘과 미래
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [MarketIN팀] : 디지털 마케팅 헬스체킹 서비스
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [MarketIN팀] : 디지털 마케팅 헬스체킹 서비스제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [MarketIN팀] : 디지털 마케팅 헬스체킹 서비스
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [MarketIN팀] : 디지털 마케팅 헬스체킹 서비스
 
모비데이즈_디지털마케팅환경조사
모비데이즈_디지털마케팅환경조사모비데이즈_디지털마케팅환경조사
모비데이즈_디지털마케팅환경조사
 
빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.
 
[창업자&예비창업자] 스타트업 사업계획서 샘플
[창업자&예비창업자] 스타트업 사업계획서 샘플[창업자&예비창업자] 스타트업 사업계획서 샘플
[창업자&예비창업자] 스타트업 사업계획서 샘플
 
Bigdata analysis team 5
Bigdata analysis team 5Bigdata analysis team 5
Bigdata analysis team 5
 
Bigdata analysis Team 5
Bigdata analysis Team 5Bigdata analysis Team 5
Bigdata analysis Team 5
 
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
[2016 데이터 그랜드 컨퍼런스] 2 5(빅데이터). 유비원 비정형데이터 중심의 big data 활용방안
 
온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석
 
비즈스프링과 함께하는 앱전문 분석 솔루션 - 와이즈트래커
비즈스프링과 함께하는 앱전문 분석 솔루션 - 와이즈트래커비즈스프링과 함께하는 앱전문 분석 솔루션 - 와이즈트래커
비즈스프링과 함께하는 앱전문 분석 솔루션 - 와이즈트래커
 
[Partner TechForum] Alternative Data 기반의 대안 신용평가 플랫폼 소개
[Partner TechForum] Alternative Data 기반의 대안 신용평가 플랫폼 소개[Partner TechForum] Alternative Data 기반의 대안 신용평가 플랫폼 소개
[Partner TechForum] Alternative Data 기반의 대안 신용평가 플랫폼 소개
 
온라인 마케팅 대행사 ADMAN 회사소개서
온라인 마케팅 대행사 ADMAN 회사소개서온라인 마케팅 대행사 ADMAN 회사소개서
온라인 마케팅 대행사 ADMAN 회사소개서
 
온라인 마케팅 대행사 ADMAN 회사소개서
온라인 마케팅 대행사 ADMAN 회사소개서온라인 마케팅 대행사 ADMAN 회사소개서
온라인 마케팅 대행사 ADMAN 회사소개서
 
데이터 블렌딩으로 더빠른 Insight 획득
데이터 블렌딩으로 더빠른 Insight 획득데이터 블렌딩으로 더빠른 Insight 획득
데이터 블렌딩으로 더빠른 Insight 획득
 

브랜딧) 창업 프랜차이즈 추천 솔루션

  • 1.
  • 2. 브랜딧(Brandeat) : 외식 프랜차이즈 창업 추천 솔루션 파이썬을 활용한 빅데이터 청년인재 양성 프로그램 세종대학교 세캉스조 곽현석, 권혜인, 민두홍, 박원준, 이재랑, 최태호, 홍영현
  • 3. Index 하나. 분석 배경 둘. 활용 데이터 셋. 데이터 처리 및 분석 넷. 서비스 활용 다섯. 기대효과 및 한계점 3
  • 5. 어떻게 하면 돈을 벌 수 있을까? 분석배경 5 하나 창업에 관심이 있다 69% 45.9% 선호하는 창업방식 프랜차이즈 출처 프랜차이즈산업연구원 출처 LG Challengers 창업 선호 분야 음식점 15% 카페 36% 외식업 51% 출처 LG Challengers 대학생 대상
  • 6. 6 출처 맥세스컨설팅 전수조사 외식 프랜차이즈 폐업수 매년 ‘증가’ 하는 폐업수 어려움과 실패 분석배경 하나 10500 11000 9000 7350 2017 2016 2014 2015
  • 7. 해결 할 수는 없을까? 분석배경 하나 7
  • 9. 프랜차이즈 데이터 수집 : 웹 크롤링 활용 데이터 둘 9 브랜드 DATA 출처 공정거래위원회 수집데이터 정보공개서 가맹본부별 비교정보 브랜드별 비교정보 기간 2017년 총 4332개 SNS DATA 출처 소상공인마당 수집데이터 인지도 감성분석 기간 최근 3개월 총 4332개
  • 10. 상권 데이터 수집 : 공공데이터 활용 데이터 둘 10 상권 DATA 출처 서울 열린 데이터 광장 API 수집데이터 서울시 우리마을가게 상권분석 서비스 (14개 항목) 기간 17년 1월 ~ 18년 5월 약 30,000 개 업소 DATA 출처 공공데이터포탈 수집데이터 상가 업소 정보 기간 2018년 6월 약 100,000개
  • 12. 데이터 활용 : 파생변수 데이터 처리 및 분석 셋 안정적인 시장 집입 해지율 매출액 증가율 개업률 창업비 대비 매출 본사 부채 비율 데이터 처리 및 분석 파생변수 1. 평판 = 긍정 언급수+1 소셜 언급수+1 2. 성장성 개업률 = 신규 점포수 전체 점포수 매출액 증가율 3. 본사의 신용도 부채비율 법 위반 유무 5. 창업비 대비 매출 = 평균 매출액 비용합계 본사의 안정성 4. 안정성 안정적인 시장진입 = 가맹점 수 60 해지율 = 계약 해지 신규 점포수 본사의 안정성 = 자기 자본 비율 부채비율 평판 12 본사 법위반
  • 13. 13 데이터 탐색 : 분포 데이터 처리 및 분석 셋 평판 성장성 본사의 신용도 안정성 창업대비 매출 개월 수 mean 0.89 8.82 0.70 6.00 3.37 90.04 min 0.03 0.00 0.00 0.00 0.02 20.00 25% 0.86 0.26 0.04 4.02 1.74 45.00 50% 0.93 1.20 0.34 6.91 2.79 73.00 75% 1.00 5.95 0.79 8.00 4.05 115.50 max 1.00 69.50 2.71 10.20 142.62 493.00 안정성 : 전체적으로 고르지만 들쭉날쭉하게 분포함 성장성, 창업대비매출 : 분포가 고르지 않고 한쪽으로 치우친 모양 안정성 창업대비매출 성장성
  • 14. 14 데이터 탐색 : 상관관계 데이터 처리 및 분석 셋 본사의신용도와 안정성 상관계수 : 0.45 scatterplot : 비선형적 상관관계 성장성과 개월수 상관계수 ; -0.43 scatterplot : 뚜렷한 관계확인 어려움
  • 15. 전처리 : 활용 데이터 처리 및 통합 데이터 처리 및 분석 셋 * Naver와 Kakao API를 이용해 구한 각 프랜차이즈 별 실제 점포데이터와 주변시설(지하철, 병원 등)과 인구수(유동,상주)데이터를 결합해 각 점포별 매출액을 예측해보았으나 수도권 위주의 데이터가 수집되어 비수도권 프랜차이즈가 추천대상에 포함되지 않음 게다가 기존 데이터에 비해 개수의 차이가 미미함 하지만 ‘가맹점 수‘와 ‘가맹점 매출액’이 없어 누락되는 데이터 수가 많음 파생변수 생성에 사용되는 변수들 위주로 전처리 내용 재무제표 정보가 없고 ‘부채’가 ‘0’보다 작은 데이터 삭제 ‘가맹점 수’가 ‘0’인 데이터 삭제 ‘가맹점 매출액’이 ‘0’인 데이터 삭제 데이터 수 4324개 -> 3303개 3303개 -> 2489개 2489개 -> 1555개 15
  • 16. 프랜차이즈 데이터 분석 : K-means군집분석 데이터 처리 및 분석 셋 16 본사의 신용도 안정성 창업대비매출 성장성 사업개월수 평판 12개
  • 17. 프랜차이즈 데이터 분석 : 군집분석 데이터 처리 및 분석 셋 17 N0.1 Long-run형 N0.2 슈퍼루키형
  • 18. 프랜차이즈 데이터 분석 : 군집분석 데이터 처리 및 분석 셋 18 N0.3 본사신뢰형 N0.4 High risk High return형
  • 19. 상권 추천 서비스 데이터 처리 및 분석 셋 19 10개의 업종별 상권 추천/비추천 분류 모델 서울시 주요 상권 총 1744길 상권 관련정보 68개 2017년 1월~ 2018년 5월 총 27005개 데이터 매출 건수를 A,B,C,F 평가 등급로 나누어 분류 B 등급 (안전) 초록색 F 등급 (위험) 빨간색 A 등급 (추천) 파란색 C 등급 (주의) 노란색
  • 20. 상권 데이터 분석 : 랜덤 포레스트 데이터 처리 및 분석 셋 20 Why? 연령대_20_유동인구_수 연령대_10_유동인구_수 연령대_30_유동인구_수 남성_유동인구_수 연령대_60_이상_유동인구_수 연령대_50_유동인구_수 여성_유동인구_수 아파트_평균_시가 연령대_40_유동인구_수 숙박_시설_수 1 트리 개수 30개 2 Variable importance Top 10 • 모델에 대한 설명력을 위한 트리기반모형 변동감소 • 상권 분석에서 사용되는 독립변수 58개, 다중 공선성을 고려해야함
  • 21. 상권 데이터 분석 : 랜덤 포레스트 성능 데이터 처리 및 분석 셋 훈련데이터 70% 분류 모델 적합 검증데이터 30% 분류 모델 평가 21 Grade A Grade B Grade C Grade F Grade A 1521 207 12 0 Grade B 235 1898 315 7 Grade C 16 267 1885 163 Grade F 1 8 197 1370 훈련 accuracy 0.99 검증 accuracy 0.82 precision recall f1-score support Grade A 0.86 0.87 0.87 1740 Grade B 0.8 0.77 0.79 2455 Grade C 0.78 0.81 0.8 2331 Grade F 0.89 0.87 0.88 1576 avg 0.82 0.82 0.82 8102 여러 성능 지표에서 준수한 성능을 보여줌
  • 22. 상권 데이터 분석 : 딥러닝 다중분류 데이터 활용 및 분석 셋 22 Input_dim 58 Hidden layer node 3 Output layer node 1 Learning algorithm Gradient Descent Transfer function Softmax Loss function Categorical_Crossentropy Optimizer Adam 향상된 모델을 만들기 위하여 딥러닝을 활용한 모델 구축 1 MLP Binary Classification 2 Loss
  • 23. 상권 데이터 분석 : 딥러닝 성능 데이터 처리 및 분석 셋 훈련데이터 70% 분류 모델 적합 검증데이터 30% 분류 모델 평가 23 Grade A Grade B Grade C Grade F Grade A 1495 234 9 20 Grade B 213 1874 359 90 Grade C 16 267 1880 1680 Grade F 4 3 234 1335 precision recall f1-score support Grade A 0.87 0.86 0.86 1740 Grade B 0.79 0.76 0.78 2455 Grade C 0.76 0.81 0.78 2331 Grade F 0.88 0.85 0.86 1576 avg 0.81 0.81 0.81 8102 훈련 accuracy 0.832 검증 accuracy 0.8126 랜덤 포레스트와 비교할때 예측력에 큰 차이 無
  • 25. 고객 페르소나 서비스 활용 넷 25 열정적인 고객 김율곡씨 나이 : 31세 선호지역 : 성북구 고용주가 되고 싶어 창업을 생각 특징 서류 100회 탈락 면접 20회 탈락 선호업종 : 카페 대기만성형
  • 26. 고객 페르소나 서비스 활용 넷 26 노후 대비 고객 최군자씨 나이 : 62세 선호지역 : 영등포 안정적인 노후 대비를 위해 창업을 생각 특징 회사 정년퇴임 자식들 모두 독립 선호업종 : 한식 Long-run형
  • 27. 상권 추천 김율곡씨 서비스 활용 넷 27 카페 추천 등급 및 메가엠지씨 매장 맵핑 선호지역 성북구 확대 및 지역 확인 STEP 1 STEP 2 매장지역 A (추천) B (안전) C (주의) F (위험)
  • 28. 상권 추천 김율곡씨 서비스 활용 넷 28 매장지역 A (추천) B (안전) C (주의) F (위험) STEP 3
  • 29. 상권 추천 최군자씨 서비스 활용 넷 29 한식 추천 등급 및 돌배기집 매장 맵핑 선호지역 영등포구 확대 및 지역 확인 STEP 1 STEP 2 매장지역 A (추천) B (안전) C (주의) F (위험)
  • 30. 상권 추천 최군자씨 서비스 활용 넷 30 매장지역 A (추천) B (안전) C (주의) F (위험) STEP 3
  • 31. 추천 결과 서비스 활용 넷 31 열정적인 김율곡씨 노후 대비 최군자씨 추천 브랜드 : 메가엠지씨 추천 상권 : 도봉로10다길 외 상권 추천 브랜드 : 돌배기집 추천 상권 : 영신로 19길 외 상권
  • 34. 경쟁 업체와 비교분석 기대효과 및 한계 다섯 34 주요 특징 프랜차이즈 정보공개서를 바탕으로 필터링하여 상위에 있는 프랜차이즈를 추천해주는 서비스 예비창업자가 원하는 업종, 프랜차이즈 를 선택하고 가맹점 별 비용 등을 고려해 조건에 맞는 상권을 추천해주는 서비스 업종 선택부터 프랜차이즈 선택, 입지 추천까지 원스톱으로 진행되는 서비스 장 점 유망 창업 아이템 순위 신규 브랜드 랭킹 등 다양한 지표 활용한 랭킹시스템 제공 업종, 창업비용, 임대료, 희망 입지 등의 정보를 입력하면 해당 아이템의 종합적인 경쟁분석제공 정부에서 제공하는 무료서비스임 경쟁업체 서비스 제공 및 예비창업자가 최소한의 배경지식만 갖추어도 상황에 맞는 프랜차이즈를 선택가능 단 점 예비 창업자 자신이 어떤 프랜차이즈를 어떤 위치에 할 것인지, 비용은 얼마나 드는지. 사전에 알아야하는 정보가 많음 프랜차이즈와 예비창업자의 직접적인 매칭에는 관여하지 않음 BRANDEAT 창업경영신문 소상공인마당
  • 35. 외식 프랜차이즈 창업 솔루션 기대효과 및 한계점 다섯 기대 효과 1.프랜차이즈 창업 정보의 격차 완화 → 프랜차이즈 창업에 대한 장벽이 낮아짐 2.예비 창업자들의 실패율 감소 3. 일반 기업에서 제공하는 데이터에 대한 접근이 가능하다면 발전된 서비스 제공 가능 한계점 35 1. 결측데이터 2. 민간데이터 활용 불가 3. 소셜미디어 분석 신뢰도
  • 36. 분석 Tool 분석 Tool 여섯 36 - 분석 tool 크롤링 및 전처리, 파생변수 생성 머신러닝(군집분석, 랜덤포레스트) 및 딥러닝(MLP) EDA - 분석 tool R : 군집분석 최적화 및 시각화 Tableau : 서비스 활용 시연 - 분석 tool 서울특별시 지도 표시 업종별 추천등급, 프랜차이즈 매장 맵핑
  • 38. 38
  • 39. 데이터 활용 : 파생변수 데이터 활용 및 분석 셋 안정적인 시장 집입 해지율 매출액 증가율 개업률 창업비 대비 매출 본사 부채 비율 데이터 활용 및 분석 파생변수 1. 평판 = 긍정 언급수+1 총 소셜 언급수+1 2. 성장성 개업률 = 신규 점포수 전체 점포수 ※ 전체 점포수 = 가맹점수 + 계약해지 + 계약종료 3. 본사의 신용도 = 𝑒 − 부채비율+법위반횟수∗0.001 ※ 부채비율 = 𝑄3 + 1.5𝐼𝑄𝑅 , 부채비율 ≥ 𝑄3 부채비율 , 부채비율 < 𝑄3 5. 창업비 대비 매출 = 평균 매출액 비용합계 본사의 안정성 4. 안정성 = 가맹점 수 – 해지율 + 본사의 안정성 ※ 안정적인 시장진입 = 2 , 가맹점 수 ≥ 120 가맹점수 60 , 가맹점 수 < 120 ※ 해지율 = 𝑥−min(𝑥) max 𝑥 −min(𝑥) , 𝑥 = 계약해지+1 신규개점+1 ※ 본사의 안정성 = 자기자본 비율 – 부채비율 ※ 자기자본비율 = 𝑄3 + 1.5𝐼𝑄𝑅 , 자기자본비율 ≥ 𝑄3 자기자본비율 , 자기자본비율 < 𝑄3 평판 39 본사 법위반