SlideShare a Scribd company logo
1 of 19
Download to read offline
32기 권채은
장바구니
분석
목차
데이터 마이닝 (Data Mining)
연관규칙 (Association Rule)
연관 규칙 알고리즘 – Apriori Algorithm
데이터 마이닝
데이터 마이닝(data mining)
대용량의 데이터로부터 데이터 속의
“유용한 정보” 를 발견하는 과정
유용한 정보 ?
데이터들의 연관성, 유사성, 순차패턴 등
데이터 마이닝의 기법
의사결정
트리
연관 규칙
인공
신경망
군집분석
사례기반
분석
연관 규칙
연관 규칙 (Associate rule)
항목 집합 (item set) : 전체 item 중에서 가능한 부분집합
항목 집합의 집합 (The set of item set) : item 의 부분집합들로 구성된 집합
=> 특정 항목 집합이 발생하였을 때(동시에) 또 다른 항목 집합이 발생!
연관 규칙 (Associate rule)
지지도 (support) : s(X→Y) = n(XUY)/N
신뢰도 (confidence) : c(X→Y) = n(X∩Y)/n(X)
향상도 (lift) : lift(X,Y) = c(X→Y)/s(Y)
연관 규칙 알고리즘
알고리즘이 필요한 이유 ?
항목 집합 L = {L1, L2, … ,Lk}
부분 집합 개수
= 2 𝑘
-1 ( 공집합 제외)
항목 집합의 item 개수에
따라 지수적으로 증가
다양한 알고리즘
항목 집합 개수(M) 줄이기
→ Apriori Algorithm
Transaction 개수(N) 줄이기
→ DHP Algorithm
비교 수(W) 줄이기
→ FP-growth Algorithm
Aprioro - 수도코드
Aprioro – 빈발항목집합 추출
Principle : 한 항목집합이 비빈발(infrequent)하다면
이 항목집합을 포함하는 모든 집합은 비빈발 항목 집합이다.
* 비 빈발 항목 집합 = pruning (가지치기)
{A,B,C,D,E} 에서 {A,B}가 비빈발(infrequent)하다면,
Aprioro – 빈발항목집합 추출
항목집합의 ‘빈발’을 판단하는 기준 → 지지도(support)
s(X→Y) = n(XUY)/N
최소 지지도(SUPmin) = 2
C1 → {D} 탈락
C2 → {A,C},{A,E} 탈락
C3 → {B,C,E} 추출
Apriori – 연관 규칙 도출
빈발항목집합 후보 생성
↓
연관 규칙 생성
↓
purning(가지치기)
Apriori – 연관 규칙 도출
Principle : 빈발항목집합 L에 대하여
연관규칙 X → Y 가 최소신뢰도 기준을 만족하지 않으면
X의 부분집합 X'에 대한 연관규칙 X' → L - X' 도
최소신뢰도 기준을 만족할 수 없다.
신뢰도 (confidence) : c(X→Y) = n(X∩Y)/n(X)
Apriori – 연관 규칙 도출

More Related Content

More from hyu_jaram

30기 박소영 "한양대학교Erica다전공제도(2017)"
30기 박소영 "한양대학교Erica다전공제도(2017)"30기 박소영 "한양대학교Erica다전공제도(2017)"
30기 박소영 "한양대학교Erica다전공제도(2017)"hyu_jaram
 
30기 최준호 "음악프로그래밍"
30기 최준호 "음악프로그래밍"30기 최준호 "음악프로그래밍"
30기 최준호 "음악프로그래밍"hyu_jaram
 
30기 정성학 "Git, sourcetree 사용법"
30기 정성학 "Git, sourcetree 사용법"30기 정성학 "Git, sourcetree 사용법"
30기 정성학 "Git, sourcetree 사용법"hyu_jaram
 
Rating System을 알아보기
Rating System을 알아보기Rating System을 알아보기
Rating System을 알아보기hyu_jaram
 
170510 자람세미나 pt
170510 자람세미나 pt170510 자람세미나 pt
170510 자람세미나 pthyu_jaram
 
Physical rendering
Physical renderingPhysical rendering
Physical renderinghyu_jaram
 
Paradigm of computer architecture
Paradigm of computer architectureParadigm of computer architecture
Paradigm of computer architecturehyu_jaram
 

More from hyu_jaram (10)

30기 박소영 "한양대학교Erica다전공제도(2017)"
30기 박소영 "한양대학교Erica다전공제도(2017)"30기 박소영 "한양대학교Erica다전공제도(2017)"
30기 박소영 "한양대학교Erica다전공제도(2017)"
 
30기 최준호 "음악프로그래밍"
30기 최준호 "음악프로그래밍"30기 최준호 "음악프로그래밍"
30기 최준호 "음악프로그래밍"
 
30기 정성학 "Git, sourcetree 사용법"
30기 정성학 "Git, sourcetree 사용법"30기 정성학 "Git, sourcetree 사용법"
30기 정성학 "Git, sourcetree 사용법"
 
Rating System을 알아보기
Rating System을 알아보기Rating System을 알아보기
Rating System을 알아보기
 
170510 자람세미나 pt
170510 자람세미나 pt170510 자람세미나 pt
170510 자람세미나 pt
 
Physical rendering
Physical renderingPhysical rendering
Physical rendering
 
창업
창업창업
창업
 
Paradigm of computer architecture
Paradigm of computer architectureParadigm of computer architecture
Paradigm of computer architecture
 
세미나
세미나세미나
세미나
 
RNN & LSTM
RNN & LSTMRNN & LSTM
RNN & LSTM
 

데이터마이닝