26. ▶(飽和)頻出アイテム集合とは?
●
頻出アイテム集合(Frequent Item Set)
– 例: 「スーパーの客のレシートのデータから、同時に購入される商
品の組を見つけたい」
– 多くの集合(トランザクションと呼ぶ。例では「レシート」)に共通し
て含まれる要素(アイテムと呼ぶ。例では「商品」)
Apple
Cupcake
Donut
Cupcake
Donut
Eclair
Apple
Banana
Cupcake
Donut
Apple
Banana
Donut
A
C
D
C
D
E
A
B
C
D
A
B
D
A
C
D
C
D
E
A
B
C
D
A
B
D
{ Apple, Donut }
{ Cupcake, Donut }
27. ▶(飽和)頻出アイテム集合とは? (つづき)
●
飽和頻出アイテム集合(Closed Frequent Item Set)
– サポート: そのアイテム集合を含むトランザクションの数
– 飽和: そのアイテム集合にアイテムを足したものは、そのアイテム
集合よりもサポートが小さい
●
本研究では
– あるコード断片から(直接的、間接的に)呼び出される手続きをア
イテム
– 呼び出す手続きが共通しているコード断片を求めるのに利用
A
C
D
C
D
E
A
B
C
D
A
B
D
{ Apple, Banana }は飽和頻出アイテム集合ではない
←Donutを足してもサポートが減らない