一個(gè)數(shù)據(jù)庫有5個(gè)事務(wù),如表所示。設(shè)min_sup=60%,min_conf=80%。
(a)分別用Apriori算法和FP-growth算法找出所有頻繁項(xiàng)集。比較兩種挖掘方法的效率。
(b)比較窮舉法和Apriori算法生成的候選項(xiàng)集的數(shù)量。
(c)利用(1)所找出的頻繁項(xiàng)集,生成所有的強(qiáng)關(guān)聯(lián)規(guī)則和對(duì)應(yīng)的支持度和置信度。
考慮如下的頻繁3-項(xiàng)集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。
(a)根據(jù)Apriori算法的候選項(xiàng)集生成方法,寫出利用頻繁3-項(xiàng)集生成的所有候選4-項(xiàng)集。
(b)寫出經(jīng)過剪枝后的所有候選4-項(xiàng)集。