考慮下表數(shù)據(jù)集,請完成以下問題:
(1)估計條件概率。
(2)根據(jù)(1)中的條件概率,使用樸素貝葉斯方法預(yù)測測試樣本(A=0,B=1,C=0)的類標(biāo)號;
(3)使用Laplace估計方法,其中p=1/2,l=4,估計條件概率。
(4)同(2),使用(3)中的條件概率。
(5)比較估計概率的兩種方法,哪一種更好,為什么?
(5)當(dāng)條件概率為0的時候,條件概率的預(yù)測用Laplace估計方法比較好,因為我們不想整個條件概率計算結(jié)果為0。
考慮下表所示二元分類問題的數(shù)據(jù)集。
(1)計算按照屬性A和B劃分時的信息增益。決策樹歸納算法將會選擇哪個屬性?
(2)計算按照屬性A和B劃分時Gini系數(shù)。決策樹歸納算法將會選擇哪個屬性?