A.去掉數(shù)據(jù)中的噪聲
B.對數(shù)據(jù)進行匯總和聚集
C.使用概念分層,用高層次概念替換低層次“原始”數(shù)據(jù)
D.將屬性按比例縮放,使之落入一個小的特定區(qū)間
您可能感興趣的試卷
你可能感興趣的試題
A.填補數(shù)據(jù)種的空缺值
B.集成多個數(shù)據(jù)源的數(shù)據(jù)
C.得到數(shù)據(jù)集的壓縮表示
D.規(guī)范化數(shù)據(jù)
A.概念分層
B.離散化
C.分箱
D.直方圖
A.孤立點
B.空缺值
C.測量變量中的隨即錯誤或偏差
D.數(shù)據(jù)變換引起的錯誤
A.空間填充曲線
B.散點圖矩陣
C.平行坐標
D.圓弓分割
A.標稱屬性
B.二元屬性
C.序數(shù)屬性
D.數(shù)值屬性
最新試題
數(shù)據(jù)復(fù)制或者備份均是為了從提高數(shù)據(jù)并發(fā)這個角度來設(shè)計和實現(xiàn)的。
給定用于2類分類問題的線性可分離數(shù)據(jù)集,線性SVM優(yōu)于感知器,因為SVM通常能夠在訓(xùn)練集上實現(xiàn)更好的分類精度。
數(shù)據(jù)存儲體系中并不牽扯計算機網(wǎng)絡(luò)這一環(huán)節(jié)。
當(dāng)MAP中使用的先驗是參數(shù)空間上的統(tǒng)一先驗時,MAP估計等于ML估計。
數(shù)據(jù)壓縮與解壓縮可以使得數(shù)據(jù)處理的速度加快。
要將工作申請分為兩類,并使用密度估計來檢測離職申請人,我們可以使用生成分類器。
最大似然估計的一個缺點是,在某些情況下(例如,多項式分布),它可能會返回零的概率估計。
選擇用于k均值聚類的聚類數(shù)k的一種好方法是嘗試k的多個值,并選擇最小化失真度量的值。
無論質(zhì)心的初始化如何,K-Means始終會給出相同的結(jié)果。
使用偏差較小的模型總是比偏差較大的模型更好。