A.數(shù)據(jù)中的空缺值
B.噪聲數(shù)據(jù)
C.數(shù)據(jù)中的不一致性
D.數(shù)據(jù)中的概念分層
您可能感興趣的試卷
你可能感興趣的試題
A.平滑
B.聚集
C.數(shù)據(jù)概化
D.規(guī)范化
A.數(shù)據(jù)清理
B.數(shù)據(jù)集成
C.數(shù)據(jù)變換
D.數(shù)據(jù)歸約
A.去掉數(shù)據(jù)中的噪聲
B.對數(shù)據(jù)進行匯總和聚集
C.使用概念分層,用高層次概念替換低層次“原始”數(shù)據(jù)
D.將屬性按比例縮放,使之落入一個小的特定區(qū)間
A.填補數(shù)據(jù)種的空缺值
B.集成多個數(shù)據(jù)源的數(shù)據(jù)
C.得到數(shù)據(jù)集的壓縮表示
D.規(guī)范化數(shù)據(jù)
A.概念分層
B.離散化
C.分箱
D.直方圖
最新試題
通常,當(dāng)試圖從大量觀察中學(xué)習(xí)具有少量狀態(tài)的HMM時,我們幾乎總是可以通過允許更多隱藏狀態(tài)來增加訓(xùn)練數(shù)據(jù)的可能性。
使用正則表達式可以找到一個文本文件中所有可能出現(xiàn)的手機號碼。
公司內(nèi)部收集的數(shù)據(jù)不存在需要考慮數(shù)據(jù)隱私的環(huán)節(jié)。
非結(jié)構(gòu)化數(shù)據(jù)也可以使用關(guān)系型數(shù)據(jù)庫來存儲。
訓(xùn)練神經(jīng)網(wǎng)絡(luò)具有過度擬合訓(xùn)練數(shù)據(jù)的潛在問題。
要將工作申請分為兩類,并使用密度估計來檢測離職申請人,我們可以使用生成分類器。
當(dāng)數(shù)據(jù)集標簽錯誤的數(shù)據(jù)點時,隨機森林通常比AdaBoost更好。
對于文本數(shù)據(jù)和多媒體數(shù)據(jù)進行特征提取是為了方便對于這類數(shù)據(jù)的觀察和理解。
使決策樹更深將確保更好的擬合度,但會降低魯棒性。
如果P(A B)= P(A),則P(A∩B)= P(A)P(B)。