A.數(shù)據(jù)清理
B.數(shù)據(jù)集成
C.數(shù)據(jù)變換
D.數(shù)據(jù)歸約
您可能感興趣的試卷
你可能感興趣的試題
A.去掉數(shù)據(jù)中的噪聲
B.對(duì)數(shù)據(jù)進(jìn)行匯總和聚集
C.使用概念分層,用高層次概念替換低層次“原始”數(shù)據(jù)
D.將屬性按比例縮放,使之落入一個(gè)小的特定區(qū)間
A.填補(bǔ)數(shù)據(jù)種的空缺值
B.集成多個(gè)數(shù)據(jù)源的數(shù)據(jù)
C.得到數(shù)據(jù)集的壓縮表示
D.規(guī)范化數(shù)據(jù)
A.概念分層
B.離散化
C.分箱
D.直方圖
A.孤立點(diǎn)
B.空缺值
C.測(cè)量變量中的隨即錯(cuò)誤或偏差
D.數(shù)據(jù)變換引起的錯(cuò)誤
A.空間填充曲線
B.散點(diǎn)圖矩陣
C.平行坐標(biāo)
D.圓弓分割
最新試題
通常,當(dāng)試圖從大量觀察中學(xué)習(xí)具有少量狀態(tài)的HMM時(shí),我們幾乎總是可以通過(guò)允許更多隱藏狀態(tài)來(lái)增加訓(xùn)練數(shù)據(jù)的可能性。
非結(jié)構(gòu)化數(shù)據(jù)也可以使用關(guān)系型數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)。
支持向量機(jī)不適合大規(guī)模數(shù)據(jù)。
選擇用于k均值聚類(lèi)的聚類(lèi)數(shù)k的一種好方法是嘗試k的多個(gè)值,并選擇最小化失真度量的值。
對(duì)于文本數(shù)據(jù)和多媒體數(shù)據(jù)進(jìn)行特征提取是為了方便對(duì)于這類(lèi)數(shù)據(jù)的觀察和理解。
由于分類(lèi)是回歸的一種特殊情況,因此邏輯回歸是線性回歸的一種特殊情況。
數(shù)據(jù)存儲(chǔ)體系中并不牽扯計(jì)算機(jī)網(wǎng)絡(luò)這一環(huán)節(jié)。
根據(jù)數(shù)據(jù)科學(xué)家與數(shù)據(jù)工程師對(duì)于問(wèn)題的理解并相互討論,然后確定需要收集數(shù)據(jù)的范圍以及種類(lèi),然后數(shù)據(jù)工程師使用數(shù)據(jù)收集工具,架構(gòu),甚至編程的形式來(lái)進(jìn)行數(shù)據(jù)收集的工作,然后并把數(shù)據(jù)收集的數(shù)據(jù)放置到對(duì)應(yīng)的存儲(chǔ)系統(tǒng)。
數(shù)據(jù)壓縮與解壓縮可以使得數(shù)據(jù)處理的速度加快。
要將工作申請(qǐng)分為兩類(lèi),并使用密度估計(jì)來(lái)檢測(cè)離職申請(qǐng)人,我們可以使用生成分類(lèi)器。