?如下圖所示,樣本中有三個(gè)類別C1、C2、C3,采用KNN分類算法,圖中給出了被測(cè)數(shù)據(jù)對(duì)象X和Y在特征空間中的映射點(diǎn),以X、Y為中心的圓表示對(duì)應(yīng)K個(gè)與X、Y最相近點(diǎn)的分布情況。依據(jù)KNN的多數(shù)表決規(guī)則,X歸為C3類,Y歸為C2類,但感覺這個(gè)分類結(jié)果與圖示有些偏差,直觀上X和Y都比較接近C1。你覺得可以采取哪些措施來改進(jìn)算法以避免這種情況發(fā)生?()
A.X的問題是K值選擇太小,可以適當(dāng)增大K值,Y的問題是K值過大,可以適當(dāng)減小K值
B.Y的分類問題可能是由于樣本數(shù)不平衡造成,可以考慮壓縮C2類別的樣本數(shù)量
C.Y的問題可以考慮用加權(quán)多數(shù)表決法解決
D.X的問題可能是C3類含比較異常的樣本,去除異常樣本數(shù)據(jù)可以提高分類準(zhǔn)確度
您可能感興趣的試卷
你可能感興趣的試題
采用KNN分類,表中列出了與被測(cè)對(duì)象距離最近的5個(gè)結(jié)果,采用歐式距離,有2個(gè)類別“0”、“1”。請(qǐng)選擇以下正確的選項(xiàng)()。
A.采用多數(shù)表決法,K=3時(shí),結(jié)果為“0”類,K=5時(shí)為“1”類
B.用加權(quán)多數(shù)表決法,直接用距離倒數(shù)作為權(quán)值。結(jié)果與A一致
C.用加權(quán)多數(shù)表決法,直接用距離倒數(shù)作為權(quán)值。K=3和K=5時(shí),結(jié)果均為“0”類
D.采用加權(quán)表決規(guī)則后,K值越大,準(zhǔn)確性越高
?假設(shè)一門課將一部分內(nèi)容安排成了線上內(nèi)容,包括課程相關(guān)的視頻和集中討論兩部分。對(duì)于線上內(nèi)容學(xué)生可以自愿選擇是否參加,不影響總成績。學(xué)期結(jié)束時(shí),老師希望對(duì)學(xué)生在線上的學(xué)習(xí)情況用KNN進(jìn)行分析,老師能夠統(tǒng)計(jì)到每個(gè)學(xué)生線上收看視頻的時(shí)間,以及參與集中討論的時(shí)間?,F(xiàn)在老師希望做兩個(gè)分類工作:
(1)根據(jù)學(xué)生看視頻和參與討論的時(shí)間,將學(xué)生分成“自主學(xué)習(xí)型”(看視頻較多)和“集中學(xué)習(xí)型”(參與討論較多)兩類。
(2)根據(jù)學(xué)生參與線上內(nèi)容的程度,將學(xué)生分成“課堂學(xué)習(xí)型”和“課堂+線上學(xué)習(xí)型”。
?試問對(duì)于上述兩個(gè)分類工作,如果考慮歐式距離和余弦相似度,應(yīng)該選擇哪種距離函數(shù)比較合適?()
A.(1)和(2)都選擇余弦相似度
B.(1)選擇歐式距離,(2)選擇余弦相似度
C.(1)選擇余弦相似度,(2)選歐式距離
D.(1)和(2)都選歐式距離
A.根據(jù)初始中心,最開始1,2,5,11,15同屬第一類,但后來15屬于第二類了
B.聚類結(jié)束時(shí),第二類最大,有7個(gè)數(shù)
C.聚類結(jié)束時(shí),第三類的中心大于35
D.聚類結(jié)束時(shí),11也屬于第二類了
A.如果把人們的受教育程度分為“受過高等教育”和“沒有受過高等教育”兩類,張三剛從大學(xué)畢業(yè)了,因此他應(yīng)該屬于“受過高等教育”類別的
B.幼兒園舉辦親子活動(dòng),午餐的時(shí)候,為了便于交流,特意安排家長們聚在一起,小朋友們聚在一起
C.產(chǎn)品經(jīng)過自動(dòng)檢測(cè)的流水線,就被分成了次品和正品兩類
D.經(jīng)過長期的觀察研究,發(fā)現(xiàn)小學(xué)生在課堂上的表現(xiàn)可以分為“積極踴躍”“沉靜寡言”和“心里有數(shù)”三種類別
A.13是滿足ax+by=gcd(a,b),x絕對(duì)值最小的整數(shù)
B.21是滿足ax+by=gcd(a,b),y絕對(duì)值最小的整數(shù)
C.x的絕對(duì)值還可以減小,會(huì)引發(fā)y的絕對(duì)值發(fā)生變化
D.y的絕對(duì)值還可以減小,會(huì)引發(fā)x的絕對(duì)值發(fā)生變化
最新試題
關(guān)于使用回溯法求解0-1背包問題,以下說法正確的是()。
分支限界法中,擴(kuò)展出的孩子結(jié)點(diǎn)在入隊(duì)時(shí),存儲(chǔ)該孩子結(jié)點(diǎn)的父結(jié)點(diǎn)的地址和左孩子標(biāo)志。其目的是什么?()
已知f(1)=1,f(n)=f(n-1)+n,那么f(50)的作用是()。
下列關(guān)于效率的說法正確的是()。
輸入數(shù)組(-1,0,1,-2,3),它的最大子段和是()。
有一個(gè)問題的蒙特卡洛算法,給定一個(gè)實(shí)例,已知運(yùn)行一次其答案是錯(cuò)誤的概率是1/8,現(xiàn)運(yùn)行k次該算法,其答案一直不變,問該答案的正確率是()。
在解決活動(dòng)安排問題時(shí)應(yīng)首先對(duì)活動(dòng)進(jìn)行排序,排序的依據(jù)是()。
在對(duì)Dijkstra算法進(jìn)行初始化時(shí),如果兩個(gè)頂點(diǎn)之間沒有邊,則它們之間的距離為()。
?在分治法中講到快速排序,如果每次使用partion函數(shù)導(dǎo)致分組出現(xiàn)嚴(yán)重不平衡情況下,算法效率不高,最壞情況下的時(shí)間復(fù)雜度為O(n2),通過改造partition函數(shù),也就是每次隨機(jī)選擇一個(gè)元素作為劃分基準(zhǔn),這樣會(huì)很好地改善算法的性能,這種算法思想是()。
使用窮舉法求解最長遞增子序列的時(shí)間復(fù)雜度為()。