您可能感興趣的試卷
你可能感興趣的試題
A.客戶端緩存有集群的拓?fù)湫畔?br />
B.服務(wù)端緩存有集群的拓?fù)湫畔?br />
C.兩者都是
D.兩者都不是
在Spark中,假設(shè)lines是一個DStream對象,filter語句可以過濾掉80%的數(shù)據(jù),針對以下兩個語句說法正確的是:()
X:lines.filter(...).groupByKey(...)
Y:lines.groupByKey(...).filter(...)
A.X比Y的性能更高
B.X比Y的性能更低
C.X和Y和性能一樣
D.無法確性X和丫的性能差異
A.分桶表,按照天分桶
B.分區(qū)表,按天分區(qū)
C.傾斜表,傾斜字段選擇日期,傾斜值隨機(jī)
D.分區(qū)+分桶表,按照時(shí)間分區(qū),每個分區(qū)2560個桶
最新試題
Fusionlnsight HD系統(tǒng)中,Solr示例工程solr-example\confisolr-confisolr.properties中ZK_URL和ZOOKEEPER_DEFAULT_SERVER_PRINCIPAL的值可以從下面哪個選項(xiàng)獲?。浚ǎ?/p>
對于HBase rowkey的設(shè)計(jì)原則,如下敘述正確的是?()
在Spark應(yīng)用開發(fā)中,以下哪項(xiàng)的代碼能正確進(jìn)行單詞統(tǒng)計(jì)?()
關(guān)于Redis特點(diǎn),下面敘述正確的是?()
由于Spark是基于內(nèi)存的計(jì)算引擎,因此,一個Spark應(yīng)用可以處理的數(shù)據(jù)量不能超過分給這個Spark應(yīng)用的內(nèi)存總和。()
以下業(yè)務(wù)應(yīng)用中,哪個不是Hive適用的場景?()
Fusionlnsight HD支持通過哪些方式ᨀ交Oozie作業(yè)?()
在HBase表設(shè)計(jì)中,對于多項(xiàng)業(yè)務(wù)共用rowkey,導(dǎo)致數(shù)據(jù)訪問矛盾的情況,可以有哪些應(yīng)對策略?()
關(guān)于Kafka的特點(diǎn)如下᧿述正確的是?()
存在如下業(yè)務(wù)場景:用戶上網(wǎng)日志文件已經(jīng)存放在HDFS上,日志文件內(nèi)容格式是:每條上網(wǎng)記錄三個字段,分別是姓名,性別,上網(wǎng)時(shí)間,字段之間用“,”護(hù)分隔;要求打印輸出所有上網(wǎng)總時(shí)間大于兩小時(shí)的女性網(wǎng)友。請問如下哪些代碼片段能實(shí)現(xiàn)上述業(yè)務(wù)場景?()