在Spark中,假設lines是一個DStream對象,filter語句可以過濾掉80%的數(shù)據(jù),針對以下兩個語句說法正確的是:()
X:lines.filter(...).groupByKey(...)
Y:lines.groupByKey(...).filter(...)
A.X比Y的性能更高
B.X比Y的性能更低
C.X和Y和性能一樣
D.無法確性X和丫的性能差異
您可能感興趣的試卷
你可能感興趣的試題
A.分桶表,按照天分桶
B.分區(qū)表,按天分區(qū)
C.傾斜表,傾斜字段選擇日期,傾斜值隨機
D.分區(qū)+分桶表,按照時間分區(qū),每個分區(qū)2560個桶
A.HDfS
B.HBase
C.Kafka
D.Redis
A.HBase
B.Hive
C.Spark
D.Redis
A.Versions
B.TTL
C.Coprocessor
D.Compression
最新試題
在Kafka中,關于Consumer說法正確的是()。
在Spark應用開發(fā)中,以下哪項的代碼能正確進行單詞統(tǒng)計?()
Fusionlnsight HD系統(tǒng)中,Solr示例工程solr-example\confisolr-confisolr.properties中ZK_URL和ZOOKEEPER_DEFAULT_SERVER_PRINCIPAL的值可以從下面哪個選項獲???()
Fusionlnsight HD支持通過哪些方式ᨀ交Oozie作業(yè)?()
在Solr的應用查詢場景中,當對查詢結(jié)果深度翻頁時,需使用游標進行深度翻頁。下面對游標說法正確的是?()
Oozie的workflow.xml文件是工作流配置文件。()
存在如下業(yè)務場景:用戶上網(wǎng)日志文件已經(jīng)存放在HDFS上,日志文件內(nèi)容格式是:每條上網(wǎng)記錄三個字段,分別是姓名,性別,上網(wǎng)時間,字段之間用“,”護分隔;要求打印輸出所有上網(wǎng)總時間大于兩小時的女性網(wǎng)友。請問如下哪些代碼片段能實現(xiàn)上述業(yè)務場景?()
Fusionlnsigt HD的Hive組件可以運行在哪些分布式計算機框架上?()
FusionLnsigt HD用戶想通過HBase shell操作來查詢某個HBase表中的內(nèi)容,這中場景下推薦管理員給這個用戶分配一個機機賬號。()
Fusionlnsight HD中,Streaming的特點?()