相关考题
-
单项选择题
在Spark中,假设lines是一个DStream对象,filter语句可以过滤掉80%的数据,针对以下两个语句说法正确的是:() X:lines.filter(...).groupByKey(...) Y:lines.groupByKey(...).filter(...)
A.X比Y的性能更高
B.X比Y的性能更低
C.X和Y和性能一样
D.无法确性X和丫的性能差异 -
判断题
Solr是一个高性能,基于Lucene的全文检索服务。Solr对Lucene进行了扩展,提供了比Lucene更为丰富的查询语言,并实现了强大的全文检索功能,具有高度的可扩展性。同时从Solr4.0版本开始,支持SolrCloud模式。() -
单项选择题
存在如下场景:每天由线上系统产生新数据500G,需要对这些数据按天、周、月等维度做统计汇总。请问它适合用Hive哪种表来处理?()
A.分桶表,按照天分桶
B.分区表,按天分区
C.倾斜表,倾斜字段选择日期,倾斜值随机
D.分区+分桶表,按照时间分区,每个分区2560个桶
