单项选择题
下列哪项不是数据准备需要完成的工作?()
A.从数据源采集数据并存入HDFS
B.分析数据的特点,提取有效的特征
C.去除数据中的噪声
D.过滤无效的或不完整且无法补全的数据
点击查看答案&解析
相关考题
-
单项选择题
大数据分析处理的基本流程主要包括哪些步骤?()
A.数据准备
B.特征工程
C.建模分析
D.以上都是 -
单项选择题
关于Spark,下列说法错误的是()。
A.Spark可以将数据缓存在内存中,极大提高运算效率
B.Spark采用MapReduce机制进行任务并行化
C.RDD是Spark的基本数据结构
D.Spark非常适合迭代运算 -
单项选择题
Mahout是一个机器学习包,它()。
A.包含若干机器学习算法的MapReduce实现
B.提高了HDFS文件存取的速度
C.增强了Hadoop集群的性能
D.降低了数据通信的时间开销
