单项选择题

A.从数据源采集数据并存入HDFS
B.分析数据的特点,提取有效的特征
C.去除数据中的噪声
D.过滤无效的或不完整且无法补全的数据