多项选择题
给定一个巨大的文本(如1TB),可以编写mapreduce程序计算单词出现的数目,需要经历如下哪几个步骤()
A.自动对文本进行分割
B.对分割后的每一个KV对应用用户定义的Map进行处理,生成新的KV对
C.对输出的结果集归拢、排序(系统自动完成)
D.通过Reduce操作生成最后结果
点击查看答案&解析
相关考题
-
多项选择题
Mahout中实现的canopy聚类命令的可选参数是()
A.–input偏好数据路径
B.–output推荐结果路径
C.--t1(-t1)t1:T1阈值
D.--t2(-t2)t2:T2阈值 -
多项选择题
Mahout中实现的kmeans聚类命令的必选参数是()
A.–input偏好数据路径
B.–output推荐结果路径
C.–clusters初始聚类中心点文件路径
D.--overwrite对输出路径进行重写 -
多项选择题
基于内容的推荐算法生成推荐的过程主要依靠()
A.内容分析器
B.推荐系统
C.文件学习器
D.过滤部件
