单项选择题
假设需要对某个数据集使用mahout进行聚类,数据集共有6类数据,需要迭代7次,拟使用mahout进行聚类,假设输入文件为input/part-m-0000,输出目录为output,初始聚类中心点文件路径为clusters,下列聚类语句正确的是()
A.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-k6-x7
B.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-k7-x6
C.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-x6
D.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-k7
点击查看答案&解析
相关考题
-
单项选择题
如果你面对的大数据都是结构化的数据,使用传统的数据库进行数据库查询和分析时,数据库的反应速度很慢,在这种大数据应用场景下,正确的大数据技术解决方案是()
A.Hadoop+oracle+spark
B.Hadoop+sqoop+hive+spark
C.oracle+mahout
D.sql server+oracle+mahout -
单项选择题
大数据的起源是以下哪个领域()
A.金融
B.电信
C.互联网
D.公共管理 -
单项选择题
使用sparkMLib进行K-means算法分析时,我们会调用KMeans.train方法对数据集进行聚类训练,该函数的返回值是()
A.K_MEANS_PARALLEL
B.KMeansModel类实例
C.kmeans.epsilon
D.kmeans.test实例
