单项选择题
假设需要对某个数据集使用mahout进行聚类,数据集共有6类数据,需要迭代7次,拟使用mahout进行聚类,假设输入文件为input/part-m-0000,输出目录为output,初始聚类中心点文件路径为clusters,下列聚类语句正确的是()
A.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-k6-x7 B.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-k7-x6 C.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-x6 D.mahout kmenas-iinput/part-m-0000-ooutput-cclusters-k7
单项选择题 如果你面对的大数据都是结构化的数据,使用传统的数据库进行数据库查询和分析时,数据库的反应速度很慢,在这种大数据应用场景下,正确的大数据技术解决方案是()
单项选择题 大数据的起源是以下哪个领域()
单项选择题 使用sparkMLib进行K-means算法分析时,我们会调用KMeans.train方法对数据集进行聚类训练,该函数的返回值是()