单项选择题
下列何种算法可以了解各产品间的先后购买的关系及概率值()
A.关联规则(AssociationRules)
B.序列模式(Sequential Patterns)
C.时间序列(Time Series)
D.聚类分析(Cluster Analysis)
点击查看答案&解析
相关考题
-
单项选择题
在KNN算法上进行预测概率的推估时,会采用哪一种方法,以保证每一类的预测概率不为0()
A.数据正规化(Data Normalization)
B.拉普拉斯修正法(Laplace Correction)
C.数据一般化(Data Generalization)
D.以上皆非 -
多项选择题
20Newsgroups数据集是机器学习研究中常用的标准数据集,它使用20个Usenet新闻单位上几个月发布的18828个消息,共18828个文件,如果要对该数据集使用mahout进行文本分类,错误的做法是()
A.直接使用mahout算法,在namenode机器的本地文件系统中调用这18828个文件
B.将这18828个文件上传到hdfs上,然后使用mahout算法分析
C.使用mahoutᨀ供的seqdirectory命令将18828个文件序列化成一个大文件上传到hdfs上,然后使用mahout算法分析
D.将这18828个文件rar压缩软件将其压缩成一个大文件上传到hdfs上,然后使用mahout算法分析 -
多项选择题
给定一个巨大的文本(如1TB),可以编写mapreduce程序计算单词出现的数目,需要经历如下哪几个步骤()
A.自动对文本进行分割
B.对分割后的每一个KV对应用用户定义的Map进行处理,生成新的KV对
C.对输出的结果集归拢、排序(系统自动完成)
D.通过Reduce操作生成最后结果
