单项选择题
在KNN算法上进行预测概率的推估时,会采用哪一种方法,以保证每一类的预测概率不为0()
A.数据正规化(Data Normalization)B.拉普拉斯修正法(Laplace Correction)C.数据一般化(Data Generalization)D.以上皆非
多项选择题 20Newsgroups数据集是机器学习研究中常用的标准数据集,它使用20个Usenet新闻单位上几个月发布的18828个消息,共18828个文件,如果要对该数据集使用mahout进行文本分类,错误的做法是()
多项选择题 给定一个巨大的文本(如1TB),可以编写mapreduce程序计算单词出现的数目,需要经历如下哪几个步骤()
多项选择题 Mahout中实现的canopy聚类命令的可选参数是()