相关考题
-
多项选择题
关于FP-groqth算法,以下描述正确的是()
A.FP-growth算法与Apriori算法不同,该算法的第二步使用后缀树(FP-tree)结构来编码事务,不显式生成候选集
B.SparkMLlib中实现关联规则算法的包是∶org.apache.spark.mllib.fpa.
C.SparkMlib中实现了FP-growth的平行版本,叫做PFP.PFP可以将FP-growth的工作分发到其他机器,比单机运行有更好的扩展性
D.给定一个交易数据集,FP-growth的第一步骤是计算项目的频率,并确定频繁项目 -
多项选择题
可以用来计算相似度的指标有()
A.Tanimoto系数
B.Pearson相关系数
C.Cosine相似度
D.欧式距离 -
多项选择题
Basic Statistic为数据度处理数据中统计分析提供支撑方法,包括()等数据分析方法。
A.Elementwise Product
B.Stratified sampling
C.Summary statistics
D.Hypothesis testing
