单项选择题
Spark MLlib中的Basic Statistic是专门用于进行大数据集群上的统计分析工具,以下哪个不属于Basic Statisti6发持的功能?()
A.假设检验
B.特征抽取
C.汇总统计
D.生成随机数
点击查看答案
相关考题
-
单项选择题
以下关于SparkLlib中FP-Growth的超参数描述不正确的是()
A.minConfidence∶生成关联规则的最小置信度。置信度表明关联规则被发现的真实程度
B.minSupport∶对项目集的最小支持被识别为频繁
C.numPartitions∶用于分发工作的分区数
D.transform∶以高于minConfidence的置信度生成的关联规则 -
多项选择题
在进行完数据预处理和特征工程后,接下来要进行的就是选择合适的模型来训练我们己经处理好的数据和选择的特征。假如你是一名数据挖掘工程师,一般会从以下哪几个方面来进行特征分析?()
A.其他要求∶性能、时间、空间
B.特征是否独立
C.对拟合程度的要求
D.特征空间的维度
E.是否为线性特征 -
单项选择题
以下哪些不属于无量纲化特征缩放的为法?()
A.最大-最小归化
B.0neHot编码
C.缩放成单位向量
D.特征标准化
E.均值归一化
