单项选择题
以下关于SparkLlib中FP-Growth的超参数描述不正确的是()
A.minConfidence∶生成关联规则的最小置信度。置信度表明关联规则被发现的真实程度 B.minSupport∶对项目集的最小支持被识别为频繁 C.numPartitions∶用于分发工作的分区数 D.transform∶以高于minConfidence的置信度生成的关联规则
多项选择题 在进行完数据预处理和特征工程后,接下来要进行的就是选择合适的模型来训练我们己经处理好的数据和选择的特征。假如你是一名数据挖掘工程师,一般会从以下哪几个方面来进行特征分析?()
单项选择题 以下哪些不属于无量纲化特征缩放的为法?()
单项选择题 现实中大数据挖掘任务往社特征属性过多,而一个普遍存在的事实是,大数据集带来的关键信息只聚集在部分甚至少数特征上,因此我们需要进行以下哪种操作?()