相关考题
-
多项选择题
数据挖掘中用于解决预测问题的模型主要包括哪几大类?()
A.分类
B.流行
C.回归
D.复变 -
判断题
不要在整个数据集上做归一化处理,要区分训练集和测试集。 -
单项选择题
以下哪些选项不属于数值特征离散化的必要性?()
A.数值高散化实际是一个数据简化机制,通过数值离散化过程,一个完整的数据集变成一个个按照某种规则分类的子集,增强了模型的稳定性
B.离散化数值在提高建模速度和提高模型精度上有显著作用
C.离散化过程并没有带来信息丢失
D.离散化后的特征对异常数据有很强的鲁棒性,能减少噪音节点对数据的影响
