相关考题
-
多项选择题
以下哪个是对分类变量进行归类压缩的常见原因()
A.避免某分类中Y缺乏变异的问题
B.避免在模型中出现过多的哑变量
C.避免解释变量共线性
D.避免显性样本过少 -
多项选择题
以下哪个方法属于盖帽法()
A.删去大于三倍标准差的值
B.距离均值大于三倍标准差的值使用三倍标准差的值替代
C.删去1.5倍IQR的值
D.超出1.5倍IQR的值使用1.5倍IQR的值替代 -
多项选择题
对数值字段作离散化,有哪些优点()
A.可使数据精简
B.可支持许多无法处理数值型字段的算法
C.可提高分类器的稳定性
D.可降低数据的复杂度
