black

数据仓库与数据挖掘

登录

问答题

简答题

假定用于分析的数据包含属性age。数据元组的age值(以递增序) 是:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。
(1)使用分箱均值光滑对以上数据进行光滑,箱的深度为3。解释你的步骤。评述对于给定的数据,该技术的效果。 
(2)如何确定数据中的离群点?
(3)对于数据光滑,还有哪些其他方法?

【参考答案】

(1)用箱深度为3的分箱均值光滑对以上数据进行光滑需要以下步骤:
步骤1:对数据排序。(因为数据已被排序,所以......

(↓↓↓ 点击下方‘点击查看答案’看完整答案 ↓↓↓)

相关考题

问答题 如下规范化方法的值域是什么? (a)min-max规范化。 (b)z-score规范化。 (c)小数定标规范化。

问答题 假定用于分析的数据包含属性age。数据元组的age值(以递增序)是:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。 (1)该数据的均值是什么?中位数是什么? (2)数据的中列数是什么?数据的中列数是最大术和最小是的均值。 (3)你能(粗略地)找出数据的第一个四分位数(Q1)和第三个四分位数(Q3) 吗? (4)给出数据的五数概括。

问答题 假设给定的数据集的值已经分组为区间。区间和对应的频率如下。 计算数据的近似中位数值。

All Rights Reserved 版权所有©PP题库网库(pptiku.com)

备案号:湘ICP备14005140号-5

经营许可证号:湘B2-20140064