问答题 假定用于分析的数据包含属性age。数据元组的age值(以递增序) 是:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。 (1)画出一个等宽为10的等宽直方图; (2)为如下每种抽样技术勾画例子:SRSWOR,SRSWR ,聚类抽样,分层抽样。使用大小为5的样本和层“青年”,“中年”和“老年”。
问答题 假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215。使用如下每种方法将其划分成三个箱。 (a)等频(等深)划分。 (b)等宽划分。 (c)聚类。
问答题 假定用于分析的数据包含属性age。数据元组的age值(以递增序) 是:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。 (1)使用分箱均值光滑对以上数据进行光滑,箱的深度为3。解释你的步骤。评述对于给定的数据,该技术的效果。 (2)如何确定数据中的离群点? (3)对于数据光滑,还有哪些其他方法?