问答题 假定BigUniversity的数据仓库包含如下4个维:student(student_name,area_id,major,status,university),course(course_name,department),semester(semester,year)和instructor(dept,rank);2个度量:count和avg_grade。在最低概念层,度量avg_grade存放学生的实际课程成绩。在较高概念层,avg_grade存放给定组合的平均成绩。 (1)由基本方体[student,course,semester,instructor]开始,为列出BigUniversity每个学生的CS课程的平均成绩,应当使用哪些特殊的OLAP操作。 (2)如果每维有5层(包括all),如“student
问答题 假定用于分析的数据包含属性age。数据元组的age值(以递增序) 是:13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70。 (1)画出一个等宽为10的等宽直方图; (2)为如下每种抽样技术勾画例子:SRSWOR,SRSWR ,聚类抽样,分层抽样。使用大小为5的样本和层“青年”,“中年”和“老年”。
问答题 假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215。使用如下每种方法将其划分成三个箱。 (a)等频(等深)划分。 (b)等宽划分。 (c)聚类。