问答题 下表由雇员数据库的训练数据组成。数据已泛化。例如,age“31…35”表示年龄在31~35之间。对于给定的行,count表示department,status,age和salary在该行具有给定值的元组数。 给定一个数据元组,它的属性department,age和salary的值分别为“systems”,“26…30”,和“46K…50K”。该元组status的朴素贝叶斯分类是什么?
问答题 考虑下面的多特征立方体查询:按{item,region,month}的所有子集分组,对每组找出2004年的最小货架寿命,并对价格低于100美元、货架寿命在最小货架寿命的1.25~1.5倍之间的元组找出总销售额部分。用扩充的SQL表示该查询。
问答题 假定BigUniversity的数据仓库包含如下4个维:student(student_name,area_id,major,status,university),course(course_name,department),semester(semester,year)和instructor(dept,rank);2个度量:count和avg_grade。在最低概念层,度量avg_grade存放学生的实际课程成绩。在较高概念层,avg_grade存放给定组合的平均成绩。 (1)由基本方体[student,course,semester,instructor]开始,为列出BigUniversity每个学生的CS课程的平均成绩,应当使用哪些特殊的OLAP操作。 (2)如果每维有5层(包括all),如“student