单项选择题
使用()给DataFrames数据去重。
A.orderByB.distinctC.countD.groupBy
单项选择题 ()被创建时必须定义Schema,定义每一个字段名与数据类型,因而可以用字段名进行统计。
单项选择题 ()是指每个父RDD的一个Partition最多被子RDD的一个Partition所使用。
单项选择题 ()操作返回RDD的第一个元素