判断题
Spark SQL的表数据在内存中存储不是采用原生态的JVM对象存储方式,而是采用内存列存储。
正确(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
判断题 在对Spark的操作中,定义纯Python方法会降低应用程序的速度,因为Spark需要在Python解释器和JVM之间连续切换。所以要尽可能的使用内置的Spark算子。
判断题 RDD中的批量操作,运行时将根据数据存放的位置来调度任务,可对比与MapReduce中的数据本地化读取特点。
判断题 当前Spark中实现了两种类型的分片函数,一个是基于哈希的HashPartitioner,另外一个是基于范围的RangePartitioner。