判断题
RDD中的批量操作,运行时将根据数据存放的位置来调度任务,可对比与MapReduce中的数据本地化读取特点。
正确(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)
判断题 当前Spark中实现了两种类型的分片函数,一个是基于哈希的HashPartitioner,另外一个是基于范围的RangePartitioner。
判断题 transformations操作会在一个已存在的RDD上创建一个新的RDD,但实际的计算并没有执行,仅仅记录操作过程,所有的计算都发生在actions环节。
判断题 窄依赖不仅包含一对一的窄依赖,还包含一对固定个数的窄依赖。