相关考题
-
单项选择题
以下关于特征缩放的处理方法,量小值一最大值归一化和标准化的应用场景描述错误的是()
A.在实际应用中,特征缩放的标准化操作更常用
B.标准化方法在分、聚类算法中需要使用PCA技术进行降维
C.最小值一最大值归一化的数据不符合正态分布
D.最小值最大值归一化和标准化都需要使用距高来度量相似性 -
多项选择题
传统的ETL与ELT存在局限性,为了更好地适应多数据源.实时数据处理.高容惜.并行化等业务需求,基于Kafka的ETL矿架应运而生,以下关于Kafka Connec的描述正确的是()
A.Apache Kafka是由Apache Hadoop开发的,能够实时处理数据,为所有的消息处理目的地提供现实状况来源管道
B.Kafka Conect将数据源和数据目的地视为彼此独立的任务,源端和目的端完全解耦,彼此不知道对方的存在
C.Sources负责从其他异构系统中读取数据井导入到afka中
D.Sinks负责把Kafka中的数据写入到其他的系统中 -
判断题
ETL主要负责将分布的、异构的数据(Extract阶段)根据一定的业务规则进行数据清洗、转换、集成(Tra立sferr阶段)。最终将处理后的数据加载到数据目的地(亿*ad阶段),比如数据仓库。
