1.6 习题_Spark编程基础（Scala版）-QQ阅读男生玄幻网

上QQ阅读APP看书，第一时间看更新

1.6 习题

1.请阐述大数据处理的基本流程。

2.请阐述大数据的计算模式及其代表产品。

3.请列举Hadoop生态系统的各个组件及其功能。

4.分布式文件系统HDFS的名称节点和数据节点的功能分别是什么？

5.试阐述MapReduce的基本设计思想。

6.YARN的主要功能是什么？使用YARN可以带来哪些好处？

7.试阐述Hadoop生态系统中HBase与其他部分的关系。

8.数据仓库Hive的主要功能是什么？

9.Hadoop主要有哪些缺点？相比之下，Spark具有哪些优点？

10.如何实现Spark与Hadoop的统一部署？

11.Flink相对于Spark而言，在实现机制上有什么不同？

12.Beam的设计目的是什么，具有哪些优点？