大数据技术与应用
上QQ阅读APP看书,第一时间看更新

3.5 实训1 Hadoop搭建

1.实训目的

掌握Hadoop平台的安装和配置。

2.实训内容

搭建Hadoop平台的第一步,就是根据实际情况选择最合适的Hadoop版本。目前,由于Hadoop飞速发展,功能更新和错误修复在不断地迭代着,所以版本特别多,显得有些杂乱。结合功能和稳定性两方面,这里选择CDH5。该版本是目前生产环境中装机量较大的版本之一,涵盖了所有Hadoop版本的主要功能和模块,稳定且有很多有用的新特性。下载地址为https://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.6.0.tar.gz。

Hadoop的运行环境有以下两种。

● Windows。虽然Hadoop社区目前已经支持Windows,但由于Windows操作系统本身不适合作为服务器操作系统,因此本书不介绍Windows下Hadoop的安装方式。

● Linux。Hadoop的最佳运行环境无疑是开源操作系统Linux。Linux的发行版本众多,常见的有CentOS、Ubuntu、RedHat等。本书选择的就是CentOS。

(1)安装虚拟机

1)进入VMware安装向导,如图3-12所示,单击“下一步”按钮。

2)选择自定义安装,进入“自定义安装”界面,如图3-13所示,单击“下一步”按钮。

图3-12 VMware安装向导

图3-13 “自定义安装”界面

3)进入“用户体验设置”界面,设置用户体验,单击“下一步”按钮,如图3-14所示。

4)进入“快捷方式”界面,选择创建快捷方式的位置,单击“下一步”按钮,如图3-15所示。

图3-14 “用户体验设置”界面

图3-15 “快捷方式”界面

5)准备工作完成,单击“安装”按钮,开始安装,如图3-16所示。

6)在安装过程中不需要用户执行任何操作,如图3-17所示。

图3-16 开始安装

图3-17 安装过程

7)单击“完成”按钮,退出安装向导,安装完成,如图3-18所示。

(2)新建虚拟机并安装CentOS

1)选择“自定义(高级)”单选按钮,进入新建虚拟机向导,单击“下一步”按钮,如图3-19所示。

图3-18 安装完成

图3-19 新建虚拟机向导

2)选择虚拟机硬件兼容性,单击“下一步”按钮,如图3-20所示。

3)安装客户机操作系统,单击“下一步”按钮,如图3-21所示。

图3-20 选择虚拟机硬件兼容性

图3-21 安装客户机操作系统

4)设置安装信息,单击“下一步”按钮,如图3-22所示。

5)命名虚拟机为“hadoop”,并选择安装位置,单击“下一步”按钮,如图3-23所示。

图3-22 设置安装信息

图3-23 命名虚拟机

6)配置处理器参数,单击“下一步”按钮,如图3-24所示。

7)给虚拟机分配内存,单击“下一步”按钮,如图3-25所示。

图3-24 配置处理器

图3-25 设置虚拟机内存

8)选择“使用网络地址转换(NAT)”单选按钮,为虚拟机添加网络,单击“下一步”按钮,如图3-26所示。

9)选择“LSI Logic(L)(推荐)”单选按钮,设置I/O控制器类型,单击“下一步”按钮,如图3-27所示。

10)选择“SCSI(S)(推荐)”单选按钮,设置磁盘类型,单击“下一步”按钮,如图3-28所示。

11)选择“创建新虚拟磁盘”单选按钮,单击“下一步”按钮,如图3-29所示。

图3-26 选择网络类型

图3-27 选择I/O控制器类型

图3-28 选择磁盘类型

图3-29 选择磁盘

12)设置“最大磁盘大小”为20GB,单击“下一步”按钮,如图3-30所示。

13)选择磁盘文件存储位置,单击“下一步”按钮,如图3-31所示。

图3-30 指定磁盘容量

图3-31 指定磁盘文件存储位置

14)单击“完成”按钮,虚拟机创建结束,如图3-32所示。

图3-32 创建完成

15)安装完成后,可以看到前面创建的hadoop虚拟机,设置用户名为“root”,如图3-33所示。

图3-33 设置用户名

(3)配置CentOS网卡

1)执行“vi/etc/sysconfig/network-scripts/ifcfg-eth0”命令编辑ifcfg-eth0网卡,如图3-34所示。

图3-34 输入编辑网卡命令

2)在该网卡内修改其IP地址、子网掩码及网关,如图3-35所示。

图3-35 设置IP地址

3)修改完成后,执行“service network restart”命令重启网卡,如图3-36所示。

图3-36 重启网卡

4)重启后,执行“ifconfig”命令查看网卡相关信息,如图3-37所示。

图3-37 查看网卡信息

5)执行“vi/etc/system/network”命令编辑network文件,如图3-38所示。

图3-38 输入编辑文件命令

6)进入CentOS系统名称修改界面,修改系统名称(HOSTNAME)为“hadoop”,如图3-39所示。

图3-39 修改系统名称

7)设置完成后,执行“reboot”命令重启虚拟机,如图3-40所示。

图3-40 重启虚拟机

8)执行“vi/etc/host”命令编辑hosts文件,如图3-41所示。

图3-41 输入编辑文件命令

9)进入绑定IP地址与主机名界面,输入要绑定的IP地址与主机名,如图3-42所示。

图3-42 输入要绑定的IP地址与主机名

(4)配置ssh无密码连接

1)执行“ssh-keygen”命令生成公钥。生成公钥后执行“ssh-copy-id 192.168.137.10”命令,将其转发至本机的authorized_keys列表,如图3-43所示。

图3-43 生成公钥并转发

2)使用SecureCRT工具上传JDK安装包至hadoop主机,为下一步安装JDK做准备,如图3-44所示。

图3-44 上传JDK安装包

(5)安装JDK与Hadoop环境

1)使用tar命令解压JDK安装包,如图3-45所示。

图3-45 解压JDK安装包

2)执行“vi/etc/profile”命令编辑profile文件,配置JDK环境变量,如JAVA_HOME和PATH,如图3-46所示。

3)执行“source/etc/profile”命令使profile文件立即生效,如图3-47所示。

图3-46 配置JDK环境变量

图3-47 使profile文件生效

4)执行“java-version”命令查看JDK安装结果,能看到已经安装成功,如图3-48所示。

图3-48 查看JDK安装结果

5)上传Hadoop安装包文件至虚拟机,如图3-49所示。

图3-49 上传Hadoop安装包

6)使用tar命令解压Hadoop安装包,如图3-50所示。

图3-50 解压Hadoop安装包

7)使用mv命令将解压后的Hadoop安装文件从上传目录移动至opt目录下,如图3-51所示。

图3-51 移动Hadoop安装文件

8)执行“vi/etc/profile”命令编辑profile文件,为Hadoop配置环境变量,如图3-52所示。执行“source/etc/profile”命令使profile文件立即生效。

图3-52 配置Hadoop环境变量

9)使用vi命令修改Hadoop配置文件,即hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml和slaves文件,如图3-53所示。

图3-53 修改Hadoop配置文件

① 修改hadoop-env.sh文件,在文件末尾追加环境变量语句。

② 修改core-site.xml文件,修改如下。

③ 修改hdfs-site.xml文件,修改如下。

④ 修改mapred-site.xml文件,修改如下。

⑤ 修改yarn-site.xml文件,修改如下。

⑥ 修改slaves文件,修改如下。

10)执行“hadoop namenode-format”命令格式化HDFS。最后执行“hadoop version”命令查看安装完成后的Hadoop,如图3-54所示。至此,Hadoop已经安装并配置完成。

图3-54 查看Hadoop安装信息