一、Hadoop集群简介Hadoop集群整体概述Hadoop集群包括两个集群: HDFS集群、YARN集群两个集群逻辑上分离、通常物理上在一起两个集群都是标准的主从架构集群Hadoop集群简介Hadoop集群=HDFS集群+YARN集群逻辑
Hadoop集群整体概述
Hadoop集群简介
Hadoop集群=HDFS集群+YARN集群
两个集群互相之间没有依赖、互不影响
某些角色进程往往部署在同一台物理服务器上
MapReduce是计算框架、代码层面的组件 没有集群之说
Hadoop源码编译
https://archive.apache.org/dist/hadoop/common/hadoop-3.3.0/
匹配不同操作系统本地库环境, Hadoop某些操作比如压缩、 IO需要调用系统本地库(*.so|*.dll)修改源码、重构源码。
源码包根目录下文件: BUILDING.txt 详细步骤参考附件资料
hadoop-3.3.0-Centos7-64-with-snappy.tar.gz
根据软件工作特性和服务器硬件资源情况合理分配
比如依赖内存工作的NameNode是不是部署在大内存机器上?
资源上有抢夺冲突的,尽量不要部署在一起
工作上需要互相配合的。尽量部署在一起
vim /etc/hostname
vim /etc/hosts
systemctl stop firewalld.service #关闭防火墙systemctl disable firewalld.service #禁止防火墙开启自启
ssh-keygen #4个回车 生成公钥、私钥ssh-copy-id node1、ssh-copy-id node2、ssh-copy-id node3 #
yum -y install ntpdatentpdate ntp4.aliyun.com
mkdir -p /export/server/ #软件安装路径mkdir -p /export/data/ #数据存储路径mkdir -p /export/software/ #安装包存放路径
官网文档: https://hadoop.apache.org/docs/r3.3.0/靠前类1个: hadoop-env.sh第二类4个: xxxx-site.xml ,site表示的是用户定义的配置,会覆盖default中的默认配置。core-site.xml 核心模块配置hdfs-site.xml hdfs文件系统模块配置mapred-site.xml MapReduce模块配置yarn-site.xml yarn模块配置第三类1个: workers所有的配置文件目录: /export/server/hadoop-3.3.0/etc/hadoop
hadoop-env.sh
core-site.xml
hdfs-site.xml
mapred-site.xml
yarn-site.xml
workers
在node1机器上将Hadoop安装包scp同步到其他机器
vim /etc/profileexport HADOOP_HOME=/export/server/hadoop-3.3.0export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
scp /etc/profile root@node2:/etc/scp /etc/profile root@node3:/etc/
source /etc/profilehadoop #验证环境变量是否生效
首次启动HDFS时,必须对其进行格式化操作。format本质上是初始化工作,进行HDFS清理和准备工作命令:hdfs namenode -format
在node1上,使用软件自带的shell脚本一键启动。前提: 配置好机器之间的SSH免密登录和workers文件。
start-dfs.shstop-dfs.sh
start-yarn.shstop-yarn.sh
start-all.shstop-all.sh
地址: http://namenode_host:9870
其中namenode_host是namenode运行所在机器的主机名或者ip如果使用主机名访问,别忘了在Windows配置hosts
地址: http://resourcemanager_host:8088其中resourcemanager_host是resourcemanager运行所在机器的主机名或者ip如果使用主机名访问,别忘了在Windows配置hosts
HDFS 初体验
shell命令操作hadoop fs -mkdir /itcasthadoop fs -put zookeeper.out /itcasthadoop fs -ls / Web UI页面操作
执行Hadoop官方自带的MapReduce案例, 评估圆周率π的值。
以上就是小编给大家带来的关于'配置hadoop环境变量的参数,linux配置hadoop环境变量'的探讨分享,希望大家通过阅读小编的文章之后能够有所收获!如果大家觉得小编的文章不错的话,可以多多分享给有需要的人。