博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Federation+HA集群运维
阅读量:5752 次
发布时间:2019-06-18

本文共 1508 字,大约阅读时间需要 5 分钟。

Federation+HA集群运维

 

hadoop管理客户端

copy一个hadoop部署目录作为客户端,用于集群的管理和监控,我的客户端如下:

客户端目录:

/home/deploy/hadoop/ hadoop-2.0.6-cilent-lin

  • 修改客户端hadoop的core-site.xml

<property>

   <name>fs.defaultFS</name>

 <!-- <value>viewfs:///</value>-->

   <value>hdfs://server-solr-001.m6.server.com:9000</value>

               </property>

否则无法使用./bin/hdfs dfsadmin –report 等,fs.defaultFS 应该为active的namenode的地址。

  • 测试客户端:

 

 

不停机加datanode

  • slaves文件

将要加入的datanode加入到slaves中,避免以后集群重启忘记了。

  • dfs.hosts文件

在$HADOOP_HOME/etc/hadoop/ 创建dfs-hosts文件: dfs-hosts

Host1

Host2

Host3

newhost

注意:newhost不能出现在dfs.hosts.exclude文件中。并且dfs-hosts文件需要在两个NN都有。

  • 刷新节点

./bin/hdfs dfsadmin -refreshNodes

查看web监控如下:

 

 

发现已经有一个Decommissioned节点。

  • 启动新加的datanode

./sbin/hadoop-daemon.sh start datanode

 

  • 再次查看web监控

 

发现该Decommissioned节点已经是live node。

  • 查看standby的namenode

关键是要看看standby的namenode,是否感知到这个过程。

 

发现stanby的namenode并没有感知到上线的datanode。

经过实际验证,只有active的namenode才能感知到上线和下线操作。

  • 初步实现策略

初步处理策略,执行一次

./bin/hdfs dfsadmin -refreshNodes

后,手动kill掉active的namenode,使得standby的namenode变为active,再次执行

./bin/hdfs dfsadmin -refreshNodes

后,将刚才kill的namenode启动起来。

    注意:要将刚才kill的namenode启动起来。

然后在新加的datanode上面,启动此datanode

./sbin/hadoop-daemon.sh start datanode

 

  • 两外不用执行刷新,即refreshNodes,直接启动datanode,两个NN都可以感知到,而且运行也良好...后来我就直接启动了。

下线某个datanode

在$HADOOP_HOME/etc/hadoop/ 创建dfs.hosts.exclude文件:dfs-hosts-exclude

host

执行过程与添加一个新的datanode类似,下线过程最好不要直接停掉。

Namenode不停机替换

  将standby的NN手动kill掉,然后将这个NN的元数据同步到新的NN下,然后启动新的NN,这是后应该可以启动,但是新的NN感知不到livenodes,显示livenodes为0,此时可以顺次重启下DN,之后新的NN即可感知到了。

转载于:https://www.cnblogs.com/requelqi/p/3740944.html

你可能感兴趣的文章
为eclipse安装maven插件
查看>>
公司新年第一次全员大会小记
查看>>
最懒的程序员
查看>>
JAVA8 Stream 浅析
查看>>
inner join on, left join on, right join on要详细点的介绍
查看>>
SAS vs SSD对比测试MySQL tpch性能
查看>>
Spring boot 整合CXF webservice 全部被拦截的问题
查看>>
Pinpoint跨节点统计失败
查看>>
【Canal源码分析】Canal Server的启动和停止过程
查看>>
机房带宽暴涨问题分析及解决方法
查看>>
iOS 绕过相册权限漏洞
查看>>
我的友情链接
查看>>
XP 安装ORACLE
查看>>
八、 vSphere 6.7 U1(八):分布式交换机配置(vMotion迁移网段)
查看>>
[转载] 中华典故故事(孙刚)——19 万岁
查看>>
修改hosts文件里面的主机名,oralce asm无法启动
查看>>
Maven学习总结(十)——使用Maven编译项目gbk的不可映射问题
查看>>
php5编译安装常见错误和解决办法集锦
查看>>
Linux远程访问及控制
查看>>
MongoDB实战系列之五:mongodb的分片配置
查看>>