公司采用HDP的大数据平台,周六周日突然停电后,周一上班通过ambari发现组件heartbeat都lost。查了一圈,发现应该是正好碰到了低版本HDP的bug。下面是实践后有效的解决方式。
- 确保防火墙关闭,能够ping通ambari-server服务所在机器的IP
升级openssl服务
1
yum upgrade openssl
关闭 openssl 的检查
1
sed -i 's/verify=platform_default/verify=disable/' /etc/python/cert-verification.cfg
先停掉ambari-server,然后依次停掉各个ambari-agent
1
2ambari-server stop
ambari-agent stop在所有ambari-agent节点上,修改ambari-agent.ini文件的[security],新增force_https_protocol如下:
1
2
3vi /etc/ambari-agent/conf/ambari-agent.ini
[security]
force_https_protocol=PROTOCOL_TLSv1_2依次开启ambari-agent,最后开启ambari-server
1
2ambari-server start
ambari-agent start