我的原创地址:https://dongkelun.com/2018/07/10/ambariExceptions/
前言
本文总结在使用ambari时产生的异常,以及如何解决的。
如果发生了异常,在界面上不能直观的看出异常的原因,那么我一般通过查看日志的方法解决。
通过下面的命令查看
vim /var/log/ambari-server/ambari-server.log
若该日志文件没有异常信息,可在其他日志文件里查找
1、异常一
异常发生在add host并confirm host的时候,会卡住不动,然后看日志会发现异常信息:
Error executing bootstrap Cannot create /var/run/ambari-server/bootstrap
1.1 具体的异常
七月 2018 14:29:08,339 INFO [ambari-client-thread-22654] BootStrapImpl:108 - BootStrapping hosts ambari.slave1.com:09 七月 2018 14:29:08,340 INFO [Thread-4609] BSRunner:189 - Kicking off the scheduler for polling on logs in /var/run/ambari-server/bootstrap/309 七月 2018 14:29:08,340 INFO [Thread-4609] BSRunner:372 - Error executing bootstrap Cannot create /var/run/ambari-server/bootstrap09 七月 2018 14:29:08,343 ERROR [Thread-4609] BSRunner:441 - java.io.FileNotFoundException: /var/run/ambari-server/bootstrap/3/ambari.slave1.com.done (没有那个文件或目录)09 七月 2018 14:29:08,344 WARN [Thread-4609] BSRunner:401 - File does not exist: /var/run/ambari-server/bootstrap/3/sshKey09 七月 2018 14:40:28,033 INFO [ambari-client-thread-22676] BootStrapImpl:108 - BootStrapping hosts amabri.slave1.com:09 七月 2018 14:40:28,034 INFO [Thread-4635] BSRunner:189 - Kicking off the scheduler for polling on logs in /var/run/ambari-server/bootstrap/409 七月 2018 14:40:28,035 INFO [Thread-4635] BSRunner:372 - Error executing bootstrap Cannot create /var/run/ambari-server/bootstrap09 七月 2018 14:40:28,036 ERROR [Thread-4635] BSRunner:441 - java.io.FileNotFoundException: /var/run/ambari-server/bootstrap/4/amabri.slave1.com.done (没有那个文件或目录)09 七月 2018 14:40:28,037 WARN [Thread-4635] BSRunner:401 - File does not exist: /var/run/ambari-server/bootstrap/4/sshKey09 七月 2018 14:44:02,863 INFO [ambari-client-thread-22659] BootStrapImpl:108 - BootStrapping hosts ambari.slave1.com:
1.2 解决办法
通过查看,/var/run/ambari-server目录下确实没有bootstrap文件夹,手动添加即可
mkdir bootstrap
但是,如果只创建该文件夹的话,ambari依然报错,大概是没有权限相关的,就不贴出详细的异常了
为ambari用户添加权限即可
chown -R ambari:ambari /var/run/ambari-server/bootstrap/
1.3 解决添加host时给出的警告
在添加host时,如果没有异常,最后会检查该host相关的配置,最后会给出警告,点击警告的详细信息,会看到下面的界面
image
根绝他的提示,在对应的host上执行下面的命令
python /usr/lib/python2.6/site-packages/ambari_agent/HostCleanup.py --silent --skip=users
在重新检查一下,可能还有警告,且警告为,该host存在一些用户,根据界面上的提示,将--skip=users去掉,即可删除这些用户
python /usr/lib/python2.6/site-packages/ambari_agent/HostCleanup.py
2、异常二
异常体现在,添加完host,选择要安装的组件的时候,next为灰色,不能点击,检查网页源代码为disabled(不可用),重试几次发现结果一样,然后尝试修改界面上的代码disabled删掉,然后next按钮可用,点击next,但是依然会卡住,确定不是ambari的bug
image
image
image
2.1 具体的异常
然后在浏览器的console发现ambari打印出了异常,大概是哪个目录或地址找不到,没有截图保存~,发现ambari报了异常之后,继续在ambari-server.log查看,发现确实有异常,且该异常和第一个异常类似
org.apache.ambari.server.api.services.stackadvisor.StackAdvisorException: Error occured during stack advisor command invocation: Cannot create /var/run/ambari-server/stack-recommendations
2.2 解决办法
和第一个异常解决方法一样
cd /var/run/ambari-server mkdir stack-recommendations chown -R ambari:ambari /var/run/ambari-server/stack-recommendations/
2、3 重新添加host
重新执行添加host的操作,到这一步,就可以点击next继续后面的操作了!
作者:董可伦
链接:https://www.jianshu.com/p/21de84b44a44