在此记录一下
1、zookeeper一直启动失败:
看你的事物目录配置的是什么
解决方法:删除掉/var/lib/zookeeper/version-2 为0kb的有问题文件,问题解决
2、NodeManager内存溢出无法链接等的问题
注意几点:
1、这里不能超过物理内存的80%
2、这里不能设置无限制大小,按容器内存设置,后续有问题可随时调整
最重要的问题,跟踪日志发现:
会读取恢复目录下的文件,一旦里面文件有异常就会一直卡死在这里,所以解决办法:
删除掉 /var/lib/hadoop-yarn/yarn-nm-recovery/yarn-nm-state ,删除掉这个yarn-nm-state文件夹及文件,问题解决。