该问题常在主机从集群分离后出现,现象是登录WebUI后,总会在登陆(大约)5分钟后就无法继续操作,并会弹出登录框,需要重新登录。
TLDR:解决方法是在参照官方wiki分离节点后,删除/etc/pve/ha/
目录下的所有文件(可能需要停止pve相关服务),即可。
如果/etc/pve/priv/lock/
下有残留的文件,也可以一并删除。
这个问题原先在国内和外网上都没有靠谱的解决方案,而我也是在重装了Proxmox VE后对比新旧配置文件夹发现的异样,可能是网络上可见的第一例成功解决的吧。
以下DLC
关于如何在不丢失虚拟机的情况下重装Proxmox VE软件套件,这里可以简单的说明一下:
- 首先分离节点(即主机),确保不在cluster中
- 备份需要的pve配置文件:
- 存储配置文件:
/etc/pve/storage.cfg
- 每个LXC容器配置文件:
/etc/pve/nodes/<your_node_name
>/lxc/*
- 每个VM的配置文件:
/etc/pve/nodes/<your_node_name>/qemu-server/*
- 存储配置文件:
- 然后停止pve服务,卸载
proxmox-ve
元软件包(期间还会有一道安全措施),然后用apt autoremove
卸载所有的pve软件包 - 备份并移除
/var/lib/pve-cluster/
(/etc/pve
目录虚拟文件系统,即pmxcfs,而这里是其“本体”) - 此时你的系统就变成了近似普通的Debian Linux,
可以重启一下(要有仪式感) - 重新装回
proxmox-ve
- 先关闭所有pve服务,然后恢复之前备份的文件,重启机器
- 登陆WebUI,你应该能看到你原来所有的虚拟机和LXC了
最后吐槽一下pve:cluster加入容易,移出难。还会导致一些奇怪的问题,建议一旦你的cluster有分离操作,最好把所有涉及到的节点都分离并清理干净(甚至重装pve软件),再把需要的节点重新组合为cluster。当然最好是加入cluster就考虑清楚,别做分离操作。
我也出现这个问题,但按你所说的删除这两个目录下所有文件,我的PVE里这两个目录内就没有文件,不知道还应该怎么处理。
/etc/pve/priv/lock/
/etc/pve/ha/
可以尝试按文章中的方法重新安装pve套件(记得做好备份)
直接把 /etc/pve/priv/* 删掉