奇怪的 pve 故障

90 天前
 LeeLou

用机房的三台 x86 pc 服务器自己组了一个 pve 集群,刚开始都用得好好的.

有一台虚拟的 win2008r2, 突然不能 rdp 远程了,打开 console 看打不开 .直接重启了虚拟机,启动失败了.然后用 winpe 光盘启动进去看了一下硬盘, 发现好像 c 盘少了不少文件,难怪启动不了,难道是黑客上来把文件删了,感觉又不太可能.

过了一段时间,一台 hfish 蜜罐服务端的 web 管理页面打不开了,但是 ssh 还能登录上去,看到有不少 zombie 进程, 但是 reboot 和 shutdown 都启动失败了. 就又去强制重启了一下,又进不去系统了. 难道又被黑了?

想不明白怎么回事. 从 pve 界面上看,三台服务器运行了 200 来天,没有异常重启过.

唯一有点类似的情况,是两台虚拟机都运行在 ceph 的磁盘上,三台服务器硬盘空间相差比较大,随意组了个 ceph,ceph 好像一直有 warning 的状态.

2231 次点击
所在节点    Linux
8 条回复
Zeaxion
90 天前
改了 IP 起不来,或者网口没插线也起不来,多搜索一下相关资料
nutting
90 天前
那肯定 ceph 的问题了
vibbow
90 天前
那肯定 ceph 的问题了
edenzhang
90 天前
这种情况先排查 ceph 的问题,把 warning 问题排查修复一下
个人家庭环境不建议使用运维比较复杂的分布式存储
guanzhangzhang
90 天前
那肯定 ceph 的问题了,ceph 集群加监控,然后盘有问题换盘,基本 ceph 就不会出问题
Int100
90 天前
大概率是 ceph 的问题,看看是啥 warning
qW7bo2FbzbC0
90 天前
还是别用 ceph 吧
Int100
89 天前
@qW7bo2FbzbC0 ceph 是个好东西, 只要不出问题......

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/1109212

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX