V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yanaxiao
V2EX  ›  问与答

畅网 N100 软路由死机频繁, PVE + 爱快 + IstoreOS 配置,换硬盘后仍未解决,求助!

  •  
  •   yanaxiao · 13 天前 · 1815 次点击

    大家好,

    我家使用的是畅网 N100 软路由,安装了 PVE 作为虚拟化平台,配置了爱快做主路由,IstoreOS 做旁路由,硬盘是刚刚更换的铠侠 SD10 ,1TB ,内存为 16GB 海力士。

    问题是,设备经常死机,系统死机时硬盘灯不亮,只有重启后才能恢复正常,硬盘灯会闪烁。每次死机后需要强制重启才能恢复,而每次重装 PVE 系统后,最多能坚持一个月左右,之后问题再次出现。

    现象: • 死机时,网口灯正常闪烁,但硬盘灯不亮。 • 手摸机器,感觉超级烫,可能是过热问题。

    在最初,我怀疑是 IstoreOS 旁路由问题,已经设置了旁路由每天自动重启,但问题依然没有解决。

    更换硬盘前,老硬盘也有类似问题,最后几次强制重启都没用,每次都需要格式化硬盘并重装 PVE ,且死机的间隔时间越来越短,一开始是 30 天,最后仅能坚持 3 天。

    新硬盘情况:目前新硬盘强制重启系统后不会立即挂掉,但系统的维持时间越来越短,现在是 15 天、7 天、3 天,下一次死机时间无法预测。

    目前排查的情况: • 设备配置:畅网 N100 软路由,PVE 虚拟化 + 爱快主路由 + IstoreOS 旁路由,硬盘为铠侠 SD10 ,1TB ,内存 16GB 海力士。 • 现象:死机时网口灯正常闪烁,硬盘灯不亮,机器非常烫,需重启才能恢复,重装系统后最多能坚持一个月。 • 历史问题:换硬盘前,老硬盘也频繁死机,强制重启和重装 PVE 均未能解决问题。最后几次强制重启都无效,需要格式化硬盘并重装,死机时间间隔逐渐缩短,从 30 天到 3 天。

    怀疑问题: 1. 电源问题:电源是否稳定,是否供电不足导致死机? 2. 硬件兼容性或驱动问题:是否存在硬件不兼容或驱动问题,导致系统不稳定? 3. 散热问题:设备过热是否导致死机?是否需要更好的散热方案? 4. PVE 配置问题:PVE 和虚拟机的资源配置是否合理?

    37 条回复    2025-03-27 13:06:27 +08:00
    ysc3839
        1
    ysc3839  
       13 天前
    建议先排查散热吧,打开盖子用个小风扇吹,看看有没有问题就知道了
    jiaoguan1688
        2
    jiaoguan1688  
       13 天前
    我想回贴告诉你,畅网很垃圾
    我买的万兆畅网也不行了
    jiaoguan1688
        3
    jiaoguan1688  
       13 天前
    你的问题我感觉是 cpu 过热了
    但是也排除下内存问题吧先
    kk2syc
        4
    kk2syc  
       13 天前
    99%供电不足
    Int100
        5
    Int100  
       13 天前 via iPhone
    大概率硬件问题,搞一台二手服务器跑 PVE 吧
    ashes1122
        6
    ashes1122  
       13 天前
    把机器盖子打开。
    laminux29
        7
    laminux29  
       13 天前
    科普一下硬件维护,新电脑买回来后,要做几个检查:

    1.内存条检测,用 memtest86+,至少跑 48 小时,不能有红字报错。

    2.每个硬盘、SSD 要做 3 项检测:全盘读写检测、性能检测、S.M.A.R.T 检测。

    3.满负载测试:双烤 3 天检测,记录功耗与温度曲线。
    wq2016
        8
    wq2016  
       13 天前
    供电、SSD 、散热,就这 3 个问题,自己排查吧
    godwei
        9
    godwei  
       13 天前
    是不是这硬盘发热量太大了
    Excepti0n
        10
    Excepti0n  
       13 天前
    换个内存试试
    akvo
        11
    akvo  
       13 天前 via Android
    遇到过差不多状况,直接返厂了
    ofnh
        12
    ofnh  
       13 天前
    N100 发热挺大的,先加个风扇试一下吧
    keengrass
        13
    keengrass  
       13 天前
    最有可能是过热
    yinmin
        14
    yinmin  
       13 天前 via iPhone
    大概率是 cpu 过热没有降频,导致 cpu 死机。

    进 bios 调整一下散热设置。windows 系统下 cpu 温度过高会降频,pve 没这个功能,风扇和降频依赖 bios 。
    vmebeh
        15
    vmebeh  
       13 天前
    遇到过 N5105 发热大了 SSD 掉盘的情况,接了显示器才看到一堆内核错误,这时 SSD 挂了没法写日志
    yinmin
        16
    yinmin  
       13 天前 via iPhone
    升级 bios ,实在不行,可以试试 pve 转 windows 的 hyper-v ,windows 有 cpu 过热降频的
    hefish
        17
    hefish  
       13 天前
    感觉是板载的东西可能有问题,最大嫌疑是 cpu 或者跟 cpu 相关的控制器之类的。。 应该不是散热。应该是 cpu 体质或者南桥北桥之类的。
    Qazxcv123
        18
    Qazxcv123  
       13 天前
    @laminux29 #7 一般正常家用电脑,买回来默认设置,也不用搞这么多压测吧
    kokutou
        19
    kokutou  
       13 天前 via Android
    找售后❌
    上 v2 输出✅
    laminux29
        20
    laminux29  
       13 天前
    @Qazxcv123 这就是传说中的纪律性了。如果你愿意赌产品质量,当然可以选择不做测试。
    Yuchi
        21
    Yuchi  
       13 天前 via Android
    可能与固件版本和配置有关,网上搜一下"爱快 死机",不少人遇到同样的问题。
    sunulin
        22
    sunulin  
       13 天前
    硬件问题,我的不小心碰一下就会死机。红屏 我装的 EXSI ,给我售后了两个月 才弄回来,回来了 4 个网口 有一个坏掉了 ,过了两个月又犯病了。。
    Y25tIGxpdmlk
        23
    Y25tIGxpdmlk  
       13 天前
    @keengrass #13 最没可能是过热,过热一般降频或卡顿。
    死机多半是内存或硬盘啥的硬件问题
    davidyin
        24
    davidyin  
       13 天前 via Android
    幾個系統都放在一起就不太好判斷,最好還是專門配路由,別放在 PVE 裡面。
    vinsony
        25
    vinsony  
       13 天前
    大概率就是最近气温升高了,几块钱买个 USB 的风扇一直吹就行了
    exkernel
        26
    exkernel  
       13 天前
    检验判断是内存
    IvanLi127
        27
    IvanLi127  
       13 天前
    把虚拟机全停了,在宿主机烤机看看。排除一点是一点。不过我感觉是掉盘了
    VwEI
        28
    VwEI  
       13 天前
    首先换个电源看看
    Logtous
        29
    Logtous  
       13 天前
    建议直接安装一个 x86 immortal openwrt 到设备上观察运行一段时间,如果一切正常那就是系统层面的问题,感觉都已经是多网口设备了,为何不直接软路由系统,pve 虚拟机虽然死可以多虚拟机,但 openwrt 基本上也是一个全能系统(我设置用 openwrt 组了 raid1 来做 nas )软路由+ap 简单清晰明了的网络布局 比旁路由简单多了
    HK560
        30
    HK560  
       13 天前
    我的也是 n100 ,我感觉这发热是得上风扇的
    TobeRey
        31
    TobeRey  
       13 天前
    PVE ?我的是 N5105 ,频繁死机,查日志老是卡死在每日定时更新,关了以后就好了。
    `systemctl disable pve-daily-update.timer`
    Fooooo0
        32
    Fooooo0  
       13 天前
    我也是畅网 N100 ,大背头版,也是 PVE ,已经运行 550 天 没重启过了
    chnsatan
        33
    chnsatan  
       13 天前
    两个问题建议排查下
    1 、看日志,PVE 有个毛病,Intel NIC e1000e hardware unit hang ,导致 PVE 整个系统崩溃
    2 、加个风扇,N100 散热通病
    TNOK
        34
    TNOK  
       12 天前
    用的是 1215U ,12 代装 PVE 有 C 状态睡死的问题,表现也是网口正常亮,grub 里修改最大 C 状态为 2 可以解决。
    pinyoung
        35
    pinyoung  
       12 天前
    我的 n100 零刻,风扇坏了照样跑,功率降低了,不会死机,之前装 esxi 的时候会死点,pve 基本上全天 90%负载跑,温度 cpu 差不多 89 度全天,没事
    ysc3839
        36
    ysc3839  
       12 天前
    @laminux29 建议直接跑 y-cruncher ,其他内存检测工具压力都不够大,有问题可能要跑很久才报错,相比之下 y-cruncher 能更快发现问题。
    sanquan
        37
    sanquan  
       12 天前 via iPhone
    找畅网退换
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3168 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 12:15 · PVG 20:15 · LAX 05:15 · JFK 08:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.