V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yibie
V2EX  ›  Apple

用 M4 Max MacBook Pro + 128GB RAM 跑大模型

  •  
  •   yibie · 2 天前 · 464 次点击

    M4 Max MacBook Pro + 128GB RAM 跑大模型:

    • 模型使用 70GB 大小的 QwQ-32B ,精度 16 bit
    • LM Studio 显示的 CPU 使用率没有跑满,不过风扇开始启动了
    • 内存使用 63GB 左右
    • 除了风扇启动之外,其它程序的操作没有影响
    • QwQ-32B 在推理方面很强,推理过程当中不停地产生新的问题,然后自问自答
    yinmin
        1
    yinmin  
       2 天前 via iPhone
    能跑到多少 tokens/秒?另外,8bit 的 70B 模型跑的性能如何?
    yibie
        2
    yibie  
    OP
       2 天前
    8bit 还不知道,之前跑 Gemma3 应该是 8 bit 精度的,20 token/s 吧,不过这个速度不恒定,看模型会不会自己卡,但一般超过 10 token/s
    yibie
        3
    yibie  
    OP
       2 天前
    @yinmin 8bit 还不知道,之前跑 Gemma3 应该是 8 bit 精度的,20 token/s 吧,不过这个速度不恒定,看模型会不会自己卡,但一般超过 10 token/s
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4072 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 04:07 · PVG 12:07 · LAX 21:07 · JFK 00:07
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.