用 M4 Max MacBook Pro + 128GB RAM 跑大模型

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

Support

› 根据产品序列号查看状态

有用链接

› Apple 产品更新周期

› Apple 软件 Beta 测试

M4 Max MacBook Pro + 128GB RAM 跑大模型：

3 条回复

yinmin

2 天前 via iPhone

能跑到多少 tokens/秒？另外，8bit 的 70B 模型跑的性能如何？

yibie

2 天前

8bit 还不知道，之前跑 Gemma3 应该是 8 bit 精度的，20 token/s 吧，不过这个速度不恒定，看模型会不会自己卡，但一般超过 10 token/s

yibie

2 天前

@yinmin 8bit 还不知道，之前跑 Gemma3 应该是 8 bit 精度的，20 token/s 吧，不过这个速度不恒定，看模型会不会自己卡，但一般超过 10 token/s