V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
sqshanyao
V2EX  ›  Local LLM

求可靠本地 vibe coding,有八卡的 L20 服务器

  •  
  •   sqshanyao · Apr 15 via Android · 754 views
    有一台八卡 llgpu 服务器,想搞一个本地 AI 编码,求可靠方案
    coefu
        1
    coefu  
       Apr 16
    unsloth/Qwen3.5-397B-A17B-GGUF, UD-Q6_K,327G,留 50G 跑 context ,看情况;如果 context 不够,就换 UD-Q4_K_XL ,245G ,留 130G 跑 context ,肯定够的。

    IDE 用开源的 continue 即可。想完全 agent ,估计够呛,你自己得盯着。local 的能力肯定不如云端 api 的。
    coefu
        2
    coefu  
       Apr 16
    先试 llama.cpp 的 8 卡 tensor parallel 。反正一年前的 8 卡 TP 模式,是有点问题的,不知道修复没有。如果不行,就上 vllm 。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   829 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 68ms · UTC 20:19 · PVG 04:19 · LAX 13:19 · JFK 16:19
    ♥ Do have faith in what you're doing.