V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
superkkk

minimax M2.7 权重文件开源了

  •  
  •   superkkk · 14 days ago · 1875 views

    看很多帖子大家都说 minimax glm kimi qwen 这些模型用着降智,如果我自己租 ai 算力机器,自己部署 minimax m2.7 模型,大家会买账吗?

    比如租一台 8*H20 的机器,大概可以满足 200 位用户同时使用,但是如果有某位用户突然发几百 k 的上下文进来,就要等很长时间。

    算力机器一个月算 2 万块钱的话,那我定价就需要 100 块钱/月了,这还是不亏本 不赚钱的前提,超售的话可能用户体验就很差了。

    所以只能要么超售卖给更多用户,要么价格更高卖给更少的用户。

    14 replies    2026-04-13 07:39:47 +08:00
    stormer
        1
    stormer  
       14 days ago
    不会买,100 一个月还不如买 gpt claude
    而且你的算力机器成本太高了,这种算力服务器公司都有协议价,都是市场价的 3-5 折就能拿到,我们公司这种服务器就是自己不用,转手租出去都能大赚一笔
    stormer
        2
    stormer  
       14 days ago
    类似 4090 48G 外面租一个月要 2000,我们租一个月只要 500
    yzding
        3
    yzding  
       14 days ago via iPhone
    100 块一个月必然不能每位用户随便蹬吧? 不然服务器遭不住。那直接每个月不如充 100 到 openrouter 还能体验不同的模型
    billlee
        4
    billlee  
       14 days ago
    cookii
        5
    cookii  
       14 days ago via Android
    这个价格直接买 minimax 官方不是随便蹬吗
    cherryas
        6
    cherryas  
       14 days ago
    对于个人用户就是开源,禁止二道贩子罢了。 内部系统用谁知道
    cairnechen
        7
    cairnechen  
       14 days ago   ❤️ 4
    禁止商用怎么就不是开源了?
    slowgen
        8
    slowgen  
       14 days ago
    8 卡 H20 跑 MiniMax 撑死满足 80 个用户并发使用,而且有一个 10w 级别的上下文 prefill 阶段就很慢了,拖死其他用户,我的服务器就是 8 卡 H20 。

    你要租的话可以先从 2 张 RTX Pro 6000 开始,2 张就可以跑 MiniMax M2.7 的 nvfp4 量化了,10w 级别的上下文无 KV Cache 下 prefill 要 40 秒左右,你可以算算能服务多少个用户。
    superkkk
        9
    superkkk  
    OP
       14 days ago via iPhone
    @slowgen 那肯定是要跑慢满血原精度的。我这试过能并发 200 左右跑,单用户上下文 3k ,prefill 是 10 秒左右。现在算了一下感觉租机器的成本太高了。要是用户全是 100k 的上下文肯定抗不住,偶尔来 2 3 个还行
    lel020
        10
    lel020  
       14 days ago
    大厂做同样的事,成本只会比你低,你这操作怎么可能有任何赚钱的余地,除非你能产个可乐打赢可口可乐,
    slowgen
        11
    slowgen  
       14 days ago
    @superkkk 跑原精度的不现实啊,nvfp4 量化后的基准和原精度差距不到 1%,nvfp4 还可以用上新的架构优势,prefill 速度大幅度提高,而且可以开的 KV Cache 也大得多,可以容纳更多的用户使用。

    单用户上下文 3k 也不现实,龙虾一个初始会话都是 12k 左右起步。我现在基于闲置算力开了个小规模用的 API ,看平时的统计,基本上 10k 上下文涨到 100k 也就 40 个请求左右。如果过一段时间用户不请求了可能 KV Cache 就释放掉了,然后用户再请求过来的时候又要从头开始 prefill 了,也会有影响的。
    superkkk
        12
    superkkk  
    OP
       14 days ago via iPhone
    好吧,这个幻想破灭了
    zhang666
        13
    zhang666  
       14 days ago via iPhone
    你要想想资本大佬都开始收缩算力了。你自己个人弄不是自找苦吃么
    chapiom
        14
    chapiom  
       14 days ago via iPhone
    挺好的,等量化版本出来试试。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3577 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 90ms · UTC 04:56 · PVG 12:56 · LAX 21:56 · JFK 00:56
    ♥ Do have faith in what you're doing.