minimax M2.7 权重文件开源了

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

看很多帖子大家都说 minimax glm kimi qwen 这些模型用着降智，如果我自己租 ai 算力机器，自己部署 minimax m2.7 模型，大家会买账吗？

比如租一台 8*H20 的机器，大概可以满足 200 位用户同时使用，但是如果有某位用户突然发几百 k 的上下文进来，就要等很长时间。

算力机器一个月算 2 万块钱的话，那我定价就需要 100 块钱/月了，这还是不亏本不赚钱的前提，超售的话可能用户体验就很差了。

所以只能要么超售卖给更多用户，要么价格更高卖给更少的用户。

minimax

部署

算力

14 replies • 2026-04-13 07:39:47 +08:00

stormer

14 days ago

不会买,100 一个月还不如买 gpt claude
而且你的算力机器成本太高了,这种算力服务器公司都有协议价,都是市场价的 3-5 折就能拿到,我们公司这种服务器就是自己不用,转手租出去都能大赚一笔

stormer

14 days ago

类似 4090 48G 外面租一个月要 2000,我们租一个月只要 500

yzding

14 days ago via iPhone

100 块一个月必然不能每位用户随便蹬吧？不然服务器遭不住。那直接每个月不如充 100 到 openrouter 还能体验不同的模型

billlee

14 days ago

不是开源，禁止商用： https://huggingface.co/MiniMaxAI/MiniMax-M2.7/blob/main/LICENSE

cookii

14 days ago via Android

这个价格直接买 minimax 官方不是随便蹬吗

cherryas

14 days ago

对于个人用户就是开源，禁止二道贩子罢了。内部系统用谁知道

cairnechen

14 days ago

禁止商用怎么就不是开源了？

slowgen

14 days ago

8 卡 H20 跑 MiniMax 撑死满足 80 个用户并发使用，而且有一个 10w 级别的上下文 prefill 阶段就很慢了，拖死其他用户，我的服务器就是 8 卡 H20 。

你要租的话可以先从 2 张 RTX Pro 6000 开始，2 张就可以跑 MiniMax M2.7 的 nvfp4 量化了，10w 级别的上下文无 KV Cache 下 prefill 要 40 秒左右，你可以算算能服务多少个用户。

superkkk

14 days ago via iPhone

@slowgen 那肯定是要跑慢满血原精度的。我这试过能并发 200 左右跑，单用户上下文 3k ，prefill 是 10 秒左右。现在算了一下感觉租机器的成本太高了。要是用户全是 100k 的上下文肯定抗不住，偶尔来 2 3 个还行

lel020

14 days ago

大厂做同样的事，成本只会比你低，你这操作怎么可能有任何赚钱的余地，除非你能产个可乐打赢可口可乐，

slowgen

14 days ago

@superkkk 跑原精度的不现实啊，nvfp4 量化后的基准和原精度差距不到 1%，nvfp4 还可以用上新的架构优势，prefill 速度大幅度提高，而且可以开的 KV Cache 也大得多，可以容纳更多的用户使用。

单用户上下文 3k 也不现实，龙虾一个初始会话都是 12k 左右起步。我现在基于闲置算力开了个小规模用的 API ，看平时的统计，基本上 10k 上下文涨到 100k 也就 40 个请求左右。如果过一段时间用户不请求了可能 KV Cache 就释放掉了，然后用户再请求过来的时候又要从头开始 prefill 了，也会有影响的。

superkkk

14 days ago via iPhone

好吧，这个幻想破灭了

zhang666

14 days ago via iPhone

你要想想资本大佬都开始收缩算力了。你自己个人弄不是自找苦吃么

chapiom

14 days ago via iPhone

挺好的，等量化版本出来试试。