先抛个砖:GLM5.1 > deepseek v4 > minimax2.7 ≥ mimo v2.5 ≈ kimi2.6
以一个案例来分析这几个的能力:帮我生成一个天气查询H5应用 提示词就这一句,都一样。
glm5.1: https://imgchr.com/i/pehcWCR 天气温度假
kimi2.6:https://imgchr.com/i/pehczKf 天气温度真
minimax2.7:https://imgchr.com/i/pehcBvV 拉完了
mino v2.5 : 第一遍没有给我生成,换提示词:帮我开发一个天气查询H5应用。才继续生成:https://imgchr.com/i/pehgQIJ 天气温度假。 有一个背景下雨的效果
deepseek v4: https://imgchr.com/i/pehcgUJ 温度真
仅针对这个案例的评价:glm5.1,kimi2.6 可以, deepseek v4 ,mino v2.5 次之。 minimax2.7 什么玩意?
大家也可以自己测试下。
1
canyue7897 8 小时 51 分钟前 via iPhone 我觉得 kimi 还可以哈?
没想到这么拉? |
2
onedge 8 小时 44 分钟前
GLM 5.1 > DS v4 = Kimi 2.6 > mimo v2.5 > minimax 2.7
|
3
cookii 8 小时 42 分钟前 via Android
minimax 不配上榜好吧,夸张点说 4B 模型水平
|
5
uqf0663 8 小时 31 分钟前
kimi 我会继续订阅,但是 minimax 就算了,订阅完用了三天我就放弃了,不会再考虑使用。
|
7
ayasealter570 8 小时 20 分钟前
minimax 官方订阅的极速版,智力低到没边了
|
8
huaweii 8 小时 18 分钟前 via Android
@ayasealter570 有没有例子看看,好奇
|
10
junwind OP @canyue7897 实测的这个案例,kimi 还行,不过生成是很慢的
|
11
junwind OP @canyue7897 kimi 不拉,是我个人的武断,实测后还不错
|
12
drealism 8 小时 2 分钟前 via Android
可以把 qwen 系列补一个进去么🤜🤛
|
13
ebushicao 6 小时 33 分钟前
每次有人说跑分能够说明能力,我就会举出 minimax2.7 这个例子,那真是连 skill 和 tool 都不一定会调用,某些时候我本地部署的 qwen3.5 9b 都比它强。
|
14
aes114514gcm 6 小时 27 分钟前
和我的体感比较接近,glm5.1 略强于 kimi2.6 ,
|
15
zenfsharp 6 小时 22 分钟前
GLM5.1 > deepseek v4 > 其他,起码到这里是同意的。
我刚开了 opencode 的 Go 订阅,在 opencode-cli 里使用同样的 skill 、MCP 、Agent.md ,问 GLM 我项目里的一个业务逻辑,直接一次性揪出来了,而 DS 没有,反复提示了三次才找到。 |
16
zenfsharp 6 小时 21 分钟前
不知道各种公众号是有任务还是怎么回事,一个劲的鼓吹 deepseek v4 ,跟实际体验严重背离。
|
17
lukaktus6768 5 小时 49 分钟前
看到 glm 我就要踩一脚,买谁都不要买他
|
18
anmie 5 小时 43 分钟前 @zenfsharp 自媒体不这么写没人看啊, 但是你看 Deepseek 官方就实在多了,官方在公众号里,明确说了模型在某些方面比 xx 模型要弱,而不是无脑鼓吹遥遥领先。
这么说把,做信息分享类的自媒体,有一个算一个,肯定会夹带私货,在我看来,有一个算一个都是傻逼。 而看自媒体说的就深信不疑的人也是傻逼。 我自始至终,从大模型刚能聊天,到现在 agentic ,Deepseek 虽然不是最强的那个,但是一直都是我的主力,不为别的,我坚定的站在这样一个不焦虑,不浮躁的人和公司这边。(而 minimax 我根本试都没试过,不感兴趣。) |
19
metalvest 5 小时 41 分钟前
GLM5.1 天气温度假,为什么排第一?
|
20
weilongs 5 小时 28 分钟前
minimax2.7 排不到那个位置.
|
21
Desiree 5 小时 28 分钟前
暂时只用过 Glm 跟 minimax2.7 挺垃圾的,glm 勉强能用,但是比 cc 跟 codex 还是差一大截,minimax2.7 是完全不能用
|
22
zzz123456qqq 5 小时 12 分钟前
啊
|
23
richardwong 4 小时 23 分钟前
GLM5.1 不支持多模态挺难受的
|
24
owt5008137 3 小时 24 分钟前 via Android
@richardwong 官方送的视觉识别 mcp 可以勉强顶一顶。
|
25
Azmeont 3 小时 9 分钟前
GLM5.1 和 DSv4-Pro 体感都比 opus4.6 强,但 DSv4 胜在 1M 上下文
|
26
issakchill 2 小时 57 分钟前
看到 minimax 不上桌就放心了
|
27
Lighfer 2 小时 43 分钟前
不测一下 qwen3.6 27b 吗?据说编程能力也也很强?
|
28
xiaomushen 2 小时 36 分钟前
基本同意,今天高强度用 DeepSeek V4 Pro
|
29
xiangqiankan 2 小时 35 分钟前 deepseekv4 只是编码方面的后训练不足,架构设计上这是唯一的真神,理论上是开源模型的天花板
|
30
mingtdlb 1 小时 14 分钟前
GLM 是写代码比较强吗?我感觉他 chat 有点拉
|