比如 example.nacos.com 这是我的 nacos 地址, 帮我写个 bash 脚本, 查询 cpp_long_link 命名空间下的所有服务信息, grok 可以一次写对, deepseek 就会忘记 pageSize 这个参数
1
honkew 3 天前
那就对了
|
![]() |
2
willchen 3 天前
那就对了
|
![]() |
3
whoosy 3 天前
新版本的确实感觉有问题
|
4
DIO 3 天前 ![]() ds 何德何能和 grok 比,现在中文 qwen QWQ ,英文 Grok 基本是我这个穷鬼的标准答案了。虽然订阅了 chatgpt 但是这两个月很少动用了。ds 用来平替百度还可以。claude 没开会员,不知道付费版体验怎么样。
|
![]() |
5
windyboy 3 天前 ![]() 唯一可以指责你的是政治不正确
|
7
Donaldo 3 天前
最近写 CUDA ,grok3 是唯一能写对的,其他像 o1,o3-mini-high,claude-3.7(或 thinking),r1,gemini-pro(或 flash-thinking)都不行。
|
![]() |
8
MRG0 3 天前
我无法触发他的第二次回答
|
![]() |
9
javazero 3 天前
马斯克实在给的太多了,ChatGPT plus 停了。主力直接用 grok 3 免费而且量大管饱
|
![]() |
12
bronyakaka 3 天前
gro3k 本来就是目前最强的,差点很正常。
|
![]() |
13
lzgshsj 3 天前 ![]() 我代码主力 claude 的,前两天写了两个 awk 脚本,claude 3.7s 完全不对,ds r1 思考了 7 分钟,完美符合要求
只能说每个人遇到的问题都千奇百怪,哪怕是同一家 AI 也不是每次答案都一样。 同样问题,你问出来不对,我问出来对了。刚才问的不对,现在问对了……只能说不要只看一家,平时也可以多换着问问。 |
14
zbw0414 3 天前 ![]() @jdz 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费
|
![]() |
15
dapang1221 3 天前
我现在日常琐事问题 deepseek R1 ,需要创意及比较新颖的问题 grok ,写逻辑代码 claude 3.7 ,生成前端 UI deepseek R1 或 V3
|
![]() |
16
ahdw 3 天前
@zbw0414
> 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费 太赞同了。主要就是因为没有使用门槛,而且背后的「浙江六小龙」都在宣传和公关方面投入了很多,让 DeepSeek 充分曝光了。 为我自己的这篇文章引流: https://kutt.it/Z4bAtw |
![]() |
17
youthfire 3 天前 via iPhone
claude3.7 thinking 稳稳第一,grok3 第二,其他都是玩具
|
18
NoOneNoBody 3 天前
ds 有个最奇怪的现象是在其他 ai 没见过的,回答代码居然会漏一边括号这种低级错误
代码质量我觉得过得去,比 copilot 和 genmini 好,gpt 就暂时判断不出哪个更佳,当然说的都只是免费 web 之间比较 |
19
qinxs 3 天前 via Android ![]() 对大多数普通人来说 deepseek 已经够用了
编程领域 我提出的问题 ds 也能完美解决 80%以上 最后 马化腾财富全球排名 36 所以他很穷!! |
20
wsbqdyhm 3 天前 via iPhone
文字工作者,深度使用,感觉 grok3 和阿里新出那个差不多,ds 在这两个之后,ds 比 chatgpt 好,gpt 降智太弱了,我说的都是免费版
|
![]() |
21
Cloud9527 3 天前
最近再用 qwq-plus 感觉还可以,主要是吐字快!
|
![]() |
22
evilStart 3 天前 ![]() deepseek 不行为什么美国人这么害怕?这么讨厌国产的还是 run 吧,在这里苦了你们了
|
![]() |
23
kyor0 3 天前 ![]() 只拿小红分滚出这个论坛
|
![]() |
24
ZSeptember 3 天前 ![]() llm 都不是很稳,不能因为单一场景,单次使用有点问题,就否定整个模型。。
|
25
Donaldo 3 天前
@ZSeptember #24 评论区完美体现了你这个观点,大家针对不同使用场景,分别对不同模型进行了赞扬和批判~
|
26
iamsad3508 3 天前
温度调到 0 ,再试
|
![]() |
27
takanashisakura 3 天前
@zbw0414 #14 qwq-plus 也不用翻墙
|
28
9ki 3 天前
这个月高强度用 ai 学习,claude 3.7 ( Thinking )/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队,grok3 ,gpt-4.5 o1-mini 纯纯路边
我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来,像二楼那种 claude 都没用过,不知道哪来的自信参与讨论 |
![]() |
30
EricYuan1 3 天前
别的不说,手机 app ,这几个中 grok 做的最好看
|
![]() |
31
qiaobeier 3 天前
通用的 deepseek (翻译,帮小孩写作文,润色文档,甚至还做过 WEB 项目配色方案等等,结果都很优秀)。 写代码只使用 claude 。有买 GTP 但基本不用了。
|
32
lscho 3 天前
因为 ai 覆盖的场景太广泛,所以看测试就行。只有测试才能尽可能覆盖大部分场景。
单一场景谁都有可能出错 |
33
xbtx3790 3 天前
grok3 确实能打
|
![]() |
34
k9982874 3 天前 via Android
先不说质量,输出速度 ds 是最慢的。。。
|
35
fancy2020 3 天前
百度和 Google 的区别
|
![]() |
36
clino 3 天前
我其实是从 deepseek v2 开始用的,当时就感觉很好用,切成 v3 以后好像没有明显更好的感觉
当然我没怎么用过 claude 所以没有明显对比,但是 deepseek 一直给我感觉是相当好了 |
37
cookii 3 天前 via Android
体感 grok 确实很好用,比其他都强
|
![]() |
38
zhwguest 3 天前
刚开始出来其实感觉很不错,但是后来慢慢觉得越来越不那么惊艳了...
|
![]() |
39
LittleYangYang 3 天前
deepseek 我从 v2 开始用它去处理数据,当时主要是相比其他家太便宜了,效果还好,这价格很难让人拒绝(),就是并发非常低
新的 R1 主要强在它的强化学习策略,落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的,说的话非常似人,比其他模型更像贴吧老哥,但是编数据的幻觉倾向也很厉害,也有丢上下文的倾向,很多生成结果基本上义眼就能看出来是 deepseek 写的。 最近我在信息抽取工作上比较了几个模型,在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右,json 格式化约束的稳定度倒是还挺好。 其他的模型实际用起来其实感觉 grok3 幻觉也严重,gemini deepresearch 是真好用啊,谷歌的信息来源还是太猛,开了 gemini advanced ,下个月想把 gpt plus 关掉了,o3 真废物.... |
![]() |
41
seven777 3 天前
它本来就很差,从没象吹的那么优秀过。
我真心佩服的就 Claude ,Grok |
![]() |
42
docx 3 天前 via iPhone
编程用 Claude Sonnet
|
43
Yuanlaoer 3 天前
我记得最常见的一句评论是:
deepseek 的逻辑推理能力很强 我当年参加物理竞赛和辩论赛的时候,都不知道原来有这么多深耕逻辑学的人士深藏网络 |
![]() |
44
MYDB 3 天前
都不好用,一个问题多问几家,然后选择自己认为是正确的答案,也不排除都不对,一些小众领域还是不适合 ai
|
45
YooboH 3 天前 ![]() 从我个人体验来看,ds 中文回复质量比免费的 4o 和 gemini 要好上不少,我写论文有时遇到复杂的问题他都能够给不错的参考回复。不过他指令依从性不太好,很容易发散,需要自己注意限制。付费版的 chatgpt 很久没有续费了就没资格评价了。
另外,光是他坚持开源权重这一点就让我没有任何理由批评他了,所谓的什么营销和这一点相比算的了什么。楼里的某些人的回复可真是让人大开眼界,国产是多大仇啊 |
![]() |
46
skiy 3 天前
不好用就别用了吧。这样它就不要总是“服务器不可用”了。
刚刚提交了个提问,还不错。而同个问题,ChatGPT 只给出文字描述,必没有给代码。DeepSeek 给出代码实例了。 自从之前一直给“服务器不可用”,就很长时间不用了,改用 Kimi 。今天回来用,居然可用。不错不错。 代码这个,一般情况都是要多个平台提问,再综合答案得出自己的解决方案。没有哪个是最好的。ChatGPT 相对来说,Shell 给的非常不错,但有时要使用 Kimi 补充。Grok 有限额,DeepSearch 有时会不可用。其它的比如 ChatGPT 和 Gemini 也一样情形。 |
![]() |
47
BelovedOne 3 天前
目前来说 Grok 体验最好,非常的专业,效率也很高,思考和搜索的过程非常干练。ChatGPT 也很棒,不过结果总是略逊一筹。
|
![]() |
48
rpish 3 天前
op 用的 v3 还是 r1 ?
话说 grok3 刚发布不久,r1 发布 2 个多月了,按照大模型半年一代的迭代周期,有差距也很正常。 |
49
wwhc 3 天前 ![]() 在开源模型中 DeepSeek 和 Qwen 是目前最好的,自建成本也并不是高不可攀,我觉得没有责难的理由,那些闭源模型没有匹配的可能性
|
![]() |
50
elone 3 天前
我今天写一个较为复杂点的 swiftui 的代码, 最终用下来只有 grok3 帮我把代码写出来了, 对比了 ds, 还用了最新的 gemini 2.5, 都完全跑不起来. 只有 grok3 最终实现了, 而且, 代码风格居然很贴合我的习惯.
|
52
NanFengxuan 3 天前 via iPhone
DeepSeek 就是一坨,让它写一段 matlab 代码结果死机了,一直重复输出一个字母
|
![]() |
54
iamv2er 3 天前 via iPhone
grok3 很强
|
![]() |
55
laikick 3 天前 ![]() 给老中打打鸡血就完事了 你还真用啊?
|
![]() |
56
cnrting 3 天前 via iPhone
grok3 最近是主力
|
57
JoshTheLegend 3 天前 ![]() 对啊,Sam Altman 就一傻逼,这么垃圾的东西还天天追着屁股又是喷又是上书懂王要求封杀,他要是提前问下你的意见估计就不会做这些小丑表演了。
|
58
xuejianxianzun 3 天前 ![]() 楼上挺有乐子的
|
![]() |
60
me1onsoda 2 天前
r1 做离散数学题我觉得比 grok 好
|
![]() |
61
evan9527 2 天前
和哪吒的爆火异曲同工。
|
62
crackidz 2 天前
@JoshTheLegend 你说的太对了,还有一个傻逼叫 Dario Amodei
|
![]() |
63
FlorentinoAriza 2 天前
用时间长了 ds 感觉只能替代文心一言吧,浪费一大堆时间自说自话说一些没用的,最后给一个狗屁不通的方案,又加一大堆文本解释这狗屁不通的方案,用用就觉得火大,全靠自媒体博主带火的。主用 claude 和 gpt-o3 ,只有需要 sql 语句转换这类的用 ds 轻微辅助
|
64
tabc2tgacd 2 天前
用得少,只是开始放出思维链时,有新鲜感,用了几次,仅有的那么几次还时不时的服务器忙,就没再用过了
|
![]() |
65
FlorentinoAriza 2 天前
@wsbqdyhm #20 免费能给你用什么好动西,文字工作者首用 gpt4.5 专搞创作类,比其他模型强多了,编码免费 4o 之上有 o1 o3mini o3high 4o 都是远古模型了
|
![]() |
66
ramcasky 2 天前
😰很难凭 我觉得 ds R1 已经完全可以覆盖日常开发基本诉求了
|
![]() |
67
cat9life 2 天前
没有尝试过 Grok ,看到 op 这帖子马上去试一下。一龙应该给你打钱😁
|
68
ZColin 2 天前
Grok3 个人体验下来综合实力不错的,就是中文语言处理这块基本没什么适配
|
![]() |
69
sunny2580839896 2 天前
国内 ai ,营销>实力
|
70
yedkk 2 天前
我只用 sonnet 3.7 ,配合 windsurf ,这个模型是最强的,加上有命令行的能力。
|
![]() |
71
godspeedyou 2 天前
这是什么 grok 隐性广告贴么,“何德何能”都出来了,v2 对于 LLM 无论是技术还是应用的话题和讨论质量真的不太行
|
![]() |
72
MartinWu 2 天前
借楼问问大佬,哪个智能体能比较好地实现塞给他一个 pdf 的接口文档,就能直接帮我写对接代码。主要是里面字段太多了,我懒得手敲。
|
73
billly 2 天前
昨晚试了几个免费的,感觉最强的是 Gemini2.5 pro ,而且有很大的上下文
|
74
dthghjhe 2 天前 ![]() 不同情境下综合选择表现最好的模型才是正解
|
![]() |
75
lovedebug 2 天前 ![]() 真的不能理解一些人拉踩的嘴脸。。。
我日常用 ChatGPT(包括 o3), gemini, grok, deepseek r1(api 充值),每家都有自己的特色,还是感谢 deepseek 真的拉下了 GPT 的限制,让 plus 用户享受更多。 一般我解决问题会写一个常常的提示词,然后发给每个 ai 提供解决方案。 gemini 很适合写文章,gpt 适合分析问题,deepseek 真的特别能懂我的需求,grok 适合找多个解决方案。 |
77
bli22ard 2 天前
相反,我让写过使用 https://github.com/kubernetes/client-go 访问 k8s ,然后获取指定 pod 的日志,实现类似 tail -f 的功能,结果,Grok3 和 chatgpt 4o 和 ds 都写的有问题, 不过 ds 的最接近正确,chatgpt 4o 次之,然后 Grok3 给的代码 80%错误的
|
![]() |
78
batyu 2 天前
DS 给出的答案,最好二次确认一遍。有些东西简直是现编的
|
![]() |
79
iv2ex 2 天前
@billly #73 请问哪里可以体验`Gemini2.5 pro `。我看 `https://gemini.google.com/ ` 没有这个
|
81
DinnyXu 2 天前
相同的问题,几个 AI 模型都问问,取长补短就可以了,一次对一次错代表不了什么,只不过在写代码方面,grok 我感觉还是强,可能是因为马斯克他们编程能力更出色? 但是涉及到一些我们本土化的语言表达,我认为 ds 很能懂的起,比如你可以尝试让他们起一个 LOL 的搞笑的昵称,ds 绝对能给你起很多梗,但是 grok 就做不到,所以你可以分为文科和理科的区别
|
![]() |
82
vipfts 2 天前 ![]() 你的使用姿势对, ds 很差劲啊, 比 grok3 差远了, 所有问题试了上万次次都表现很差
|
![]() |
83
gaodq 2 天前
确实是这样的
|
85
ziyeziye 2 天前
只能说编程方面 ds 的确差点,还有就是上下文长度差了很多(编程问题和幻觉严重都受到这个影响),还有就是不支持多模态,其他的你想说有别的 ai 比 ds 强那是不可能的,其他都逻辑推理比 ds 差了不是一点
|
86
wryyyyyyyyyyyy 2 天前
@DIO 这个 qwen QWQ 在哪里可以用?自己没条件部署。
|
![]() |
88
AlexHsu 2 天前
ds 的价值是 671b 开源 今年从过年回来到现在 我都部了两套了 但是都是 32b 的 去年政企还没啥需求呢
能力上 别说 grok 了 比 gpt4o1 和 claude3.7 也没得比啊 |
![]() |
89
neptuno 2 天前
ds 的意义是训练成本低+开源。我一直不觉得它推理很强。
|
92
jurassic2long 2 天前
个人经验,DeepSeek 分析问题时最好看它的思维链,然后人工得出答案,经常遇到思维链分析思路非常正确,结论确实错误的情况。grok 用的少,也遇到过几次类似问题,grok 的思维链似乎比其他的要长不少,阅读思维链要花更多时间
|
![]() |
93
Moierby 2 天前
楼主先了解一下通用模型和推理模型的区别
写代码应该用推理模型,deepseek 不擅长做这个 |
![]() |
94
dbaazz 2 天前
@iv2ex #79 https://aistudio.google.com 这里可以使用谷歌全部的模型
|
95
johnhuangemc2 2 天前
@lovedebug 我也觉得让 deepseek r1 根据自己的需求写出提示词质量特别高
|
96
coolcoffee 2 天前
DS 给我的感觉就和 Google Gemini 差不多,跑分没输过,但是。。。
不过它们还是有价值的,能把 openai 和 anthropic 牙膏管给挤爆。 |
![]() |
97
liangzaiyi 2 天前
日常编程方面用 deepseek 和 grok 比较多,各有胜负。GPT 已经弃用了。deepseek 除了慢点和有时候服务崩,思考分析我觉得是最好的,常恨服务不给力。
|
![]() |
98
Wonz 2 天前
那就对了
|
![]() |
99
Promtheus 2 天前
deepseek 好像是老外吹起来的。。
|
![]() |
100
ssb4 2 天前 ![]() deepseek 用户有几个拿他写代码?码农不要拿自己太当回事了
|