我的使用姿势不对么, 我感觉 ds 很差劲啊, 比 grok3 差远了, 编程相关问题试了几次都表现很差

使用姿势

ds

Grok3

164 条回复 • 2025-03-29 10:15:35 +08:00

1 2

❮

❯

1

honkew

2025 年 3 月 26 日

那就对了

2

willchen

2025 年 3 月 26 日

那就对了

3

whoosy

2025 年 3 月 26 日

新版本的确实感觉有问题

4

DIO

2025 年 3 月 26 日

1

ds 何德何能和 grok 比，现在中文 qwen QWQ ，英文 Grok 基本是我这个穷鬼的标准答案了。虽然订阅了 chatgpt 但是这两个月很少动用了。ds 用来平替百度还可以。claude 没开会员，不知道付费版体验怎么样。

5

windyboy

2025 年 3 月 26 日

3

唯一可以指责你的是政治不正确

6

jdz

OP

2025 年 3 月 26 日

2

@DIO 我也感觉, 感觉铺天盖地吹捧 ds, 试水了几次都被劝退了

7

Donaldo

2025 年 3 月 26 日

最近写 CUDA ，grok3 是唯一能写对的，其他像 o1,o3-mini-high,claude-3.7(或 thinking),r1,gemini-pro(或 flash-thinking)都不行。

8

MRG0

2025 年 3 月 26 日

我无法触发他的第二次回答

9

javazero

2025 年 3 月 26 日

马斯克实在给的太多了，ChatGPT plus 停了。主力直接用 grok 3 免费而且量大管饱

10

zbw0414

2025 年 3 月 26 日

@DIO ds 幻觉那么严重各种瞎编, 你居然让他平替百度.....
真平替还是 perplexity 吧. 搜索真的接受不了幻觉.

11

jdz

OP

2025 年 3 月 26 日

@javazero 虽然免费, 但是感觉质量挺好的

12

bronyakaka

2025 年 3 月 26 日

gro3k 本来就是目前最强的，差点很正常。

13

lzgshsj

2025 年 3 月 26 日

39

我代码主力 claude 的，前两天写了两个 awk 脚本，claude 3.7s 完全不对，ds r1 思考了 7 分钟，完美符合要求

只能说每个人遇到的问题都千奇百怪，哪怕是同一家 AI 也不是每次答案都一样。
同样问题，你问出来不对，我问出来对了。刚才问的不对，现在问对了……只能说不要只看一家，平时也可以多换着问问。

14

zbw0414

2025 年 3 月 26 日

20

@jdz 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费

15

dapang1221

2025 年 3 月 26 日

我现在日常琐事问题 deepseek R1 ，需要创意及比较新颖的问题 grok ，写逻辑代码 claude 3.7 ，生成前端 UI deepseek R1 或 V3

16

ahdw

2025 年 3 月 26 日

@zbw0414
> 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费

太赞同了。主要就是因为没有使用门槛，而且背后的「浙江六小龙」都在宣传和公关方面投入了很多，让 DeepSeek 充分曝光了。

为我自己的这篇文章引流： https://kutt.it/Z4bAtw

17

youthfire

2025 年 3 月 26 日 via iPhone

claude3.7 thinking 稳稳第一，grok3 第二，其他都是玩具

18

NoOneNoBody

2025 年 3 月 26 日

ds 有个最奇怪的现象是在其他 ai 没见过的，回答代码居然会漏一边括号这种低级错误
代码质量我觉得过得去，比 copilot 和 genmini 好，gpt 就暂时判断不出哪个更佳，当然说的都只是免费 web 之间比较

19

qinxs

2025 年 3 月 26 日 via Android

3

对大多数普通人来说 deepseek 已经够用了

编程领域我提出的问题 ds 也能完美解决 80%以上

最后马化腾财富全球排名 36 所以他很穷！！

20

wsbqdyhm

2025 年 3 月 26 日 via iPhone

文字工作者，深度使用，感觉 grok3 和阿里新出那个差不多，ds 在这两个之后，ds 比 chatgpt 好，gpt 降智太弱了，我说的都是免费版

21

Cloud9527

2025 年 3 月 26 日

最近再用 qwq-plus 感觉还可以,主要是吐字快!

22

evilStart

2025 年 3 月 26 日

14

deepseek 不行为什么美国人这么害怕？这么讨厌国产的还是 run 吧，在这里苦了你们了

23

kyor0

2025 年 3 月 26 日

5

只拿小红分滚出这个论坛

24

looplj

2025 年 3 月 26 日

4

llm 都不是很稳，不能因为单一场景，单次使用有点问题，就否定整个模型。。

25

Donaldo

2025 年 3 月 26 日

@ZSeptember #24 评论区完美体现了你这个观点，大家针对不同使用场景，分别对不同模型进行了赞扬和批判～

26

iamsad3508

2025 年 3 月 26 日

温度调到 0 ，再试

27

takanashisakura

2025 年 3 月 26 日

@zbw0414 #14 qwq-plus 也不用翻墙

28

9ki

2025 年 3 月 26 日

这个月高强度用 ai 学习，claude 3.7 （ Thinking ）/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队，grok3 ，gpt-4.5 o1-mini 纯纯路边

我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来，像二楼那种 claude 都没用过，不知道哪来的自信参与讨论

29

Stunt4013

2025 年 3 月 26 日

@Donaldo 刚出的 gemini 2.5 pro 也很强

30

EricYuan1

2025 年 3 月 26 日

别的不说，手机 app ，这几个中 grok 做的最好看

31

qiaobeier

2025 年 3 月 26 日

通用的 deepseek （翻译，帮小孩写作文，润色文档，甚至还做过 WEB 项目配色方案等等，结果都很优秀）。写代码只使用 claude 。有买 GTP 但基本不用了。

32

lscho

2025 年 3 月 26 日

因为 ai 覆盖的场景太广泛，所以看测试就行。只有测试才能尽可能覆盖大部分场景。

单一场景谁都有可能出错

33

4eympe94CsqJ7Y39

2025 年 3 月 26 日

grok3 确实能打

34

k9982874

2025 年 3 月 26 日 via Android

先不说质量，输出速度 ds 是最慢的。。。

35

fancy2020

2025 年 3 月 26 日

百度和 Google 的区别

36

clino

2025 年 3 月 26 日

我其实是从 deepseek v2 开始用的，当时就感觉很好用，切成 v3 以后好像没有明显更好的感觉
当然我没怎么用过 claude 所以没有明显对比，但是 deepseek 一直给我感觉是相当好了

37

cookii

2025 年 3 月 26 日 via Android

体感 grok 确实很好用，比其他都强

38

zhwguest

2025 年 3 月 26 日

刚开始出来其实感觉很不错，但是后来慢慢觉得越来越不那么惊艳了...

39

LittleYangYang

2025 年 3 月 26 日

deepseek 我从 v2 开始用它去处理数据，当时主要是相比其他家太便宜了，效果还好，这价格很难让人拒绝()，就是并发非常低
新的 R1 主要强在它的强化学习策略，落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的，说的话非常似人，比其他模型更像贴吧老哥，但是编数据的幻觉倾向也很厉害，也有丢上下文的倾向，很多生成结果基本上义眼就能看出来是 deepseek 写的。
最近我在信息抽取工作上比较了几个模型，在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右，json 格式化约束的稳定度倒是还挺好。
其他的模型实际用起来其实感觉 grok3 幻觉也严重，gemini deepresearch 是真好用啊，谷歌的信息来源还是太猛，开了 gemini advanced ，下个月想把 gpt plus 关掉了，o3 真废物....

40

wweerrgtc

2025 年 3 月 26 日

@lzgshsj #13 思考 7 分钟也太慢了吧, 有没有问答链接可以看看呀

41

seven777

2025 年 3 月 26 日

它本来就很差，从没象吹的那么优秀过。
我真心佩服的就 Claude ，Grok

42

docx

2025 年 3 月 26 日 via iPhone

编程用 Claude Sonnet

43

Yuanlaoer

2025 年 3 月 26 日

我记得最常见的一句评论是：
deepseek 的逻辑推理能力很强
我当年参加物理竞赛和辩论赛的时候，都不知道原来有这么多深耕逻辑学的人士深藏网络

44

MYDB

2025 年 3 月 26 日

都不好用，一个问题多问几家，然后选择自己认为是正确的答案，也不排除都不对，一些小众领域还是不适合 ai

45

YooboH

2025 年 3 月 26 日

14

从我个人体验来看，ds 中文回复质量比免费的 4o 和 gemini 要好上不少，我写论文有时遇到复杂的问题他都能够给不错的参考回复。不过他指令依从性不太好，很容易发散，需要自己注意限制。付费版的 chatgpt 很久没有续费了就没资格评价了。
另外，光是他坚持开源权重这一点就让我没有任何理由批评他了，所谓的什么营销和这一点相比算的了什么。楼里的某些人的回复可真是让人大开眼界，国产是多大仇啊

46

skiy

2025 年 3 月 26 日

不好用就别用了吧。这样它就不要总是“服务器不可用”了。
刚刚提交了个提问，还不错。而同个问题，ChatGPT 只给出文字描述，必没有给代码。DeepSeek 给出代码实例了。
自从之前一直给“服务器不可用”，就很长时间不用了，改用 Kimi 。今天回来用，居然可用。不错不错。

代码这个，一般情况都是要多个平台提问，再综合答案得出自己的解决方案。没有哪个是最好的。ChatGPT 相对来说，Shell 给的非常不错，但有时要使用 Kimi 补充。Grok 有限额，DeepSearch 有时会不可用。其它的比如 ChatGPT 和 Gemini 也一样情形。

47

BelovedOne

2025 年 3 月 26 日

目前来说 Grok 体验最好，非常的专业，效率也很高，思考和搜索的过程非常干练。ChatGPT 也很棒，不过结果总是略逊一筹。

48

rpish

2025 年 3 月 26 日

op 用的 v3 还是 r1 ？
话说 grok3 刚发布不久，r1 发布 2 个多月了，按照大模型半年一代的迭代周期，有差距也很正常。

49

wwhc

2025 年 3 月 26 日

1

在开源模型中 DeepSeek 和 Qwen 是目前最好的，自建成本也并不是高不可攀，我觉得没有责难的理由，那些闭源模型没有匹配的可能性

50

elone

2025 年 3 月 27 日

我今天写一个较为复杂点的 swiftui 的代码, 最终用下来只有 grok3 帮我把代码写出来了, 对比了 ds, 还用了最新的 gemini 2.5, 都完全跑不起来. 只有 grok3 最终实现了, 而且, 代码风格居然很贴合我的习惯.

51

jdz

OP

2025 年 3 月 27 日 via Android

@rpish 最新的 v3

52

NanFengxuan

2025 年 3 月 27 日 via iPhone

DeepSeek 就是一坨，让它写一段 matlab 代码结果死机了，一直重复输出一个字母

53

Meursau1T

2025 年 3 月 27 日

2

@zbw0414 ds 有幻觉没错，但是你推荐 perplexity 就不对了，这东西还不如 ds 和 qwen 呢，而且注水非常严重，印度人搞的垃圾罢了。

54

iamv2er

2025 年 3 月 27 日 via iPhone

grok3 很强

55

laikicka

2025 年 3 月 27 日

1

给老中打打鸡血就完事了你还真用啊?

56

cnrting

2025 年 3 月 27 日 via iPhone

grok3 最近是主力

57

JoshTheLegend

2025 年 3 月 27 日

15

对啊，Sam Altman 就一傻逼，这么垃圾的东西还天天追着屁股又是喷又是上书懂王要求封杀，他要是提前问下你的意见估计就不会做这些小丑表演了。

58

xuejianxianzun

2025 年 3 月 27 日

1

楼上挺有乐子的

59

dodakt

2025 年 3 月 27 日

@cookii 试试新出的 gemini 2.5 pro

60

me1onsoda

2025 年 3 月 27 日

r1 做离散数学题我觉得比 grok 好

61

evan9527

2025 年 3 月 27 日

和哪吒的爆火异曲同工。

62

crackidz

2025 年 3 月 27 日

@JoshTheLegend 你说的太对了，还有一个傻逼叫 Dario Amodei

63

4UyQY0ETgHMs77X8

2025 年 3 月 27 日

用时间长了 ds 感觉只能替代文心一言吧，浪费一大堆时间自说自话说一些没用的，最后给一个狗屁不通的方案，又加一大堆文本解释这狗屁不通的方案，用用就觉得火大，全靠自媒体博主带火的。主用 claude 和 gpt-o3 ，只有需要 sql 语句转换这类的用 ds 轻微辅助

64

tabc2tgacd

2025 年 3 月 27 日

用得少，只是开始放出思维链时，有新鲜感，用了几次，仅有的那么几次还时不时的服务器忙，就没再用过了

65

4UyQY0ETgHMs77X8

2025 年 3 月 27 日

@wsbqdyhm #20 免费能给你用什么好动西，文字工作者首用 gpt4.5 专搞创作类，比其他模型强多了，编码免费 4o 之上有 o1 o3mini o3high 4o 都是远古模型了

66

ramcasky

2025 年 3 月 27 日

😰很难凭我觉得 ds R1 已经完全可以覆盖日常开发基本诉求了

67

cat9life

2025 年 3 月 27 日

没有尝试过 Grok ，看到 op 这帖子马上去试一下。一龙应该给你打钱😁

68

ZColin

2025 年 3 月 27 日

Grok3 个人体验下来综合实力不错的，就是中文语言处理这块基本没什么适配

69

sunny2580839896

2025 年 3 月 27 日

国内 ai ，营销>实力

70

yedkk

2025 年 3 月 27 日

我只用 sonnet 3.7 ，配合 windsurf ，这个模型是最强的，加上有命令行的能力。

71

godspeedyou

2025 年 3 月 27 日

这是什么 grok 隐性广告贴么，“何德何能”都出来了，v2 对于 LLM 无论是技术还是应用的话题和讨论质量真的不太行

72

MartinWu

2025 年 3 月 27 日

借楼问问大佬，哪个智能体能比较好地实现塞给他一个 pdf 的接口文档，就能直接帮我写对接代码。主要是里面字段太多了，我懒得手敲。

73

billly

2025 年 3 月 27 日

昨晚试了几个免费的，感觉最强的是 Gemini2.5 pro ，而且有很大的上下文

74

undefinedBoy

2025 年 3 月 27 日

1

不同情境下综合选择表现最好的模型才是正解

75

lovedebug

2025 年 3 月 27 日

7

真的不能理解一些人拉踩的嘴脸。。。
我日常用 ChatGPT(包括 o3), gemini, grok, deepseek r1(api 充值)，每家都有自己的特色，还是感谢 deepseek 真的拉下了 GPT 的限制，让 plus 用户享受更多。
一般我解决问题会写一个常常的提示词，然后发给每个 ai 提供解决方案。
gemini 很适合写文章，gpt 适合分析问题，deepseek 真的特别能懂我的需求，grok 适合找多个解决方案。

76

lovedebug

2025 年 3 月 27 日

@lovedebug 总结下，让 deepseek r1 分析需求，写出提示词，给其他 ai

77

bli22ard

2025 年 3 月 27 日

相反，我让写过使用 https://github.com/kubernetes/client-go 访问 k8s ，然后获取指定 pod 的日志，实现类似 tail -f 的功能，结果，Grok3 和 chatgpt 4o 和 ds 都写的有问题，不过 ds 的最接近正确，chatgpt 4o 次之，然后 Grok3 给的代码 80%错误的

78

batyu

2025 年 3 月 27 日

DS 给出的答案，最好二次确认一遍。有些东西简直是现编的

79

iv2ex

2025 年 3 月 27 日

@billly #73 请问哪里可以体验`Gemini2.5 pro `。我看 `https://gemini.google.com/ ` 没有这个

80

zxjxzj9

2025 年 3 月 27 日

@DIO 虽然我也没觉得 claude 的会员很值得开，但是 claude 开不开会员区别特别大

81

DinnyXu

2025 年 3 月 27 日

相同的问题，几个 AI 模型都问问，取长补短就可以了，一次对一次错代表不了什么，只不过在写代码方面，grok 我感觉还是强，可能是因为马斯克他们编程能力更出色？但是涉及到一些我们本土化的语言表达，我认为 ds 很能懂的起，比如你可以尝试让他们起一个 LOL 的搞笑的昵称，ds 绝对能给你起很多梗，但是 grok 就做不到，所以你可以分为文科和理科的区别