V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
jdz
V2EX  ›  程序员

我的使用姿势不对么, 我感觉 ds 很差劲啊, 比 grok3 差远了, 编程相关问题试了几次都表现很差

  •  1
     
  •   jdz · 3 天前 · 14406 次点击

    比如 example.nacos.com 这是我的 nacos 地址, 帮我写个 bash 脚本, 查询 cpp_long_link 命名空间下的所有服务信息, grok 可以一次写对, deepseek 就会忘记 pageSize 这个参数

    164 条回复    2025-03-29 10:15:35 +08:00
    1  2  
    honkew
        1
    honkew  
       3 天前
    那就对了
    willchen
        2
    willchen  
       3 天前
    那就对了
    whoosy
        3
    whoosy  
       3 天前
    新版本的确实感觉有问题
    DIO
        4
    DIO  
       3 天前   ❤️ 1
    ds 何德何能和 grok 比,现在中文 qwen QWQ ,英文 Grok 基本是我这个穷鬼的标准答案了。虽然订阅了 chatgpt 但是这两个月很少动用了。ds 用来平替百度还可以。claude 没开会员,不知道付费版体验怎么样。
    windyboy
        5
    windyboy  
       3 天前   ❤️ 3
    唯一可以指责你的是政治不正确
    jdz
        6
    jdz  
    OP
       3 天前   ❤️ 2
    @DIO 我也感觉, 感觉铺天盖地吹捧 ds, 试水了几次都被劝退了
    Donaldo
        7
    Donaldo  
       3 天前
    最近写 CUDA ,grok3 是唯一能写对的,其他像 o1,o3-mini-high,claude-3.7(或 thinking),r1,gemini-pro(或 flash-thinking)都不行。
    MRG0
        8
    MRG0  
       3 天前
    我无法触发他的第二次回答
    javazero
        9
    javazero  
       3 天前
    马斯克实在给的太多了,ChatGPT plus 停了。主力直接用 grok 3 免费而且量大管饱
    zbw0414
        10
    zbw0414  
       3 天前
    @DIO ds 幻觉那么严重各种瞎编, 你居然让他平替百度.....
    真平替还是 perplexity 吧. 搜索真的接受不了幻觉.
    jdz
        11
    jdz  
    OP
       3 天前
    @javazero 虽然免费, 但是感觉质量挺好的
    bronyakaka
        12
    bronyakaka  
       3 天前
    gro3k 本来就是目前最强的,差点很正常。
    lzgshsj
        13
    lzgshsj  
       3 天前   ❤️ 39
    我代码主力 claude 的,前两天写了两个 awk 脚本,claude 3.7s 完全不对,ds r1 思考了 7 分钟,完美符合要求

    只能说每个人遇到的问题都千奇百怪,哪怕是同一家 AI 也不是每次答案都一样。
    同样问题,你问出来不对,我问出来对了。刚才问的不对,现在问对了……只能说不要只看一家,平时也可以多换着问问。
    zbw0414
        14
    zbw0414  
       3 天前   ❤️ 20
    @jdz 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费
    dapang1221
        15
    dapang1221  
       3 天前
    我现在日常琐事问题 deepseek R1 ,需要创意及比较新颖的问题 grok ,写逻辑代码 claude 3.7 ,生成前端 UI deepseek R1 或 V3
    ahdw
        16
    ahdw  
       3 天前
    @zbw0414
    > 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费

    太赞同了。主要就是因为没有使用门槛,而且背后的「浙江六小龙」都在宣传和公关方面投入了很多,让 DeepSeek 充分曝光了。

    为我自己的这篇文章引流: https://kutt.it/Z4bAtw
    youthfire
        17
    youthfire  
       3 天前 via iPhone
    claude3.7 thinking 稳稳第一,grok3 第二,其他都是玩具
    NoOneNoBody
        18
    NoOneNoBody  
       3 天前
    ds 有个最奇怪的现象是在其他 ai 没见过的,回答代码居然会漏一边括号这种低级错误
    代码质量我觉得过得去,比 copilot 和 genmini 好,gpt 就暂时判断不出哪个更佳,当然说的都只是免费 web 之间比较
    qinxs
        19
    qinxs  
       3 天前 via Android   ❤️ 3
    对大多数普通人来说 deepseek 已经够用了

    编程领域 我提出的问题 ds 也能完美解决 80%以上

    最后 马化腾财富全球排名 36 所以他很穷!!
    wsbqdyhm
        20
    wsbqdyhm  
       3 天前 via iPhone
    文字工作者,深度使用,感觉 grok3 和阿里新出那个差不多,ds 在这两个之后,ds 比 chatgpt 好,gpt 降智太弱了,我说的都是免费版
    Cloud9527
        21
    Cloud9527  
       3 天前
    最近再用 qwq-plus 感觉还可以,主要是吐字快!
    evilStart
        22
    evilStart  
       3 天前   ❤️ 14
    deepseek 不行为什么美国人这么害怕?这么讨厌国产的还是 run 吧,在这里苦了你们了
    kyor0
        23
    kyor0  
       3 天前   ❤️ 5
    只拿小红分滚出这个论坛
    ZSeptember
        24
    ZSeptember  
       3 天前   ❤️ 4
    llm 都不是很稳,不能因为单一场景,单次使用有点问题,就否定整个模型。。
    Donaldo
        25
    Donaldo  
       3 天前
    @ZSeptember #24 评论区完美体现了你这个观点,大家针对不同使用场景,分别对不同模型进行了赞扬和批判~
    iamsad3508
        26
    iamsad3508  
       3 天前
    温度调到 0 ,再试
    takanashisakura
        27
    takanashisakura  
       3 天前
    @zbw0414 #14 qwq-plus 也不用翻墙
    9ki
        28
    9ki  
       3 天前
    这个月高强度用 ai 学习,claude 3.7 ( Thinking )/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队,grok3 ,gpt-4.5 o1-mini 纯纯路边

    我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来,像二楼那种 claude 都没用过,不知道哪来的自信参与讨论
    Stunt4013
        29
    Stunt4013  
       3 天前
    @Donaldo 刚出的 gemini 2.5 pro 也很强
    EricYuan1
        30
    EricYuan1  
       3 天前
    别的不说,手机 app ,这几个中 grok 做的最好看
    qiaobeier
        31
    qiaobeier  
       3 天前
    通用的 deepseek (翻译,帮小孩写作文,润色文档,甚至还做过 WEB 项目配色方案等等,结果都很优秀)。 写代码只使用 claude 。有买 GTP 但基本不用了。
    lscho
        32
    lscho  
       3 天前
    因为 ai 覆盖的场景太广泛,所以看测试就行。只有测试才能尽可能覆盖大部分场景。

    单一场景谁都有可能出错
    xbtx3790
        33
    xbtx3790  
       3 天前
    grok3 确实能打
    k9982874
        34
    k9982874  
       3 天前 via Android
    先不说质量,输出速度 ds 是最慢的。。。
    fancy2020
        35
    fancy2020  
       3 天前
    百度和 Google 的区别
    clino
        36
    clino  
       3 天前
    我其实是从 deepseek v2 开始用的,当时就感觉很好用,切成 v3 以后好像没有明显更好的感觉
    当然我没怎么用过 claude 所以没有明显对比,但是 deepseek 一直给我感觉是相当好了
    cookii
        37
    cookii  
       3 天前 via Android
    体感 grok 确实很好用,比其他都强
    zhwguest
        38
    zhwguest  
       3 天前
    刚开始出来其实感觉很不错,但是后来慢慢觉得越来越不那么惊艳了...
    LittleYangYang
        39
    LittleYangYang  
       3 天前
    deepseek 我从 v2 开始用它去处理数据,当时主要是相比其他家太便宜了,效果还好,这价格很难让人拒绝(),就是并发非常低
    新的 R1 主要强在它的强化学习策略,落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的,说的话非常似人,比其他模型更像贴吧老哥,但是编数据的幻觉倾向也很厉害,也有丢上下文的倾向,很多生成结果基本上义眼就能看出来是 deepseek 写的。
    最近我在信息抽取工作上比较了几个模型,在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右,json 格式化约束的稳定度倒是还挺好。
    其他的模型实际用起来其实感觉 grok3 幻觉也严重,gemini deepresearch 是真好用啊,谷歌的信息来源还是太猛,开了 gemini advanced ,下个月想把 gpt plus 关掉了,o3 真废物....
    wweerrgtc
        40
    wweerrgtc  
       3 天前
    @lzgshsj #13 思考 7 分钟也太慢了吧, 有没有问答链接可以看看呀
    seven777
        41
    seven777  
       3 天前
    它本来就很差,从没象吹的那么优秀过。
    我真心佩服的就 Claude ,Grok
    docx
        42
    docx  
       3 天前 via iPhone
    编程用 Claude Sonnet
    Yuanlaoer
        43
    Yuanlaoer  
       3 天前
    我记得最常见的一句评论是:
    deepseek 的逻辑推理能力很强
    我当年参加物理竞赛和辩论赛的时候,都不知道原来有这么多深耕逻辑学的人士深藏网络
    MYDB
        44
    MYDB  
       3 天前
    都不好用,一个问题多问几家,然后选择自己认为是正确的答案,也不排除都不对,一些小众领域还是不适合 ai
    YooboH
        45
    YooboH  
       3 天前   ❤️ 14
    从我个人体验来看,ds 中文回复质量比免费的 4o 和 gemini 要好上不少,我写论文有时遇到复杂的问题他都能够给不错的参考回复。不过他指令依从性不太好,很容易发散,需要自己注意限制。付费版的 chatgpt 很久没有续费了就没资格评价了。
    另外,光是他坚持开源权重这一点就让我没有任何理由批评他了,所谓的什么营销和这一点相比算的了什么。楼里的某些人的回复可真是让人大开眼界,国产是多大仇啊
    skiy
        46
    skiy  
       3 天前
    不好用就别用了吧。这样它就不要总是“服务器不可用”了。
    刚刚提交了个提问,还不错。而同个问题,ChatGPT 只给出文字描述,必没有给代码。DeepSeek 给出代码实例了。
    自从之前一直给“服务器不可用”,就很长时间不用了,改用 Kimi 。今天回来用,居然可用。不错不错。

    代码这个,一般情况都是要多个平台提问,再综合答案得出自己的解决方案。没有哪个是最好的。ChatGPT 相对来说,Shell 给的非常不错,但有时要使用 Kimi 补充。Grok 有限额,DeepSearch 有时会不可用。其它的比如 ChatGPT 和 Gemini 也一样情形。
    BelovedOne
        47
    BelovedOne  
       3 天前
    目前来说 Grok 体验最好,非常的专业,效率也很高,思考和搜索的过程非常干练。ChatGPT 也很棒,不过结果总是略逊一筹。
    rpish
        48
    rpish  
       3 天前
    op 用的 v3 还是 r1 ?
    话说 grok3 刚发布不久,r1 发布 2 个多月了,按照大模型半年一代的迭代周期,有差距也很正常。
    wwhc
        49
    wwhc  
       3 天前   ❤️ 1
    在开源模型中 DeepSeek 和 Qwen 是目前最好的,自建成本也并不是高不可攀,我觉得没有责难的理由,那些闭源模型没有匹配的可能性
    elone
        50
    elone  
       3 天前
    我今天写一个较为复杂点的 swiftui 的代码, 最终用下来只有 grok3 帮我把代码写出来了, 对比了 ds, 还用了最新的 gemini 2.5, 都完全跑不起来. 只有 grok3 最终实现了, 而且, 代码风格居然很贴合我的习惯.
    jdz
        51
    jdz  
    OP
       3 天前 via Android
    @rpish 最新的 v3
    NanFengxuan
        52
    NanFengxuan  
       3 天前 via iPhone
    DeepSeek 就是一坨,让它写一段 matlab 代码结果死机了,一直重复输出一个字母
    Meursau1T
        53
    Meursau1T  
       3 天前   ❤️ 2
    @zbw0414 ds 有幻觉没错,但是你推荐 perplexity 就不对了,这东西还不如 ds 和 qwen 呢,而且注水非常严重,印度人搞的垃圾罢了。
    iamv2er
        54
    iamv2er  
       3 天前 via iPhone
    grok3 很强
    laikick
        55
    laikick  
       3 天前   ❤️ 1
    给老中打打鸡血就完事了 你还真用啊?
    cnrting
        56
    cnrting  
       3 天前 via iPhone
    grok3 最近是主力
    JoshTheLegend
        57
    JoshTheLegend  
       3 天前   ❤️ 15
    对啊,Sam Altman 就一傻逼,这么垃圾的东西还天天追着屁股又是喷又是上书懂王要求封杀,他要是提前问下你的意见估计就不会做这些小丑表演了。
    xuejianxianzun
        58
    xuejianxianzun  
       3 天前   ❤️ 1
    楼上挺有乐子的
    dodakt
        59
    dodakt  
       2 天前
    @cookii 试试新出的 gemini 2.5 pro
    me1onsoda
        60
    me1onsoda  
       2 天前
    r1 做离散数学题我觉得比 grok 好
    evan9527
        61
    evan9527  
       2 天前
    和哪吒的爆火异曲同工。
    crackidz
        62
    crackidz  
       2 天前
    @JoshTheLegend 你说的太对了,还有一个傻逼叫 Dario Amodei
    FlorentinoAriza
        63
    FlorentinoAriza  
       2 天前
    用时间长了 ds 感觉只能替代文心一言吧,浪费一大堆时间自说自话说一些没用的,最后给一个狗屁不通的方案,又加一大堆文本解释这狗屁不通的方案,用用就觉得火大,全靠自媒体博主带火的。主用 claude 和 gpt-o3 ,只有需要 sql 语句转换这类的用 ds 轻微辅助
    tabc2tgacd
        64
    tabc2tgacd  
       2 天前
    用得少,只是开始放出思维链时,有新鲜感,用了几次,仅有的那么几次还时不时的服务器忙,就没再用过了
    FlorentinoAriza
        65
    FlorentinoAriza  
       2 天前
    @wsbqdyhm #20 免费能给你用什么好动西,文字工作者首用 gpt4.5 专搞创作类,比其他模型强多了,编码免费 4o 之上有 o1 o3mini o3high 4o 都是远古模型了
    ramcasky
        66
    ramcasky  
       2 天前
    😰很难凭 我觉得 ds R1 已经完全可以覆盖日常开发基本诉求了
    cat9life
        67
    cat9life  
       2 天前
    没有尝试过 Grok ,看到 op 这帖子马上去试一下。一龙应该给你打钱😁
    ZColin
        68
    ZColin  
       2 天前
    Grok3 个人体验下来综合实力不错的,就是中文语言处理这块基本没什么适配
    sunny2580839896
        69
    sunny2580839896  
       2 天前
    国内 ai ,营销>实力
    yedkk
        70
    yedkk  
       2 天前
    我只用 sonnet 3.7 ,配合 windsurf ,这个模型是最强的,加上有命令行的能力。
    godspeedyou
        71
    godspeedyou  
       2 天前
    这是什么 grok 隐性广告贴么,“何德何能”都出来了,v2 对于 LLM 无论是技术还是应用的话题和讨论质量真的不太行
    MartinWu
        72
    MartinWu  
       2 天前
    借楼问问大佬,哪个智能体能比较好地实现塞给他一个 pdf 的接口文档,就能直接帮我写对接代码。主要是里面字段太多了,我懒得手敲。
    billly
        73
    billly  
       2 天前
    昨晚试了几个免费的,感觉最强的是 Gemini2.5 pro ,而且有很大的上下文
    dthghjhe
        74
    dthghjhe  
       2 天前   ❤️ 1
    不同情境下综合选择表现最好的模型才是正解
    lovedebug
        75
    lovedebug  
       2 天前   ❤️ 7
    真的不能理解一些人拉踩的嘴脸。。。
    我日常用 ChatGPT(包括 o3), gemini, grok, deepseek r1(api 充值),每家都有自己的特色,还是感谢 deepseek 真的拉下了 GPT 的限制,让 plus 用户享受更多。
    一般我解决问题会写一个常常的提示词,然后发给每个 ai 提供解决方案。
    gemini 很适合写文章,gpt 适合分析问题,deepseek 真的特别能懂我的需求,grok 适合找多个解决方案。
    lovedebug
        76
    lovedebug  
       2 天前
    @lovedebug 总结下,让 deepseek r1 分析需求,写出提示词,给其他 ai
    bli22ard
        77
    bli22ard  
       2 天前
    相反,我让写过使用 https://github.com/kubernetes/client-go 访问 k8s ,然后获取指定 pod 的日志,实现类似 tail -f 的功能,结果,Grok3 和 chatgpt 4o 和 ds 都写的有问题, 不过 ds 的最接近正确,chatgpt 4o 次之,然后 Grok3 给的代码 80%错误的
    batyu
        78
    batyu  
       2 天前
    DS 给出的答案,最好二次确认一遍。有些东西简直是现编的
    iv2ex
        79
    iv2ex  
       2 天前
    @billly #73 请问哪里可以体验`Gemini2.5 pro `。我看 `https://gemini.google.com/ ` 没有这个
    zxjxzj9
        80
    zxjxzj9  
       2 天前
    @DIO 虽然我也没觉得 claude 的会员很值得开,但是 claude 开不开会员区别特别大
    DinnyXu
        81
    DinnyXu  
       2 天前
    相同的问题,几个 AI 模型都问问,取长补短就可以了,一次对一次错代表不了什么,只不过在写代码方面,grok 我感觉还是强,可能是因为马斯克他们编程能力更出色? 但是涉及到一些我们本土化的语言表达,我认为 ds 很能懂的起,比如你可以尝试让他们起一个 LOL 的搞笑的昵称,ds 绝对能给你起很多梗,但是 grok 就做不到,所以你可以分为文科和理科的区别
    vipfts
        82
    vipfts  
       2 天前   ❤️ 1
    你的使用姿势对, ds 很差劲啊, 比 grok3 差远了, 所有问题试了上万次次都表现很差
    gaodq
        83
    gaodq  
       2 天前
    确实是这样的
    cxe2v
        84
    cxe2v  
       2 天前
    @dodakt 账号所在区域不支持付费
    ziyeziye
        85
    ziyeziye  
       2 天前
    只能说编程方面 ds 的确差点,还有就是上下文长度差了很多(编程问题和幻觉严重都受到这个影响),还有就是不支持多模态,其他的你想说有别的 ai 比 ds 强那是不可能的,其他都逻辑推理比 ds 差了不是一点
    wryyyyyyyyyyyy
        86
    wryyyyyyyyyyyy  
       2 天前
    @DIO 这个 qwen QWQ 在哪里可以用?自己没条件部署。
    ziyeziye
        87
    ziyeziye  
       2 天前
    @ziyeziye 其他 ai 只有 claude 真不错,编程 top ,逻辑能力除了 ds-r1 也比其他的强
    AlexHsu
        88
    AlexHsu  
       2 天前
    ds 的价值是 671b 开源 今年从过年回来到现在 我都部了两套了 但是都是 32b 的 去年政企还没啥需求呢
    能力上 别说 grok 了 比 gpt4o1 和 claude3.7 也没得比啊
    neptuno
        89
    neptuno  
       2 天前
    ds 的意义是训练成本低+开源。我一直不觉得它推理很强。
    InkStone
        90
    InkStone  
       2 天前
    @ziyeziye 这话应该反过来说才对,deepseek r1 只有逻辑推理这一个方面能达到较高水平,其它方面都是二流的……
    cxe2v
        91
    cxe2v  
       2 天前
    @YooboH 可能当年革命他家有些人被干掉了,所以仇恨家族传承下来了
    jurassic2long
        92
    jurassic2long  
       2 天前
    个人经验,DeepSeek 分析问题时最好看它的思维链,然后人工得出答案,经常遇到思维链分析思路非常正确,结论确实错误的情况。grok 用的少,也遇到过几次类似问题,grok 的思维链似乎比其他的要长不少,阅读思维链要花更多时间
    Moierby
        93
    Moierby  
       2 天前
    楼主先了解一下通用模型和推理模型的区别
    写代码应该用推理模型,deepseek 不擅长做这个
    dbaazz
        94
    dbaazz  
       2 天前
    @iv2ex #79 https://aistudio.google.com 这里可以使用谷歌全部的模型
    johnhuangemc2
        95
    johnhuangemc2  
       2 天前
    @lovedebug 我也觉得让 deepseek r1 根据自己的需求写出提示词质量特别高
    coolcoffee
        96
    coolcoffee  
       2 天前
    DS 给我的感觉就和 Google Gemini 差不多,跑分没输过,但是。。。

    不过它们还是有价值的,能把 openai 和 anthropic 牙膏管给挤爆。
    liangzaiyi
        97
    liangzaiyi  
       2 天前
    日常编程方面用 deepseek 和 grok 比较多,各有胜负。GPT 已经弃用了。deepseek 除了慢点和有时候服务崩,思考分析我觉得是最好的,常恨服务不给力。
    Wonz
        98
    Wonz  
       2 天前
    那就对了
    Promtheus
        99
    Promtheus  
       2 天前
    deepseek 好像是老外吹起来的。。
    ssb4
        100
    ssb4  
       2 天前   ❤️ 2
    deepseek 用户有几个拿他写代码?码农不要拿自己太当回事了
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   931 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 22:24 · PVG 06:24 · LAX 15:24 · JFK 18:24
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.