V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
germain
V2EX  ›  Claude

Claude Opus 似乎是官方降智了,洗车题失败

  •  
  •   germain · 3 小时 56 分钟前 · 1586 次点击
    如图
    13 条回复    2026-04-09 11:28:26 +08:00
    b309f3337
        1
    b309f3337  
       3 小时 25 分钟前   ❤️ 1
    我最近也发感觉 opus 4.5 好像有点变傻了,以前让它做的很多功能一次性就能解决了,甚至超出我的预料,最近好几次也不算是很复杂的问题,来回好几次都搞不定
    murmur
        2
    murmur  
       3 小时 20 分钟前   ❤️ 1
    这题我见过攻击性最强的回答是米哈游那个 AI ,直接扛着车去
    germain
        3
    germain  
    OP
       3 小时 10 分钟前
    @b309f3337 甚至有几个 Opus 没能干净解决的历史问题我用免费的 qwen3.6 plus 搞定了,这几天 Claude 问题一堆,还有很多 billing 相关的问题他们的那个 fin bot 无法解决,说让我等真人 email 联系,都一周过去了,音讯全无


    @murmur 这题是快速验证模型真正算力的最简单方法了,不过这扛过去的模型我是不大敢用,怕闪着钱包
    jchencode
        4
    jchencode  
       2 小时 59 分钟前   ❤️ 1
    Opus 确实降智了,应该是跟新出的 Glasswing 有关系,Glasswing 吃掉了很多算力。

    而且,Glasswing 模型推理能力比 Opus 高出几十个百分点。。。。

    [img]https://ft.wzznft.com/i/2026/04/09/e4iicp.jpg[/img]
    99185302
        5
    99185302  
       2 小时 54 分钟前   ❤️ 1
    @b309f3337 跟 GPT 和 Gemini 聊过这种问题,得出的结果都差不多,后台会有一个叫"用户画像"的用户数据,模型会根据这个用户画像决定第一时间调用的算力和子模型。简单点说就是如果用户画像倾向于逻辑和推理,那模型会优先调用逻辑和推型的子模型会给到更高的算力;如果用户画像倾向于闲聊的话,就会优先调用简单的聊天子模型,只需要低算力就足够的这种。还有就是别拿这种问题去测试 AI ,你测试越多,就越会变傻,闲聊越多也会越来越傻。
    letwewell
        6
    letwewell  
       2 小时 29 分钟前
    对牛弹琴不能怪牛听不懂,只怪弹琴的人有问题
    csfreshman
        7
    csfreshman  
       2 小时 6 分钟前   ❤️ 1
    估计算力不够,新出的模型,延迟发布,会不会是算力不够导致的? opus 4.6 使用没这个感觉,洗车问题也回答正确。
    satoru
        8
    satoru  
       2 小时 0 分钟前   ❤️ 1
    最官方 status https://status.claude.com/ 最近故障好多
    gitdoit
        9
    gitdoit  
       1 小时 45 分钟前   ❤️ 1
    最近确实变蠢了,一个小需求干的一塌糊涂,我还以为用错模型了
    chtcrack
        10
    chtcrack  
       1 小时 20 分钟前
    @murmur 哈哈哈,这个 AI 有自己独特的想法,有前途..
    germain
        11
    germain  
    OP
       1 小时 18 分钟前
    大家感觉都差不多,这个月的额度用光之后我换 Codex 用一段时间看看
    hadi
        12
    hadi  
       1 小时 0 分钟前
    Effort Level 现在默认是 Medium ,好像还有一个设置也调整过,有检查过吗?
    germain
        13
    germain  
    OP
       25 分钟前
    @hadi 我懒人,所以设置都固定在 claude.md 里,就算官方改了他们的默认设置,CC 也都会恢复到我自己的设置
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5200 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 03:54 · PVG 11:54 · LAX 20:54 · JFK 23:54
    ♥ Do have faith in what you're doing.