Claude Opus 似乎是官方降智了，洗车题失败

25 replies • 2026-04-14 09:29:05 +08:00

1

b309f3337

Apr 9

1

我最近也发感觉 opus 4.5 好像有点变傻了，以前让它做的很多功能一次性就能解决了，甚至超出我的预料，最近好几次也不算是很复杂的问题，来回好几次都搞不定

2

murmur

Apr 9

2

这题我见过攻击性最强的回答是米哈游那个 AI ，直接扛着车去

3

germain

OP

Apr 9

@b309f3337 甚至有几个 Opus 没能干净解决的历史问题我用免费的 qwen3.6 plus 搞定了，这几天 Claude 问题一堆，还有很多 billing 相关的问题他们的那个 fin bot 无法解决，说让我等真人 email 联系，都一周过去了，音讯全无

@murmur 这题是快速验证模型真正算力的最简单方法了,不过这扛过去的模型我是不大敢用，怕闪着钱包

4

jchencode

Apr 9

1

Opus 确实降智了，应该是跟新出的 Glasswing 有关系，Glasswing 吃掉了很多算力。

而且，Glasswing 模型推理能力比 Opus 高出几十个百分点。。。。

[img]https://ft.wzznft.com/i/2026/04/09/e4iicp.jpg[/img]

5

99185302

Apr 9

2

@b309f3337 跟 GPT 和 Gemini 聊过这种问题，得出的结果都差不多，后台会有一个叫"用户画像"的用户数据，模型会根据这个用户画像决定第一时间调用的算力和子模型。简单点说就是如果用户画像倾向于逻辑和推理，那模型会优先调用逻辑和推型的子模型会给到更高的算力；如果用户画像倾向于闲聊的话，就会优先调用简单的聊天子模型，只需要低算力就足够的这种。还有就是别拿这种问题去测试 AI ，你测试越多，就越会变傻，闲聊越多也会越来越傻。

6

letwewell

Apr 9

对牛弹琴不能怪牛听不懂，只怪弹琴的人有问题

7

csfreshman

Apr 9

1

估计算力不够，新出的模型，延迟发布，会不会是算力不够导致的？ opus 4.6 使用没这个感觉，洗车问题也回答正确。

8

satoru

Apr 9

2

最官方 status https://status.claude.com/ 最近故障好多

9

gitdoit

Apr 9

1

最近确实变蠢了,一个小需求干的一塌糊涂,我还以为用错模型了

10

chtcrack

Apr 9

@murmur 哈哈哈,这个 AI 有自己独特的想法,有前途..

11

germain

OP

Apr 9

大家感觉都差不多，这个月的额度用光之后我换 Codex 用一段时间看看

12

hadi

Apr 9

Effort Level 现在默认是 Medium ，好像还有一个设置也调整过，有检查过吗？

13

germain

OP

Apr 9

@hadi 我懒人，所以设置都固定在 claude.md 里，就算官方改了他们的默认设置，CC 也都会恢复到我自己的设置

14

q534

Apr 9

@germain #13 怎么做到 Effort Level 设置在 claude.md 中的

15

wsbqdyhm

Apr 9 via iPhone

@99185302 #5 你好，你是什么大模型，今天天气怎么样，

16

vsomeone

Apr 9

@hadi 没用哈，effort level 调到 high 乃至 max 都没用，就是降智了。

17

dreamingms

Apr 9

体感降智了，就是不行了。这行业发展了这么多年来来回回的不知道在干嘛，最开始 gpt4 也是一样，有种超越我智商的感觉，用着用着就不对劲了。现在的 opus 也是，一开始感觉能力远超我，现在又回去了，干个活我能给它指出一堆错误，不知道在搞什么。

18

germain

OP

Apr 10

@q534 现在我们所用来编程的大模型，本质上还和几年前那种聊天模型一样，都是语言类的模型。Claude Code 的所有设置都是基于人类语言的理解，然后再下达给远端的大模型。你可以在 md 文件里面用自然语言设置几乎所有参数。

19

germain

OP

Apr 10

@dreamingms 这似乎跟用户量和这个公司正在开发的新模型有必然联系。看这几天金融类和科技类关于他们公司的几个头条新闻就知道了。

20

xssleak

Apr 13

那现在还合适开 100 刀的么我一般用 code 里面我现在纠结

21

germain

OP

Apr 13 via iPhone

@xssleak 没有更好的选择

22

xssleak

Apr 13

@germain 5.4 就是太死板而且没 opus 这么全面

23

lyxxxh2

Apr 13

我用 Sonnet 4.6,上周五还正常。

1. 我让他只能出方案,结果直接改了代码
2. 说了他角色是 web 端,还去改小程序
- 我以前一直这样用的,今天突然不听话了。

24

germain

OP

Apr 13

@lyxxxh2
@xssleak

十有八九是在蒸馏 Opus4.6 给 4.7 上线做准备
我准备过两天 Claude 过期后用一个月的 Codex 换换口味

25

xssleak

Apr 14

1

@germain 你可以试试俩个我都用了俩个的开发想法是不同的