Opus 4.8 真的好难用!

在 Claude Code 中使用 Opus 4.8 ，这几天一直遇到这些问题：

反应奇慢无比，间歇性一个问题思考 10 分钟以上仍然没有响应，必须手动停止对话然后 continue
频繁报错 The model's tool call could not be parsed (retry also failed)
输出中莫名夹杂着其他语言

刚才一次性同时出现了这三个问题，给我气笑了：

  Read 1 file (ctrl+o to expand)

● この Table 组件が核心。normalLayout propと、表格高度・doLayout の処理を確認します。

  Read 1 file (ctrl+o to expand)

● The model's tool call could not be parsed (retry also failed).

✻ Worked for 12m 32s

❯ continue

* Whatchamacalliting… (5m 51s · ↓ 1.7k tokens · almost done thinking)

Opus

Claude

问题

29 replies • 2026-06-03 16:10:03 +08:00

Danswerme

10 days ago

怀念 4.6

zoharSoul

10 days ago

4.7 感觉就不如 4.6

FinnBai

10 days ago

非常赞同，4.8 这次更新真是太差劲了

zekeluii

10 days ago

我今天用了一天 opus 4.8 ，很正常啊，沒遇到問題啊

zhuyao

10 days ago

哈哈哈，我今天也出现日文了

oouz

10 days ago

是的，出现日文的概率挺大的，我最近遇到好几次了。
而且，感觉逻辑性没有 codex 强，我今天用 Claude 写完一个需求，再让 Claude review 没发现问题，再使用 codex review 出来两个 bug ，把 bug 提供给 Claude 他自己也承认这两个 bug 真的存在。

Plutooo

10 days ago

一直在用 4.6 ，4.7 开始说的话已经听不懂了，一股 gpt5.4 的感觉

coderfee

10 days ago via Android

哈哈哈，这谁能不被气笑。像已读乱回的同事。

mnoputd20adfadf3

10 days ago

我日本韩文都出现过 🤡 🤡 🤡

kpprotector

10 days ago

如果不加约束的话，日文、韩文、中文、英文会变来变去……
不如 4.6 + 1

leadfast

10 days ago

简单任务用 pi + deepseek 之后, 对比之下 claude code 太太太慢了

w568w

10 days ago

再补充个我遇到几次的 bug：模型有时会输出一大堆 tool calls ，但是不输出 finish 。于是从 API 角度来说，响应一直在进行，不给客户端返回结果的机会，模型就拿不到执行命令的结果。

而 Opus 4.8 会出现幻觉，认为自己拿到了空白输出，于是就能看到这种奇观：

================
（前略）

$ grep -R xxx ./

thinking: 奇怪，grep 没有返回任何结果，让我测试 Bash 工具是否正常。

$ ls -l .

$ echo ok

$ echo ====probing====

$ printf "yes\n"

$ echo PROBING_OK

thinking: 依然没有任何输出，Bash 工具可能存在问题。我需要向用户解释当前的工具状况。

vlink

10 days ago

我的体验是 4.7 不如 4.6 ，4.7 很恶心的点是输出中文时（文档、注释等地方）经常出现一些很不常用，很奇怪的词汇表达（「当前」->「目下」、「继续」->「续行」、「重新生成」->「再演」等）。以及某些词汇会出现像火星文一样，看字形能看出意思但是文字被替换的情况。我用的是 cursor 内的模型，模型肯定是正确的，感觉像是官方为了反蒸馏做了什么处理...
4.8 用下来基本没出现 4.7 的这种情况，但是整体的体验下来和 4.6 、4.7 没有明显的大提升。

chanssl

10 days ago via Android

还在用 4.6

workbest

10 days ago

大模型瓶颈时代来了

teaguexiao

10 days ago

Opus 4.8 现在确实不稳定，我也遇到过类似的 tool call 解析失败，目前换回 Sonnet 4.5 反而更顺滑。重推理模型在 agentic 场景下容易超时，这不是你的求问方式有问题，就是这模型现阶段网络延迟太高。

jaoyina

10 days ago

4.8 出来 4.6 还能用吗？

bwnjnOEI

10 days ago via iPhone

4.7 4.8 都会有但 4.8 尤为严重就是模型在回答中主动出现推理过程否定前面几句，感觉像是本应该在 tk 里的内容出现在普通回复里，像是他们的后训练在尝试不同的东西

zed1018

10 days ago

我今天遇到的是，在之前 memory 已经都交代过的情况下，甚至 CLAUDE.md 里都关联过的情况下，既不看 UI 设计图，也不看接口文档，直接硬编码实现 app 逻辑。

wenhuacode

10 days ago

用了一天，4.8 token 烧的太快

XenoGear

9 days ago

家乡のOPUS

maxwellz

9 days ago

有时候还会输出一堆 echo a1 a2 a3 a b c d e 啥的

JerningChan

9 days ago

由人工智能转向人工智障？😂

yangyaofei

9 days ago

今天稍微尝试了一下, 模型特别自信, 像三哥一样自信, 而且一直说着听不懂的黑话, 黑话内容空洞/自信也是没有根据的自信

nakun233

9 days ago

感觉还行，刚开始用 4.7 觉得没 4.6 好，后面高强度用下来规范还是有提升不少。4.8 目前啊用下来和 4.7 差不多，还经常顺手修无关本次问题的 BUG

yh7gdiaYW

9 days ago

直接烧 API 没有出现楼上的奇怪输出问题，套餐给加料了吧。总体感觉还是不错的，比 4.7 强，但比我记忆中的 4.6 弱

Linioi

9 days ago

Opus 4.8 语气上比 Opus 4.7 舒服多了，并且最近额度似乎上调了很多，体感我 Pro 套餐 5h 额度大概有 $20 API 额度。之前我用 Opus 跑单 Agent 任务都是 10min 不到跑完 5h 额度，现在让我用得起 Opus 了。
虽然 Opus 4.8 对比 Opus 4.6 还是有差距（ Opus 4.5&4.6 在我这里已经是白月光了），但是比 Sonnet 4.6 还是强多了。所以现在 Pro 套餐的体感还是变好了。

gefangshuai

8 days ago

4.8 能力确实强，但是最近不稳定，老出错

loveshuyuan

8 days ago

我的也是，老是 The model's tool call could not be parsed (retry also failed)，让我怀疑是不是我的网络有问题，设备有问题