claude-opus-4-6 目前在大模型编程这方面看上去排名第一了 想问问大家的体验
1
paidaxtis 20 小时 28 分钟前
实话说,我在 sonnet 4.5 后,通常的工作问题用 claude code 基本上都能解决了。后续也是跟着最新的模型走,过了能完成常见代码问题的甜蜜点后,都体感不出差异。
不过最难的问题,还是直接 codex ,用 5.2 或 5.3-codex 的 high/xhigh |
2
stinkytofux 20 小时 26 分钟前
周末登了两天的福利中转站, 4.6 非常好用, plan 聊清楚的任务, 几乎不会出错, 代码一次编译成功. 不像其他模型丢三落四的.
|
3
hanguofu 18 小时 52 分钟前 via Android
@stinkytofux 求推荐福利中转站,谢谢!
|
4
letitbesqzr 18 小时 32 分钟前
感觉和 opus 4.5 差不了多少 , 4.5 已经能实现我绝大部分需求了... 贵还是最大的问题
最近几天 5.3-codex 用的比较多, 量大管饱 , 价格实惠. |
5
stinkytofux 18 小时 18 分钟前
@hanguofu V 站不是天天有人发么
|
6
stinkytofux 18 小时 17 分钟前
@letitbesqzr 朋友, 5.3-codex 怎么买的? 指个路
|
7
gadfly3173 18 小时 16 分钟前
感觉比 4.5 聪明一点,速度快一点
|
8
a632079 13 小时 1 分钟前 指令遵从性比 opus 4.5 差很多。
经常定义了多个 Phrase ,比如说 Phrase 2 调用 Codex ,Gemini 进行多模型分析需求,会被主动跳过。 再比如生成代码原型,后端使用 codex 生成指令会高很多,opus 4.6 往往选择这时候跳过。 最重要的是实施完成后,需要进行代码指令控制,使用多模型审核,以及单元测试,一不注意 opus 4.6 就跳过了。 Opus 4.5 在使用相同的 skills 和 prompt 都没有这样的问题。 以及在调试错误,opus 4.6 会陷入死循环。比如说测试失败,需要更新一下 snapshot ,尝试方案 A->B->C->A 会循环重试。 * 而 Codex 5.3 在尝试 2-3 cycle 后就解决了 * Opus 4.5 虽然不能解决,但是也能告知可能路径,不会循环重试 |