有人测评过 Claude Fable 5 吗？

guanwei1225 · 2026-06-10T00:12:05Z

不知道大家有没有开始用了？看了一个测评报告，好想用 https://zhuanlan.zhihu.com/p/2047952434945865695

Claude

测评

使用

28 replies • 2026-06-10 16:52:14 +08:00

1

Leeeeex

Jun 10 via iPhone

1

这个评测报告一股子 ai slop 味道
还不如隔壁站真人用过的体验

2

hsiafan

Jun 10

6

我现在见到这样的 AI 文风都已经生理不适了,这个文章你是咋看得下去的..

3

mnoputd20adfadf3

Jun 10

1

Anthropic 发布 Claude Fable 5 和 Claude Mythos 5 。

两者用的是同一个底层模型，差别主要不在能力本身，而在开放边界：

Fable 5 是加了更严格安全措施、面向大众可用的版本。

Mythos 5 则只向少量可信用户开放，部分高风险领域的限制被解除。

Anthropic 也借这次发布明确了一件事：Mythos 级已经是高于 Opus 级的新一档模型。

Fable 5 是他们目前公开可用里最强的模型，任务越长、越复杂，优势越明显。

软件工程部分最典型的例子来自 Stripe：在一个约 5000 万行的 Ruby 代码库里，Fable 5 用一天完成了原本需要整个团队两个月以上的迁移。

它在知识工作、图表和表格理解、复杂分析任务上也被认为明显更加健壮。视觉能力则不只是“会看图”，还包括从科学图表中提取精确数据，或仅凭截图重建 web app 源代码。

长上下文和持续执行能力也是这次发布反复强调的部分。Anthropic 提到，Fable 5 能在数百万 token 的任务里持续推进，还会利用自己留下的笔记改进后续输出。

文章用 Slay the Spire 和 Pokémon FireRed 这些例子来说明，它在长程任务中的状态维持、自我修正和纯视觉执行能力都比过去强了一截。

Mythos 5 则更多被放到科研场景里展示。内部蛋白设计团队用它把药物设计中的部分流程提速约 10 倍；在分子生物学盲测里，研究人员大约 80% 的情况下更偏好 Mythos 5 提出的假设。它还做过一项持续一周以上的基因组学研究，整合跨 138 个动物物种、数百万细胞的单细胞数据，设计并训练了一个定制模型，效果超过一篇近期发表在 Science 的模型，而且规模小得多。

Mythos 级模型在网络安全、生命科学这些领域已经足够强，既能帮助研究和防御，也可能被恶意利用。所以 Fable 5 上线时带了一套新的分类器：一旦请求涉及网络安全、生物与化学、或蒸馏等风险方向，系统就会把请求交给 Claude Opus 4.8 处理，而不是让 Fable 5 直接回答。按官方说法，超过 95% 的 Fable 会话不会触发回退。

安全安排之外，Anthropic 还调整了数据策略：对 Fable 5 、Mythos 5 以及同等级模型的企业流量，统一要求保留 30 天，用于安全监测和减少误判，不用于训练新模型。

开放范围上，Mythos 5 目前主要面向 Project Glasswing 的网络安全合作伙伴，之后会逐步扩展 trusted access program ； Fable 5 则从发布当天起全面可用，价格是每百万输入 token 10 美元、每百万输出 token 50 美元。

订阅侧先在 6 月 9 日到 6 月 22 日向 Pro 、Max 、Team 和 seat-based Enterprise 提供，6 月 23 日后改为 usage credits ，之后再视算力情况调整。