guanwei1225
V2EX  ›  Claude

有人测评过 Claude Fable 5 吗?

  •  
  •   guanwei1225 · 1 day ago · 6779 views
    不知道大家有没有开始用了?
    看了一个测评报告,好想用
    https://zhuanlan.zhihu.com/p/2047952434945865695
    28 replies    2026-06-10 16:52:14 +08:00
    Leeeeex
        1
    Leeeeex  
    PRO
       1 day ago via iPhone   ❤️ 1
    这个评测报告一股子 ai slop 味道
    还不如隔壁站真人用过的体验
    hsiafan
        2
    hsiafan  
       1 day ago   ❤️ 5
    我现在见到这样的 AI 文风都已经生理不适了,这个文章你是咋看得下去的..
    mnoputd20adfadf3
        3
    mnoputd20adfadf3  
       1 day ago   ❤️ 1
    Anthropic 发布 Claude Fable 5 和 Claude Mythos 5 。

    两者用的是同一个底层模型,差别主要不在能力本身,而在开放边界:

    Fable 5 是加了更严格安全措施、面向大众可用的版本。

    Mythos 5 则只向少量可信用户开放,部分高风险领域的限制被解除。

    Anthropic 也借这次发布明确了一件事:Mythos 级已经是高于 Opus 级的新一档模型。

    Fable 5 是他们目前公开可用里最强的模型,任务越长、越复杂,优势越明显。

    软件工程部分最典型的例子来自 Stripe:在一个约 5000 万行的 Ruby 代码库里,Fable 5 用一天完成了原本需要整个团队两个月以上的迁移。

    它在知识工作、图表和表格理解、复杂分析任务上也被认为明显更加健壮。视觉能力则不只是“会看图”,还包括从科学图表中提取精确数据,或仅凭截图重建 web app 源代码。

    长上下文和持续执行能力也是这次发布反复强调的部分。Anthropic 提到,Fable 5 能在数百万 token 的任务里持续推进,还会利用自己留下的笔记改进后续输出。

    文章用 Slay the Spire 和 Pokémon FireRed 这些例子来说明,它在长程任务中的状态维持、自我修正和纯视觉执行能力都比过去强了一截。

    Mythos 5 则更多被放到科研场景里展示。内部蛋白设计团队用它把药物设计中的部分流程提速约 10 倍;在分子生物学盲测里,研究人员大约 80% 的情况下更偏好 Mythos 5 提出的假设。它还做过一项持续一周以上的基因组学研究,整合跨 138 个动物物种、数百万细胞的单细胞数据,设计并训练了一个定制模型,效果超过一篇近期发表在 Science 的模型,而且规模小得多。

    Mythos 级模型在网络安全、生命科学这些领域已经足够强,既能帮助研究和防御,也可能被恶意利用。所以 Fable 5 上线时带了一套新的分类器:一旦请求涉及网络安全、生物与化学、或蒸馏等风险方向,系统就会把请求交给 Claude Opus 4.8 处理,而不是让 Fable 5 直接回答。按官方说法,超过 95% 的 Fable 会话不会触发回退。

    安全安排之外,Anthropic 还调整了数据策略:对 Fable 5 、Mythos 5 以及同等级模型的企业流量,统一要求保留 30 天,用于安全监测和减少误判,不用于训练新模型。

    开放范围上,Mythos 5 目前主要面向 Project Glasswing 的网络安全合作伙伴,之后会逐步扩展 trusted access program ; Fable 5 则从发布当天起全面可用,价格是每百万输入 token 10 美元、每百万输出 token 50 美元。

    订阅侧先在 6 月 9 日到 6 月 22 日向 Pro 、Max 、Team 和 seat-based Enterprise 提供,6 月 23 日后改为 usage credits ,之后再视算力情况调整。
    laimailai
        4
    laimailai  
       1 day ago
    给 OP 总结一下:

    526457385
        5
    526457385  
       1 day ago
    写个 crud 用得着这么高级的模型,gpt-5.4 完全够用
    skuuhui
        6
    skuuhui  
       1 day ago
    @526457385 给公司写的,用智普都大材小用
    wat4me
        7
    wat4me  
       1 day ago
    这个文章是用 Fable 5 总结的吗
    Kokomashiro
        8
    Kokomashiro  
       1 day ago
    昨天订阅的,今早刚好看到新的 Fable 5 ,试了前端,我是直接把 figma 设计图给他,可以说爆杀 5.5 ,可以做到 1 比 1 像素级还原。
    jsq2627
        9
    jsq2627  
       1 day ago
    @laimailai 我现在见到这样的 AI 生图也已经生理不适了
    takanashisakura
        10
    takanashisakura  
       1 day ago via iPhone
    @jsq2627 AI 生图说实话比 AI 八股还是好受些的。特别是这类示意图而美术资产的情况,更让人好接受些。
    hellodigua
        11
    hellodigua  
       1 day ago
    没有测评,但是在网页上尝试聊了一下,感觉进步很大,已经是我的主力文本对话模型了
    HENQIGUAI
        12
    HENQIGUAI  
       1 day ago
    据说前端进步能力巨大!
    EnterpriseD
        13
    EnterpriseD  
       1 day ago via iPhone
    生物问题限制是真的严格,随便总结一篇自己发的的 paper 都不给
    dongmian2019
        14
    dongmian2019  
       1 day ago
    用了一下,没感觉和 4.8 有什么大的差别
    shyrock2026
        15
    shyrock2026  
       1 day ago
    感觉提升巨大,那种轻快的,指哪儿打哪儿的感觉好像飞起来了。。。
    zzzzz024
        16
    zzzzz024  
       1 day ago
    早上用了 mythos 一个 codex-review
    直接把 max5 的 5h 额度干没了
    xiangran0028
        17
    xiangran0028  
       1 day ago
    早上用了,比较满意,解决了工程中遗留的一个复杂问题,之前 claude 4.8 和 codex 5.5 尝试了几轮都不行。
    qiaobeier
        18
    qiaobeier  
       1 day ago
    @zzzzz024 正在用 Fable review 小弟代码,会自动打开 jira 评估原始需求,真是挺厉害的。之前没有这种操作
    tomyark123
        19
    tomyark123  
       1 day ago
    刷了下 HN 上的评论都说不错
    widowcat
        20
    widowcat  
       1 day ago
    @laimailai 这个是什么生成的
    kkth
        21
    kkth  
       1 day ago
    神话级的模型,目前最强,国产估计要明年才能赶上,就看 codex6 有没有机会了,codex6 如果能赶上,那估计就能回到订阅包里,不然就等着猛猛烧钱把
    xyooyx
        22
    xyooyx  
       1 day ago
    看了楼主帖子,发现我禁用已久的 claude 删号重创居然可以用了
    xfxz
        23
    xfxz  
       1 day ago
    @kkth 奥特曼,就看你的了
    nathandoge
        24
    nathandoge  
       1 day ago
    只能用到 22 号,之后就只有 api ,A/就是 A/,希望 gpt 赶紧搞个能竞争过的。
    xajh87
        25
    xajh87  
       1 day ago
    @laimailai 请问是什么 llm 生图的,一般提示词是什么
    doinb6686
        26
    doinb6686  
       1 day ago
    momo1pm
        27
    momo1pm  
       1 day ago
    以后按量付费,打的就是代理
    widowcat
        28
    widowcat  
       1 day ago
    太烧 token 了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3308 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 86ms · UTC 11:45 · PVG 19:45 · LAX 04:45 · JFK 07:45
    ♥ Do have faith in what you're doing.