V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ccctttwww
V2EX  ›  分享发现

AI 测试,我每次只要看到有最新的 AI 我都会试一次,但目前没有一个 AI 能回答正确一次

  •  1
     
  •   ccctttwww · 10 小时 40 分钟前 · 523 次点击
    关于"我想洗车,离洗车店只有 50 米,你建议我开车去还是走去"这个问题还是有 AI 能回答正确的,但这张图至今没有一个 AI 能回答正确,这个问题只要是个 3 岁小朋友都能回答正确,AI 已经这么强大了还是回答不了 这张图片中小人的颜色和名字的对应关系
    6 条回复    2026-02-10 17:10:46 +08:00
    N0vermber11
        1
    N0vermber11  
       10 小时 18 分钟前
    应该是因为免费版或者低级别版本的 AI 厂商不愿意把特征提取精确到能提取细线的级别
    WessonC
        2
    WessonC  
       9 小时 3 分钟前
    有人试了豆包回复的对。
    zwkcoder
        3
    zwkcoder  
       9 小时 2 分钟前
    gemini pro 败北了
    ccctttwww
        4
    ccctttwww  
    OP
       8 小时 51 分钟前
    @WessonC 我很早就试过一次,刚又试了一次还是不行
    sillydaddy
        5
    sillydaddy  
       8 小时 43 分钟前
    有意思,试了几个模型:
    Opus 4.5 thinking ,对了 0 个。

    Opus 4.6 thinking ,对了 2 个( Bob 和 Adam )。

    GPT 5.2 codex extra high thinking ,对了 3 个( Bob, Adm 和 Tommy )。

    GPT 5.3 codex extra high thinking ,对了 5 个:
    Bob:从 Bob 右侧线头出发,沿线向右后下弯,终点箭头指向中间黄绿色小人。
    Jack:从 Jack 下方线头出发,走上方并行线中下方那条,终点箭头指向右上浅橙(偏米黄)小人。
    Jimmy:从 Jimmy 下方线头出发,走上方并行线中上方那条长线,再沿右侧外圈下绕,终点箭头指向右中深蓝小人。
    Tom:从 Tom 下方竖线出发,向下再左弯,终点箭头指向左下黄色小人。
    Adam:从 Adam 左侧长线出发,沿底部向左再沿左侧上行,终点箭头指向左上粉红/玫红小人。


    GPT codex 是用的编程工具处理的,尝试用 opencv 失败,后来用的 ffmpeg 。我还特意把线加粗了,不行的还是不行。
    在 GPT 5.2 尝试过程中,里面冒出了这样一句: “我在校准裁剪参数,马上拿到上半部分的放大细节来确认 Jack/Jimmy 这两条最容易混淆的线”
    sillydaddy
        6
    sillydaddy  
       8 小时 39 分钟前
    我是在 cursor 里面试的。感觉上面的成绩,跟 ARC-AGI 这个图形推理的测试成绩高度相关:

    https://arcprize.org/leaderboard
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1134 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 17:50 · PVG 01:50 · LAX 09:50 · JFK 12:50
    ♥ Do have faith in what you're doing.