V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
chenzhe
V2EX  ›  随想

出了个乌龙,被各个 AI 搞的恍惚了。

  •  5
     
  •   chenzhe · 1 天前 · 3877 次点击

    乌龙

    起因

    今天早上,我在浏览论坛时看到了一篇帖子 链接。因为刚醒,头脑昏沉,并没有仔细阅读,只是随意扫了一眼。帖子里提到了 uv 这个包管理器工具,我没留意它其实是 Python 相关的包管理器。由于名字短小简洁,我就把它记在了脑袋里。

    晚上的尝试

    晚上闲下来,我突然想起了这个 uv 工具,于是决定向 AI 提问,看看它能给我什么答案。

    提问

    “帮我对比一下 uv, yarn, npm, pnpm 之间的区别。”

    AI 给出的回复如下:

    Google Gemini 2.0 Pro

    看完 Google Gemini 的介绍,我觉得这款工具很不错,于是按照它给的网址直接打开文档并开始安装。

    安装尝试

    我满怀兴奋地删除了原有的 Node.js 项目的 node_modules,想要试试 uv 的速度。根据惯性思维,我输入了几个安装命令,但是都没有成功。于是,我去查看官网。

    发现问题

    官网的内容几乎都是 Python 相关的,完全没有涉及 Node.js 或 JavaScript 。这时我感到一丝疑惑,脑袋里仍然清晰记得我是在一个 Node.js 相关的帖子里看到过 uv 这个包管理器的名字。更奇怪的是,Gemini 的回答也提到它是 Node.js 的包管理器。

    这时候我去找别的 AI 问了第一个问题

    1. Github Copilot (Claude 3.7 Sonnet)

    Github Copilot Claude 3.7 Sonnet

    2. Github Copilot (GPT-4o)

    Github Copilot GPT-4o

    3. Grok

    Grok-3

    4. Deepseek R1

    Deepseek R1

    质问 AI

    “我看到 uv 文档 上完全没有提到 Node.js 的操作,都是 Python 相关的内容,怎么回事?”

    此时大部分 AI 都告诉我他们搞错了,只有 Grok 并没有表示它搞错了,只是又开始自顾自的表述 nv 跟 Python 之间的关系。

    虽然 AI 在某些领域能提供帮助,但最终我们仍然需要依赖自己的判断力,确保能够在面对技术问题时做出明智的决策。

    44 条回复    2025-03-26 16:10:19 +08:00
    ddmasato
        1
    ddmasato  
       1 天前
    ai 在一本正经的胡说八道(ಡωಡ)
    ltaoo1o
        2
    ltaoo1o  
       1 天前
    不止胡说八道,有时候智障,真是把我气笑了。之前发现,一个简单的问题

    > js 代码 "Tom told John he failed the exam.".slice(10,12) 的结果是什么,算不出来

    https://static.funzm.com/assets/images/d0e6893d061c038a.png
    learnshare
        3
    learnshare  
       1 天前   ❤️ 2
    一般内容,仍需要人类判定真假;
    代码内容,仍需要人类搭建环境、运行和调试;
    自动驾驶,仍需要人类双手握住方向盘,随时接管。
    NoOneNoBody
        4
    NoOneNoBody  
       1 天前   ❤️ 2
    AI 在“顺着受害人的话继续展开”这方面的能力,远超过诈骗犯
    Remember
        5
    Remember  
       1 天前
    现在的所有 AI 都会这样,一个不存在的东西都能给你编的栩栩如生。
    foolishcrab
        6
    foolishcrab  
       1 天前 via iPhone
    这就是为什么 ai 在解决业务属性强的代码 bug 的时候非常危险
    linghan
        7
    linghan  
       1 天前 via iPhone
    Ai 是真的一本正经的胡说八道,有个值是数值类型,但是 es 字段类型也定义错了,我应该定义成 int 类型的,但是定义成了 keyword ,使用 range 查询就有问题,然后我问 ai 有没有办法不新增字段的情况对这个字段进行 range 查询,他一本正经的说如果是这个值是数值的话是可以进行 range 查询的,可以个锤子哦
    icyalala
        8
    icyalala  
       1 天前
    现有的 LLM 很不擅长处理这类 “我不知道,或者我不太确定” 的问题。
    当你问题涉及这类情况,AI 就只能顺着你的说法去生成新内容。

    其实人也有类似表现。
    AndrewHenry
        9
    AndrewHenry  
       1 天前
    ai 不能放在一起问(放在一起他会认为这些是一个东西给你胡编),只能单个单个的问
    msg7086
        10
    msg7086  
       1 天前
    我问了一圈以后怀疑是因为这个原因:
    「我之前的回答将它与一个类似的但不太相关的 JavaScript 包管理器混淆了。」
    问他 uv 的官方链接结果他给的是 pixi ,应该是把原材料搞混淆了。

    另外在打开 Gemini 的接地功能以后,可以返回正确结果,也有正确的来源标注:
    「[1]历史: uv 是由 Astral 开发的,使用 Rust 编写的 Python 包和[9][11]项目管理器。」
    应该是去搜了关键字以后更新了知识。
    shiny
        11
    shiny  
       1 天前   ❤️ 1
    题外话,你应该试试 bun
    wwhc
        12
    wwhc  
       1 天前
    本地部署的 Qwen_QwQ-32B 很老实,明确表示不知道 UV ,要用户提供该工具的详细信息:

    关于“UV”

    如果“UV”指的是某个特定工具,请提供更多上下文。以下是一些可能的解释:

    可能的拼写错误:
    v 或 npx:v 是一个包版本管理工具,而 npx 是 npm 的执行工具。
    unpkg:一个 CDN 服务,用于快速访问包,但非包管理器。
    Unity Package Manager:Unity 的包管理工具,与 Node.js 无关。
    其他可能性:
    如果是某种自定义工具,请具体说明。
    ......
    如果需要进一步探讨其他工具(如 UV 的具体含义),请补充信息!
    DOLLOR
        13
    DOLLOR  
       1 天前
    典型的 AI 幻觉,问它 A ,它会把 B 的东西移花接木说给你听
    ZE3kr
        14
    ZE3kr  
       1 天前 via iPhone
    你就说正确率是不是 75% 吧
    samli12
        15
    samli12  
       1 天前   ❤️ 2
    AI 本质只是计算下一个字符最有可能是什么
    wnpllrzodiac
        16
    wnpllrzodiac  
       1 天前 via Android
    @icyalala 完全人的思路。顺着来回来不会错。
    kevinbeta
        17
    kevinbeta  
       1 天前 via Android
    现有大模型关于 uv 的资料确实少 一般说 uv 他们会联想到紫外线或者其他项目上去
    FlorentinoAriza
        18
    FlorentinoAriza  
       1 天前
    现在的 ai 需要你搞清本质再去问问题或者先让他讲述某一个,然后再弄
    yb2313
        19
    yb2313  
       1 天前   ❤️ 5
    你把 r1 关了干什么
    dwu8555
        20
    dwu8555  
       1 天前
    @wwhc #12 Qwen 还是挺强的
    lynnharry
        21
    lynnharry  
       1 天前
    直接给我幻想出来一个新的工具包 UV ( Unjs Vector ),UV 的官方网站是 https://uv.unjs.io/ 这是由 Unjs 团队开发的 UV 包管理工具的官方网站。
    shylockhg
        22
    shylockhg  
       1 天前
    @lynnharry 又幻想了:)
    MoneyWasUseless
        23
    MoneyWasUseless  
       1 天前
    mac os 颜值确实是高,这个 UI 看的是真舒服。。
    woodfizky
        24
    woodfizky  
       1 天前
    LLM 本质就是预测下一个词,只不过现在训练的很多场景预测的都不错而已。
    本质上,跟赛博算命没什么区别,算对了你觉得很厉害,偶尔算错了就祛魅了。

    如果你区分不了"AI"提供的内容正确性,还要依赖"AI"的话,你大概率会被它们时不时的幻觉和错误计算狠狠阴一把。


    换个角度想,跟人也类似的,你作为领导/上司 提出一个诱导性强,容易回答错的问题给真人员工,真人一样容易搞错。
    MoneyWasUseless
        25
    MoneyWasUseless  
       1 天前   ❤️ 1
    @yb2313 开了 R1 以后就没有 OP 这个情况了,R1 确实牛逼,直接分析出了 uv 就是 py 那边的工具,然后思考用户这边可能是弄错了。


    mrcotter2013
        26
    mrcotter2013  
       1 天前 via iPhone
    现阶段使用 AI 需要自己有一定的判断力和基础知识。用它来写代码也是,如果读不懂,AI 经常会乱来,甚至改掉你原本的需求……
    coolfan
        27
    coolfan  
       1 天前
    哈哈哈 好问题,全军覆没啊
    davidyin
        28
    davidyin  
       1 天前 via Android
    人工智障還是要小心使用。
    dkrao
        29
    dkrao  
       1 天前
    所以 ai 从来不会说它不知道,不知道的它就自己瞎编,被你发现了它就找借口说搞错了,抱歉!
    charles0
        30
    charles0  
       1 天前
    gpt-4.5 指出:uv 不是一个包管理工具,更多是指与 Deno 相关的底层库(如果你是指这个)。
    https://chat01.ai/zh/chat/01JQ84ZZVPWVW58EEX8C5QSZXT
    charles0
        31
    charles0  
       1 天前
    但是它的回答的第一行还是有一点迷惑性,虽然后面具体解释 uv 的时候它说 uv 可能是指 Deno 的 uv 库:在某些文档中提到的 uv 可能指的是 Deno (一个新的 JavaScript/TypeScript 运行时)所用的底层库 libuv ,这是一个提供事件驱动、异步 I/O 操作的库。它不是一个包管理工具,而是用于 Deno 环境中的底层 I/O 操作,类似于 Node.js 中的 libuv 库。
    charles0
        32
    charles0  
       1 天前
    连 GPT-4 都能回答正确,它第一句话就是:在讨论 uv, yarn, npm, 和 pnpm 之间的区别之前,我想先澄清一下可能存在的误解。uv 在这个上下文中可能是一个笔误,因为 uv 通常不与包管理工具相关联。假设你指的是 npm, yarn, 和 pnpm 这三种 JavaScript 包管理工具,我将基于这个假设来进行比较。
    vicalloy
        33
    vicalloy  
       1 天前
    uv 太新了,如果不联网各 AI 关于 uv 的资料太少。而且还有 libuv 、uvloop 之类的知名库让 AI 混淆。
    Perry
        34
    Perry  
       1 天前 via iPhone
    你的问法让 AI 默认了 uv 是和 yarn npm pnppm 相关的,导致了更容易得到幻觉的结果
    inhzus
        35
    inhzus  
       1 天前
    问 AI 的语句确实要尽量保证没有错误...
    Perry
        36
    Perry  
       1 天前 via iPhone
    你的问法并没有让 AI 知道你只想比较 JS 包管理器,因为完全
    Perry
        37
    Perry  
       1 天前 via iPhone
    因为完全有可能我只是想比较不同语言的包管理器
    wolfie
        38
    wolfie  
       1 天前
    这不是随便用几天就知道的吗?
    grok 确实强,降智的 gpt 没有任何主见,反驳就改变回答,再反驳就再次改变回答。
    Perry
        39
    Perry  
       1 天前
    这就是你在问 “帮我对比一下 ruby on rails, express.js, koa.js, hapi 之间的区别。”
    shyangs
        40
    shyangs  
       1 天前
    @Perry

    如果 AI 想應用到醫學、法律、自動駕駛領域,克服幻覺和錯誤誘導是必須的.

    病人的主訴完全有可能誤導醫師.

    主訴: Disk 故障,檢查後結果是主板/POWER 故障. 如果換到外科情景那不就是拔錯牙,或割錯器官了(左腎右腎割錯醫療事故)
    eroneko
        41
    eroneko  
       1 天前
    试了最新的 Gemini Pro 2.5 ,也是一本正经地胡说八道:
    uv 是一个新兴的工具,由开发了 Ruff (高速 Python Linter) 的 Astral 公司开发,它首先是一个 Python 包管理器和工具链 (旨在替代 pip, pip-tools, virtualenv 等),但也实验性地加入了对 Node.js/JavaScript 包管理的支持,目标是利用其 Rust 实现的超高性能。
    Fallenwood
        42
    Fallenwood  
       1 天前
    问了下 ms copilot, 不认识 uv, 没啥问题, 补充包管理器的信息之后说的也是对的

    Vegetable
        43
    Vegetable  
       1 天前
    uv 太新太小了,你如果问的是 rye ,就不会这么难看
    Abbeyok
        44
    Abbeyok  
       1 天前   ❤️ 1
    ai 很擅长一本正经的胡说八道,所以自己不了解的东西一定要先去了解了解再去针对性问
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3581 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 101ms · UTC 10:36 · PVG 18:36 · LAX 03:36 · JFK 06:36
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.