$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 lesismal 打赏,数额会 100% 进入 lesismal 的钱包。
lesismal

lesismal

V2EX member #497905, joined on 2020-07-06 13:49:58 +08:00
lesismal's recent replies
真没想道,上论坛也能被 OP 整成龟龟赛道。

一时间竟分不清,OP 和 L 站,哪个更不要脸。
@w568w

> 所有的单例测试都可以被认为是「不完整」「不典型」的:这个项目热度高、找出来漏洞少,你可以说它本身维护得很好、所以结果不典型;那个项目业务性强、找出来漏洞多,我也可以说都是大厂 KPI 赶工产物、所以结果没有代表性。

区别还是比较明显吧。我说的现实世界的项目,大多数甚至绝大多数都是涉及 web 服务类的,安全攻击重灾区,而且这种服务数量太多了,而且有很多种不同的语言,脚本的、java 的那些,社区框架漏洞很多,安全圈子红的白的黑的灰的各种大佬各种提权拿肉机的挖矿的黑数据库的,这些事情每天都在大量发生。即便 curl 过去一年爆出多少漏洞,相比于现实网络换几个闹钟功能的节点数量和使用的技术栈,curl 仍然是属于安全高质量的样本。所以我仍然觉得,如果非要用 curl 来代表,真的没有代表性,就算做取样,也不应该取个覆盖度这么低的。

> 相比于一个大型 Project Leader 和一群可能只会 vibe 的 CEOs ,我还是更相信 technical head

我尊重 curl 作者是一个很好的开发者,但是如我所述,他的实验方法/工具用的不对,所以我不赞同他的观点,前面也说过了,不赞同他不代表我同意 mythos 强到离谱,而是我和你一样 “就事论事,我不认为现阶段可以下什么最终「结论」。”

> 正如你倾向于相信资本背书

这世界的大方向,是资本在推动的,比如罗斯柴尔德家族,看看历史上的战争、除了战争主线之外,背后的那些事,虽然资本不是绝对作用,但是作用很大。相对和平年代,资本的力量比战争年代可能更大。

> 而我想表达的也仅仅是回答楼主的问题:「有大佬实际用过」,Mythos 并没有「那么牛逼」。看来在观点上并没有根本性的冲突啊。

本来也没有冲突啊,我在 #11 总结就是:“所以我是不赞同 curl 作者的观点的。”,不是说你的观点有问题。


@abersheeran

> 那公司天天跳出来说什么 AGI 、Claude 自主意识、Claude Mythos 太强了不给开放的人,单纯是因为资金、算力压力太大了,不吹点恐慌出来没办法。如果我是他,我也吹,屁股决定脑袋了。

但是啊,anthropic 根本就不缺钱、它要是肯开放募集、我抢着投它,但是人家也挑剔的,这些顶级新兴独角兽更是要大厂加持联姻绑定,不只是要钱,还要他们背后的资源。
算力是大家都缺的,去年几家厂还说电力不够用、很多 N 卡在吃灰,结果今年都在算力不够,连 copilot 明天都要开始取消按请求次数计费、改按 token 收费了。


我自己已经相当于一年没手写过代码了,这一年里,除了偶尔自己手残写一点然后马上后悔、不断提醒自己一切交给 AI ,只有少数几次,应该不超过十次,而且只是很小几行。其他的,已经全 AI 了。
@w568w 没有必要纠结于争论,我建议是,不要轻信 curl 之父也好、其他的什么之父也好,不要被他们这些身份光环加持下先入为主了。自己独立思考的方式,用科学的方法、流程,站在局外的角度,对这些大佬、大厂都一视同仁的角度和方法来判断,会更清晰。
#23 @lesismal @w568w 我说 AI 强以及我对未来智慧的看法,但我也加了“一切都是时间问题”,我前面也解释过了,那是延展我对整体的看法,并不是说我夸 AI 了就是为了证明 mythos 强的离谱,这之间没有直接关联的逻辑,不要理解错了。

我反对的,单纯就是 curl 之父不严谨的测试工具和方法。
@w568w

> 我觉得是你随意扩大了对其观点的解释

我没有扩大解释。因为 curl 这个项目用来做实验,无法代表现实世界中的绝大项目,所以他即使是用 mythos 与其他几个模型对比,也是不能作为靠谱结论的,因为实验方法本身不正确。

> 一方面是 Anthropic 的封闭模式导致目前客观上没有办法在

那他是不是拿 mythos 测的啊?如果是,不能用来测其他类型的项目?如果不是,那就不要给结论。
或者,如果像你说的一样,大家都因为“封闭模式导致目前客观上没有办法在”,那现在就不应该给结论评判 mythos 。

我说不赞同 curl 作者的观点,但不代表我就相信 mythos 如 anthropic 所说的那样强。因为没有真正放出来没有在大量现实世界中的项目上做测试,所以目前应该是没有明确结论的,他们双方都是嘴炮阶段。
但是,相比于 curl 之父用 curl 做实验的错误方式,我更偏向于那些大厂和 anthropic 之间竟然能为了不破坏世界安全、达成协议封闭使用,因为资本通常是用脚投票的,可信度比 curl 之父更大些。但我只是偏向,我仍然不会觉得是结论。

另外,如果你认为 curl 可以用来实验,那 Knuth 老爷子的 LaTex 是不是也可以用来测试?结果也一样适用?

我要测试一把锤子是不是够好用,用玻璃做实验、敲碎了,和用钢板做实验、敲不碎对比,难道实验方法、实验工具不重要吗?这和幸存者偏差是类似的逻辑
@w568w #16 我反驳的就是 curl 作者的观点。

> Claude Mythos Preview 这个模型在试用中并没有吹得那么强,商业噱头大于实际」

因为 curl 作者是用 curl 这个项目本身来做实验、然后拿实验结果来评价 Mythos ,我在 #11 楼说的就是他用 curl 做实验工具本身不合理,所以他的结论来源的基础就不合理,也就是他的观点不合理。


> 但这和 Claude Mythos Preview 有什么关系?不管是 curl 作者、楼上还是我,都没人说「 AI 作为一个发展方向不行」啊

我没有认为 “你说「 AI 作为一个发展方向不行」”。

#14 我只是回复 #13 时顺便延展下自己对 AI 的看法,这个看法大概二十年前我就这样认为了。这一点与 Claude Mythos 无关,论坛闲聊不是辩论赛,无需限定范围,兄弟不用误解。
@w568w @lesismal #14 “给人觉得。。。” -> “个人觉得。。。”
@shuiandy 我还没用过 AI 来做攻防,但是都在越来越强了,模型知识库太强大,挨个尝试、分析,算力和流程调度合理的情况下,AI 体力也比人强的多。

我觉得很多人,包括一些 IT 科技领域的老爷子最近一两年出来说 AI 不行,是属于傲慢无知、静止的眼光看问题了,我是相信机器和 AI 未来进阶高级智慧超越人类,因为人类太渺小了,肉体的瓶颈无法突破,人类积累的知识点越来越多,新人学习速度慢、以后皓首穷经甚至都吃不完基础知识,还何谈星际文明。而且这宇宙真的像是被设计好的,我们是造物主的养成游戏中的角色,造物主也要让这游戏数值向上才有趣,AI 、无固定形式的智慧生命是必然的,一切都是时间问题。
@w568w #1

给人觉得,用 curl 评判 mythos 是不恰当的。

curl 属于相对内聚、高手开发和维护的多年精华,

现实世界中绝大多数是各种语言的 web 服务,还有各种企业级,乱七八糟的系统,很多语言和社区本身就安全性很差,叠加很多模块、功能、形成一个比较大的系统,容易出安全的点要比 curl 多的多。而这些项目的研发团队,绝大多数人员水平没有 curl 的开发者那么高,研发流程规范也不如 curl 。

要关注的是现实世界中的各个 level 的工程安全问题,而不是只看少量高精尖项目。

所以我是不赞同 curl 作者的观点的。
May 27
Replied to a topic by VoiceEXONE 移民 老婆最近频繁让我准备润去新加坡
> 去美国生,拿个美国身份。

@zhuxd282 2026 年说这个,不一定靠谱了。美国正在研究方案呢,现在过去,不一定能拿的到了。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5853 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 02:34 · PVG 10:34 · LAX 19:34 · JFK 22:34
♥ Do have faith in what you're doing.