@
w568w > 所有的单例测试都可以被认为是「不完整」「不典型」的:这个项目热度高、找出来漏洞少,你可以说它本身维护得很好、所以结果不典型;那个项目业务性强、找出来漏洞多,我也可以说都是大厂 KPI 赶工产物、所以结果没有代表性。
区别还是比较明显吧。我说的现实世界的项目,大多数甚至绝大多数都是涉及 web 服务类的,安全攻击重灾区,而且这种服务数量太多了,而且有很多种不同的语言,脚本的、java 的那些,社区框架漏洞很多,安全圈子红的白的黑的灰的各种大佬各种提权拿肉机的挖矿的黑数据库的,这些事情每天都在大量发生。即便 curl 过去一年爆出多少漏洞,相比于现实网络换几个闹钟功能的节点数量和使用的技术栈,curl 仍然是属于安全高质量的样本。所以我仍然觉得,如果非要用 curl 来代表,真的没有代表性,就算做取样,也不应该取个覆盖度这么低的。
> 相比于一个大型 Project Leader 和一群可能只会 vibe 的 CEOs ,我还是更相信 technical head
我尊重 curl 作者是一个很好的开发者,但是如我所述,他的实验方法/工具用的不对,所以我不赞同他的观点,前面也说过了,不赞同他不代表我同意 mythos 强到离谱,而是我和你一样 “就事论事,我不认为现阶段可以下什么最终「结论」。”
> 正如你倾向于相信资本背书
这世界的大方向,是资本在推动的,比如罗斯柴尔德家族,看看历史上的战争、除了战争主线之外,背后的那些事,虽然资本不是绝对作用,但是作用很大。相对和平年代,资本的力量比战争年代可能更大。
> 而我想表达的也仅仅是回答楼主的问题:「有大佬实际用过」,Mythos 并没有「那么牛逼」。看来在观点上并没有根本性的冲突啊。
本来也没有冲突啊,我在 #11 总结就是:“所以我是不赞同 curl 作者的观点的。”,不是说你的观点有问题。
@
abersheeran > 那公司天天跳出来说什么 AGI 、Claude 自主意识、Claude Mythos 太强了不给开放的人,单纯是因为资金、算力压力太大了,不吹点恐慌出来没办法。如果我是他,我也吹,屁股决定脑袋了。
但是啊,anthropic 根本就不缺钱、它要是肯开放募集、我抢着投它,但是人家也挑剔的,这些顶级新兴独角兽更是要大厂加持联姻绑定,不只是要钱,还要他们背后的资源。
算力是大家都缺的,去年几家厂还说电力不够用、很多 N 卡在吃灰,结果今年都在算力不够,连 copilot 明天都要开始取消按请求次数计费、改按 token 收费了。
我自己已经相当于一年没手写过代码了,这一年里,除了偶尔自己手残写一点然后马上后悔、不断提醒自己一切交给 AI ,只有少数几次,应该不超过十次,而且只是很小几行。其他的,已经全 AI 了。