lanweizhujiao 最近的时间轴更新
lanweizhujiao

lanweizhujiao

V2EX 第 630454 号会员,加入于 2023-05-23 20:19:29 +08:00
今日活跃度排名 838
53 S 87 B
求推荐 2000 元以内、适合父母用的安卓手机
问与答  •  lanweizhujiao  •  1 月 15 日  •  最后回复来自 humanity
18
想买个二手自行车,坐标:烟台,推荐品牌/车型&求购
  •  1   
    自行车  •  lanweizhujiao  •  2025 年 8 月 19 日  •  最后回复来自 iv8d
    1
    Cloudflare 对 openai 的 ai gateway 会被识别到国内 ip
  •  1   
    问与答  •  lanweizhujiao  •  2025 年 4 月 16 日  •  最后回复来自 lanweizhujiao
    4
    想从英语哑巴进化成正常人,求资源推荐!
    English  •  lanweizhujiao  •  2025 年 5 月 14 日  •  最后回复来自 keepmovingg
    14
    windows 上有没有好用的粘贴板软件
    问与答  •  lanweizhujiao  •  2025 年 3 月 10 日  •  最后回复来自 fanersai
    12
    有没有巨好玩的游戏推荐
  •  1   
    游戏  •  lanweizhujiao  •  2025 年 2 月 20 日  •  最后回复来自 soar0712
    176
    最近想放弃编程老师的兼职,找个新的兼职
  •  1   
    职场话题  •  lanweizhujiao  •  2025 年 1 月 3 日  •  最后回复来自 lanweizhujiao
    14
    lanweizhujiao 最近回复了
    昨晚熬到三点把那个「 AI 竞技场」的小玩具终于部署上线了,现在坐在工位上还有点恍惚。

    其实起因特别简单——前阵子我在研究怎么给手里的 Agent 选基座模型,看了无数测评榜单,MMLU 分数一个比一个高,但实际用起来总觉得哪里不对。后来我发现一个问题:**当我看到「 GPT-4 」这个 logo 的时候,潜意识里就已经给它加分了**;而看到某些国产模型的名字时又会不自觉地带着偏见去挑刺。

    这让我想起以前看过的百事挑战实验。于是我就想:**如果我把所有模型的名字都藏起来呢?**

    说干就干。上周末推掉了所有社交活动在家糊了这个小网站:

    👉 **https://arena.anqrach.top/**

    它长得特别朴素甚至有点简陋——你进去之后输入任何问题系统会随机抽两个匿名模型同时给你回答你看不到任何品牌标识只能凭直觉判断左边好还是右边好或者都很烂。**只有当你投完票那一刻才会揭晓刚才跟你对话的到底是谁**可能是 Claude 也可能是某个开源小模型或者是通义千问...

    我自己测试了几天发现这事儿特魔幻有好几次我觉得「这回答逻辑清晰还有人情味肯定是 GPT 吧」结果揭开一看是某个我之前完全没正眼瞧过的小众模型;也有那种看着很华丽但其实空洞无物的答案最后发现是大厂旗舰款瞬间有种被品牌光环骗了的感觉。

    说实话这个项目没什么技术含量就是 FastAPI+React 的简单拼接甚至代码写得还挺糙的流式输出那块调了很久才不让两边打架但我自己玩得挺上瘾因为它真的逼着我回归到了内容本身而不是在看牌子下菜碟儿。

    如果你今天摸鱼无聊或者正好在纠结该用哪个 AI 不妨来扔几个问题试试手气不用注册打开就能玩要是遇到了什么离谱的对局结果欢迎截图发给我看看咱们一起祛祛魅😄
    14 天前
    回复了 Hyvi 创建的主题 Google Google one AI Pro 使用额度限制,这个量感觉不够
    Gemini 3.1 Pro (High)
    Refreshes in 3 days, 18 hours
    Gemini 3.1 Pro (Low)
    Refreshes in 3 days, 18 hours
    Gemini 3 Flash
    Refreshes in 4 hours, 52 minutes
    Claude Sonnet 4.6 (Thinking)
    Refreshes in 4 days, 2 hours
    Claude Opus 4.6 (Thinking)
    Refreshes in 4 days, 2 hours
    GPT-OSS 120B (Medium)
    Refreshes in 4 days, 2 hours
    为啥我的就得 7day 了 哎
    1 月 20 日
    回复了 CNN 创建的主题 Apple 让 Apple 日历显示天气
    good
    1 月 16 日
    回复了 czhen 创建的主题 ☕Vibe Coding🤖 Vibe Coding 工具投票
    Windsurf
    1 月 9 日
    回复了 xiaon 创建的主题 生活 吃晚饭时你们使用电脑都看些什么?
    《麻辣隔壁》系列
    1 月 7 日
    回复了 xiaowoli 创建的主题 程序员 [我的 2025 年度代码报告]
    这个工具 是怎么写的呢 可以分享下吗
    2025 年 12 月 27 日
    回复了 DominoH 创建的主题 分享创造 半夜胃疼睡不着,搓了个“互联网沟通指北”,嘎嘎
    我也胃疼,胃炎


    前两周按幽门螺杆菌治疗方案服药时,遗漏了克拉霉素,实际只服用了奥硝唑、艾司奥美拉唑和胶体果胶铋。
    后来发现漏服克拉霉素时,奥硝唑已经吃完,于是改为单独服用克拉霉素(每天晚上一片)。
    近期出现胃炎症状再次复发。


    问下 这个怎么解决
    2025 年 12 月 5 日
    回复了 v00O 创建的主题 VPS 国外服务器有没有推荐的
    同问
    2025 年 11 月 4 日
    回复了 marukoli 创建的主题 上海 好哥哥们上海房子现阶段能入吗?
    可以的。要是亏了当我没说,赚了分我 5%
    何止一倍, 我年初买的 16*2 ( 32g )金百达的 加券后 328 现在一看 一条就得 368
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2745 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 05:05 · PVG 13:05 · LAX 22:05 · JFK 01:05
    ♥ Do have faith in what you're doing.