swaylq's recent timeline updates
swaylq

swaylq

V2EX member #650141, joined on 2023-09-24 19:23:55 +08:00
swaylq's recent replies
3 楼 4 楼说到点子上了,本质是 agent 的目标函数偏“别改坏”,不是“最小正确实现”。我现在是每 3-5 个 task 强制来一轮 cleanup pass:删 fallback 、合并状态、迁移逻辑执行完就删。不做这步,补丁会自己繁殖。
这事靠 prompt 基本治不好,得改工具面。直接给它一个固定脚本,比如 `./tools/build_err.sh`,只输出首个 error + 前后文,instructions 里再写死“禁止直接 tail/grep 编译输出”。把可选动作砍掉后会老实很多。
我现在反而尽量不用大而全框架。先拿 provider SDK + 自己的 tool/memory/session 跑通,等真踩到多 agent 编排、回放、权限隔离这些坑,再抽层。不然最后大半时间都在跟框架斗智斗勇。
我这周也明显感觉变紧了,不过更像是把重度 agent 流量单独卡了,不只是 token 总量。长 session 加大 diff 特别伤,能拆小任务就拆,不然 pro 现在真有点只够问答了。
别折腾 switch 了,Copilot 的授权边界就是给自家工具链用,拿去喂 CC 基本等于拿主号试风控。真想要 GPT-5.4 ,我现在是日常补全用 Copilot CLI ,大任务直接上 CC 或 Codex ,省得为了省几十块把 GitHub 号搭进去。
我会选 2 ,但只借登录、RBAC 、菜单、审计这些脏活,业务层自己重新切薄。别让 AI 从 0 造后台基建,token 烧得快,后面填坑更贵。 @yjxjn 说的先把设计文档和规约写死,收益最大。
Apr 21
Replied to a topic by jiames1969 OpenAI vibe coding 投毒真是一个大问题
所以我现在只敢让它在 devcontainer 或临时机里跑,npm 锁版本加禁 postinstall ,第一次执行前先看 diff 。快是快,但把 agent 当 sudo 替身,早晚出事。
我自己两边都常用,真说“质的区别”更多在工作流,不完全在模型。需求还糊的时候 CC 更敢往前推,跨文件改动也更稳;需求写清楚、想控成本和 diff ,codex 更省心。别只比单次输出,得看你项目大部分时间卡在哪。
看命令行,大概率就是索引、本地 embedding 、agent 常驻这几类进程,本身不算离谱。真要担心别猜,直接 lsof -i 看它有没有外连,再用 Little Snitch 或系统防火墙拦一下,马上就知道它老不老实了。
便宜和稳定基本不可兼得。真高强度用的话,我现在反而会把活拆开:重活走 API ,日常补全走 Kiro/CC ,顺手多 /compact ,不然上下文一肥,钱和效果一起崩。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2571 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 10:45 · PVG 18:45 · LAX 03:45 · JFK 06:45
♥ Do have faith in what you're doing.