swaylq's recent timeline updates

swaylq

V2EX member #650141, joined on 2023-09-24 19:23:55 +08:00

auramate.net/

分享创造 • swaylq • Mar 29 • Lastly replied by sunnysab

swaylq's recent replies

Apr 27

3 楼 4 楼说到点子上了，本质是 agent 的目标函数偏“别改坏”，不是“最小正确实现”。我现在是每 3-5 个 task 强制来一轮 cleanup pass：删 fallback 、合并状态、迁移逻辑执行完就删。不做这步，补丁会自己繁殖。

Apr 26

这事靠 prompt 基本治不好，得改工具面。直接给它一个固定脚本，比如 `./tools/build_err.sh`，只输出首个 error + 前后文，instructions 里再写死“禁止直接 tail/grep 编译输出”。把可选动作砍掉后会老实很多。

Apr 25

我现在反而尽量不用大而全框架。先拿 provider SDK + 自己的 tool/memory/session 跑通，等真踩到多 agent 编排、回放、权限隔离这些坑，再抽层。不然最后大半时间都在跟框架斗智斗勇。

Apr 24

我这周也明显感觉变紧了，不过更像是把重度 agent 流量单独卡了，不只是 token 总量。长 session 加大 diff 特别伤，能拆小任务就拆，不然 pro 现在真有点只够问答了。

Apr 23

别折腾 switch 了，Copilot 的授权边界就是给自家工具链用，拿去喂 CC 基本等于拿主号试风控。真想要 GPT-5.4 ，我现在是日常补全用 Copilot CLI ，大任务直接上 CC 或 Codex ，省得为了省几十块把 GitHub 号搭进去。

Apr 22

我会选 2 ，但只借登录、RBAC 、菜单、审计这些脏活，业务层自己重新切薄。别让 AI 从 0 造后台基建，token 烧得快，后面填坑更贵。 @yjxjn 说的先把设计文档和规约写死，收益最大。

Apr 21

所以我现在只敢让它在 devcontainer 或临时机里跑，npm 锁版本加禁 postinstall ，第一次执行前先看 diff 。快是快，但把 agent 当 sudo 替身，早晚出事。

Apr 18

我自己两边都常用，真说“质的区别”更多在工作流，不完全在模型。需求还糊的时候 CC 更敢往前推，跨文件改动也更稳；需求写清楚、想控成本和 diff ，codex 更省心。别只比单次输出，得看你项目大部分时间卡在哪。

Apr 15

看命令行，大概率就是索引、本地 embedding 、agent 常驻这几类进程，本身不算离谱。真要担心别猜，直接 lsof -i 看它有没有外连，再用 Little Snitch 或系统防火墙拦一下，马上就知道它老不老实了。

Apr 14

便宜和稳定基本不可兼得。真高强度用的话，我现在反而会把活拆开：重活走 API ，日常补全走 Kiro/CC ，顺手多 /compact ，不然上下文一肥，钱和效果一起崩。