kennylam777

V2EX member #90581, joined on 2015-01-08 01:22:38 +08:00

kennylam777 提问技术话题好玩工作信息交易信息城市相关

Per kennylam777's settings, the topics list is only visible after you sign in

Deals info, including closed deals, is not hidden

kennylam777's recent replies

1 day ago

Replied to a topic by bihui › 程序员 › 你们用啥 ai 编程工具可以当生产力?

@phinex 本來我就一堆 microservices, 有時候需求變動要幾個組件一起改

1 day ago

Replied to a topic by bihui › 程序员 › 你们用啥 ai 编程工具可以当生产力?

@justd 看看這個 https://opencode.ai/docs/agents/#model

示例中的 agent 就叫做'cheap-model', 你可以改成其他名字
```json
{
"agent": {
"cheap-model": {
"model": "anthropic/claude-haiku-4-20250514"
}
}
}
```

我是直接在 main agent 中用 GPT 5.5, plan 的時候要它 "cheap-model"的 sub-agent 去實作及跑 smoke-test

反正有免費的 model, 你可以先用免費的試試這種配置, 到能用的時候再接入 Codex subscription, provider 選 OpenAI 就可以
https://opencode.ai/docs/providers/#openai

1 day ago

Replied to a topic by bihui › 程序员 › 你们用啥 ai 编程工具可以当生产力?

OpenCode 已經很不錯吧, 我配 Codex 的 subscription, GPT5.5 還挺能打, 要幹重活的話, 用多個 sub-agents 配 Deepseek 去跑吧, 然後讓主 agent 的 GPT 5.5 驗收就成

1 day ago

Replied to a topic by kennylam777 › OpenAI › Codex 又要重置啦

我的重置了, 比預定早了一天, 算小賺一點

OpenCode 能用 Codex subscriptions 真的很佛心, 先用 GPT5.5 計劃好, 再用其他便宜的模型跑 subagents 去實作及 smoke-test 成功為止, 這樣的分配還真的省下不少 Codex usage

2 days ago

Replied to a topic by TuTouPower › 程序员 › 写了个代理薅 MiMo Code 免费模型的羊毛

想買 MiMo token plan Lite 但不知道小米模型甚麼樣, 總算能免注冊先試用了

3 days ago

Replied to a topic by lezhou › OpenAI › 有人用过 antigravity 2.0 了吗？说说

模型還不錯, 但 harness 很拉, 無論是 agy (CLI)還是 IDE 還是 Agent, 都很容易改錯 file, 然後不管你有沒有 git commit 都給你來一個 git restore

但 Pro 3.1 的 quota 還算可以, 總體來說我用它來幹粗活的

如果多次也修不好, 我試過用 pi.dev + Qwen3.6 27B(本地)也比它好

當然 Codex 是吊打 AG 的, quota 也不少, 只是我 Codex 也常用滿了, 才需要用 AG 及本地 LLM 分擔一下

5 days ago

Replied to a topic by nc › Java › Java 确实是内存高效的

我也不想用 JVM ，但 ElasticSearch 真的香，好像暫時還沒取代品？

6 days ago

Replied to a topic by yhtbiy › 程序员 › AI 时代了，语言之争和框架之争是不是没那么重要了？

雖然我還有在用 Python, 但 production 的東西我都轉向用 Go 了, 畢竟 compile time 能擋很多東西, strong type 讓 LLM 也能清楚理解數據結構

React 及 Python 的 project, 我都要用 strict type check 及 ruff 及 pyright 一類先檢查再讓 LLM 去宣告做完, 還真的能擋不少低級錯誤

8 days ago

Replied to a topic by Livid › Local LLM › DiffusionGemma

@BingoXuan Nemotron Nano 還真的不太行, Ultra 出來了好像也不太有性價比, 550B 等級的中國模型比它強。

btw, MTP 在 Coding agent 上加速效果挺明顯的, 我想是算 diff 一類能搬字過紙的任務上猜得到就能過, Gemma 4 31B Q4 在 5090 我試過能跑到最高 90tps, 反而 Qwen 3.6 27B 我都沒仔細看過最高 tps

但真的要快的話, 把 Qwen 3.6 35B 灌下去, tokens 嘩啦嘩啦就跑一堆出來還算爽的, max tps 過 130, 簡單任務也算能用

8 days ago

Replied to a topic by Livid › Local LLM › DiffusionGemma

@commoccoom 我單張 RTX5090, Q3.6 27B Q5_K_XL 用以上配置能跑 context 102400, 56tps

另外我還有兩張 RTX3090 的 NVLink 能跑 Gemma 4 31B Q8, F16 K/V, ctx 51200, 55-60tps, 但現在要買 3090 及它的 NVLink 應該不容易。

聽說有人在淘寶魔改了 V100 能插 PCIe 及多卡 NVLink, 但這種魔改的東西除非你對 inference 很有經驗, 否則不建議用。也有些人用舊款 AMD MI50 32GB 去組多卡, 但好像 llama.cpp 沒直接支援要用改版的, 也不太建議用。

RTX6000 Pro 的 96GB VRAM 及超大 bandwidth 肯定是單卡最強的民用產品

32GB 的新品好像還有 Intel Arc Pro B70, 比 RTX5090 便宜不少, 但這個 llama.cpp 的支援可能不完整, vllm 倒是有 Intel 自己的版本有維護能配 Qwen 3.5

» More replies by kennylam777