kennylam777

kennylam777

V2EX member #90581, joined on 2015-01-08 01:22:38 +08:00
Per kennylam777's settings, the topics list is only visible after you sign in
Deals info, including closed deals, is not hidden
kennylam777's recent replies
1 day ago
Replied to a topic by bihui 程序员 你们用啥 ai 编程工具可以当生产力?
@phinex 本來我就一堆 microservices, 有時候需求變動要幾個組件一起改
1 day ago
Replied to a topic by bihui 程序员 你们用啥 ai 编程工具可以当生产力?
@justd 看看這個 https://opencode.ai/docs/agents/#model

示例中的 agent 就叫做'cheap-model', 你可以改成其他名字
```json
{
"agent": {
"cheap-model": {
"model": "anthropic/claude-haiku-4-20250514"
}
}
}
```

我是直接在 main agent 中 用 GPT 5.5, plan 的時候要它 "cheap-model"的 sub-agent 去實作及跑 smoke-test

反正有免費的 model, 你可以先用免費的試試這種配置, 到能用的時候再接入 Codex subscription, provider 選 OpenAI 就可以
https://opencode.ai/docs/providers/#openai
1 day ago
Replied to a topic by bihui 程序员 你们用啥 ai 编程工具可以当生产力?
OpenCode 已經很不錯吧, 我配 Codex 的 subscription, GPT5.5 還挺能打, 要幹重活的話, 用多個 sub-agents 配 Deepseek 去跑吧, 然後讓主 agent 的 GPT 5.5 驗收就成
1 day ago
Replied to a topic by kennylam777 OpenAI Codex 又要重置啦
我的重置了, 比預定早了一天, 算小賺一點

OpenCode 能用 Codex subscriptions 真的很佛心, 先用 GPT5.5 計劃好, 再用其他便宜的模型跑 subagents 去實作及 smoke-test 成功為止, 這樣的分配還真的省下不少 Codex usage
想買 MiMo token plan Lite 但不知道小米模型甚麼樣, 總算能免注冊先試用了
3 days ago
Replied to a topic by lezhou OpenAI 有人用过 antigravity 2.0 了吗? 说说
模型還不錯, 但 harness 很拉, 無論是 agy (CLI)還是 IDE 還是 Agent, 都很容易改錯 file, 然後不管你有沒有 git commit 都給你來一個 git restore

但 Pro 3.1 的 quota 還算可以, 總體來說我用它來幹粗活的

如果多次也修不好, 我試過用 pi.dev + Qwen3.6 27B(本地)也比它好

當然 Codex 是吊打 AG 的, quota 也不少, 只是我 Codex 也常用滿了, 才需要用 AG 及本地 LLM 分擔一下
5 days ago
Replied to a topic by nc Java Java 确实是内存高效的
我也不想用 JVM ,但 ElasticSearch 真的香,好像暫時還沒取代品?
雖然我還有在用 Python, 但 production 的東西我都轉向用 Go 了, 畢竟 compile time 能擋很多東西, strong type 讓 LLM 也能清楚理解數據結構

React 及 Python 的 project, 我都要用 strict type check 及 ruff 及 pyright 一類先檢查再讓 LLM 去宣告做完, 還真的能擋不少低級錯誤
8 days ago
Replied to a topic by Livid Local LLM DiffusionGemma
@BingoXuan Nemotron Nano 還真的不太行, Ultra 出來了好像也不太有性價比, 550B 等級的中國模型比它強。

btw, MTP 在 Coding agent 上加速效果挺明顯的, 我想是算 diff 一類能搬字過紙的任務上猜得到就能過, Gemma 4 31B Q4 在 5090 我試過能跑到最高 90tps, 反而 Qwen 3.6 27B 我都沒仔細看過最高 tps

但真的要快的話, 把 Qwen 3.6 35B 灌下去, tokens 嘩啦嘩啦就跑一堆出來還算爽的, max tps 過 130, 簡單任務也算能用
8 days ago
Replied to a topic by Livid Local LLM DiffusionGemma
@commoccoom 我單張 RTX5090, Q3.6 27B Q5_K_XL 用以上配置能跑 context 102400, 56tps

另外我還有兩張 RTX3090 的 NVLink 能跑 Gemma 4 31B Q8, F16 K/V, ctx 51200, 55-60tps, 但現在要買 3090 及它的 NVLink 應該不容易。

聽說有人在淘寶魔改了 V100 能插 PCIe 及多卡 NVLink, 但這種魔改的東西除非你對 inference 很有經驗, 否則不建議用。也有些人用舊款 AMD MI50 32GB 去組多卡, 但好像 llama.cpp 沒直接支援要用改版的, 也不太建議用。

RTX6000 Pro 的 96GB VRAM 及超大 bandwidth 肯定是單卡最強的民用產品

32GB 的新品好像還有 Intel Arc Pro B70, 比 RTX5090 便宜不少, 但這個 llama.cpp 的支援可能不完整, vllm 倒是有 Intel 自己的版本有維護能配 Qwen 3.5
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2442 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 01:10 · PVG 09:10 · LAX 18:10 · JFK 21:10
♥ Do have faith in what you're doing.