zhmouV2 最近的时间轴更新
zhmouV2

zhmouV2

V2EX 第 580402 号会员,加入于 2022-05-08 11:19:45 +08:00
今日活跃度排名 1915
zhmouV2 最近回复了
问个题外话 python 各种打包工具有类似 treeshaking 的机制吗?感觉好像只要 import 就把所有 lib 引入进去了
2 小时 5 分钟前
回复了 zhmouV2 创建的主题 分享发现 DeepSeek 发布了推理模型 R1-Lite-Preview
@cat9life #1 目前还不支持
@forisra 是不是把 MMA 和 WWE 搞混了……WWE 纯纯表演 MMA 起码真打
顺便看了下 ollama 上已经有各种量化版本了 https://ollama.com/library/qwen2.5-coder/tags
14b q2_k 应该是我本地 8G 显存能跑的极限了 有没有兄弟说说效果
Deepseek 确实深有同感 cursor 上用 ds 的 api 问题很严重
9 天前
回复了 WolverineL 创建的主题 程序员 safetensors 模型部署请教
@WolverineL #2 你找到的是画图的模型吗,3G 大小感觉是一个画图的模型,然后 130M 是对应的 Lora ?“Lora”不是某一种模型,而是对模型参数的微调方法,类似于一种“插件”,以画画为例,某个特定的“Lora”模型能够让原来的大模型本体画出之前不认识的角色/画风/概念之类的。建议先搜索一下模型的文件名,知道大概是哪个范围的才能有答案。
10 天前
回复了 WolverineL 创建的主题 程序员 safetensors 模型部署请教
safetensors 不包含模型本身的结构,只有模型参数,你得知道这个模型是啥样的。然后 safetensors 一般还是用 python 部署吧,就是安装一下 pytorch 之类的框架,最后用 gpt 写个示例代码就行。
10 天前
回复了 COW 创建的主题 问与答 国内有哪个 AI 能平替 chatgpt?
@PositionZero #9 DeepSeek 2.5 就是两者合并成一个模型了,api 访问接口还保留应该是出于兼容考虑,新版网页端也没有切换模型的选项了。
多语言好像没做?除了英语都是 404
这个应该是用计时器实现的自动增长吧 浏览器基本上因为性能因素在切到后台的时候计时器执行时间会延长……这游戏一切 tab 页数据就不咋增长了
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3284 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 11:55 · PVG 19:55 · LAX 03:55 · JFK 06:55
Developed with CodeLauncher
♥ Do have faith in what you're doing.