V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ryanwong97  ›  全部回复第 1 页 / 共 1 页
回复总数  4
正在搞这块,可以简单回答下。

首先 anythingLLM 这个是娱乐级的,个人玩玩可以,用在企业级不合适。

目前企业搞知识库,基本上就 2 个途径,第一个是自己从零开始撸,这个也没有想象得难,比较 langchain 和 llamaindex 把玩法已经早就放出来了。当然目前的显著趋势是去 langchain 化。第二个就是基于目前现有的开源框架,比如 dify 、ragflow 、bisheng 等。这种的优势是不用从零开始,上手会很快,如果要求不高甚至是开箱即用;弊端是如果需求比较个性化,那么二开是难免的。也就很考验开发团队的工程能力了。

当然,这些都是工具,企业搞知识库,很重要的一点是你的私有数据到底已经整理得怎么样了。很多传统企业或者传统业务部门,数字化都还没完全实现,信息传递还在重度依赖纸张和萝卜章,想越过数字化直接拥抱 AI 化,基本上是痴人说梦。凑个热闹写个通稿可以,但实际效果只能说冷热自知。
@yb2313 除了文档解析比较好,其他都比较一般。不过文档解析是 RAG 的重要一环,不少业务场景对这块要求挺高。
@hwangyi 之前大致算了一下 kimi 的 API 接入方式的使用费用。moonshot-128k 现在的价格,是 6 分钱每千 token ,按照 50 人规模团队测算,假设每人每天对话 20 轮,一个月下来(就工作日 22 天)的话,费用接近一张 4090 的钱。
跟 LZ 类似的需求,现在主力在用 Dify ,同时还在备选观望 Bisheng 和 RAGFlow ,这俩还没部署,实际功能和体验尚不明确。

目前的主力解决方案是:框架用 Dify ,主要选择理由是完成度高,开箱即用。LLM 本地部署了 Qwen1.5-14b (基本上目前国产开源 10b 级别里面中文对话场景最强),也有 API 接入方式的 LLM ,比如 moonshot 。对智谱、百川和 yi 在实际任务中的表现比较失望。为了 RAG 任务本地还部了 embedding 模型和 rerank 模型。

知识库功能那块,Dify 目前的能力勉强算“能用”,自动分块基本上都是切稀碎,想要召回命中效果好,重新编辑 chunk 是必须的。而且对复杂文档的解析非常一般,这也是目前在看 RAGFlow 的原因(文档解析功能很牛,但整体框架的完成度太低)。

我这边的需求不仅仅是企业私有知识库,还需要对接企业数据库( MySQL )以实现 Chat to DB 的功能,目前还在研究解决方案摸索中。如果大家有合适的解决方案,也请推荐一下。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3431 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 00:40 · PVG 08:40 · LAX 17:40 · JFK 20:40
Developed with CodeLauncher
♥ Do have faith in what you're doing.