V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  veotax  ›  全部回复第 1 页 / 共 2 页
回复总数  22
1  2  
@janda 向量数据库目前就用的 mysql 这种普通数据库

@wangxiaoer 支持中文分词和全文检索,中英都支持
@popdo @Altairvelvet @bboring 均已修复
@elseswitch 不会,通过 Open AI Embedding API + 最佳向量相似度算法,保证高准确度

@whoosy Casibase 带有启发式的 Splitter 切分算法,能够智能分段。也可以自定义 Splitter 切分算法

@hydyy 可以,Casibase 本身支持多租户,每个组织里的每个用户,都可以有自己的知识库(文档集合)
@dislazy2023 Casibase 可支持 100GB 以上的文档数据( docx 、pptx, pdf 等)作为知识库,采用先进的向量检索算法,对知识进行检索,性能强悍。可以部署试用下
@chenjianyi 这个企业级应用要强很多,功能很细
231 天前
回复了 weishao666 创建的主题 问与答 有提供支持千问的 RAG API 的开源项目么
@weishao666 可以试下 Casibase 开源 RAG 知识库: https://www.v2ex.com/t/1022439
@hwangyi Casibase ( https://github.com/casibase/casibase )是一套开源的企业级基于 Web 的 AI 知识数据库,直接带有 RAG 聊天功能,可以配置不同的大模型 API ,包括你说的:文心一言,智谱,kimi 等,企业级是指支持单点登录、多租户、管理员管理等企业常用功能。GitHub 已达到 2000+ stars ,欢迎体验~
250 天前
回复了 sirz 创建的主题 数据库 向量存储数据库该如何选择?
@sirz Casibase ( https://github.com/casibase/casibase )是一套开源的基于 Web 的 AI 知识数据库,直接带有 RAG 聊天功能,也自带向量数据库。GitHub 已达到 2000+ stars ,欢迎体验~
@lstz 欢迎集成哈
@chlinlearn Casibase 支持上传 PDF 文件作为知识库,然后进行问答(包括总结)
@nunterr 演示站的这个性能问题是由于调用了 OpenAI 接口,API 调用到地球另一边有延迟。你自建,然后用国内模型就速度完全没问题了。主页则是 GitHub Pages ,这个看你的网好不好了
@shiyuu 在数据仓库这个页面(比如: https://demo-admin.casibase.com/stores ),点击对应仓库的“刷新向量”这个按钮,Casibase 会对这个仓库对应的“存储提供商”里的所有文件进行向量索引操作,go 后端会有日志输出。还有其他具体问题可以在 Q 群里提问哈,回答会比较快些~
@shiyuu @NeedforV2 可以看下 Casibase ,支持多租户,每个租户里可以有管理员,去管理普通用户,支持计费,支持各种单点登录: https://v2ex.com/t/1022439
@lointo @ohazyi Casibase 提供了 Embedding Provider 抽象接口,支持各种类型大模型 API 和本地模型的向量化功能。目前实测效果最好的是 OpenAI 的 Embedding V2 以及 V3 模型: https://github.com/casibase/casibase/blob/master/embedding/provider.go
@muchenlou 向量相似度的阈值,这种基本功能都有的,这个放心

@lointo Casibase 内置了多个切词算法,也叫 Split Provider ,可以选择适合代码的切词算法
@boringwheat 架构是前后端分离的,所有功能都有 HTTP API ,包括 Embedding 的 CRUD API

@kneo 经过多位用户反馈和实际测试,采用 GPT-4 的模型,实测效果还是不错的
@fredweili 内置一个向量数据库,为知识数据库提供向量查询功能

@cccb 内置实现的,可以存储在 MySQL 、Postgres 等数据库中,采用余弦距离作为检索算法

@JaguarJack 可能是演示站同时使用的人有点多,API 限制了,可以稍等下再用哈~

@coolair 可以刷新,相比 danswer 的特点包括:后台管理更为强大、支持计算 API 费用、支持国内大模型、开源版支持单点登录 SSO 等
2023-12-29 15:52:25 +08:00
回复了 iorilu 创建的主题 程序员 怎么感觉 v2 这里很少有 ai 或大模型开发相关得讨论啊
可以看看这个 langchain 平台,可以集成多种 GPT 接口:

Casibase:开源的企业级 AI 知识库,让 AI 助手学会所有企业内部文档知识!包括如下特性:

1. 支持 ChatGPT 、Azure OpenAI 、HuggingFace 、OpenRouter 、百度文心一言、讯飞星火、Claude 等众多国内外模型;
2. 支持多种 Embedding 嵌入 API 接口,如 OpenAI Ada, 百度文心一言等;
3. 支持多种文档格式:txt, markdown, docx, pdf 等,支持 PDF 文件智能解析;
4. 支持 AI 小助手通过右下角弹框嵌入到应用网站,进行在线实时聊天,支持聊天会话人工接入;
5. 支持多用户、多租户,支持 Casdoor 单点登录;
6. 所有聊天会话保存日志,管理员可查看、修改,方便审计、计费等操作;
7. 界面语言支持中文、英文等多语种。

Casibase 帮助实现企业内部员工知识分享与积累、智能客服等多种功能场景,也适用于个人知识库场景。目前开源版已达到 GitHub 1500+ stars ,用户好评如潮,欢迎体验~

- GitHub: https://github.com/casibase/casibase
- 官网文档: https://casibase.org
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1422 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 17:11 · PVG 01:11 · LAX 09:11 · JFK 12:11
Developed with CodeLauncher
♥ Do have faith in what you're doing.