mumu9

V2EX 第 609620 号会员，加入于 2023-01-07 17:33:40 +08:00

mumu9 提问技术话题好玩工作信息交易信息城市相关

根据 mumu9 的设置，主题列表被隐藏

二手交易相关的信息，包括已关闭的交易，不会被隐藏

mumu9 最近回复了

2024-11-14 14:07:11 +08:00

回复了 ysicing 创建的主题 › 程序员 › Github Copilot 开启 Anthropic Claude 3.5 Sonnet 好像没生效，有生效的么

Sonnet 和请求 copilot 的位置有关，你默认把 copilot 的 API 路由美区访问就能稳定使用了

2024-10-08 11:24:28 +08:00

回复了 isno 创建的主题 › 程序员 › 我写了一本拙作，求一波读感/建议

感谢大佬分享，star 再看

2024-09-23 13:46:04 +08:00

回复了 Suinn 创建的主题 › 问与答 › 关于 Rag 本地知识库落地的问题求助

@cheava 尝试下来的效果就是成本和收益不成比例吧😂。我个人的建议是不要在 RAG 上花费太多时间去尝试，收益很。目前看到的各种框架都属于指标战神，没有真正意义上能用于落地的。

2024-09-22 13:28:06 +08:00

回复了 Suinn 创建的主题 › 问与答 › 关于 Rag 本地知识库落地的问题求助

@Suinn 内容压缩简单点就是提取文件中的摘要，将这些摘要作为新的 chunk ，这样就不会出现超过 chunk 长度限制，也能最大限度保留上下文。我们之前的做法是让有需求的同事明确指出需要关注的主题和内容，然后根据他们的反馈，依赖 LLM 去确定文档中的关键信息，但可能不太适合你说描述的场景，因为交易单中的信息可能比较密集。
楼下 v 友的意思应该是让你们先把交易单中的信息比如提取出交易编号、金额、日期等关键信息，存储后进行检索。这个思路我们之前也做过，不过是依赖数据库，利用 function call 去处理查询的参数，然后在存储结构化内容的数据库中执行 SQL 生成响应。
另外的一个做法是你可以尝试使用比如 neo4j 这类的图数据库，将基于交易编号、金额、客户信息等实体进行关联和存储。这方面你可以参考 graphRAG ，不过不算太推荐就是了😂。

2024-09-21 16:39:50 +08:00

回复了 Suinn 创建的主题 › 问与答 › 关于 Rag 本地知识库落地的问题求助

不太清楚你的“交易单”具体包含哪些信息。从你的描述看，更需要的是知识图谱。交易编号作为一个实体，金额和其他文件内容属于实体信息。对 Query 部分进行 NER 后，根据实体进行检索。
如果非用 RAG 不可，对文件内容进行内容压缩后作为 chunk 可能是更有效的方法。

» mumu9 创建的更多回复