frandy

frandy

小小的我,有个大大的梦想
🏢  软件工程师
V2EX 第 78116 号会员,加入于 2014-10-22 18:36:17 +08:00
今日活跃度排名 13834
根据 frandy 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
frandy 最近回复了
巧了,仅一个月就在弄这样的产品,首先罗列下相关的开源项目
https://github.com/tencentmusic/supersonic 腾讯音乐出的 chatbi,结合 llm 和 bi 能力,看完源码,你会发现,是先通过传统的 bi 进行语义匹配,然后仍给 llm 做处理,减少模型的幻觉产生
https://github.com/eosphoros-ai/DB-GPT 核心是它的提示词,核心是它的提示词,核心是它的提示词,可以得到图表
https://github.com/CodePhiliaX/Chat2DB 开源版就是挂羊头卖狗肉,广告做的好
好了,说了那么多,就是 Text2Sql 的本质就是大模型自身的能力,
我们能做的是
1 、在喂给大模型之前,做一些语义处理,然后大模型生成 sql 之后,对 sql 进行校正,这一块,又可以让大模型来校正,反复迭代
2 、表结构不要有歧义性,关联的 id 等需要明确表明是哪个表的哪个字段,这样处理之后,32b 参数量的模型,至少能准确生成 2-3 张表关联的 sql 语句
3 、引入 rag,可以把 ddl 的信息做成 rag ,然后先进行相似度匹配,然后得到对应的相关表结构信息,最后生成 sql.
4 、切分场景,不要一把梭把所有表结构信息都仍给大模型,大模型也扛不住,尽量切分场景,场景的识别也可以依靠大模型,专业术语叫意图识别
5 、指令型的大模型比推理型的速度要高,但是出的结果不一定准确,可以结合使用。
至于 mcp,emm,别太神话。追根到对应的某个 mcp 服务器的相关源码,其实还是上面那些
以上就是我近一个月开发此类产品的最大体会。
ps:这种类型的需求,领导是最喜欢的,但是,mmp 的这种需求,你必须得知道你的数据库里有哪些信息的数据,所以就等于领导要有提问的艺术,而这,是领导缺乏的。so,做此类需求,只能尽人事,听天命,懂甩锅,会报命。
31 天前
回复了 Amose2024 创建的主题 职场话题 是我老了,还是新同事很牛?
Talk is cheap, Show me the code.
这周会很忙,毕竟 ds 天天开源,哈哈哈哈
56 天前
回复了 iorilu 创建的主题 程序员 下载 huggingface 大模型有什么好方法吗
@frandy #21 迅雷没问题
56 天前
回复了 iorilu 创建的主题 程序员 下载 huggingface 大模型有什么好方法吗
之前因为这个问题写了个脚本,集成 aria2 还有点问题,没问题
https://github.com/readmagic/hx
希望能帮到你
87 天前
回复了 huguadao 创建的主题 NAS 我的影视私库折腾记录
我的省事方案:
操作系统:windows 10
家庭影院:jellyfin
下载器: 迅雷远程下载
内网穿透:zerotier
家用路由器:斐讯 k3+梅林
146 天前
回复了 DanLi 创建的主题 Java 有谁的公司已经用 WebFlux 替换了 SpringMVC 吗
在 2020 年左右用过一段时间反应式编程,不推荐用来写业务,复杂的页面,跟意大利面条一样,各种 flatmap,一个简单的获取都需要花很大功夫来弄,当时用的是还是 rxjava,就很难受.最后那个项目维护太复杂了.
之后归纳总结,考虑了下适用的场景,反应式编程在前端可能更合适,防止页面或者窗口阻塞,然后流式的传输,中间做桥进行转接也不错,类似楼上说的网关.
早前流行 FP,现在是 OOP+FP,怎么好维护怎么来,因为现实业务没有纯函数,而且 FP 里面好多概念无法理解,比如函子(Functor)、适用函子(Applicative)、单子(Monad),一听名词就觉得好高大上,哈哈哈哈哈
359 天前
回复了 feather12315 创建的主题 分享发现 AI 是个好东西,但没想想得那么好
了解一下 AI agent
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1131 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 23:34 · PVG 07:34 · LAX 16:34 · JFK 19:34
Developed with CodeLauncher
♥ Do have faith in what you're doing.