aoguai

aoguai

V2EX 第 606971 号会员,加入于 2022-12-16 13:38:56 +08:00
今日活跃度排名 24185
根据 aoguai 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
aoguai 最近回复了
37 天前
回复了 buynonsense 创建的主题 程序员 如何自己打包 win 系统镜像?
之前刚好有想法,找到了这个教程系列

2021 年 WIN10 20H2(2009)系统封装视频教程(一)定制母盘_哔哩哔哩_bilibili
https://www.bilibili.com/video/BV11K411M73e/
40 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
一个简单的个人思路是:

如果使用二分类方案的话,用白名单关键词+自己整理一些特定的正则表达式匹配。对上即是正样本。
跑一遍没对上的,全归为负样本。
然后就可以用传统方法开始训练了,传统方法对硬件要求不高,没 GPU 都没问题。

然后拿模型开始验证即可,效果不好就调参,漫长的调参,调整白名单关键词+自己整理一些特定的正则表达式匹配,直到满意为止。

(另外同求数据集
40 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
hrwhisper/SpamMessage: 中文垃圾短信识别(手写分类器)
https://github.com/hrwhisper/SpamMessage

junxincai/ChineseTextClassification: 自然语言处理之中文文本分类(以垃圾短信识别为例)
https://github.com/junxincai/ChineseTextClassification

单纯要识别垃圾短信/正常短信,就是个二分类的问题,使用传统方法即可。

如果要多标签的话就是个体力活了,因为您这个应该是没有任何标签的。你首先需要分类打标签,才能使用机器学习也好大模型也好才能训练。

或者干脆分类也交给机器学习(AI)来搞定,这种情况下建议像楼上说的那样先聚类,挑选聚类中心的一部分短信来用于训练识别某类短信,然后再用训练好的模型重新给短信打标签,再训练。

最简单的方法就是二分类+白名单关键词。
88 天前
回复了 aoguai 创建的主题 分享创造 [开源] LiYing 证件照自动处理程序
@Rrrrrr 整合包可以直接用
GPT 完全不能胜任是错误的。

或许你应该学习一下 Prompt 该如何编写。

在这里我给出一个初步 Prompt:
```
我需要快速转化为 HTML 。以下是我的需求和背景:

**背景:**
我手头有一些零零散散的工作,都是用不同的 Python 脚本完成的,例如 PDF 转换、分割、合并等操作。我已经将这些脚本整合到一个脚本中,可以通过命令行调用,但设置路径和参数等操作还是有点繁琐。因此,我想开发一个网页版应用,通过点击按钮来执行不同的脚本,以简化工作流程。

**想法:**
网页上放置一些按钮,点击不同按钮执行不同的脚本。这应该不难,我用 Flask 实现了基本功能:页面上有两个按钮,可以上传和下载文件。

**具体需求:**
- 我希望页面有一个 header ,上面有几个按钮,中间是一些文本和按钮的美观排列。
- 一个简单的页面设计,只能使用 HTML 和 CSS ,不需要 Vue/React 等复杂框架。
- 请你参考我上传是图片实现

请给出完整的代码。
```

输出效果如下:

https://files.catbox.moe/xd1dzp.png

https://files.catbox.moe/n8s8j9.png

这只是一个初步 Prompt 在此基础上你可以继续优化 Prompt ,甚至可以将前端页面代码全部丢给他,让它在此基础上继续完善。
93 天前
回复了 aoguai 创建的主题 分享创造 [开源] LiYing 证件照自动处理程序
@Tubbs 该项目的制作初衷和项目名称来源于帮助我的父母更轻松的完成他们的工作
93 天前
回复了 aoguai 创建的主题 分享创造 [开源] LiYing 证件照自动处理程序
@Rrrrrr 后期有打算,主要是初版实现了一下美颜效果不太好而且对机器要求有点高,就暂时没搞。
@v2tudnew 好像不能找出相同文件的不同位置,只保留一个,其他位置创建链接并指向这剩余的一个
@tool2dx 主要是可能还要考虑到需要创建同名链接问题,而且确实没看到有满足需求的软件
好的好的,谢谢各位。
看了 @NoOneNoBody 的建议,深思熟虑感觉确实管理的难度远远高于腾出空间获得的优化,还是放弃了
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3346 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 10:54 · PVG 18:54 · LAX 02:54 · JFK 05:54
Developed with CodeLauncher
♥ Do have faith in what you're doing.