想找一个文件找了十分钟终于找到!于是很气愤,准备整理、梳理一下。
初步排查了下目前设备里的所有文件,发现自己的文件管理做的可以说是非常混乱,什么规则都有!
大家都是怎么解决这些需求(进行文件分类整理存放)的呢?
目前我个人文件大概 4TB 左右 很少访问的文件大概 20TB 总阵列大小 200TB 左右 云端总空间 200TB 左右
影视资源 100TB 左右 大都可以扔 纯粹是因为硬盘比较大还没扔
1
tyzandhr 2023-04-15 00:36:46 +08:00 via Android 1
感觉题主像是囤囤鼠……
凡是能在网上找到的资源我是不可能存的,最多存个书签。我的个人文件,重要的证书什么的就多个云盘备份,不太重要的就 onedrive 。 拍的照片上传前我都会审核一下,我觉得我这辈子再也不会看到它第二次的就直接删掉。 |
2
Light1226 2023-04-15 05:45:18 +08:00 1
感觉题主像是囤囤鼠+1
真正重要的东西只有一些证件的扫描件,200M 空间足以。 其它的东西,什么时候需要,去下载,用完了就删掉。 |
3
Light1226 2023-04-15 05:45:52 +08:00 1
感觉题主像是囤囤鼠+1
真正重要的东西只有一些证件、重要文件的扫描件,200M 空间足以。 其它的东西,什么时候需要,去下载,用完了就删掉。 |
4
sakisaki 2023-04-15 06:27:40 +08:00 via Android 1
有同样的困扰
|
5
ltkun 2023-04-15 06:45:26 +08:00 via Android 1
虽然成本很高 但是其实是必须的 认为不需要的观点只是还没有意识到自建存储的必要性 四年前入门的 NAS 目前硬盘容量 100t 以上 机箱三五个
|
6
kkwa56188 2023-04-15 06:58:27 +08:00 1
十分钟找到了就好.
把那一套套的需求和疑问整理一遍都不止十分钟了, 更别说日常实践了. 人生苦短, 时间留给更重要的事情吧. |
7
SuperMild 2023-04-15 08:17:22 +08:00 1
我做了一个文件管理工具, 基本的功能和想法是这样的:
1. 分类问题, 我用了纯标签管理, 没有文件夹, 并且规定每个文件必须至少有两个标签, 基于这样的基本理念, 做了一个很强大的标签系统, 详细说明看这里: https://github.com/ahui2016/localtags/wiki 2. 版本问题, 我允许软件里有同名文件, 并且只要上传同名文件就自动生产备份, 用上传时间区分版本. 3. 文件内容重复: 不允许, 软件里每一个文件都是唯一的. 4. 校验(文件完整性), 用 sqlite 记录了每个文件的 sha256, 并且可以自动修复文件(利用备份功能) 另外, 每次触发自动校验, 只校验一小部分文件, 因此用户感觉不到校验卡顿. 5. 备份功能: 采用单向同步备份. 因为双向备份很容易出错, 并且用户使用时还要逐一选中覆盖方向. 使用单向备份后就方便了, 用户只需要点击备份按钮, 剩下的全自动, 不用处理冲突问题. 6. 由于有备份功能, 又有自动的文件完整性校验, 因此我认为备份有两份就行, 两个硬盘同时坏掉的可能性已经很低了. 另外, 我没有做云盘备份功能, 只做了本地备份. 这个工具的最大特点是标签系统, 很强大, 可以让用户对文件分类有很充分的掌控. 但是也有很多缺点, 比如要求每个文件至少有两个标签, 如果不这样要求, 标签系统的威力就无法体现, 但这样要求, 使用时的心智消耗实在太大. ============ 上面说的工具我自用了几年, 最近在做一个新版(还没完成), 抛弃了标签系统, 另外新增了加密功能. 新版允许用户新建多个仓库(文件夹), 每个仓库可以选择是公开或加密, 上传到加密仓库的文件会自动加密. |
8
vitaminx 2023-04-15 08:55:10 +08:00 via Android 1
OP 这情况还好了!我现在想整理都啃不动!大杂烩几百 G 😂
|
9
totoro625 2023-04-15 09:35:30 +08:00 1
同样的困惑+1 ,我做的没有楼主那么详细,管理的比较混乱,但是数据比较少,不到 1T
1.分类 按自己的使用习惯,工作文件分项目,项目版本手动加日期,旧版资料扔到一个 old 文件夹 具体细节详见: https://imgur.com/a/cOq3ggP 2.去重、归档、快照 工作目录全是重复的副本,去重主要在备份的时候去重 主要用 Restic 版本控制、去重、归档备份,数据备份主要备份这个 其次通过 Seafile 同步数据,自带去重、文件历史记录 最后兜底的是 Windows 自带文件历史记录功能+syncback 带回收站+WPS 数据同步+Drive SnapShot 3.321 备份 公司电脑 SSD+HDD 公司 NAS ( J5105 PVE ) 2.5G 本地; 200mbps Tailscale ; FRP 腾讯云上海 8M + Oracle 自己家 NAS ( J4125 PVE + DS120J ) 1G 本地; 100mbps NAT1 打洞 /IPv6 ; 200mbps Tailscale 老家 NAS (树莓派+移动硬盘),计划加一个正经 NAS 公有云:onedrive 等,主要通过自己家 NAS 上传 4.分享、反向分享 均为公司 NAS 上的 Seafile 5.问题 Seafile 所在 NAS 扩展性不佳,没有做快照备份,哪天炸了就没了 文件存储重心都在公司,BOOM 可能性较大 家庭无 IPV4 公网(只有随机的端口),办公无 IPv6 公网,套 CDN 价格太高 |
10
Licsber OP @tyzandhr #1 囤囤鼠没办法 就是喜欢收集一些东西 而且不信任互联网 说真的一些东西必须在本地 自己可管才觉得安心
@Light1226 #2 证件扫描件 原件我都有备份 还专门找了档案盒来存放 另外我的 Scan 扫描文件夹里还放了购物小票啥的扫描件 想把经手的一切东西都电子化 然后不重要的物理扔掉 这样在超市买东西的时候很方便查看 X 月前的小票看价格 @sakisaki #4 已经被困扰很久了 主要是存储空间日益增长 有很多时候在挪来挪去 很希望更大的带宽可以更快完成一些备份到云端 或者互相传文件的操作 所以折腾 nas 的同时也在折腾软路由 对多拨+负载均衡啥的都很在意 @ltkun #5 怕的是虽然花了很高的成本 可是效率还是很低 只保证安全性那是没意义的 数据是使用才有价值 全部存起来然后使用效率很低违背了初衷 @kkwa56188 #6 人生苦短 但上班时候做 PPT 偶尔记得一些素材找不到了会很难受 然后郁闷一整天 所以我又建了一个素材.pptx 的 PPT 专门把觉得以后可能用到的单页收集起来 可是又存在这个文件大小太大 检索效率低 多端不统一的问题 @SuperMild #7 有想过去掉传统的目录-文件式文件管理 但是标签式对我来说还是有点乱 现在我只有种子和 paperless-ngx 上面的文档是有标签整理的 其他的依然是传统结构 并且重复的文件到处都是这个问题 我在尝试使用链接来解决 目前主要是 win 上用 在尝试用域名 lnk 的方式建快捷方式 指向一个统一的 smb 存储地址 @vitaminx #8 几百 G 的个人文件 感觉分类都不好分类 主要是一个文件夹下的文件也有重要性排行 比如班级临时收集的表格文件 很难和班级通讯录一样归类在班级文件夹里 呜呜呜 太难了 虽然说事情的复杂度是与生俱来的 可是实在找不到方法来控制复杂度 现在好多新文件我都是按时间序整理 如 230415-XXX 看起来更有顺序了 可是检索效率还是很低 文件都如此 就更不用说图片的检索效率了 |
11
Licsber OP @totoro625 #9 我梳理了下我主要的需求点目前可以先做选择性同步 然后干脆就不管文件大小和类型 全部按项目来分类 目前主要是 linux 的 smb 服务器 所以 mklink 好像没法用 只能是 ln -s 然后 smb 开启 follow links
我现有的方案把同步文件夹全量同步 然后文件大小比较大的都会独立出去单独编号 在同步的文件夹里引用那个编号 导致了文件两边管理比较混乱 不太容易进行归档 (归档还是要同时把同步文件夹里和它引用的如媒体文件放在一个文件夹最终归档 |
12
SuperMild 2023-04-15 09:56:05 +08:00 1
@Licsber 我现在新版抛弃了标签系统, 然后每个文件增加两个属性: 备注 和 关键词.
其中关键词并没有做特殊处理, 就是一个普通的字符串, 事实上其实是备注 1, 备注 2 两个属性, 都是为了有个地方可以写备注, 方便日后搜索. 这样, 新文件如果文件名不够信息量的, 可以在备注里补充信息. 旧文件就每个周末找半个小时到一个小时, 一边听音乐一边整理, 也是一种放松. |
13
Licsber OP @SuperMild #12 确实文件的文件名有时候表达不了所有信息 需要增加额外的元信息
hhhh 确实 我现在就在整理文件 得周期性的维护整理 不然还是乱 |
14
wemac 2023-04-15 13:50:56 +08:00
有同样的困扰+1
|
16
sleepingdog 2023-04-15 20:28:14 +08:00 1
我今天也提了类似的问题,有两位老哥给了回答你参考下~
https://www.v2ex.com/t/932774#reply2 |
17
sakisaki 2023-04-15 22:45:28 +08:00 via Android 1
我的做法和楼主类似。
找文件靠翻文件夹,找不到只能搜索。 图片去重的话可以依靠专门的软件对比相似度。 现在的互联网下仓鼠党应该是优势,因为网上的东西不知道什么时候就被删了。 |
18
Licsber OP @sleepingdog #16 已部署 seafile pro 准备试用一段时间
@sakisaki #17 翻文件夹主要问题就是不正交 但是正交了会导致使用效率下降 hhh 也是取舍 仓鼠是没办法的 丢东西给我的难受更大 那就只能仓鼠 |
19
qztx 2023-04-16 09:29:38 +08:00 via Android
在自己电脑上可以用 listary 和 everything 快速找文件,双击 ctrl 就能搜索
|
20
ellermister 252 天前
@Licsber
> 怕的是虽然花了很高的成本 可是效率还是很低 只保证安全性那是没意义的 数据是使用才有价值 全部存起来然后使用效率很低违背了初衷 非常认同这句话。 我也是囤囤鼠,没有你做的那么细致,但是和你遇到了同样的问题;各种分类规则都有,导致找不到文件。有时候像一股脑去给他分类清楚,搞一天也没分类几个文件…… 另外比起安全性同步灾备我没有那么多需求,很多文件都是我自己受不了给他 一股脑删除了。 我更希望有基于 Linux/docker 运行 的类似 everything 的程序,即使分类错误也可以轻松让我根据模糊搜索找到想要的文件。但目前似乎没有,你有经验吗? |
21
Licsber OP @ellermister #20 目前检索效率还算可以
按照类别/获取途径分类 然后不便分类的东西全按照时间序放着 找的时候基本能命中第一个分类 然后事件可以命中后者 比如 某某采购项目 就会放在 架构角色/部门名称/采购/2024/240101-XXX 项目采购/Timeline/240102-立项系统信息 这里 然后就比较好搜索 兜底途径是 find . -name '*' 再兜底途径是 QNAP 自带的 Qsirch |