之前在 V 友的帮助下,已经使用 YOLO 训练好了我需要的模型,( https://www.v2ex.com/t/1077539 ) 由于当前收集的图片样本比较少,我想继续增加训练样本以提高分类精度。
但目前遇到几个问题:管理这些训练样本很麻烦。
我现在的操作是,搞一个文件夹收集原始数据,然后统一规划这些数据用于训练。
[原始数据目录] ---->> {使用 python 统一格式、裁剪、缩放大小} --->> [存放到用于训练的新目录]
去重问题,图片来源比较分散,有可能数据会被重复放进 [原始数据目录] 可能是文件名重复(这个还好说),也可能是图片本身是重复的
每次搞到新的图片数据,我得打开 Finder 一层一层找到归类子文件夹放进去 感觉比较繁琐
以上,有没有什么管理软件能让我更轻松管理这些数据集合