手头有大量图片,以及一些分类标签的名单列表,需要根据图片找到对应的标签。 比如输入图片 1 ,期望得出标签:风景,夜晚。
我试了一下某大厂的,不能用我提供的标签去分,而是它自己的标签,比如我期望的是“人物,女性”,然而它给出的是“眼睛,鼻子,咖啡”
1
abelyao 203 天前
反过来想,输入图片,问它内容是否为“风景”,是的话你就打上标签“风景”咯,以此类推
|
2
forty OP 如果有几百个基本标签,那 1 个图片得问上几百次?还是说有支持 1 次问全部的?不知道哪家的 api 支持
|
3
mumbler 203 天前
你先给每个标签准备一个标准图片,计算出向量,然后新图片也计算向量,相似度排序看与哪个标签的标准图片最接近,就先粗分到这个标签下,然后用大模型询问复核一下是否与这个标签匹配
|
5
jimrok 203 天前
这个不是做一个微调就行了吗,你用 restnet 50 的模型,改一下分类,载入原来的权重,重新训练一下就行了。问一下 gpt4 ,马上给你一套代码。
|
7
rming 203 天前
用 yolo 微调下
|
8
mightybruce 203 天前
这个图片分类属于计算机视觉的经典任务。
常见的有好几种方案 第一种,图片元数据信息 尤其是 exif 信息,可以直接利用来打上标签,然后就用这个做文本做索引查找, 第二种,这个属于少量自己训练的计算机视觉任务,叫做 image classification 如果你一点都不懂 AI, 不建议自己训练, 百度飞浆 可以看看,easydl 提供了这些 https://ai.baidu.com/easydl/vision/ 第一步需要你把图片做分类, 并完成标注,这个手动的话要耗费很多时间的 自动标注最好借助一些平台来做 第二步 选取训练集, 做有监督的训练学习 第三步 用剩下的测试集 测试效果 |
10
jimrok 203 天前
图像识别已经是深度学习非常成熟的领域,一般都不建议重新训练一个模型,现有的模型选一个速度和准确率都能接受的模型,做一个微调就行,因为现有的模型对图片的纹理特征都完成了比较好的训练,只需要基于现有的权重,重新训练,就能得到特定领域的模型。
|
11
ZnductR0MjHvjRQ3 203 天前
这种服务应该没有,如果你找的是你认为很通用的,但是市面上没有的话,就只能自己微调了,yolo8 很好用
|
12
chenuu 203 天前
azure 有自定义视觉这个能力
|
13
qq316107934 203 天前
试试 zero shot 分类然后算向量相似度,自己卡一个阈值,参考 CLIP 模型
|
15
fjkfwz406 202 天前
clip
|
16
suke119 202 天前
每一种图片 20-40 张,越多模型越准确 准备好分类,然后训练下 最后准确率在 99%以上,前端时间刚给别人定制过一个
|
17
huang86041 202 天前
我使用的图库应用 MT-Photos 里面就包含 AI 识别,而且他也开源了。用的 Chinese-CLIP
省事的话,你直接用他的 docker 部署一个。搜 mt-photos-ai 或者你直接搜 Chinese-CLIP ,自己定制一个。 |
18
andforce 108 天前
目前回复中好像没有开箱即用的,蹲一个
|
19
xiaobai987 102 天前
@suke119 #16 你好 你是用的 YOLO 训练的吗?
|