Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于数据集切割再合并的问题 #27

Open
lzJune opened this issue Jul 15, 2024 · 5 comments
Open

关于数据集切割再合并的问题 #27

lzJune opened this issue Jul 15, 2024 · 5 comments

Comments

@lzJune
Copy link

lzJune commented Jul 15, 2024

作者您好,想请教您一下,如果是针对一些飞机、小汽车等比较小的目标进行目标检测,将训练集利用tools/data/dota/split/img_split.py切割的小一点(比如原始图像12001200,切割成一堆640640的patch)来进行训练,同时在测试推理时利用mmrotate里的inference_detector_by_patches(model, img, [640], [512], [1.0], 0.1)进行分割后检测再合并结果,这么做是不是比训练一堆12001200,14001400的训练集最后在原图大小的图片上推理效果要好一点?这么做有什么弊端吗?因为飞机、小汽车等都是比较小的目标,不像桥梁这种很大的目标需要很大的上下文信息,不知道我理解的对不对,请作者指教。

@yuhongtian17
Copy link
Owner

这里其实有一个问题:是把原图放大两倍切割成1024*1024好,还是把原图直接切割成512*512好?我们一般会选用前者,因为在算力允许的前提下,输入图像分辨率越高性能越好。

@lzJune
Copy link
Author

lzJune commented Jul 15, 2024

这里其实有一个问题:是把原图放大两倍切割成10241024好,还是把原图直接切割成512512好?我们一般会选用前者,因为在算力允许的前提下,输入图像分辨率越高性能越好。

您好,没太理解,为什么1200x1200的图片要放大两倍再切成1024x1024呢,不能直接切成1024吗?

@yuhongtian17
Copy link
Owner

因为图片放大会把检测目标也放大,大目标对于模型更容易学习

@lzJune
Copy link
Author

lzJune commented Jul 15, 2024

因为图片放大会把检测目标也放大,大目标对于模型更容易学习

谢谢您,我明白了,请问有成熟的工具可以将原图无损放大吗?还是就训练的时候resize就行了

@yuhongtian17
Copy link
Owner

无损放大在图像处理上是无法实现的,有很多尽可能接近无损的办法,包括超分辨率以及图像生成都是计算机视觉的另一些子领域的研究内容。如果只是针对常用数据集的目标检测任务,普通的多尺度方法就足够了。如果针对特定的数据集,根据数据集特点定制数据增强方法会更有效。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants