关于数据集切割再合并的问题 #27

lzJune · 2024-07-15T14:37:55Z

作者您好，想请教您一下，如果是针对一些飞机、小汽车等比较小的目标进行目标检测，将训练集利用tools/data/dota/split/img_split.py切割的小一点（比如原始图像12001200，切割成一堆640640的patch）来进行训练，同时在测试推理时利用mmrotate里的inference_detector_by_patches(model, img, [640], [512], [1.0], 0.1)进行分割后检测再合并结果，这么做是不是比训练一堆12001200,14001400的训练集最后在原图大小的图片上推理效果要好一点？这么做有什么弊端吗？因为飞机、小汽车等都是比较小的目标，不像桥梁这种很大的目标需要很大的上下文信息，不知道我理解的对不对，请作者指教。

yuhongtian17 · 2024-07-15T14:53:53Z

这里其实有一个问题：是把原图放大两倍切割成1024*1024好，还是把原图直接切割成512*512好？我们一般会选用前者，因为在算力允许的前提下，输入图像分辨率越高性能越好。

lzJune · 2024-07-15T15:23:30Z

这里其实有一个问题：是把原图放大两倍切割成10241024好，还是把原图直接切割成512512好？我们一般会选用前者，因为在算力允许的前提下，输入图像分辨率越高性能越好。

您好，没太理解，为什么1200x1200的图片要放大两倍再切成1024x1024呢，不能直接切成1024吗？

yuhongtian17 · 2024-07-15T16:06:04Z

因为图片放大会把检测目标也放大，大目标对于模型更容易学习

lzJune · 2024-07-15T16:08:24Z

因为图片放大会把检测目标也放大，大目标对于模型更容易学习

谢谢您，我明白了，请问有成熟的工具可以将原图无损放大吗？还是就训练的时候resize就行了

yuhongtian17 · 2024-07-15T16:29:35Z

无损放大在图像处理上是无法实现的，有很多尽可能接近无损的办法，包括超分辨率以及图像生成都是计算机视觉的另一些子领域的研究内容。如果只是针对常用数据集的目标检测任务，普通的多尺度方法就足够了。如果针对特定的数据集，根据数据集特点定制数据增强方法会更有效。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于数据集切割再合并的问题 #27

关于数据集切割再合并的问题 #27

lzJune commented Jul 15, 2024

yuhongtian17 commented Jul 15, 2024

lzJune commented Jul 15, 2024

yuhongtian17 commented Jul 15, 2024

lzJune commented Jul 15, 2024 •

edited

Loading

yuhongtian17 commented Jul 15, 2024

关于数据集切割再合并的问题 #27

关于数据集切割再合并的问题 #27

Comments

lzJune commented Jul 15, 2024

yuhongtian17 commented Jul 15, 2024

lzJune commented Jul 15, 2024

yuhongtian17 commented Jul 15, 2024

lzJune commented Jul 15, 2024 • edited Loading

yuhongtian17 commented Jul 15, 2024

lzJune commented Jul 15, 2024 •

edited

Loading