Releases · naver-ai/vidt

There are ViDT pre-trained models for 50 and 150 epochs with different model sizes (from nano to base).
We activated auxiliary decoding loss and iterative box refinement.

Assets 18

05 Nov 06:10

songhwanjun

v0.1-swin

d1bab91

Swin-nano pre-trained on ImageNet-1K

This is a pre-trained model called Swin-nano. The accuracy was 74.9% when trained for 300 epochs.

Assets 3

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: naver-ai/vidt

ViDT+ Optimized

ViDT+ models

ViDT models trained with distillation

ViDT models trained for 50 and 150 epochs

Swin-nano pre-trained on ImageNet-1K