Skip to content

Проект по классифификации изображений симпсонов. В проекте использовались архитектуры CNN, такие как: VGG16, EfiicientNet_v2.

Notifications You must be signed in to change notification settings

zdyaknoivl/classification-of-simpsons-images

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 

Repository files navigation

Проект по классификации изображений симпсонов

Данный проект посвящен разработке системы классификации изображений симпсонов с использованием глубоких нейронных сетей и технологии Transfer Learning. Для обучения моделей использовались архитектуры VGG и EfficientNet_v2. Учитывая ограниченный размер доступного датасета, применялась аугментация данных для улучшения обобщающей способности моделей.

Архитектуры нейросетей

В проекте использовались следующие архитектуры нейронных сетей:

  1. VGG (VGG16): VGG - это сверточная нейронная сеть, изначально разработанная для классификации изображений. VGG16 - одна из его вариаций, состоящая из 16 слоев, включая сверточные, пулинговые и полносвязные слои. Она характеризуется глубокой архитектурой и хорошо зарекомендовала себя в задачах классификации.
  2. EfficientNet_v2: EfficientNet_v2 - это семейство эффективных архитектур нейронных сетей, основанных на принципе скейлинга коэффициентов глубины, ширины и разрешения модели. Они достигают высокой производительности с меньшим количеством параметров. В данном проекте использовалась одна из версий EfficientNet_v2, а именно EfficientNet_v2-B0.

Описание процесса

  1. Подготовка данных: Для обучения и оценки производительности моделей был использован набор данных, содержащий изображения персонажей из сериала "Симпсоны". Датасет был разделен на обучающую, валидационную и тестовую выборки. Для повышения разнообразия исходных данных, применялась аугментация данных, такая как случайные повороты, изменение масштаба и отражение.
  2. Разработка моделей: Были реализованы модели на основе архитектур VGG и EfficientNet_v2 с использованием фреймворка PyTorch. Вместо обучения моделей с нуля, было применено Transfer Learning, при котором предварительно обученные веса моделей на больших наборах данных использовались как инициализация для новых моделей.
  3. Обучение и настройка моделей: Обучение моделей производилось на обучающей выборке с использованием оптимизации градиентным спуском и функции потерь, cross-entropy loss. Гиперпараметры моделей и процесса обучения были настроены для достижения наилучшей производительности на валидационной выборке.
  4. Оценка производительности: После обучения моделей была проведена оценка их производительности на тестовой выборке. F1-мера, была измерены для каждой модели.
  5. Развертывание и использование: Лучшая модель может быть развернута для использования в реальных условиях, где она может классифицировать изображения симпсонов и помочь в различных задачах, связанных с этими данными.

Результаты

Результаты проекта включают обученные модели на основе архитектур VGG и EfficientNet_v2 для классификации изображений симпсонов. Они были оценены и сравнены по метрикам производительности.

About

Проект по классифификации изображений симпсонов. В проекте использовались архитектуры CNN, такие как: VGG16, EfiicientNet_v2.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published