Skip to content

Latest commit

 

History

History
8 lines (7 loc) · 1.12 KB

README.md

File metadata and controls

8 lines (7 loc) · 1.12 KB

Описание

В данном репозитории представлено решение задачи на хакатоне Leaders of Digital 2023. Задача №5 "Поиск одинаковых товаров на маркетплейсе". Реализована сиамская архитектура нейросети. Предтренированный на русских текстах BERT использовался для получения эмбеддингов. Классификация выполнялясь полносвязной нейронной сетью. Также были выполнены: генерация признаков из имеющихся данных. Обучение RandomForest, а также Randomized Search для CatBoost, что позволило повысить целевую метрику при решении задачи.

Запуск:

  1. Создайте virtual environment с python 3.11
  2. Установите зависимости: pip install -r requirements.txt
  3. Для выполнения ноутбуков вам понадобится датасет