Skip to content
This repository has been archived by the owner on Apr 10, 2023. It is now read-only.

Latest commit

 

History

History

sprint1

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 

Основы Python и анализа данных

Знакомство с языком программирования Python, библиотекой Pandas, а также средой программирования Jupyter. Основные концепции анализа данных, чем занимаются аналитики и специалисты по Data Science.

Результат

+1 проект в портфолио

Исследование: Музыка больших городов

Яндекс.Музыка — это крупный продукт с огромным запасом данных для исследований. Команды таких сервисов для поддержания интереса к продукту и привлечения новых пользователей часто проводят исследования про пользователей. Чтобы удержать клиентов и привлечь новых, сделать бренд более узнаваемым, команда сервиса проводит исследования аудитории, и публикует интересные результаты. Например, интересно сравнить тексты, сочинённые нейросетью, с произведениями настоящих рэперов.

Есть исследование, которое напоминает наше: о музыкальных предпочтениях в разных городах России.

Итак, вопрос вам: как музыка, которая звучит по дороге на работу в понедельник утром, отличается от той, что играет в среду или в конце рабочей недели? Возьмите данные для Москвы и Петербурга. Сравните, что и в каком режиме слушают их жители.

План исследования

  1. Получение данных. Прочитайте данные, ознакомьтесь с ними.
  2. Предобработка данных. Избавьтесь от дубликатов, проблем с названиями столбцов и пропусками.
  3. Анализ данных. Ответьте на основные вопросы исследования, подготовьте отчётную таблицу или опишите полученный результат.
  4. Подведение итогов. Просмотрите выполненную работу и сформулируйте выводы.