Skip to content

Repositório dedicado à análise dos micro dados do ENEM/2021. O Projeto tem por finalidade realizar a limpeza e modelagem dos dados CSV de shape (3389834 x 80), apenas utilizando a liguagem Python e suas bibliotecas, para no fim confeccionar um relatório final.

Notifications You must be signed in to change notification settings

alyssonmontovanelli/analise_microDadosENEM_2021

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Análise dos Micro Dados do ENEM/2021

forthebadge made-with-python

Descrição do Projeto

Esse projeto foi desenvolvido com o intuito de realizar uma análise profunda nos dados brutos do ENEM/2021. Para então traçar um panorama do ensino no país, bem como o perfil dos inscritos.

O relatório com toda informação gerada, auxiliada por diversos gráficos está publicada no meu perfil do medium, através do link abaixo:

Confira o artigo no Medium!

Os micro dados utilizados neste projetos foram baixados no portal de dados abertos do governo federal, o arquivo CSV não está anexado a este repositório, por ser pesado demais, tendo 1.40 GB e shape de (3.383.000 x 77)

Divisão do Projeto

  • Main.py
  • Arquivo 'filtroDados'
  • escolaNota.py
    Arquivo destinado ao tratamento e modelagem dos dados relacionados ao impacto dos tipos de escolas no desempenho
    inscritosGeral.py
    Arquivo destinado ao tratamento e modelagem dos dados relacionados gerais de candidatos
    redacaoNota.py
    Modelagem do panorama geral e status das redações do ENEM, bem como do desempenho dos estudantes
    socio_economico.py
    Modelagem dos dados referente ao fator socioeconomico dos candidatos, e o impacto deste no desempenho final
    utils.py arquivo destinados aos import's, arrays com os filtros das tabelas e dicionários para conversão dos dados.
  • Arquivo 'graphics'
  • ➜ Pasta destinada aos gráficos gerados com matplotlib e seaborn

Análise exploratória

Formato dos dados CSV, shape(3.389.832 x 77):

Descrição da imagem



Criação de arrays com os nomes das colunas necessárias a cada análise:

Descrição da imagem



Já nos arquivos de cada análise, preparei os dados com base na sequência: criação do dataframe utilizando o array correspondente de 'utils.py' / verificação de valores ausentes ou nulos / criação de uma coluna com valores 'Presente' ou 'Eliminado', com base nos valores ausentes das notas de cada disciplina / criação de coluna para a nota média geral de cada inscrito. No caso abaixo, como as quantidades de valores ausentes das colunas "Q00.." são inexpressivas, atribuí valores recorrentes.

Descrição da imagem



Após isso, iniciei as consultas para posterior plotagem e confecção de relatório final, que está postado no Medium:

Descrição da imagem

About

Repositório dedicado à análise dos micro dados do ENEM/2021. O Projeto tem por finalidade realizar a limpeza e modelagem dos dados CSV de shape (3389834 x 80), apenas utilizando a liguagem Python e suas bibliotecas, para no fim confeccionar um relatório final.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages