Feito com Jupyter Notebook e a ferramenta Orange
Minhas sugestão é baixar o Ambiente de desenvolvimento Anaconda (https://www.anaconda.com/products/individual#Downloads)
- Limpeza e tratamento de dados
- Aplicação de algoritmo de clusterização Kmeans com Sci-kit Learn
- Aplicação de algoritmo de mineração de regras de associação com Orange ou bilioteca apyori
Primeiro Precisa baixar a base dos microdados do ENEM em http://inep.gov.br/microdados
Atualizar a localização do arquivo na variável path do notebook Leitura Microdados Enem
- Criar pasta Dados
- Criar pasta Gráficos
A partir daí executar os notebooks na seguinte ordem:
- Leitura Microdados Enem
- TratandoDadosEnem
- TratandoDadosEnem_Apriori
- Clusterização
- Executar o Worlflow do Orange
- Resultados (é possível executar esse Jupyter diretamente pois o arquivo agrupadas_notas_normalizadoQuantil.csv esta versionado)
Para gerar as regras de associação, usar o programa Orange na base resultante da clusterização (agrupadas_notas_normalizadoQuantil.csv)
-
Abrir no programa Orange o workflow AnaliseCluster_NOTAS
-
Carregar o arquivo agrupadas_notas_normalizadoQuantil.csv
-
Abrir o widget Association Rules:
- Definir os parâmetros:
- Support: 20%
- Confidence: 70%
(esses foram os valores usados para o artigo, pode mudar conforme desejar)