Skip to content
This repository has been archived by the owner on Dec 22, 2024. It is now read-only.
/ ciencia-de-dados Public archive

Disciplina de Ciências de Dados da UNINOVE

License

Notifications You must be signed in to change notification settings

storopoli/ciencia-de-dados

Repository files navigation

Ciência de Dados

CC BY-SA 4.0 Open in Visual Studio Code Hits

Disciplina dos Cursos de Ciências da Computação e afins da UNINOVE.

backprop

Conteúdo

  • Python e Programação Orientada à Objetos
  • Álgebra Linear com NumPy
  • Análise de Dados com pandas
  • Visualização de Dados com pandas, matplotlib e seaborn
  • Machine Learning com Scikit-Learn
  • Redes Neurais com TensorFlow, Keras e PyTorch

Professores

Como usar esse conteúdo?

Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas.

Para configurar um ambiente local:

  1. Clone o repositório do GitHub: git clone https://github.com/storopoli/ciencia-de-dados.git
  2. Acesse o diretório: cd ciencia-de-dados
  3. Instale as bibliotecas necessárias: pip install -r .binder/requirements.txt ou conda env create -f .binder/environment.yml

Notebooks

  • Aula Especial - Curso Rápido de Python para Programadores Binder Open In Colab
  • Aula 0 - Jupyter Notebook Binder Open In Colab
  • Aula 1 - Operadores aritméticos, relacionais e lógicos Binder Open In Colab
  • Aula 2 - Desvio Condicional (IF) Binder Open In Colab
  • Aula 3 - Estruturas de Repetição (FOR e WHILE) Binder Open In Colab
  • Aula 4 - Estruturas de Dados (list e dict) Binder Open In Colab
  • Aula 5 - Funções Binder Open In Colab
  • Aula 5a - Classes e métodos Binder Open In Colab
  • Aula 6 - NumPy e Algebra Linear Binder Open In Colab
  • Aula 7 - pandas Binder Open In Colab
  • Aula 8 - pandas estatística Binder Open In Colab
  • Aula 9 - Gráficos com matplotlib e pandas Binder Open In Colab
  • Aula 10 - Machine Learning com Scikit-Learn Binder Open In Colab
  • Aula 11 - Regressão Linear com Scikit-Learn Binder Open In Colab
  • Aula 12 - Regressão Logística com Scikit-Learn Binder Open In Colab
  • Aula 13 - Support Vector Machines com Scikit-Learn Binder Open In Colab
  • Aula 14 - Árvores de Decisão com Scikit-Learn Binder Open In Colab
  • Aula 15 - Florestas Aleatórias com Scikit-Learn Binder Open In Colab
  • Aula 16 - Análise de Componentes Principais (PCA) com Scikit-Learn Binder Open In Colab
  • Aula 17 - Análise de Agrupamentos (Clusterização) com Scikit-Learn Binder Open In Colab
  • Aula 18a - Redes Neurais com TensorFlow e Keras Binder Open In Colab
  • Aula 18b - Redes Neurais com PyTorch Binder Open In Colab
  • Aula 19 - Redes Neurais Convolucionais com PyTorch Binder Open In Colab

Cheat Sheets

Algumas cheat sheets selecionadas para os temas e ferramentas da disciplina:

Proposta de Avaliação da Disciplina

A avaliação pode ser realizada por meio de trabalho final no qual cada grupo de alunos (3 a 6 integrantes) devem entregar um notebook contendo os seguintes tarefas:

  1. Leitura de dados com pandas
  2. Manipulação e limpeza de dados com pandas
  3. Descritivo e exploração de dados com pandas (groupbys)
  4. Figuras que mostrem insights sobre os dados com pandas e matplotlib
  5. Quebrar os dados em conjunto de treino e conjunto de teste
  6. Treinar um estimador do scikit-learn de aprendizagem supervisionada (regressor ou classificador) no conjunto de treino
  7. Verificar o desempenho do estimador do scikit-learn no conjunto de teste

A entrega pode ser via e-mail, mas é extremamente incentivado para que os alunos criem um repositório no GitHub aberto com um README.md bem escrito que explica o projeto. Isto pode já ser um incentivo para os alunos criarem os seus portfolio de projetos de ciências de dados no GitHub, algo que impulsionaria bastante a carreira deles.

A correção dos trabalhos deverá levar em conta o tamanho dos grupos. Grupos pequenos têm maior tolerância de erros e inconsistências do que grupos com um maior número de integrantes.

Como citar esse conteúdo

Para citar o conteúdo use:

Storopoli & Souza (2020). Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch. Disponível em https://github.com/storopoli/ciencia-de-dados

Ou em formato BibTeX para LaTeX:

@misc{storopolisouza2020cienciadedados,
  author = {Storopoli, Jose and Souza, Edson Melo de},
  title = {Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch},
  url = {https://github.com/storopoli/ciencia-de-dado},
  year = {2020}
}

Trabalhos Finais de Destaque

Licença

Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional (CC BY-SA 4.0).

CC BY-SA 4.0