Curso On-line de

DATA SCIENCE

O Curso

Em um cenário de disputa de mercado, os dados tornaram-se um ativo importante das empresas. Afinal, eles direcionam o processo de tomada de decisão dos diversos setores de uma corporação: da fabricação ao planejamento; das estratégias de venda à distribuição. Esse contexto passou a demandar das empresas um novo tipo de profissional, que une habilidades em programação, estatística, visão analítica, business e design: o cientista de dados.

No curso de Data Science da ESEG, os estudantes aprenderão a aplicar os métodos estatísticos e computacionais mais recentes em bases de dados complexas, com o objetivo de identificar padrões, gerar insights e realizar projeções.

Com aulas no modelo EAD e interativas projetadas por profissionais do mercado e acadêmicos, o curso permite aos alunos uma experiência única de aprendizado – independentemente de sua formação.

Não há pré-requisitos para participar. O curso é livre. Os interessados deverão fazer uma entrevista com o coordenador, que determinará o módulo de ingresso. Assim, aqueles que não possuem conhecimento em linguagens de programação deverão iniciar os estudos antes daqueles que já sabem programar.

Informações

Período

Módulo I: 25/08/2021 a 23/10/2021 Módulo II: 27/10/2021 a 18/12/2021 Módulo III: 02/02/2022 a 02/04/2022 Módulo IV: 20/04/2022 a 25/06/2022

Duração

154h (carga horária correspondente ao curso completo)

Aulas

Quartas-feiras, das 19h às 22h15. Hackathons aos sábados (de acordo com cronograma)

Investimento

R$ 1.789,00 (valor por módulo)

Desconto

Para alunos da ESEG e do Grupo Etapa. Consulte as condições

DOCENTES

Prof. Dr. Luiz Durão

Engenheiro de Produção (2014), mestre em Engenharia de Produção (2017) e doutor em Engenharia de Produção (2020) pela Escola Politécnica da Universidade de São Paulo.

Prof. M.e Marcelo Dias

Possui graduação em Engenharia de Produção pela Universidade de São Paulo (1998) e mestrado em Engenharia de Produção pela Universidade de São Paulo (2009).

Prof. M.e Rodrigo Aquino

Possui graduação em Engenharia Elétrica pela Universidade de São Paulo (2015). Mestrado na área de aprendizado de máquinas pela Universidade de São Paulo. 

DIFERENCIAIS

Análise estatística

Machine Learning

Engenharia de Dados

Mineração e Captura de Dados

Limpeza de Dados

Visualização de Dados

Ética e Segurança da Informação

Aplicação dos dados para tomada de decisão

Módulos

Você também pode cursar os módulos separadamente.

Programação com Python

Módulo I - 39h

  • Introdução às estruturas básicas da linguagem Python
  • Listas, tuplas e dicionários com Python
  • Estruturas que contemplam condicionais, loops e exceções
  • Desenvolvimento de uma calculadora.
  • Estudo das operações com funções em Python
  • Estudo de Módulos e principais pacotes com Python
  • Pacote Numpy e suas matrizes multidimensionais
  • Desenvolvimento de um programa de manipulação de imagens
  • Estudo da biblioteca Pandas para manipulação e análise de dados-1ª parte
  • Estudo da biblioteca Pandas para manipulação e análise de dados-2ª parte
  • Estudo da biblioteca Pandas para manipulação e análise de dados-3ª parte
  • Desenvolvimento de um programa automático de geração de estatísticas e gráficos a partir de um arquivo em formato de planilha.

Estatística e Modelagem

Módulo II - 38h

  • Principais conceitos e técnicas de Estatística frequentista aplicado à análise de dados.
  • Principais testes de hipóteses e como são utilizados nos refinamentos de análises de dados
  • Design of Experiments (DOE) – parte 1
  • Design of Experiments (DOE) – parte 2
  • Modelagem para a resolução de um problema com Design of Experiments.
  • Estudo de algoritmos estatísticos utilizando KNN para a análise de dados.
  • Estudo de Regressão Linear (Simples, Multi e SGD) – parte 1
  • Estudo de Regressão Linear (Simples, Multi e SGD) – parte 2
  • Classificação de dados utilizando Regressão Logística
  • Estudo de reamostragem com Cross-Validation e Bootstrap
  • Seleção de modelos/regularização
  • Utilização de ferramentas estatísticas para resolução de um problema real

Machine Learning

Módulo III - 39h​

  • Estrutura com Árvores
  • Clusterização
  • Sklearn (Regressão/Classificação)
  • Desenvolvimento de modelo de clusterização e visualização de resultados utilizando dados disponibilizados
  • Keras (Regressão/Classificação)
  • Modelagem NLP (Bayes) – análise de sentimentos em tweets
  • Introdução a Redes Neurais
  • Desenvolvimento de modelo de classificação utilizando técnicas de regressão
  • NLP Word Embedding parte 
  • NLP Word Embedding parte 2
  • NLP Word Embedding parte 3
  • Desafio MeLi Data Challenge (Mercado Livre)

Business e Design

Módulo IV - 38h​

  • Problemas mal definidos e teoria de design
  • Como descobrir um problema (Pesquisa desk) - Aquisição de dados 1: dados estruturados
  • Técnicas de entrevista e roteiro
  • Aquisição de dados 2: dados não estruturados/data preprocessing: ferramenta Open refine
  • Construção de persona e jornada do usuário
  • Definição de tamanho de mercado e benchmark de soluções
  • Ideação
  • Data Visualization 1: CRAP design
  • Data Visualization 2: Streamlit
  • Técnicas de pitch
  • Desafio Business e Design

INSCREVA-SE

*O curso de Data Science permite que você realize os módulos separadamente a partir de R$ 1.789,00 (por módulo). Para mais informações, entre em contato com nossa Central de Atendimento (11) 2187-1230.