Objetivo(s) do Case
Objetivos principais
- Aplicar todas as etapas de trabalho de um cientista de dados;
- Fazer um modelo que permita predizer se o voo vai atrasar ou não;
- Tirar insights da análise exploratória a ser realizada;
- Analisar a performance da pontualidade das principais companhias aéreas de 2018, 2019 e o período de 2018 a 2023;
- Criar um servidor com MLflow (V4);
- Implementar o modelo no servidor do MLflow (V5);
- Documentar o projeto.
Objetivos secundários
- Construir uma função que permita extrair de forma automatizada os dados;
- Tratar os dados;
- Utilizar dados meteorológicos (V2);
- Utilizar dados relacionados aos aeroportos (V2);
- Aplicar técnicas estatísticas para realizar seleção de variáveis, para buscar insights e validar hipóteses;
- Utilizar técnicas de machine learning para seleção de variáveis e para treinamento do modelo;
- Aplicar boas práticas;
- Aplicar técnicas variadas de codificação, modelagem estatística e análise de performance;
- Treinar um modelo utilizando alto volume de dados (V3).