Por meio deste repositório pretendemos deixar registrado todos os trabalhos realizados no desafio para área de dados de Data Science da empresa Dhauz.
O desafio tem como objetivo avaliar como o candidato consegue desenvolver sua capacidade de de exploração de dados, criatividade na elaboração de hipóteses e metodologia na resolução de problemas. Neste em especifico vamos trabalhar com um dos grandes problemas das empresas, o problema da rotatividade dos clientes ou como chamaremos de churn
que como significado tem-se por evasão.
Para realização do desafio foram disponibilizados dados que se encontram na pasta
data
e nela você entrará um dicionário de variáveis.
Foi solicitado como entrega as seguintes condições:
- Hipóteses e visualizações envolvendo a variável churn e, pelo menos, outras três variáveis presentes no dataset;
- Um modelo preditivo de classificação para identificar possíveis evasões e utilize métricas adequadas para argumentar a efetividade do modelo;
- Identificar um perfil com maior probabilidade de evasão;
Podemos verificar que uma das dores deste desafio é conseguir entregar uma análise que irá manter os clientes por mais tempo no funil da empresa, além da identificação daqueles que não fasem o perfil da empresa gerando maiores gastos. Dessa maneira vamos começar as análises para entender como os dados podem nos ajudar neste questionamento.