Giter Site home page Giter Site logo

equipe1-2024.1's Introduction

D20 Dragons


Análise de Churn de Clientes Bancários

PythonMatplotlibPandasPlotlyNumPyscikit-learn

GitHub PyPI GitHub last commit

Documentação | Dados | Execução | Insights

Contexto

Este projeto foca na análise de churn de clientes de um banco, usando um dataset disponível no Kaggle. O objetivo é identificar padrões e fatores que influenciam os clientes a deixar o banco, utilizando técnicas de ciência de dados para processar e analisar os dados. A análise ajudará a entender melhor as necessidades dos clientes e a melhorar as estratégias de retenção.

Justificativa

A justificativa para este projeto se baseia na importância de manter uma base de clientes sólida para a sustentabilidade financeira do banco. Reduzir o churn pode significar maior lucratividade e satisfação do cliente, crucial em um mercado competitivo.

Graphical Abstract

graphical-abstract-d20-dragons (2)

Desenvolvedores

Clara Lima Silva Francisco Matheus Vaz dos Santos Mateus Balda Mota Silas Eufrásio da Silva

Organização de diretórios

├── data/              # Diretório contendo todos os arquivos de dados
│   ├── external/      # Arquivos de dados de fontes externas
│   ├── interim/       # Arquivos de dados intermediários
│   ├── processed/     # Arquivos de dados processados
│   └── raw/           # Arquivos de dados originais, imutáveis
├── docs/              # Documentação gerada através da biblioteca mkdocs
├── models/            # Modelos treinados e serializados, predições ou resumos de modelos
├── notebooks/         # Diretório contendo todos os notebooks utilizados nos passos
├── references/        # Dicionários de dados, manuais e todo o material exploratório
├── src/               # Código fonte utilizado nesse projeto
│   ├── data/          # Classes e funções utilizadas para download e processamento de dados
│   ├── deployment/    # Classes e funções utilizadas para implantação do modelo
│   └── model/         # Classes e funções utilizadas para modelagem
├── app.py             # Arquivo com o código da aplicação do streamlit
├── Procfile           # Arquivo de configuração do heroku
├── pyproject.toml     # Arquivo de dependências para reprodução do projeto
├── poetry.lock        # Arquivo com sub-dependências do projeto principal
├── README.md          # Informações gerais do projeto
└── tasks.py           # Arquivo com funções para criação de tarefas utilizadas pelo invoke

equipe1-2024.1's People

Contributors

matt-balda avatar claralimasilva avatar usilas avatar omadson avatar

Stargazers

 avatar Ebtisam Elgerghani avatar Tayná Fiúza avatar

Watchers

 avatar

equipe1-2024.1's Issues

Apresentação de resultados

  • Produzir uma apresentação de slides de no máximo 5min para ser apresentada ao professor e o restante da turma.

Análise comparativa de modelos

Insira as seções de texto Obtenção de dados, Preparação de dados e Seleção de modelos no notebook notebooks/02-comparative_analysis.ipynb, de acordo com o conteúdo visto em aula:

  • Deve-se utilizar um método de validação cruzada (holdout, k-fold, Monte Carlo) apresentado em sala de aula;

  • Apresentar no mínimo quatro modelos: um baseline, para servir de comparação a pelo menos outros três (ou mais) experimentos com modelos de famílias diferentes. Deverão ser utilizadas pelo menos duas métricas para efetuar a comparação entre os modelos;

  • Para que os resultados sejam avaliados, eles devem ser sintetizados através da utilização de tabelas e/ou gráficos explicativos;

Limpeza de dados

Deve criar todo o código necessário para a limpeza dos dados e inserí-lo no notebook notebooks/02-comparative_analysis.ipynb. O notebook deve conter os seguintes tratamentos:

  • Tratamento de dados faltantes: Identificar e remover linhas/colunas com dados faltantes insignificantes. Imputar valores ausentes usando estatísticas de tendência central ou modelos preditivos.

  • Tratamento de dados discrepantes: remover ou isolar outliers dependendo do contexto.

Aplicação de streamlit

  • Estudo sobre streamlit
  • Implementação dos gráficos
  • Implementação de uma side bar para acesso lateral e particionado
  • Exibição dos resultados
  • Deploy em algum cloud

Criação do dicionário de dados

  • Criar um arquivo (ou vários) de dicionário de dados, contendo informações referentes aos conjuntos de dados utilizados no projeto. Serão arquivos no formato CSV, que devem ser guardados na pasta data/external/;

Coleta inicial de dados

  • Coleta inicial de dados: apresentar um conjunto de dados "cru", no repositório do projeto, salvo na pasta data/raw/.

Exploração de dados

  • Criar um notebook de análise exploratória notebooks/01-exploratory_data_analysis.ipynb, contendo as seguintes seções de texto:
  • Descrição dos dados,
  • Perguntas de partida e hipóteses,
  • Insights, de acordo com o conteúdo visto em aula;

Proposta de Projeto

A etapa de entendimento de negócio se destina a compreensão dos objetivos e requisitos do projeto.

  • Após compreender a tarefa a ser realizada na execução do projeto, modificar o arquivo README.md, contendo um resumo do projeto que será construído.
  • Apresentar uma justificativa para o projeto.
  • É desejável que também se insira um graphical abstract.

Transformação de dados

Deve criar todo o código necessário para a transformação de dados e inserí-lo no notebook notebooks/02-comparative_analysis.ipynb. Além dos tratamentos referentes a limpeza de dados (dados faltantes e dados discrepantes), o notebook deve conter os seguintes tratamentos relacionados a transformação de variáveis:

  • Codificação de variáveis: efetuar toda e qualquer transformação necessária para o funcionamento do modelo, seja ela codificação de variáveis qualitativas (nominais ou ordinais), temporais ou textuais.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.