Giter Site home page Giter Site logo

real-estate-default-modeling's Introduction

Scoring LCL

Ce projet se fait dans le cadre d'un challenge proposé par Mohamed Sneiba Hamoud. Le but est de challenger le modèle de scoring existant dans l'octroi de crédit immobilier. Les milestones de sont projets sont les suivantes:

  • Vision globale de la base de données: étude de la période + constitution des échantillons
  • Preprocessing sur l'ensemble des variables (valeurs manquantes, traitement de types, etc..) + réflexion nouvelles variables
  • Sélection de variables (Lasso, tests univariés)
  • Discrétisation des variables quantitatives + regroupement de modalités des variables qualitatives -
  • Sélection post-discrétisation: Random Forest + stabilité temporelle
  • Modélisation classique: régression logistique + performances
  • Modélisation alternative: modèle challengeant
  • Grille de score

Installer le projet

Voici un petit guide pour vous expliquer comment accéder au contenu du projet:

Créer un répertoire à l'endroit souhaité

Sur terminal:

cd "[chemin d'accès du répertoire, par exemple: /Users/luciegabagnou/Documents/MOSEF/SCORING/projet]

Deux options pour récupérer le projet:

  • Via Github: Après s'être placé dans ce dossier via la commande cd, on va initialiser le dépôt git en local associé au projet sur Github
git clone https://github.com/luciegaba/scoring_project.git
git pull 
  • Via Dossier transmis: on va simplement dézipper le dossier LCL

Configurer l'environnement du projet:

Créer un environnement virtuel

conda create -n"[nom de l'environnemnt, exemple: LCL]
conda activate [nom de l'environnement]
conda install python 
conda install pip
pip install -r requirements.txt

Ensuite, vous pouvez aisément accéder au(x) notebook(s) Il suffit juste de dérouler les notebooks!

Organisation du projet

Ce dossier est composé de plusieurs élements:

  • 3 notebooks:
    • Processing (Analyse exploratoire, nettoyage, et sélection de variables )
    • Modelling (Régression logistique et modèle concurrent)
    • Clustering de risque (Kmeans + graph)
  • app: dossier de l'app dashboard streamlit (il faudra se placer dans ce repo pour lancer l'app : commande terminal ``` streamlit run app.py ``)
  • artefacts: contient les modèles de ml stockés
  • data:
    • external: données de bases externes comme variables auxiliaires et longitude/latitude
    • output: données créées au sein du projet
    • Base_recents.xlsx doit être mis ici
  • doc:
    • json comportant l'encodage des variables qualitatives
  • scripts:
    • discretisation
    • feature_selection
    • firstep_dataviz
    • group_cat_variables
    • modelisation
    • processing
    • pipeline_preprocessing (à utiliser pour directement traiter un jeu de données et le preprocesser entièrement pour le ml/modélisation)

real-estate-default-modeling's People

Contributors

luciegaba avatar julesbrable avatar armanddu7513 avatar

Stargazers

 avatar

Watchers

HAMOUD Mohamed Sneiba avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.