Giter Site home page Giter Site logo

emeline2104 / predictive_energy_consumption Goto Github PK

View Code? Open in Web Editor NEW
1.0 1.0 0.0 14.78 MB

Projet 5 - OpenClassRooms - Data Science

Jupyter Notebook 99.86% Python 0.14%
dbscan-clustering gradient-boosting-regressor kmeans predictive-modeling random-forest-regression svr-regression-prediction supervised-learning supervised-machine-learning

predictive_energy_consumption's Introduction

Projet-4 - Anticipez les besoins en consommation de bâtiments

Ce projet a été réalisé dans le cadre de la formation diplomante de Data Scientist d'OpenClassRooms & CentraleSupelec.

A propos du projet :

Objectifs :

Le principal objectif de ce projet est de développer un modèle de prédiction de la consommation énergétique des bâtiments pour la ville de Seattle. Il s'inscrit dans une démarche visant à optimiser la gestion des ressources énergétiques en anticipant les besoins de consommation. Capture d’écran 2023-11-03 à 20 21 11

Données :

Les données nécessaires au projet sont disponibles ici. Elles comprennent des relevés de la ville de 2016, notamment des données structurelles des bâtiments telles que la taille, l'usage, la date de construction, etc.

Méthodologie :

1. Analyse exploratoire des données

Un notebook dédié à l'analyse exploratoire et à l'analyse de la qualité des données a été créé (1_EDA.ipynb).

2. Exploration des méthodes de pré-traitement et de modèles de régression

Un second notebook explore différentes méthodes de pré-traitement des données (gestion de la qualité des données et feature engineering) ainsi que des modèles de régression tels que la régression linéaire, Random Forest, Gradient Boosting, SVR pour sélectionner le modèle optimal (2_Prediction_consommation.ipynb). Capture d’écran 2023-11-06 à 13 45 37

3. Mise en place de pipelines

Des pipelines ont été mis en place pour le pré-traitement des données et la modélisation de la prédiction des consommations énergétiques des bâtiments (main.py).

Livrables :

Notebooks :

  • Notebook de l'analyse exploratoire et de l'analyse de la qualité des données (1_EDA.ipynb);
  • Notebook exploratoire des méthodes utilisées (features engineering & modèles de prédiction) (2_Prediction_consommation.ipynb);

Scripts :

  • Script principal du projet (main.py) qui effectue les étapes suivantes :
    • Chargement des données à partir du fichier spécifié dans le fichier de configuration (config.py);
    • Nettoyage des données à l'aide d'un pipeline défini dans le module data_cleaning (data_cleaning.py);
    • Feature Engineering à l'aide d'un pipeline défini dans le module feature_engineering (feature_engineering.py);
    • Entraînement et évaluation d'un modèle de régression baseline (régression linéaire (RL)) en utilisant le pipeline défini dans le module baseline_model (baseline_model.py);
    • Entraînement et évaluation d'un modèle XGBoost en utilisant le pipeline défini dans le module xgboost_model (xgboost_model.py).

Support de présentation :

Un support de présentation de l'analyse exploratoire pour la soutenance est également disponible (3_Presentation).

Installation et exécution

Installation

Pour exécuter le code de ce projet, vous aurez besoin de Python 3.11 ou supérieur. Installez les dépendances à l'aide du fichier requirements.txt.

pip install -r requirements.txt

Le fichier setup.py est également inclus pour permettre l'installation et la distribution du projet en tant que package Python.

pip install .

Execution du script

Pour exécuter le script, assurez-vous d'avoir Python 3.11 ou supérieur installé et exécutez la commande suivante dans le terminal :

python main.py

Assurez-vous également de personnaliser les chemins et les paramètres dans le fichier config.py selon les besoins de votre projet.

predictive_energy_consumption's People

Contributors

emeline2104 avatar

Stargazers

 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.