Projet-4 - Anticipez les besoins en consommation de bâtiments

Ce projet a été réalisé dans le cadre de la formation diplomante de Data Scientist d'OpenClassRooms & CentraleSupelec.

A propos du projet :

Objectifs :

Le principal objectif de ce projet est de développer un modèle de prédiction de la consommation énergétique des bâtiments pour la ville de Seattle. Il s'inscrit dans une démarche visant à optimiser la gestion des ressources énergétiques en anticipant les besoins de consommation.

Données :

Les données nécessaires au projet sont disponibles ici. Elles comprennent des relevés de la ville de 2016, notamment des données structurelles des bâtiments telles que la taille, l'usage, la date de construction, etc.

Méthodologie :

1. Analyse exploratoire des données

Un notebook dédié à l'analyse exploratoire et à l'analyse de la qualité des données a été créé (1_EDA.ipynb).

2. Exploration des méthodes de pré-traitement et de modèles de régression

Un second notebook explore différentes méthodes de pré-traitement des données (gestion de la qualité des données et feature engineering) ainsi que des modèles de régression tels que la régression linéaire, Random Forest, Gradient Boosting, SVR pour sélectionner le modèle optimal (2_Prediction_consommation.ipynb).

3. Mise en place de pipelines

Des pipelines ont été mis en place pour le pré-traitement des données et la modélisation de la prédiction des consommations énergétiques des bâtiments (main.py).

Livrables :

Notebooks :

Notebook de l'analyse exploratoire et de l'analyse de la qualité des données (1_EDA.ipynb);
Notebook exploratoire des méthodes utilisées (features engineering & modèles de prédiction) (2_Prediction_consommation.ipynb);

Scripts :

Script principal du projet (main.py) qui effectue les étapes suivantes :
- Chargement des données à partir du fichier spécifié dans le fichier de configuration (config.py);
- Nettoyage des données à l'aide d'un pipeline défini dans le module data_cleaning (data_cleaning.py);
- Feature Engineering à l'aide d'un pipeline défini dans le module feature_engineering (feature_engineering.py);
- Entraînement et évaluation d'un modèle de régression baseline (régression linéaire (RL)) en utilisant le pipeline défini dans le module baseline_model (baseline_model.py);
- Entraînement et évaluation d'un modèle XGBoost en utilisant le pipeline défini dans le module xgboost_model (xgboost_model.py).

Support de présentation :

Un support de présentation de l'analyse exploratoire pour la soutenance est également disponible (3_Presentation).

Installation et exécution

Installation

Pour exécuter le code de ce projet, vous aurez besoin de Python 3.11 ou supérieur. Installez les dépendances à l'aide du fichier requirements.txt.

pip install -r requirements.txt

Le fichier setup.py est également inclus pour permettre l'installation et la distribution du projet en tant que package Python.

pip install .

Execution du script

Pour exécuter le script, assurez-vous d'avoir Python 3.11 ou supérieur installé et exécutez la commande suivante dans le terminal :

python main.py

Assurez-vous également de personnaliser les chemins et les paramètres dans le fichier config.py selon les besoins de votre projet.

emeline2104 / predictive_energy_consumption Goto Github PK

predictive_energy_consumption's Introduction

Projet-4 - Anticipez les besoins en consommation de bâtiments

A propos du projet :

Objectifs :

Données :

Méthodologie :

1. Analyse exploratoire des données

2. Exploration des méthodes de pré-traitement et de modèles de régression

3. Mise en place de pipelines

Livrables :

Notebooks :

Scripts :

Support de présentation :

Installation et exécution

Installation

Execution du script

predictive_energy_consumption's People

Contributors

Stargazers

Watchers

Recommend Projects

Recommend Topics

Recommend Org