Giter Site home page Giter Site logo

twitter-profile-analysis's Introduction

Projet-analyse-de-Tweet

Ce repository contient l'ensemble des ressources qui ont été utiles à la réalisation du projet d'IF29 nécessitant l'implémentation de deux méthodes de machine learning (supervisé et non supervisé) afin de trouver des profils twitter dit suspect.

Vous trouverez donc 3 fichiers javascript et 1 notebook jupyter qui ont servis à la préparation de nos données sur mongo db :

  • etape1_creation.js qui nous a permis de réaliser le groupement par user et la selection des attributs pour le calcul de nos dimensions
  • etape_creation_new_attributes.js qui nous a permis de réaliser les calculs permettant d'obtenir nos dimensions pour le petit dataset sur mongo db
  • etape_creation_attributes_big_dataset.js qui nous a permis de réaliser les calculs permettant d'obtenir nos dimensions pour le big dataset sur mongo db
  • treatmen_similarity_tweet.ipynb qui nous a permis de calculer la distance de levenshtein pour chaque utilisateur et le repush sur mongo db

On trouvera également 5 notebook jupyter qui nous ont servis à réaliser nos algorithmes de machine learning :

  • machine_learning.ipynb est le premier fichier sur lequel nous avons pu expérimenter concernant le machine learning. Il n'est pas fonctionnel.
  • K-Means.ipynb qui est le fichier dans lequel se trouve l'intégralité du code nécessaire pour exécuter notre K-Means
  • K-Means multi-cluster.ipynb qui est le fichier qui permet d'exécuter un K-Means avec plus de 2 clusters. En tant que tel il est configuré pour utiliser 8 clusters
  • run_kmeans_in_local.ipynb qui est le fichier qui permet d'exécuter notre K-Means en rappatriant les données depuis un localhost et non plus depuis notre serveur mongo online
  • SVM.ipynb qui permet d'exécuter notre algorithme SVM

Il est important de noter que nos notebook jupyter sont dotés de parties markdown qu'il est important de lire pour comprendre l'enchainement d'exécution des chunks.

twitter-profile-analysis's People

Contributors

vallhallalm avatar gosor5 avatar rinkichi75 avatar squix avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.