Sniffit-py

Contexte

Les échanges via Internet n'ont pas cessé d’évoluer depuis les années 2000. En effet, nous partageons au quotidien tout une multitude d’objets complexes de différents types et en grand nombre. Afin d'améliorer le partage et l’échange de données, différents outils sont apparus dans le but d'observer les différents échanges sur Internet. Si des analyses ont été réalisées pour caractériser le trafic de certaines applications (exemple : YouTube), il n’existe pas à l’heure actuelle d’outil permettant d’extraire de manière agnostique un modèle des objets échangés pour l’ensemble des applications que nous pouvons utiliser au quotidien.

Objectif

L'objectif de ce projet était de fournir les outils nécessaires à l'étude du trafic internet de notre vie courante afin d'être utilisés lors de problématiques liées au Edge Computing.

Dans les informations à retrouver, on avait par exemple :

La taille des paquets échangés
Le protocole utilisé
Le type des données
Etc.

Par la suite, une analyse des données collectées devait être effectué afin de pouvoir donner un état des lieux de la solution produite.

Table des matières

Portée du projet
Solutions non retenues
Solution retenue
Architecture de la solution
État des lieux
Evolutions envisageables
Limites identifiées
Installation
Utilisation
Exemples de données obtenus

Portée du projet

Afin de fournir une solution fonctionnelle en un temps assez court, la portée du projet a été limitée aux paquets TCP et UDP. La solution fournie devaient également être le moins intrusive possible.

Exemple d'applications qui peuvent être étudiées

Youtube
Netlix
Spotify
Deezer
Waze
Google Maps
Messengers (What'sapp, Gmail/Outlook ...)
Réseaux sociaux (Instagram, Twitter ...)

Solutions non retenues

Mitmproxy

Mitmproxy permet la mise en place d'un proxy transparent. En installant un certificat particulier sur la machine cliente, il était alors possible d'analyser facilement et de manière détaillée tout le trafic passant sur ce proxy.

Avantages :

Analyse simple
Analyse détaillée et bien segmentée (on sait précisément quelle requête https donne lieu à quel payload)

Inconvénients :

Intrusif
Machine-dependent (requiert l'installation d'un certification sur chaque machine)
Faible, voire complétement inutlisable, face au Certificate Pinning
- Les applications natives s'assurent désormais qu'aucun certificat n'a été introduit afin d'éviter les attaques Man-In-The-Middle. Pour cela, certaines applications comparent la clef publique ou le certificat envoyé par le serveur avec une clef publique stockée dans l'APK. Si les clefs sont différentes, la connexion sera refusée
- Le proxy étant un Man-In-The-Middle, renverra toujours une clef publique qui ne matchera jamais celle de l'application
- Contournement possible en décompilant le code l'application, extrayant le morceau de code responsable du pinning, puis en recompilant l'application
- Méthode de contournement 'Application-dependent' qui peu s'avérée trop longue et difficile pour de grosses applications

VPN sniffé avec Libtins

Libtins est un wrapper autour de libpcap permettant d'analyser le trafic entrant et sortant d'une machine. Écrite en C++, la librairie se décrit comme presque aussi performant que libpcap, avec des fonctionnalités en plus.

Avantages :

Performant
Maîtrises de nombreux aspects du sniffing

Désavantages :

Langage que nous avons peu utilisé pour le moment
Bas niveau nécessitant d'être prêt à mettre les mains dans le cambouis
Documentation peu accessible, peu vulgarisée

Solution retenue

VPN sniffé avec PyShark

PyShark est une librairie se basant sur TShark. En lançant un processus TShark, la librairie récupère le contenu du trafic circulant sur la machine et l'encapsule dans des classes haut niveau.

Avantages :

Haut niveau facilitant l'utilisation de la librairie
Python

Désavantages :

De base, récupère et écrit dans des fichiers pcap énormément de données
Documentation seulement partielle
- To easily view the different attributes of the layer, you can simply run dir(packet.my_layer), source : http://kiminewt.github.io/pyshark/

Architecture de la solution

Recorder

Responsable de la capture du trafic, ce script minimaliste stocke les données dans un fichier pcap utilisable à posteriori

Le trafic est volontairement stocké dans un fichier plutôt qu'être analysé à la volée afin d'éviter la surcharge de notre VPS disposant de peu de ressources déjà bien mises à mal avec le VPN.

Analyzer

Responsable de l'analyse du trafic. L'analyzer vient parcourir les packets enregistrés et viens stocker les informations intéressantes (taille du payload, timestamp) dans le stream correspondant.

Les écarts entre chaque packets sont analysés et une moyenne est réalisée.

Si le temps entre deux packets d'un même stream dépasse l'écart moyen calculé pour ce stream, alors son contenu est flush vers la base de données. Le même processus se produit également si le stream n'est pas fermé à la fin de l'exécution du script.

ElasticSearch et Kibana

L'utilisation de ElasticSearch permet une bonne scalabilité à moindre coût. En fournissant des agrégations rapides, il permet une analyse performante des données. De plus, Kibana fournit énormément de représentation toutes faites telles que les représentations Timelion ou TSVB pour les données time series.

Ces deux composants peuvent être déployés rapidement grâce à docker et docker-compose

État des lieux

Recorder

Enregistrement du flux Serveur -> VPN et VPN -> Serveur
- Packet TCP, UDP ou les deux
- Filtre sur les autres flux possibles (Tunnel SSH, etc.)

Analyzer

Analyse possible selon 2 modes :
- Paquets : Envoi des informations de chaque paquet directement à Kibana
- Streams :
  - Récupération des informations
  - Calcul d'une moyenne d'interval de temps entre les paquets
  - Regroupement des paquets en stream à partir de cette moyenne
  - Récupération des noms d'hôtes à l'aide de requêtes reverse-DNS
  - Flush vers la base de données

Evolutions envisageables

Recorder

Etendre les protocoles supportés
Permettre aisément le record de plusieurs clients

Analyzer

Améliorer le système de regroupement des paquets en stream pour tendre vers la meilleure solution possible
Faire des batchs pour l'envoi des données vers Elastic Search ou JSON
Fournir la possibilité de sortir les données autrement (CSV, ...)

Global

Industrialiser les tests (au moins unitaire)
Un petit peu de refactoring

Limites identifiées

L'utilisation d'une moyenne afin d'identifier les fins de stream n'est pas optimale. Une analyse des creux devrait offrir des résultats plus pertinents
Les histogrammmes affichés actuellement via Kibana ne sont peut-être pas les meilleurs représentations possible. L'identification du début et de la fin d'un stream devrait permettre une représentation plus fidèle des données capturées

Installation

OpenVPN

Via Docker

Pour installer OpenVPN, exécuter la commande suivante dans le dossier openvpn :

docker-compose up -d

En local

Suivre ce lien

Connexion au VPN

Une fois OpenVPN Access Server lancé, vous pouvez ajouter un utilisateur via interface web admin au port 943

Identifiants admin :

Password : password

Une fois ajouté, connecter votre appareil en utilisant l'application OpenVPN, configurée en accès Access Server.

ElasticSearch / Kibana

Via docker

Pour la stack EK, exécuter la commande suivante dans le dossier elasticsearch :

docker-compose up -d

En local

Suivre ce lien

Dépendances python

apt-get update && apt-get install -y python3-pip \
    tshark \
    && pip3 --no-cache-dir install -r requirements.txt

Librairies python installées :

elasticsearch (7.1.0)
pyshark (0.4.2.9)
python-dotenv (0.10.3)

Sniffer

Maintenant que les dépendances sont en place, configurer le sniffer en mettant à jour les variables d'environnement du fichier src/.env.

Ces variables permettront de ne pas enregistrer les échanges marqués comme 'Non traité' sur le schéma.

IP_CLIENT -> Adresse IPV4 de l'appareil à enregistrer
IPV6_CLIENT -> Adresse IPV6 de l'appareil à enregistrer
IP_SSH -> Adresse IPV4 de l'appareil en tunnel SSH jusqu'au VPN (si connecté à la machine distante)
IPV6_SSH -> Adresse IPV6 de l'appareil en tunnel SSH jusqu'au VPN (si connecté à la machine distante)
IP_VPN -> Adresse IPV4 du server OpenVPN
IPV6_VPN -> Adresse IPV6 du server OpenVPN
IP_ES -> Adresse IP du server ElasticSearch
PORT_ES -> Port du serveur ElasticSearch

Si aucun VPN n'est utilisé, il est toujours possible d'utiliser le projet en ne donnant pas de valeur aux variables suivantes :

IP_CLIENT
IPV6_CLIENT
IP_SSH
IPV6_SSH

Et en mettant votre ip/ipv6 dans les variables IP_VPN, IPV6_VPN.

Utilisation

Recorder

Pour lancer le recorder, utiliser la commande suivante depuis la racine du projet :

python3 src/recorder.py

Paramètres

Paramètre	Short	Type	Description	Défaut
--output	-o	String	Nom du fichier sortant dans /capture (.pcap)	capture
--time	-t	Int	Temps d'enregistrement du recorder	En continue
--protocol	-p	String	Type de protocol à enregistrer [udp, tcp, both]	tcp
--interface	-i	String	Interface de capture	eth0

Analyzer

Après avoir récupéré le fichier .pcap sortant du recorder, lancer l'analyse avec la commande suivante depuis la racine du projet :

python3 src/analyzer.py

Paramètres

Paramètre	Short	Type	Description	Défaut
--input	-i	String	Nom du fichier présent dans /capture (.pcap)	capture
--mode	-m	String	Méthode d'analyse [packet, stream]	stream
--outputType	-o	String	Méthode d'extraction des résultats [JSON, ES]	ES

Kibana

Configuration des index pattern

Dans l'onglet Management, cliquer sur Index Patterns. Il suffit alors de créer un pattern qui matchera les index ElasticSearch. Ne pas oublier dans le processus de création de désigner la champs "timestamp" comme étant le champs temporel de l'index.

Création de la visualisation

Nous recommandons la représentation TSVB de Kibana.

Le choix de l'intervalle de visualisation se fait en haut à droite, ou en cliquant-glissant sur le graphe.

Onglet data

Cet onglet permet de définir plusieurs visualisations.

Plusieurs paramètres peuvent être changés.

Tout d'abord, les filtres :

dest: destination du stream/packet, peut-être vpn, une adresse ip ou du pattern matching (ex : *facebook*)
src: destination du stream/packet, peut-être vpn, une adresse ip ou du pattern matching (ex : *facebook*)
protocole: udp ou tcp

Ces filtres sont librement composables et optionnels.

Un autre paramètres que nous recommandons est le passage du chart type en Bar pour avoir une représentation plus lisible.

Onglet panel

Il est possible d'appliquer ces mêmes filtres à toutes les visualisations.

L'intervalle d'agrégation temporelle est également paramétrable depuis cet onglet

kilmer56 / imt-sniffit Goto Github PK

imt-sniffit's Introduction

Sniffit-py

Contexte

Objectif

Table des matières

Portée du projet

Exemple d'applications qui peuvent être étudiées

Solutions non retenues

Mitmproxy

Avantages :

Inconvénients :

VPN sniffé avec Libtins

Avantages :

Désavantages :

Solution retenue

VPN sniffé avec PyShark

Avantages :

Désavantages :

Architecture de la solution

Recorder

Analyzer

ElasticSearch et Kibana

État des lieux

Recorder

Analyzer

Evolutions envisageables

Recorder

Analyzer

Global

Limites identifiées

Installation

OpenVPN

Via Docker

En local

Connexion au VPN

Identifiants admin :

ElasticSearch / Kibana

Via docker

En local

Dépendances python

Sniffer

Utilisation

Recorder

Paramètres

Analyzer

Paramètres

Kibana

Configuration des index pattern

Création de la visualisation

Onglet data

Onglet panel

Pour aller plus loin

Exemples de données obtenus

GIF

Static

imt-sniffit's People

Contributors

Stargazers

Watchers

Recommend Projects

Recommend Topics

Recommend Org