Ceci est le dépôt du projet individuel d'évaluations de module python pour une tâche de Traitement Automatique des Langues. Il s'agit d'un cours du premier semestre de deuxième année de master TAL (NLP) de l'INALCO. L'analyse a été faite sur des modules d'étiquetage en partie du discours pour le chinois classique.
Le dossier contient tous les corpus pré-traités et les fichiers vecteurs utilisés pour l'entraînement. Il y a également les fichiers python utilisés pour le pré-traitement.
Le dossier contient tous les fichiers python qui ont été utilisé pour évaluer les modèles d'étiquetage en partie du discours. Vous pouvez appelé l'un des trois fichiers suivants : evaluate_jiayan.py, evaluate_spacy.py, evaluate_time.py.
Le dossier contient les résultats des évaluations faites avec les fichiers python du dossier evaluations.
Le dossier models contient les fichiers utilisés pour entraîner les modèles. Les modèles n'ont pas été poussé mais ils se trouvent normalement dans les dossiers jiayan et spacy.