- Introdução ao Python e ao Jupyter Notebook (opcional)
- Pré-processamento com vista à representação de documentos
- Tokenização básica, tokenização com NLTK, tokenização de tweets
- Representação de documentos. Ver também este tutorial sobre gensim
- Natural Language Processing (NLP) libraries
- Intelligent word representations
- Embeddings: word2vec, glove, etc
- Classificação de textos
- Análise de Sentimento
- Modelação de tópicos
fmmb / text-mining Goto Github PK
View Code? Open in Web Editor NEWLicense: GNU General Public License v3.0