Giter Site home page Giter Site logo

research-nlp-pt-br's Introduction

Inteligência Artificial aplicada ao meio Jurídico

Autor: João Pedro da S. Lima

Orientação: Prof. Dr. José Alfredo Costa

Este repositorio contém um conjunto de técnicas de NLP (Natural Language Processing) desenvolvidas durante a pesquisa do aluno João Pedro enquanto bolsista de Iniciação Científica na UFRN (Universidade Federal do Rio Grande do Norte).

As técnicas aqui demonstradas são focadas no processamento de textos em PT-BR, com intuito final de criação de algoritmos para automação inteligente voltada ao meio jurídico.

Mais sobre

A pesquisa aqui descrita foi desenvolvida principalmente no período de AGO-2020 a JUN-2022. Os materiais disponibilizados são resultado de todo o trabalho desenvolvido nesse período.

Nesta pesquisa, foram desenvolvidas aplicações, materiais e estudos sobre os principais algoritmos da área de IA, englobando os escopos supervisionado e não-supervisionado, com implementações em código de programação (principalmente Python) e com estudos teóricos sobre os detalhes matemáticos e estatísticos de cada algoritmo.

O escopo principal da pesquisa foi o estudo e desenvolvimento de técnicas de NLP para clustering de textos jurídicos.

Organização do Repositório

O repositório está organizado com base no escopo dos materiais produzidos.

Durante a pesquisa, foram feitas pesquisas principais, pesquisas paralelas e materiais teóricos, cada uma delas possui uma pasta única.

  • 📂 Pesquisas principais: São o foco da IC, os materiais mais aprofundados e que geram as principais análises. Atualmente são o "O desenvolvimento de um modelo para Clustering textual com TF-IDF, Mapa de Kohonen e K-Means" e "Avaliação do clustering de documentos legais com diferentes métodos de feature extraction".
  • 📂 Pesquisas paralelas: São pequenas pesquisas e experimentos pontuais desenvolvidas ao longo do IC.
  • 📂 Materiais teóricos: São materiais desenvolvidos com intuito de estudar/apresentar conceitos de NLP e Machine Learning.

Artigos e vídeos

  • LIMA, João Pedro; COSTA, José Alfredo; ARAÚJO, Diogenes Carlos. Comparison of Feature Extraction Methods for Brazilian Legal Documents Clustering. In: 2021 IEEE Latin American Conference on Computational Intelligence (LA-CCI). IEEE, 2021. p. 1-5.
  • ARAÚJO, Diógenes Carlos et al. A Comparison of Classification Methods Applied to Legal Text Data. In: EPIA Conference on Artificial Intelligence. Springer, Cham, 2021. p. 68-80.
  • LIMA, João Pedro; COSTA, José Alfredo; ARAÚJO, Diogenes Carlos. Legal Document Clustering With TF-IDF Vectors, Kohonen Map and K-Means. In: 18th CONTECSI Conference.
  • Clustering de documentos jurídicos - Apresentação eCICT UFRN 2021.
  • Vídeo Apresentação Contecsi- Legal Document Clustering with TF-IDF vectors, Kohonen Map and K-Means
  • Vídeo Apresentação LACCI - Comparison of Feature Extraction Methods for Brazilian Legal Documents Clustering

research-nlp-pt-br's People

Contributors

jaumpedro214 avatar

Stargazers

 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.