Este repositório centraliza todo o código utilizado na construção do meu Trabalho de Conclusão de Curso de Engenharia de Software pela Universidade de Brasília.
O tema proposto foi sobre Aplicação de Deep Learning Generativo como pré-processador para algoritmos de OCR.
A digitalização de processos judiciais brasileiros é uma tarefa que vem sendo realizada desde a oficialização das plataformas virtuais para controle do fluxo processual, como oPJe. Porém, o alto volume de processos digitalizados e os diversos tipos de ferramentas utilizadas no processo de digitalização podem gerar imagens com ruídos, muitas vezes impossibilitando a leitura e entendimento do conteúdo presente, dificultando a extraçãodo seu texto por meio de OCR. A partir dessa problemática, neste trabalho é proposto aconstrução de algoritmos baseados em Deep Learning utilizando as arquiteturas Generativas de CycleGAN e Decrappification para servirem como pré-processadores de imagens escaneadas, bem como a construção de um pré-processador com algoritmos simples de processamento de imagem, com o intuito de impactar positivamente na qualidade dos textos extraídos por OCR, tendo como amostra peças jurídicas do Supremo Tribunal Federal(STF).
O documento em LaTeX encontra-se também em um repositório Github.