Giter Site home page Giter Site logo

pe2lgp's Introduction

PE2LGP: traduzindo português para língua gestual portuguesa

PE2LGP é um sistema de tradução de texto em português europeu para língua gestual portuguesa.

Descrição

O sistema de tradução divide-se em dois módulos. O primeiro módulo, construção de regras de tradução, consiste na extração de informações linguísticas do corpus de referência da língua gestual portuguesa e, a partir dessas informações, na criação de regras automáticas. O segundo módulo, tradução automática, consiste na tradução de texto em português europeu para língua gestual portuguesa (LGP), em que a frase em LGP é representada por uma sequência de glosas com marcadores que identificam as expressões faciais e palavras soletradas. Na base da tradução encontram-se as regras automáticas e regras manuais.

Disponibilizamos ainda o script para a avaliação automática do sistema de tradução, usando as medidas TER e BLEU.

Requisitos

Para correr o PE2LGP:

  1. Instalar Python 3

  2. Instalar as bibliotecas do Python necessárias:

pip install -r requirements.txt
  1. Instalar a biblioteca Freeling 4.1

  2. Download do modelo pré-treinado do SpaCy para a análise de dependências:

python -m spacy download pt_core_news_sm

Para correr o script de avaliação automática:

  1. Instalar Python 2

  2. Instalar a biblioteca pyter:

pip2 install pyter

Utilização (Ubuntu)

Módulo de construção de regras automáticas

cd Modulo_construcao_regras
python criacao_regras_automaticas.py ficheiro.html

ficheiro.html é o ficheiro html exportado do ELAN. Um exemplo deste ficheiro encontra-se em /modulo_construcao_regras/Corpus/exemplo.html

Módulo de tradução automática

cd Modulo_tradutor
python tradutor.py

Avaliação automática

cd Avaliacao
python aval_automatica.py corpus_teste.csv traducoes.csv

corpus_teste.csv é o ficheiro com o corpus de teste. O corpus de teste usado na avaliação do sistema encontra-se em /Avaliacao/corpus_teste.csv.

traducoes.csv é o ficheiro com as traduções das frases em português no corpus de teste do sistema de tradução automática. Este ficheiro encontra-se em /Avaliacao/traducoes.csv.

Contactos

Desenvolvido por Matilde Gonçalves, [email protected]

pe2lgp's People

Contributors

mattgoncalves avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.