Giter Site home page Giter Site logo

pasquale's Introduction

🍎 Pasquale

O compilador da língua portuguesa!

Projeto final da disciplina de Construção de Compiladores.

🍎 Dependências e execução

O projeto foi desenvolvido em Python 3.10.x.

Antes de executar o código principal, por favor baixe as seguintes dependências:

pip install termcolor # versão 2.4.0
pip install selenium # versão 4.20.0
pip install requests # versão 2.31.0
pip install spacy # versão 3.7.4
pip install nltk # versão 3.8.1

# E execute os seguintes comandos:
python -m spacy download pt_core_news_sm

Feito isso, execute o comando abaixo na pasta raiz do projeto.

python main.py

🧪 Arquivos de Testes

Em breve.

💾 Futuras implementações

  • Realizar limpeza de código.
  • Recuperar quantidade de resultados após atualização do Google (agora tem mais passos para visualizar a quantidade de resultados).

pasquale's People

Contributors

sammid37 avatar enthonymiguel avatar

Watchers

 avatar

pasquale's Issues

Backlog

Backlog

Especificação do projeto

  • #2
  • #3
  • #4
  • #5
  • #6 (deve ser feito junto da issue #2)
  • Relatório

Analisador sintático

Objetivo

Realizar análise sintática do claim recebido a partir da sua lista de tokens.

Descrição

A gramática abaixo pode ser seguida e modificada.

  • Texto → Sentença. | Sentença. Texto
  • Sentença → Sintagma_nominal Sintagma_verbal
  • Sintagma_nominal → Substantivo | Artigo Substantivo
  • Sintagma_verbal → Verbo | Verbo Sintagma_verbal
  • Artigo → …
  • Substantivo → …

Analisador léxico

Objetivo

Realizar análise léxica de um claim recebido pelo usuário

Descrição

Fazer uso das bibliotecas spacy e nltk para Python.

  • #6
  • Armazenar os tokens da frase em uma lista de tuplas (palavra, classe_gramatical) e retorná-la

A tokenização deve ser realizada para o claim e suas variações

Regras e Sinônimos

Objetivo

Realizar modificações na frase de forma que ela mantenha a mesma semântica apesar de sintática diferente.

Essa modificação no texto original pode permitir que mais snippets sejam gerados ao realizar requisições ao buscador Google.

Obtendo Snippets

Objetivo

Realizar webscrapping das pesquisas do Google.

Descrição

Pode se fazer uso das bibliotecas Beautiful Soup e regex.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.