Giter Site home page Giter Site logo

licitasp's Introduction

LicitaSP

Esse projeto almeja integrar as bases de dados dos seguintes portais de compras públicas, fornecendo uma interface única:

Até o momento, temos funcionando um script que armazena no banco de dados as atualizações diárias do site Comprasnet.

Para executá-lo, execute o seguinte comando dentro da pasta:

scrapy crawl comprasnet

Para executar o script recorrentemente, utilize um agendador de jobs.

Estrutura de diretórios

A estrutura de diretórios deve soar familiar para alguém que já usou Scrapy:

  • scrapy.cfg: Configurações do Scrapy.
  • licitasp/: Raiz do projeto.
    • api.py: Fornece uma API JSON, que serve GET /api/acquisitions.
    • items.py: Define a classe Acquisition.
    • pipelines.py: Persistência dos objetos em MongoDB.
    • settings.py: Configurações do projeto.
    • spiders/: Define os crawlers.
      • comprasnet_spider.py: Crawler do site Comprasnet.
      • comprasnet_spider.py.md: Documentação extensiva do arquivo anterior em formato literate programming.

Documentação da API

A chamada GET /api/acquisitions retorno um vetor de objetos JSON contendo os seguintes campos de interesse:

  • date: Data de abertura da licitação.
  • description: Descrição resumida do objeto da licitação.
  • link: URL para página com maiores detalhes sobre a licitação.
  • modality: Modalidade de licitação (ex: pregão eletrônico, pregão presencial, convite, etc.).
  • organization: Órgão público licitante.
  • source: Origem dos dados (no caso, "comprasnet").

Requisitos

O projeto requer Python com os plugins scrapy, flask e pymongo, bem como MongoDB.

licitasp's People

Contributors

leopiccionia avatar

Watchers

James Cloos avatar Mauricio Rother avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.