Giter Site home page Giter Site logo

unicamp_webscraper's Introduction

Unicamp_webscraper

Um webscraper que retorna se uma dada matéria foi ou será dada em um semestre. Para utiliza-lo basta preencher as materias que você deseja verificar no disciplinas.json e rodar o script app.py. Siga este guia para aprender a preencher as materias

Instalando as dependências

Esse webscraper utiliza a biblioteca requests para fazer requisições no servidor da DAC e BeautifulSoup4 para o parsing do HTML retornado na requisição

  1. Para instalar o BeautifulSoup:
$ python -m pip install beautifulsoup4

ou se você estiver usando python3

$ python3 -m pip install beautifulsoup4
  1. Para instalar o requests:
$ python -m pip install requests

ou se você estiver usando python3

$ python -m pip install requests

Guia para preencher as matérias no .json:

Para te ajudar a preencher as suas matérias desejadas no disciplinas.json, aqui vai um exemplo:

{
    "2021-1s": {
        "IC": [
            "MC102"
        ],
        "IFGW": [
            "F 328"
        ]
    },
    "2021-2s": {
        "IC": [
            "MC102",
            "MC202"
        ],
        "IFGW": [
            "F 328",
            "F 329"
        ]
    }
}

Aqui vemos duas entradas de semestres, 2021-1s e 2021-2s, que o scraper usará para fazer a sua busca.

  1. Dentro de cada semestre coloque as siglas de instituto/faculdade, no caso temos "IC" e "IFGW".
  2. Dentro de cada uma dessas siglas, coloque os códigos das disciplinas

E se quisermos verificar mais de uma disciplina dentro dadas no mesmo semestre e instituto? Basta separarmos cada um dos códigos com uma vírgula:

{
    "2021-1s": {
        "IC": [
            "MC102",
            "MC202"
        ],
        "IFGW": [
            "F 328",
            "F 329"
        ]
    }
}

Após as mudanças, basta rodar o app.py novamente

unicamp_webscraper's People

Contributors

luizfbr avatar

Watchers

James Cloos avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.