El objetivo de este código es realizar webscraping a la página "http://informacioninteligente10.xm.com.co/transacciones/Paginas/HistoricoTransacciones.aspx" que contiene archivos en formato xls.
Se realizó un breve estudio del DOM (Document Object Model) con la finalidad de extraer las URLs esenciales.
Es preciso tener instalado Python version 3.7.0 y las librerias requests, bs4 y urllib.request.
Para instalar las librerias de Python en Windows es preciso instalar pip des la consola de Windows mediante:
python get-pip.py
Luego escribir:
pip install bs4 urllib.request
Esta es una versión en desarrollo. Se están afinando los parámetros para sincronizar la solicitud realizada al servidor con su respuesta de modo que este no interprete el continuo número de solicitudes con un ataque.
Para ejecutarlo localmente es preciso cambiar la variable OUTPUT_DIR a la dirección deseada