Giter Site home page Giter Site logo

datos-tp2's People

Contributors

camidvorkin avatar jdsanto avatar tlofano avatar

Stargazers

 avatar

Watchers

 avatar  avatar  avatar  avatar

datos-tp2's Issues

sklearn - MLPRegressor

Modelo de red neuronal

Cualquier modelo de red neuronal no va a dar buenos resultados para resolver el precio de las propiedades, pero podemos observar cómo el error de precios obtenidos del set de entrenamiento y del set de testeo son casi idénticos (sin overfitting, underfitting)

RMSLE MLPRegressor (train): 0.48541
RMSLE MLPRegressor (test): 0.48735

lightgbm

Funcionando en el branch lightgbm con algunos features.

Se buscaron hiperparámetros con hyperopt, pero este tiende a devolver un número de nodos por árbol bastante alto, resultando en un modelo más complejo.

Actualmente hay una diferencia significante entre los errores de precios obtenidos del set de entrenamiento y testeo, lo que implica overfitting.

RMSLE LightGBM (train): 0.25099
RMSLE LightGBM (test): 0.31631

Dolarizar

Hacer un par de funciones (en un notebook nuevo que se llame utils) que permitan la ida y vuelta de dólar/peso mexicano.

Ambas funciones necesitarían el dataframe con el precio de la publicación (en la moneda correspondiente) y la fecha para realizar la conversión.

Podríamos evaluar también la posibilidad de ajustar los precios mexicanos a inflación.

Features de promedios

Por el momento el feature más relevante que tenemos es promedio_idzona. Ayuda a identificar las zonas caras/baratas y los modelos ajustan bien al dato. El problema es que trae mucho overfitting.

Una de las razones puede ser que hay zonas con muy pocas (o una sola) propiedades, entonces para estas zonas estamos literalmente agregando el precio como feature, causando overfitting.

Tanto este feature como cualquier otro de promedios que tengamos, deberíamos evaluar si queremos "generalizar" aquellos casos que tengan pocos ítems para promediar.

Por ejemplo. En aquellos idzona que tengan solo cinco propiedades o menos, el valor de promedio_idzona para estas propiedades le podríamos asignar el promedio de la ciudad, o el de la provincia.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.