datos-tp2's Issues
Generación automática de HTMLs para Noteboks
sklearn - MLPRegressor
Cualquier modelo de red neuronal no va a dar buenos resultados para resolver el precio de las propiedades, pero podemos observar cómo el error de precios obtenidos del set de entrenamiento y del set de testeo son casi idénticos (sin overfitting, underfitting)
RMSLE MLPRegressor (train): 0.48541
RMSLE MLPRegressor (test): 0.48735
Unificar RMSLE
Unificar la función de RMSLE
en el notebook utils
Dolarizar
Hacer un par de funciones (en un notebook nuevo que se llame utils
) que permitan la ida y vuelta de dólar/peso mexicano.
Ambas funciones necesitarían el dataframe con el precio de la publicación (en la moneda correspondiente) y la fecha para realizar la conversión.
Podríamos evaluar también la posibilidad de ajustar los precios mexicanos a inflación.
Features de promedios
Por el momento el feature más relevante que tenemos es promedio_idzona
. Ayuda a identificar las zonas caras/baratas y los modelos ajustan bien al dato. El problema es que trae mucho overfitting.
Una de las razones puede ser que hay zonas con muy pocas (o una sola) propiedades, entonces para estas zonas estamos literalmente agregando el precio como feature, causando overfitting.
Tanto este feature como cualquier otro de promedios que tengamos, deberíamos evaluar si queremos "generalizar" aquellos casos que tengan pocos ítems para promediar.
Por ejemplo. En aquellos idzona que tengan solo cinco propiedades o menos, el valor de promedio_idzona
para estas propiedades le podríamos asignar el promedio de la ciudad, o el de la provincia.
lightgbm
Funcionando en el branch lightgbm
con algunos features.
Se buscaron hiperparámetros con hyperopt
, pero este tiende a devolver un número de nodos por árbol bastante alto, resultando en un modelo más complejo.
Actualmente hay una diferencia significante entre los errores de precios obtenidos del set de entrenamiento y testeo, lo que implica overfitting.
RMSLE LightGBM (train): 0.25099
RMSLE LightGBM (test): 0.31631
Agregar reviewNB
Agregar reviewNB al repo
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.