kaggle上一个比较热门的题目,目标是预测美国爱荷华州埃姆斯每个住宅的最终价格。有两份数据集,一份是包含79个特征和价格的train data,一份是只有79个特征,没有价格的test data。属于回归问题。文件包含了缺失值处理、离群点剔除、特征工程、模型选择、网格搜索、交叉验证、模型融合,最终线上分数是0.11644,排名455,挤进前10%,虽然不是特别的成绩,不过把机器学习的流程走了一遍,还是有所收获的。
answerlee / houseprices Goto Github PK
View Code? Open in Web Editor NEWkaggle上一个比较热门的题目,目标是预测美国爱荷华州埃姆斯每个住宅的最终价格。有两份数据集,一份是包含79个特征和价格的train data,一份是只有79个特征,没有价格的test data。属于回归问题。