主要使用sklearn进行kaggle数据竞赛基础及实践
基础部分:
包含,
一、乳腺癌数据分析及预测示例入门
二、监督学习 分类
乳腺癌线性分类(Linear Clasification)预测分类
手写数字字体线性支持向量机(Linear Support Vector Machine)预测分类
新闻数据朴素贝叶斯(Naive Baise)预测分类
鸟类数据K近临(K Nearst Neighbour)预测分类
泰坦尼克号乘客生死决策树预测分类
三、监督学习 回归
房子价格的一些线性模型预测:
线性回归(LR Linear Regression)
随机梯度下降(SGD)
SVM支持向量机 回归预测
KNN 回归预测
决策树回归DTR 回归预测
集成学习 回归模型 普通随机森林RF 极端随机森林E RFR 梯度提升树GBT
四、无监督学习 聚类
手写数字字体 K-均值聚类 后预测
聚类效果评价
多种聚类中心数量效果评价
主成份分析PCA 样本数据降维处理 聚类效果对比
提高部分:
特征提取
特征筛选
模型正则化
超参数搜索
自然语言处理 NLTH
词向量模型
XGBoot 集成训练模型
tensorflow
Skflow
ewenwan / kaggle Goto Github PK
View Code? Open in Web Editor NEWkaggle 比赛 使用sklearn进行kaggle数据竞赛基础及实践