数据集下载失效

【广告】每日Arxiv（中文版）

每日Arxiv（中文版）立志paper汉化，目前翻译目前涵盖标题和摘要，AI学科近期支持论文全文汉化

一天阅读百篇paper不是梦！

链接：学术巷子(xueshuxiangzi.com)

前言

力求每行代码都有注释，重要部分注明公式来源。具体会追求下方这样的代码，学习者可以照着公式看程序，让代码有据可查。

如果时间充沛的话，可能会试着给每一章写一篇博客。先放个博客链接吧：传送门。

注：其中Mnist数据集已转换为csv格式，由于体积为107M超过限制，改为压缩包形式。下载后务必先将Mnist文件内压缩包直接解压。

【Updates】

书籍出版：目前已与人民邮电出版社签订合同，未来将结合该repo整理出版机器学习实践相关书籍。同时会在book分支中对代码进行重构，欢迎在issue中提建议！同时issue中现有的问题也会考虑进去。（Feb 12 2022）

线下培训：女朋友计划近期开办ML/MLP/CV线下培训班，地点北上广深杭，目标各方向快速入门，正在筹备。这里帮她打个广告，可以添加微信15324951814（备注线下培训）。本人也会被拉过去义务评估课程质量。。。（Feb 12 2022）

无监督部分更新：部分无监督算法已更新！！！该部分由Harold-Ran提供，在此感谢！有其他算法补充的同学也欢迎添加我微信并pr！（Jan 27 2021）

实现

监督部分

第九章 EM算法及其推广：

实现：EM/EM.py

第十章隐马尔可夫模型：

实现：HMM/HMM.py

无监督部分

第十四章聚类方法

实现：K-means_Clustering.py

实现：Hierachical_Clustering.py

第十六章主成分分析

实现：PCA.py

第十七章潜在语意分析

实现：LSA.py

第十八章概率潜在语意分析

实现：PLSA.py

第二十章潜在狄利克雷分配

实现：LDA.py

第二十一章 PageRank算法

实现：Page_Rank.py

许可 / License

本项目内容许可遵循Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)。

The content of this project itself is licensed under the Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)

联系

欢迎pr，有疑问也可通过issue、微信或邮件联系。
此外如果有需要MSRA实习内推的同学，欢迎*扰。
Wechat: lvtengchao（备注“blog-学校/单位-姓名”）
Email: [email protected]

dod-o / statistical-learning-method_code Goto Github PK

statistical-learning-method_code's Introduction

【广告】每日Arxiv（中文版）

前言

注：其中Mnist数据集已转换为csv格式，由于体积为107M超过限制，改为压缩包形式。下载后务必先将Mnist文件内压缩包直接解压。

【Updates】

实现

监督部分

第二章 感知机：

第三章 K近邻：

第四章 朴素贝叶斯：

第五章 决策树：

第六章 逻辑斯蒂回归与最大熵模型：

第七章 支持向量机：

第八章 提升方法：

第九章 EM算法及其推广：

第十章 隐马尔可夫模型：

无监督部分

第十四章 聚类方法

第十六章 主成分分析

第十七章 潜在语意分析

第十八章 概率潜在语意分析

第二十章 潜在狄利克雷分配

第二十一章 PageRank算法

许可 / License

联系

statistical-learning-method_code's People

Stargazers

Watchers

Forkers

statistical-learning-method_code's Issues

''' 数据集：Mnist 训练集数量：60000 测试集数量：10000（实际使用：200）

print(label_most)

Recommend Projects

Recommend Topics

Recommend Org

第二章感知机：

第四章朴素贝叶斯：

第五章决策树：

第六章逻辑斯蒂回归与最大熵模型：

第七章支持向量机：

第八章提升方法：