Giter Site home page Giter Site logo

smirkcao / lihang Goto Github PK

View Code? Open in Web Editor NEW
5.9K 160.0 1.6K 10.14 MB

Statistical learning methods, 统计学习方法(第2版)[李航] [笔记, 代码, notebook, 参考文献, Errata, lihang]

Python 52.52% Shell 2.34% Jupyter Notebook 45.15%
book lihang statistical-learning-methods machine-learning python

lihang's People

Contributors

smirkcao avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

lihang's Issues

方差为1和标准差为1是一个概念么?

相关章节

CH16---主成分分析

相关主题

  • 代码
  • 文档
  • 示例

问题描述

具体问题描述
RT, 方差为1 和标准差为1是一个概念么?

在规范化这个过程里面,去均值,除以标准差。

为什么SVD拿到的结果和书中不一样

相关章节

CH17 潜在语义分析

相关主题

  • 代码
  • 文档
  • 示例

问题描述

就$P_{330}$中的结果,使用np.svd拿到的结果和书中的结果不太一样,有符号差异,为什么?

AdaBoost测试案例整理

相关章节

CH08

相关主题

  • 代码
  • 文档
  • 示例

问题描述

测试案例分解
代码整理
这章节笔记也要重新整理, 大bug,之前没注意, 这章笔记基本没整理过来。
后面加法模型与前向分步算法处理下。

EM部分测试案例

相关章节

CH10 HMM

相关主题

  • 代码
  • 文档
  • 示例

问题描述

  • [x]针对EM算法应该采用什么样的测试案例验证算法的正确性.

增加一维和多维的数据生成.

比较近的数据混合, 用工具包看下效果.

EM算法

  • [ ]EM算法应用到朴素贝叶斯的非监督学习
  • [X]EM算法推导BMM过程

README里面图entropy有问题

相关章节

CH0---

相关主题

  • 代码
  • [*] 文档
  • 示例

问题描述

最后的图entropy写成了enntropy

这个图不是太完整,统一一下风格, 做成矢量图,补充一下数据集的说明。

提升方法推导过程提问

相关章节

CH08---提升方法

相关主题

  • 代码
  • 文档
  • 示例

问题描述

AdaBoost算法最终分类器的训练误差界是怎么推导出来的:
$$
\frac{1}{N}\sum\limits_{i=1}\limits^N I(G(x_i)\neq y_i)\le\frac{1}{N}\sum\limits_i\exp(-y_i f(x_i))=\prod\limits_m Z_m
$$
看第一版有详细的说明, 但是还有个地方不太明白是怎么推导出来的
$$
\frac{1}{N}\sum_i exp \left ( -\sum_{m=1}^M a_m y_i G_m(x_i)\right ) \
= \sum_i w_{1i}\prod_{m=1}^M exp \left ( -a_m y_i G_m(x_i) \right)
$$
麻烦老师讲解

图片无法正常显示

相关章节

CH02

问题描述

具体问题描述
如“关于感知机为什么不能处理异或问题, 可以借助下图理解。”这句话下面的图片无法正常显示。

GMM聚类怎么确定类别的?

相关章节

CH09-EM算法及其推广

相关主题

  • 代码
  • 文档
  • 示例

问题描述

使用EM算法估计GMM的参数,做聚类的应用。怎么决定样本的类别的?

考虑是否需要改进示例10.2

相关章节

CH10 HMM

相关主题

  • 代码
  • 文档
  • 示例

问题描述

这个例子里面状态集合大小和观测序列长度一样, 实现的时候axis容易混淆.
是不是可以考虑增加T到4或5

解压密码是多少

相关章节

CH0---

相关主题

  • 代码
  • 文档
  • 示例

问题描述

具体问题描述

整理前向后向部分代码

相关章节

CH10 HMM

相关主题

  • 代码
  • 文档
  • 示例

问题描述

这部分代码写的不够整洁, 重新整理一下.
递推应该可以写的比较美

CRF 相关问题

  • e111
  • e112
  • e113
  • 如何对特征函数进行抽象
  • 为什么CRF要介绍三种表达形式?
  • 应用举例

后向与前向求解一致性问题.

相关章节

CH10 HMM

相关主题

  • 代码
  • 文档
  • 示例

问题描述

后向算法求观测序列概率和前向算法有千分位差异, 问题出在哪里

关于LSA的一些问题

相关章节

CH17

相关主题

  • [ lsa] 代码

问题描述

首先,非常感谢能无私开源自己的代码,对我们的学习真的很有帮助。
在lsa的fit()方法中,这个函数的作用是将x->x_trainsform。但是我不太理解为什么x_transform是Us,因为U本身已经是话题向量空间。svh代表文本在话题向量空间中的表示。那么这里x_transform的含义是什么?
而component返回的则是vh,这个component的意义又是什么?
还有explained_variance是计算的x_transform的方差,这个的意义又是什么

Undefined names: 'x' and 'rst'

flake8 testing of https://github.com/SmirkCao/Lihang on Python 3.7.1

$ flake8 . --count --select=E901,E999,F821,F822,F823 --show-source --statistics

./CH11/crf.py:60:59: F821 undefined name 'x'
                    self.M[i, j, :] = self.f[k](y_i, y_j, x, j)
                                                          ^
./CH10/hmm.py:153:24: F821 undefined name 'rst'
                return rst
                       ^
2     F821 undefined name 'rst'
2

E901,E999,F821,F822,F823 are the "showstopper" flake8 issues that can halt the runtime with a SyntaxError, NameError, etc. These 5 are different from most other flake8 issues which are merely "style violations" -- useful for readability but they do not effect runtime safety.

  • F821: undefined name name
  • F822: undefined name name in __all__
  • F823: local variable name referenced before assignment
  • E901: SyntaxError or IndentationError
  • E999: SyntaxError -- failed to compile a file into an Abstract Syntax Tree

关于第二章感知机的代码

相关章节

CH02

相关主题

            yy_ = 2 * y[index] - 1
            wx = np.dot(self.w, xx_)

            if wx * yy_ > 0:
                correct_count += 1
                if correct_count > self.max_iter_:
                    break
                continue

想知道 1.yy_ 为什么不是直接取的类别的值,而是乘以2-1,2.按照算法2.1理解,终止条件应该是没有误分类点或者迭代到最大次数,这里用准确次数大于迭代次数合适吗

库文件主函数中设置日志的意义是什么?

相关章节

CH02---感知机

相关主题

  • 代码
  • 文档
  • 示例

问题描述

perceptron.py

if __name__ == '__main__':
    logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')
    logger = logging.getLogger(__name__)

    ap = argparse.ArgumentParser()
    ap.add_argument("-p", "--path", required=False, help="path to input data file")
    args = vars(ap.parse_args())
else:
    logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')
    logger = logging.getLogger(__name__)

在单元测试中,以上设置日志的代码显然是有意义的,在库perceptron中包含这样的代码的作用是什么?

全书Review-02

  • CH01
  • CH02
  • CH03
  • CH04
  • CH05
  • CH06
  • CH07
  • CH08
  • CH09
  • CH10
  • CH11
  • CH12

CH06中logistic_regression代码的问题

相关章节

CH06

相关主题

  • 代码

问题描述

logistic_regression.py中第74行代码:rst_ = (1 / m) * np.dot(x_.T, y_ * sigmoid(np.dot(x_, w_))) (g函数);
如果使用梯度下降作为更新法则,应该是y_ - sigmoid(np.dot(x_, w_))才对吧?请问作者为什么这里给的是y_ * sigmoid(np.dot(x_, w_))呢?感谢。

感知机中的w怎么画出来的?

相关章节

CH02-感知机

相关主题

  • 代码
  • 文档
  • 示例

问题描述

具体问题描述
图2.1 或者后面支持向量机中的图7.2, 7.3, 7.5之类

关于支持向量机有6个向量拉格朗日对偶来求怎么理解?

相关章节

CH07 支持向量机

相关主题

  • 代码
  • 文档
  • 示例

问题描述

在知乎上推了这么个问题,有空可以处理下。
原链接

关于支持向量机有6个向量拉格朗日对偶来求怎么理解?
线性支持向量机对如下两类可分数据进行分类:

+1:(1,1),(2,2),(2,0)

-1:(0,0),(1,0),(0,1)

(1)在图中做出这6个训练点,构造具有最优超平面和最优间隔的权重向量

(2)说明支持向量是哪些

(3)通过寻找拉格朗日乘子αi来构造在对偶空间中的解,并将其与(1)中的结果比较

楼主能否提供PDF?

相关章节

CH0---

相关主题

  • 代码
  • 文档
  • 示例

问题描述

具体问题描述

能否提供下pdf文件下载,现在的md 公式显示不太全。

EM例9.1

相关章节

CH09---

相关主题

  • 代码
  • 文档
  • 示例

问题描述

书中描述
独立的重复n次实验(这里n=10), 观测结果如下:
1,1,0,1,0,0,1,0,1,1

上面这个观测,
1,1,1,1,1,1,0,0,0,0有区别么?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.