Giter Site home page Giter Site logo

nlp-love / ml-nlp Goto Github PK

View Code? Open in Web Editor NEW
15.4K 382.0 4.5K 11.68 MB

此项目是机器学习(Machine Learning)、深度学习(Deep Learning)、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。

Home Page: http://mantchs.com/

Python 8.88% Jupyter Notebook 91.02% Shell 0.10%
nlp machine-learning deep-learning

ml-nlp's Introduction

项目介绍

  • 此项目是机器学习、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。
  • 既然是以面试为主要目的,亦不可以篇概全,请谅解,有问题可提出。
  • 此项目以各个模块为切入点,让大家有一个清晰的知识体系。
  • 此项目亦可拿来常读、常记以及面试时复习之用。
  • 每一章里的问题都是面试时有可能问到的知识点,如有遗漏可联系我进行补充,结尾处都有算法的实战代码案例
  • 思维导图,请关注 AIArea 公众号并回复:NLP思维导图 ,即能下载高清大图。

目录

  • 项目持续更新中......
模块 章节 负责人(GitHub) 联系QQ
机器学习 1. 线性回归(Liner Regression) @mantchs 448966528
机器学习 2. 逻辑回归(Logistics Regression) @mantchs 448966528
机器学习 3. 决策树(Desision Tree) @mantchs 448966528
机器学习 3.1 随机森林(Random Forest) @mantchs 448966528
机器学习 3.2 梯度提升决策树(GBDT) @mantchs 448966528
机器学习 3.3 XGBoost @mantchs 448966528
机器学习 3.4 LightGBM @mantchs 448966528
机器学习 4. 支持向量机(SVM) @mantchs 448966528
机器学习 5. 概率图模型(Probabilistic Graphical Model)
机器学习 5.1 贝叶斯网络(Bayesian Network) @mantchs 448966528
机器学习 5.2 马尔科夫(Markov) @mantchs 448966528
机器学习 5.3 主题模型(Topic Model) @mantchs 448966528
机器学习 6.最大期望算法(EM) @mantchs 448966528
机器学习 7.聚类(Clustering) @mantchs 448966528
机器学习 8.ML特征工程和优化方法 @mantchs 448966528
机器学习 9.K近邻算法(KNN) @mantchs 448966528
深度学习 10.神经网络(Neural Network) @mantchs 448966528
深度学习 11. 卷积神经网络(CNN) @mantchs 448966528
深度学习 12. 循环神经网络(RNN) @mantchs 448966528
深度学习 12.1 门控循环单元(GRU) @mantchs 448966528
深度学习 12.2 长短期记忆(LSTM) @mantchs 448966528
深度学习 13.迁移学习(Transfer) @mantchs 448966528
深度学习 14.强化学习(Reinforcement) & 多任务 @mantchs 448966528
深度学习 15. 深度学习的优化方法 @mantchs 448966528
NLP 16. 自然语言处理(NLP) @mantchs 448966528
NLP 16.1 词嵌入(Word2Vec) @mantchs 448966528
NLP 16.2 子词嵌入(fastText) @mantchs 448966528
NLP 16.3 全局向量词嵌入(GloVe) @mantchs 448966528
NLP 16.4 textRNN & textCNN @mantchs 448966528
NLP 16.5 序列到序列模型(seq2seq) @mantchs 448966528
NLP 16.6 注意力机制(Attention Mechanism) @mantchs 448966528
NLP 16.7 Transformer模型 @mantchs 448966528
NLP 16.8 BERT模型 @mantchs 448966528
NLP 16.9 XLNet模型 @mantchs 448966528
项目 17. 推荐系统(Recommendation System) @mantchs 448966528
项目 18. 智能客服(Intelligent Customer Service) @mantchs 448966528
项目 19. 知识图谱(Knowledge Graph)
项目 20. 评论分析

欢迎大家加入!共同完善此项目!NLP学习QQ2群【207576902】NLP学习群②

ml-nlp's People

Contributors

nlp-love avatar tolicwang avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

ml-nlp's Issues

kc_train2.csv

housing price 中没有提供数据kc_train2.csv

target=pd.read_csv('kc_train2.csv') #销售价格

**

文章中的**是什么啊?

GBDT data

GBDT训练数据和测试数据是一样的,可以更正下

GBDT和RF算法的对比存在问题

第3章说GBDT使用了决策树,不需要归一化等特殊处理,后面对比RF时又说GBDT需要归一化,二者矛盾,希望作者您查看是否存在描述错误,有的话进行订正。

感谢您的工作!祝好!

GBDT不需要对特征进行归一化

GBDT由于是采用树模型作为基模型,因此也不需要对特征进行归一化。GBDT的求导是针对前面模型的预测值进行求导的而不是针对参数进行求导的,因此从梯度角度考虑也并不需要对特征进行归一化。

seq2seq章节的一个修改建议

在seq2seq章节中的编码器小节中,输⼊ xt 的特征向量 xt 和上个时间步的隐藏状态..., 建议将其修改为`输⼊数据x^t和上个时间步的隐藏状态,因为在编码器中每个隐藏层的输入是输入数据和上一步的隐藏状态,而不是输入数据的特征向量。

运行预处理数据代码的时候报错

print(globals()['doc'] % locals())
TypeError: unsupported operand type(s) for %: 'NoneType' and 'dict'

请问在word2vec.ipynb这个样例中遇到这种情况应该该怎么办

频率派vs贝叶斯派、先验概率、后验概率这里概念有问题

老兄,频率派vs贝叶斯派、先验概率、后验概率这里概念有些问题呀
频率派和贝叶斯派主要区别在于对概率概念的定义,频率派用的客观概率,贝叶斯派用的主观概率
先验概率和后验概率区别在于多个随机变量信息的相互校验啊

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.