Giter Site home page Giter Site logo

tri325 / nlp_ability Goto Github PK

View Code? Open in Web Editor NEW

This project forked from da-southampton/nlp_ability

0.0 1.0 0.0 6 KB

分享自然语言处理工程师(NLP)需要积累的各方面知识,包括各种面试题,基础知识,工程能力等等,提升核心竞争力

nlp_ability's Introduction

背景介绍

建立这个仓库是为了梳理自然语言处理(NLP)各个方面的知识,提升自己的核心竞争力。我觉得NLP是一个值得深耕的领域,所以希望可以不停的提升自己的段位!

深度学习自然语言处理

1.Transformer

Transformer 相关知识 进度
史上最全Transformer面试题 已完成并上传
手撕Transformer代码-详细解读 已完成未上传

2.词向量-word embedding

  • Word2vec

    Word2vec相关知识 进度
    史上最全Word2vec面试题 已完成未上传
    Word2vec各种细节的详细解读 已完成未上传
    基于自己语料训练词向量的各种细节和经验 已完成未上传
  • Fasttext

    Fasttext相关知识 进度
    Fasttext源码详细解读(C++版) 正在进行中
    Fasttext各种细节的详细解读 尚未完成
  • Glove

    Glove相关知识 进度
    GLove细节详细解读 尚未完成
    Glove训练词向量代码及解读 已完成未上传

3 句向量-sentence embedding

无监督模式:

  • 统计词袋模型表示句子向量

    统计词袋模型相关知识 进度
    One-hot/TF-IDF
  • 词向量词袋模型

    词向量词袋模型相关知识 进度
    平均/tf-idf 词向量(word2vec/glove)
  • Doc2vec

  • SIF

    SIF 相关知识 进度
    SIF论文详细解读 已完成未上传
    SIF在中文文本上代码及效果解读 已完成未上传
  • WMD

  • Skip-Thought vecotrs

  • Quick-Thought Vectors

  • Power Mean 均值模型

有监督:

  • Cove

  • InferSent

  • Bert

    Bert表示句向量 相关知识 进度
    Bert表示句向量效果详细解读 已经完成未上传

4. 机器翻译

机器翻译相关知识 进度
OpenNMT源代码解读(pytorch版) 进行中
手撕Seq2seq-attention机器翻译代码 已完成未上传
基于seq2seq机器翻译的各种优化策略解读 已完成未上传
subword相关论文详细解读 已完成未上传
ConS2S论文详细解读 已完成未上传
GNMT论文详细解读 已完成未上传
Seq2seq过程图画版详细解读 已完成未上传

5. 命名体识别

命名体识别相关资源 进度
HMM/CRF 详细解读 已完成未上传
BiLstm-CRF详细解读 已完成未上传
手撕BiLSTM-CRF代码 进行中
词典匹配命名体识别详细解读 已完成未上传
命名体识别最新进展 进行中

6. 文本分类

文本分类相关知识 进度
TextCNN论文详细解读 已完成未上传
手撕 TextCNN/Fasttext/Albert 文本分类 已完成未上传
TextCNN/Fasttext/Albert 实际工作应用经验 已完成未上传
多标签文本分类 进行中
文本分类各种优化策略和方法 进行中

7. 关键词提取

关键词提取相关知识 进度
TFIDF模型提取关键词解读 已完成未上传
TextRank提取关键词 已完成未上传
各种dirty工作技巧 进行中

模型部署

1.Kafka

2.Docker

3.Elasticsearch

4.Flask+nginx

5. Grpc

6. TensorRT

nlp_ability's People

Contributors

da-southampton avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.