Giter Site home page Giter Site logo

paper_notes's People

Contributors

yuhongho avatar

Watchers

 avatar

paper_notes's Issues

热点疑问(经常思考)

self-attention(也属于transformer的内容) 是将内容信息和位置信息结合起来,

向模型提供更多的先验知识——未来热点

RNN与transformer(块的概念)的结合

怎么知道模型到底学到了句子的什么东西:句子长度,句法结构

老师对论文的分析,学习方法

(以此论文为例:(Deena et al., INTERSPEECH 2017) Semi-supervised Adaptation of RNNLMs by Fine-tuning with Domain-specific Auxiliary Features)

(1)(这里的[3]和[17]都是同类顶会的论文,分别是14和16年的)

6h2 07fd hk e x d 1

(2)提出4种方法:

22gsvez qi 8fd4d9 znn5h

  • [ 其中,第一种相当于430:]
    bwmxjv z2i i kqg v 44

  • [另外三种值得看看: ]
    bwmxjv z2i i kqg v 44

  • [stacking: ]
    z d 3zat1x9a i v z1y g

  • [ Extra Perceptron:]
    7cizdt9u6 ui a 2aj9 sxx

  • [Feature Sub-network: ]
    e x2 w t q 2 z z5dl m

(3)他们选了第四种,并对为什么不选其他三种做了简要交代:

1 sfqfhv ux _ xf umml 3

(4)本文的贡献:在LM,RNNLM,Feature-based RNNLM,以及里边的具体化的Feature Sub-network的方法的基础上做的:

7 q y 1 t3 1h82n u

(5)实验看了一下,不是太明确他们PK谁:P 貌似他们做的是一个新的半监督的方法。迟点细看一下。

在论文中如何定位到前沿工作的介绍

靠的是引言和相关工作:(以此论文为例:(Deena et al., INTERSPEECH 2017) Semi-supervised Adaptation of RNNLMs by Fine-tuning with Domain-specific Auxiliary Features)

(1)引言概述技术进展并指出要解决的问题(存在的困难或者有时也会是技术挑战):
euprefl m1y7m rw6ff2mad
这段之后,评审和读者都可以很清楚地明白问题所在,以及论文的技术定位: 采用主流技术Feature-based RNNLM,并考虑特征怎么取得。

(2)第二章(2. Background and Related Work)具体展开上述提到的“采用主流技术Feature-based RNNLM”:LM->RNNLM->Feature-based RNNLM->Feature Sub-network 的Feature-based RNNLM。

(3)第三章(3. Semi-supervised Adaptation Methods)具体介绍采用了什么半监督自适应方法去取得有一定获取难度的特征:
zjt4oc 0f 1a2 zrw8alx

关于论文的pk对象

自己维持一个自己的方案以及PK对象的结果列表。

PK对象可以适当有所选择。比如培松那边目前没有用额外知识,则可以考虑选择性排除一些“对手”,比如比赛的前几名属于open的(外加资源不明),又比如意图识别的研究进展中在ATIS数据集有用slot filling和intent联合训练的,都可以适当排除掉不PK。

给个例子:在做 对话行为识别(也是一种分类,不过不是intent,而是DA),Tran 有两篇论文是这么处理的:
1、(用于去除采用了词向量作为输入,他们表2 PK的都没用词向量):
6mpn04ee80khdc40 p yr 5

2、(用于去掉PK不过的一个文献,这个文献也没用词向量,但宣称达到77%,而他们重现对方方法只取得72.5%)
26i7 eo7umwcs _l u8vemp

在数学上成熟指的是什么

在数学上成熟(即熟练掌握概率论,统计学,线性代数,优化和微积分)。测试自己的一种方法是仔细阅读最近在ICML / NIPS / AAAI / IJCAI会议上发表的一些最佳ML论文,看看你是否能完全理解那些论文中主要方程式的详细数学表达。

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.