Giter Site home page Giter Site logo

importance分数 about docee HOT 15 CLOSED

miraitowa9 avatar miraitowa9 commented on July 29, 2024
importance分数

from docee.

Comments (15)

Spico197 avatar Spico197 commented on July 29, 2024 1

我感觉完全图可能是更好的方式,因为选取的触发词可能存在共享,这样剪枝后的伪触发词(如果多个事件共享这个触发词)就会到事件缺失。当然大佬的论文里面实验表明触发词更有用,我感觉可能是因为判断是否连接的方式还不是最优导致的剪枝完全图更有效。

嗯啊,我也是先做完全图的,只是发现完全图的连接判断做的不好,很多连接关系被误判了,才想到剪枝的方案,选择一部分论元作为伪触发词组。

from docee.

WindSearcher avatar WindSearcher commented on July 29, 2024 1

我感觉完全图可能是更好的方式,因为选取的触发词可能存在共享,这样剪枝后的伪触发词(如果多个事件共享这个触发词)就会到事件缺失。当然大佬的论文里面实验表明触发词更有用,我感觉可能是因为判断是否连接的方式还不是最优导致的剪枝完全图更有效。

嗯啊,我也是先做完全图的,只是发现完全图的连接判断做的不好,很多连接关系被误判了,才想到剪枝的方案,选择一部分论元作为伪触发词组。

嗯嗯,所以我尝试了网络分类的方式,五分类,连接效果上去了一些,但整体的抽取效果不行。二分类直接recall飘升,precision飞速下跌。目前在尝试其它方式建模。

from docee.

miraitowa9 avatar miraitowa9 commented on July 29, 2024 1

这个得分用"#"号注释后,模型如何知道这个得分?这个得分如何起作用?
模型是不知道具体分值是多少的,这里的分值只是作为伪触发词importance的一个参考。
不好意思哈,我可能还是不太理解这个得分怎么用的?是根据12345的顺序从小到达的得分吗?这个“参考”是给我们可视化看一下嘛?
我修改了一个事件类型,将它的格式改为Dueefin,但是用trigger.py文件生成的得分全是1.0,
image

如果您的数据里有标注trigger,并且每个trigger只对应一个事件实例,那么importance就会是1.0的。dict里面的1234 keys表示伪触发词的数量,是可以作为超参控制的。

非常感谢,我知道啦!

from docee.

Spico197 avatar Spico197 commented on July 29, 2024

嗨您好,这里的dict表示伪触发词的数量和具体的伪触发词role,后面的分数是通过计算existence和distinguishability得来的,可以参考论文2.3节 [link].

对应代码在:这里

from docee.

WindSearcher avatar WindSearcher commented on July 29, 2024

嗨您好,这里的dict表示伪触发词的数量和具体的伪触发词role,后面的分数是通过计算existence和distinguishability得来的,可以参考论文2.3节 [link].

对应代码在:这里

哈哈,正好我也有疑惑,我跑trigger.py文件直接报错

from docee.

WindSearcher avatar WindSearcher commented on July 29, 2024

嗨您好,这里的dict表示伪触发词的数量和具体的伪触发词role,后面的分数是通过计算existence和distinguishability得来的,可以参考论文2.3节 [link].
对应代码在:这里

哈哈,正好我也有疑惑,我跑trigger.py文件直接报错

auto_select(
tot_data,
strategy="high",
max_trigger_num=num_trigger_group,
verbose=True,
with_trigger=False,
)
这里要注意,如果是ChFinAll,with_trigger=False,因为这个参数是表明数据集中有无标注的触发词,而ChFinAll数据集无标注的触发词

from docee.

Spico197 avatar Spico197 commented on July 29, 2024

嗨您好,这里的dict表示伪触发词的数量和具体的伪触发词role,后面的分数是通过计算existence和distinguishability得来的,可以参考论文2.3节 [link].
对应代码在:这里

哈哈,正好我也有疑惑,我跑trigger.py文件直接报错

嗨,请问是会报什么错呀,可以再开一条issue,我看看是不是后来改代码的时候有哪里变动有问题。

from docee.

WindSearcher avatar WindSearcher commented on July 29, 2024

嗨您好,这里的dict表示伪触发词的数量和具体的伪触发词role,后面的分数是通过计算existence和distinguishability得来的,可以参考论文2.3节 [link].
对应代码在:这里

哈哈,正好我也有疑惑,我跑trigger.py文件直接报错

嗨,请问是会报什么错呀,可以再开一条issue,我看看是不是后来改代码的时候有哪里变动有问题。

已经解决啦,在本条issue里面回复了解决方案,因为数据集的问题勒。

from docee.

Spico197 avatar Spico197 commented on July 29, 2024

嗨您好,这里的dict表示伪触发词的数量和具体的伪触发词role,后面的分数是通过计算existence和distinguishability得来的,可以参考论文2.3节 [link].
对应代码在:这里

哈哈,正好我也有疑惑,我跑trigger.py文件直接报错

嗨,请问是会报什么错呀,可以再开一条issue,我看看是不是后来改代码的时候有哪里变动有问题。

已经解决啦,在本条issue里面回复了解决方案,因为数据集的问题勒。

好嘞好嘞,谢谢您~

from docee.

miraitowa9 avatar miraitowa9 commented on July 29, 2024

这个得分用"#"号注释后,模型如何知道这个得分?这个得分如何起作用?

from docee.

WindSearcher avatar WindSearcher commented on July 29, 2024

这个得分用"#"号注释后,模型如何知道这个得分?这个得分如何起作用?
得分是根据角色的存在性(是否非空)和区分性(其它事件实例没有这个角色对应的论元值)相乘得到分数,分数的作用是选取触发词,分数高的作为触发词。

from docee.

Spico197 avatar Spico197 commented on July 29, 2024

这个得分用"#"号注释后,模型如何知道这个得分?这个得分如何起作用?

模型是不知道具体分值是多少的,这里的分值只是作为伪触发词importance的一个参考。

from docee.

WindSearcher avatar WindSearcher commented on July 29, 2024

我感觉完全图可能是更好的方式,因为选取的触发词可能存在共享,这样剪枝后的伪触发词(如果多个事件共享这个触发词)就会到事件缺失。当然大佬的论文里面实验表明触发词更有用,我感觉可能是因为判断是否连接的方式还不是最优导致的剪枝完全图更有效。

from docee.

miraitowa9 avatar miraitowa9 commented on July 29, 2024

这个得分用"#"号注释后,模型如何知道这个得分?这个得分如何起作用?
模型是不知道具体分值是多少的,这里的分值只是作为伪触发词importance的一个参考。
不好意思哈,我可能还是不太理解这个得分怎么用的?是根据12345的顺序从小到达的得分吗?这个“参考”是给我们可视化看一下嘛?
我修改了一个事件类型,将它的格式改为Dueefin,但是用trigger.py文件生成的得分全是1.0,
image

from docee.

Spico197 avatar Spico197 commented on July 29, 2024

这个得分用"#"号注释后,模型如何知道这个得分?这个得分如何起作用?
模型是不知道具体分值是多少的,这里的分值只是作为伪触发词importance的一个参考。
不好意思哈,我可能还是不太理解这个得分怎么用的?是根据12345的顺序从小到达的得分吗?这个“参考”是给我们可视化看一下嘛?
我修改了一个事件类型,将它的格式改为Dueefin,但是用trigger.py文件生成的得分全是1.0,
image

如果您的数据里有标注trigger,并且每个trigger只对应一个事件实例,那么importance就会是1.0的。dict里面的1234 keys表示伪触发词的数量,是可以作为超参控制的。

from docee.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.