Giter Site home page Giter Site logo

关于应用于FPN about open-aff HOT 7 CLOSED

Pluto1314 avatar Pluto1314 commented on August 24, 2024
关于应用于FPN

from open-aff.

Comments (7)

YimianDai avatar YimianDai commented on August 24, 2024

您好,AFF / iAFF 仅仅旨在取代 X + Y 中的加号。X, Y 这两个特征能相加的前提是两者必须是相同的大小的,所以 AFF / iAFF 对其的前提假设就是如此,这个您可以见论文4.1 小节的第一句话就假设了两者具有相同大小。具体到 FPN 中,那 X 其实是经过 PWConv 变换到跟 Y 相同通道数后的特征,Y 则是用 BilinearResize2D 到跟 X 相同尺寸后的特征,如此 X 和 Y才可以相加。 在图 3(c)中,蓝色的箭头表示通道数变换,红色的表示 Upsampling。

非常感谢您这个问题!我回去翻了一下论文,发现在我重写了一遍论文后,对红色、蓝色箭头的说明文字消失了(在初稿中是有的)。因为重写地非常匆忙,这个的确是我的疏忽,非常感谢您的指正,我在后期的修改版中会添加相应内容。

再次感谢~

from open-aff.

Pluto1314 avatar Pluto1314 commented on August 24, 2024

您好,非常感谢您的回答。
我明白您的意思了。我还有个疑问,如何我不使用相邻stage的特征层输入AFF(比如:下采样为32的层(Y)和下采样为16的层(X)),那么是不是意味着我需要将X使用PWConv将输出通道与Y匹配,而Y需要经过4倍上采样与X的尺度匹配。
通道以Y为标准,尺度以X为标准,是这个意思吗?
期待您的回复。

from open-aff.

YimianDai avatar YimianDai commented on August 24, 2024

标准的 FPN 的做法应该是 通道数往维数高的看齐,空间尺寸则往大的看齐。所以具体到您的 case,我只能说照理应该如此。但实际上,如果类别数比较少的话(比如二分类的话),我觉得维数去迁就低的可能差别也不大(需要跑过实验才知道),这个问题其实是网络设计的问题了,就 AFF/iAFF 来说,只要 X 和 Y 一样大小就行了。

PS:我想问下,邮箱里问 FPN 的是您吗?如果是的话,我一并回复了。我在手机上看到了您的消息,但想转到电脑上打字,梯子不太给力,一个小时多了,gmail 页面还没打开,囧。。。

from open-aff.

Pluto1314 avatar Pluto1314 commented on August 24, 2024

from open-aff.

YimianDai avatar YimianDai commented on August 24, 2024

哦哦,梯子突然灵光了刚刚,我回您邮件了哈。check 了一下邮件,发现我看不到抄送信息,否则就不用问了哈。

from open-aff.

Pluto1314 avatar Pluto1314 commented on August 24, 2024

from open-aff.

twsha avatar twsha commented on August 24, 2024

您好,我想请问一下AFF或者说iAFF如何应用于FPN呢,以AFF为例,X、Y分别为不同stage下的特征层,文章中说Y是高语义的,那么以resnet中下采样为32的层(Y)和下采样为16的层(X)来说,如何能使X+Y呢,这两个首先特征图的尺度不同,其次维度也不同。

很抱歉打扰您,期待您的回复,谢谢!

你好,请问你是如何把aff融合到fpn中encoder与deocder的每一层的跳跃连接中的

from open-aff.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.