딥러닝에서 사용되는 여러 유형의 Convolution 소개 <a href="https://zzsza.github.io/

data/2018/02/23/introduction-convolution/ about blog-comments HOT 13 CLOSED

zzsza commented on June 16, 2024

data/2018/02/23/introduction-convolution/

from blog-comments.

Comments (13)

zzsza commented on June 16, 2024

으엨ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ공부하다 검색해서 들어왔는데 블로그주인이 익숙하신분ㅋㅋㅋㅋㅋ 구글검색어 상위에있었어요 !! 성윤님 블로그 짱이네요ㅋㅋㅋㅋ -Hayeon

This comment was made by Disqus. 2018-05-18 11:17:24 Debbie

from blog-comments.

zzsza commented on June 16, 2024

transposed convolution이 헷갈렸는데 잘 설명해주셔서 많이 도움이 됐습니다
그런데 위에 convolution, transposed convolution에 대한 매트릭스 연산부분의 그림에 오류가 있어보이네요
convolution 연산에서 Y2 Y3 output을 만드는 연산에 사용되는 w 매트릭스 3, 4 번 row가
오른쪽으로 2 column 이동해야할것같습니다
이거에 따라서 transposed convolution weight 매트릭스도 바뀌어야할것같아요

This comment was made by Disqus. 2018-10-22 09:05:53 JongWon Jung

from blog-comments.

zzsza commented on June 16, 2024

종원님 안녕하세요! :)

그림을 퍼오면서 Y0, Y1 만 계산해보고 뒷부분은 그냥 넘어갔는데 이렇게 찾아주셔서 너무 감사합니다!! 조만간 이미지 위에 설명 덧붙일게요! 감사합니다 :)

This comment was made by Disqus. 2018-10-22 10:41:29 Seong Yun Byeon

from blog-comments.

zzsza commented on June 16, 2024

transpose convolution 에서 convolution 연산 행렬로 나타낸 그림이 좀 잘못됬네요.

This comment was made by Disqus. 2019-06-04 03:40:50 Kim NamUk

from blog-comments.

zzsza commented on June 16, 2024

그림이 잘못되었는데, 어떤 부분이 잘못되었는지 생각해볼 수 있도록 본문에 내용을 추가했습니다! 알려주셔서 감사합니다 :)

This comment was made by Disqus. 2019-09-06 08:43:38 Seong Yun Byeon

from blog-comments.

zzsza commented on June 16, 2024

receptive field라는 것이 안쪽에 밝은 파란색 공간을 말하는 건가요? 아니면 전체적인( 어두운 부분과 밝은 부분 전체적인 부분을 말하는건가요?

This comment was made by Disqus. 2019-09-24 01:44:30 구링

from blog-comments.

zzsza commented on June 16, 2024

전체적인 부분입니다. 첫 이미지에서 5*5 사이즈인 필드가 이동하고 있습니다!

This comment was made by Disqus. 2019-09-25 01:19:50 Seong Yun Byeon

from blog-comments.

zzsza commented on June 16, 2024

좋은 글 감사합니다

This comment was made by Disqus. 2020-01-13 03:29:42 afewthings

from blog-comments.

zzsza commented on June 16, 2024

안녕하세요 좋은 글 감사합니다. 다만 글의 몇몇 부분이 제가 찾아본 것과 달라 댓글 남겨봅니다.

사용하신 gif들의 원 출처라고 예상되는 깃헙 에서 언급한 논문의 fig4.5와 따라오는 설명을 보면

It is equivalent to convolvinga3×3kernel over a2×2input (with1zero inserted between inputs) paddedwith a2×2border of zeros using unit stride

라고 되어 있습니다.

즉, transposed conv를 설명하실 때 사용하셨던 gif는 transposed conv를 직접 표현한 것이 아니라 transposed conv와 같은 일을 하는 direct conv를 표현한 것이고 이것 때문에 input에 임의의 padding이 들어간 것입니다.

오히려 deconv를 설명하신 부분(

input의 각 픽셀으로부터 9개의 값을 뽑아야 합니다. 그 후에 우리는 stride가 2인 출력 이미지를 지나갑니다.

)은 transposed conv에 대한 설명 같습니다. deconv와 transposed conv는 어떤 conv를 행렬곱으로 표현했을 때 각각 역행렬의 곱과 전치행렬의 곱으로 표현될 수 있고 전치행렬로 표현한 경우에는 마치 각 픽셀로부터 9개의 똑같은 값을 뽑고, 이를 kernel에 지나보내면서 stride를 2로 출력이미지를 지나가는 것처럼 보일 수 있습니다.

부족한 부분이 있다면 지적해주시면 감사하겠습니다.

This comment was made by Disqus. 2020-01-13 05:32:01 Changmin Choi

from blog-comments.

zzsza commented on June 16, 2024

안녕하세요 좋은 글 감사합니다. 다만 글의 몇몇 부분이 제가 찾아본 것과 달라 댓글 남겨봅니다.
사용하신 gif들의 원 출처라고 예상되는 깃헙에서 언급한 논문의 fig4.5와 따라오는 설명을 보면

It is equivalent to convolvinga3×3kernel over a2×2input (with1zero inserted between inputs) paddedwith a2×2border of zeros using unit stride

라고 되어 있습니다.
즉, transposed conv를 설명하실 때 사용하셨던
gif는 transposed conv를 직접 표현한 것이 아니라 transposed conv와 같은 일을 하는 direct
conv를 표현한 것이고 이것 때문에 input에 임의의 padding이 들어간 것입니다.
오히려 deconv를 설명하신 부분(

input의 각 픽셀으로부터 9개의 값을 뽑아야 합니다. 그 후에 우리는 stride가 2인 출력 이미지를 지나갑니다.

)은
transposed conv에 대한 설명 같습니다. deconv와 transposed conv는 어떤 conv를 행렬곱으로
표현했을 때 각각 역행렬의 곱과 전치행렬의 곱으로 표현될 수 있고 전치행렬로 표현한 경우에는 마치 각 픽셀로부터 9개의 똑같은
값을 뽑고, 이를 kernel에 지나보내면서 stride를 2로 출력이미지를 지나가는 것처럼 보일 수 있습니다.
부족한 부분이 있다면 지적해주시면 감사하겠습니다.

This comment was made by Disqus. 2020-02-05 05:48:01 Changmin Choi

from blog-comments.

zzsza commented on June 16, 2024

안녕하세요. 좋은 글 감사합니다. 이 게시글에 제가 단 댓글이 스팸처리 된 것에 관해서 메일을 보냈는데 혹시 확인 가능하실까요?

This comment was made by Disqus. 2020-02-11 02:20:01 Changmin Choi

from blog-comments.

zzsza commented on June 16, 2024

안녕하세요. 제가 매트랩에서 이미지 256x256 사이즈를 3x3사이즈 kernel 필터로 convolution하려고 하는데 for문 2개를 돌리니까 계산시간이 너무 오래걸려서요... 혹시 방법을 아실까요???

This comment was made by Disqus. 2020-06-13 06:14:45 쉰당동

from blog-comments.

zzsza commented on June 16, 2024

안녕하세요 질문이 있습니다.
'5x5 커널을 사용하고 두번째 열과 행을 모두 삭제하면 (3x3 커널을 사용한 경우 대비)동일한 계산 비용으로 더 넓은 시야를 제공합니다.'
라고 하신 부분이 잘 이해가 되지 않는데요
5x5 커널의 두번째와 네번째 열과 행을 모두 삭제하면 3x3 커널을 사용한 경우( dilation rate가 1인경우, 즉 확장되지 않은 경우) 대비 동일한 계산 비용(파라미터 9개)으로 더 넓은 시야를 제공합니다
라고 이해하면 될까요?
양질의 글 감사드립니다

This comment was made by Disqus. 2020-12-26 04:58:46 JinSoo Song

from blog-comments.

data/2018/02/23/introduction-convolution/ about blog-comments HOT 13 CLOSED

Comments (13)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent