https://m.blog.naver.com/mincheol9166/221736294296
**야 근데, encoding, decoding, backward learning 이거 용어 차이를 좀 구분해야겠다. 아래에 쓰여있는게 잘못되어있을수도 있다. 내가 아직 잘 모르기 때문
downsampling
- CNN layer를 지나면서 Pooling layer, Stride, Padding 등에 의해 계속 작아지는 과정
- spatial information*** 점점 사라짐
- FCL은 그마저도 다 사라짐. -> 이래서 Encoding, Decoding 하는것이다.
* low level info : CNN 앞쪽부분 저수준 정보 : edges, colors 등
** higher level info : 객체를 분류하는 정보
*** spatial info : 공간 정보
Semantic Segmentation
Down sampling(Encoding)하면 공간정보 다 사라짐.
Encoding 한 결과를 다시 Decoding 하여 segmentation 정보를 픽셀별로 나타내야 하는데, 우선, Encoding 결과는 higher level info만 담고있을 뿐더러,
단순히 다시 Decoding만 하면, spatial info가 살아나지 않는다. 그렇기 때문에, Skip Connection을 사용한다.
Skip Connection
CNN 앞딴의 feature를 decoding 할때 갖다 쓰는거다.
2탄
성능이나 속도를 개선하는 방법은 매우 많습니다.
입력 사이즈를 바꾸던가 layer를 추가한다 던가, 줄인다던가 dilation convolution 같은 기술들을 적용해 본다 던가... 이 부분은 연구원분들의 몫인 것 같네요. 여기서부터 실력이 나뉘어 진다고 보시면 될 것 같습니다.
FCN(CVPR2015)
Semantic Segmentation을 위해 FCL을 없애고, 1x1 fully convolutional layer 로 대체하여 공간정보를 살려놓는다.
FCN은 옛날것이고,
- UNet : 의료계에서 많이 쓰이는, 정확한 segmentation 방식
- ~
- ~
이건 뭐냐.. 엄청난 정보다
https://89douner.tistory.com/m/296?category=878997
'Deep Learning > Others' 카테고리의 다른 글
[파이썬 딥러닝 파이토치] PART01, 02 (0) | 2021.06.29 |
---|---|
[MIT] Deep Generative Modeling (Unsupervised learning, Encoder, Decoder, GAN 소개) (0) | 2020.12.31 |
OpenOpse 구동을 위한 환경설정 (Visual Studio 에서 실행) (1) | 2020.12.19 |
댓글