본문 바로가기

Deep Learning18

GAN, Pix2Pix Latent Vector - 위 이미지처럼 pixel space에서 784차원의 이미지를 설명할 때, 좀 더 효율적인 방법으로 설명할 수 있는게 latent vector를 만드는것이다. - Manifold learning : 데이터가 manifold 안에서 잘 나누어져 있을 때 GAN - latent vector가 어떻게 압축되는건지, z가 노이즈를 만든다는데, 그걸로 어떻게 generate 한다는건지 모르겠다. C GAN DC GAN - 여기서는 conv layer를 사용하여 이미지 만드는 부분에서 좋은 성능을 냄. Pix2Pix - input : { image(pixel data), 실제 정답 이미지 } - output : 실제 정답 이미지와 비슷한 이미지 - Loss func : cGAN 에서 쓰인.. 2021. 11. 15.
읽어야 할 논문 1. Survey end to end (RL, SL) 2021. 10. 21.
딥러닝 layer마다 extract된 feature 시각화 하는법 https://gaussian37.github.io/dl-pytorch-observe/ Pytorch의 시각화 및 학습 현황 확인 gaussian37's blog gaussian37.github.io 2021. 10. 21.
CPU를 많이 사용하여 딥러닝 학습속도 향상 https://jybaek.tistory.com/799 DataLoader num_workers에 대한 고찰 Pytorch에서 학습 데이터를 읽어오는 용도로 사용되는 DataLoader는 torch 라이브러리를 import만 하면 쉽게 사용할 수 있어서 흔히 공식처럼 잘 쓰고 있습니다. 다음과 같이 같이 사용할 수 있겠네요. fr jybaek.tistory.com 승태신이 알려주심 ㅠㅠ 2021. 10. 21.
[Fast RCNN] https://blog.naver.com/laonple/220776743537 [Part Ⅴ. Best CNN Architecture] 8. ResNet [4], Fast-RCNN - 라온피플 아카데미 - Part I. Machine Learning Part V. Best CNN Architecture Part VII. Semantic Segmentat... blog.naver.com - ROI를 먼저 잡고, CNN을 돌리며, 그 ROI를 그대로 projection해서, 그 안에서 ROI pooling layer(SPP Net에서 한 pyramid와 같은 방식)를 적용한다. - 마지막에 classifying을 위한 softmax와, object class의 위치를 출력하기 위한 bbox(bounding .. 2021. 9. 23.
[SPPNet] Spatial Pyramid Pooling (대충봄) SPPNet에서 나온 아이디어 - RCNN이 AlexNet을 이용하다 보니, 이미지 크기를 제한시켜야 한다는 단점이 있었다. - selective search를 통해 2000개의 후보 영역을 찾고, 그것을 224 224로 바꿔야 했는데, 그 과정에서 이미지 왜곡이 심해 정보가 많이 손상되었다. - SPPNet에서는, 이미지 크기는 그대로 두고, Conv Layer 거치게 하고, 그 다음에 SPP(Spatial Pyramid Pooling)을 거쳐 FCL(Fully connected Layer) 로 들어갈 때 크기를 맞춰주게 하였다. 방법 기존 RCNN방식 이미지 -> selective search : 2000개의 영역 -> 224x224로 resize -> 각 영역에 CNN돌리기(시간↑) -> FCL에 .. 2021. 9. 22.