본문 바로가기

Deep Learning18

StyleGAN v2, Pixel2Style2Pixel StyleGAN v2- 기존 styleGAN보다 더 높은 품질의 이미지 생성- 더 부드럽게 변경 가능inversion : 이미지를 만들 때 쓰이는 latent vector를 찾는것.   기존 아키텍쳐의 문제점을 지적1. AdaIN style Transfer : blob-like artifact 발생2. progressive growing 발생 : 얼굴 특정 부분이 fixed position을 갖는 문제 발생(치아나 눈동자의 위치가 변하지 않음) 1. regularization사용latent interpolation에 따라서 이미지가 부드러운 변화를 보이게 된다.    Pixel2Style2Pixelgaussian or unifrom distribution에서 sampling 한 vector. --> la.. 2021. 12. 15.
GAN, Pix2Pix Latent Vector - 위 이미지처럼 pixel space에서 784차원의 이미지를 설명할 때, 좀 더 효율적인 방법으로 설명할 수 있는게 latent vector를 만드는것이다. - Manifold learning : 데이터가 manifold 안에서 잘 나누어져 있을 때   DC GAN- 여기서는 conv layer를 사용하여 이미지 만드는 부분에서 좋은 성능을 냄.  Pix2Pix- input : { image(pixel data), 실제 정답 이미지 } - output : 실제 정답 이미지와 비슷한 이미지- Loss func : cGAN 에서 쓰인 loss function + L1 Loss(단순 절댓값. not euclidian)- L1 loss + U-Net 구조를 썼을 때 최상의 결과가 나.. 2021. 11. 15.
딥러닝 layer마다 extract된 feature 시각화 하는법 https://gaussian37.github.io/dl-pytorch-observe/ Pytorch의 시각화 및 학습 현황 확인 gaussian37's blog gaussian37.github.io 2021. 10. 21.
CPU를 많이 사용하여 딥러닝 학습속도 향상 https://jybaek.tistory.com/799 DataLoader num_workers에 대한 고찰Pytorch에서 학습 데이터를 읽어오는 용도로 사용되는 DataLoader는 torch 라이브러리를 import만 하면 쉽게 사용할 수 있어서 흔히 공식처럼 잘 쓰고 있습니다. 다음과 같이 같이 사용할 수 있겠네요. frjybaek.tistory.com 2021. 10. 21.
[Fast RCNN] https://blog.naver.com/laonple/220776743537 [Part Ⅴ. Best CNN Architecture] 8. ResNet [4], Fast-RCNN - 라온피플 아카데미 - Part I. Machine Learning Part V. Best CNN Architecture Part VII. Semantic Segmentat... blog.naver.com - ROI를 먼저 잡고, CNN을 돌리며, 그 ROI를 그대로 projection해서, 그 안에서 ROI pooling layer(SPP Net에서 한 pyramid와 같은 방식)를 적용한다. - 마지막에 classifying을 위한 softmax와, object class의 위치를 출력하기 위한 bbox(bounding .. 2021. 9. 23.
[SPPNet] Spatial Pyramid Pooling (대충봄) SPPNet에서 나온 아이디어 - RCNN이 AlexNet을 이용하다 보니, 이미지 크기를 제한시켜야 한다는 단점이 있었다. - selective search를 통해 2000개의 후보 영역을 찾고, 그것을 224 224로 바꿔야 했는데, 그 과정에서 이미지 왜곡이 심해 정보가 많이 손상되었다. - SPPNet에서는, 이미지 크기는 그대로 두고, Conv Layer 거치게 하고, 그 다음에 SPP(Spatial Pyramid Pooling)을 거쳐 FCL(Fully connected Layer) 로 들어갈 때 크기를 맞춰주게 하였다. 방법 기존 RCNN방식 이미지 -> selective search : 2000개의 영역 -> 224x224로 resize -> 각 영역에 CNN돌리기(시간↑) -> FCL에 .. 2021. 9. 22.