CV - Mask RCNN
2022. 6. 11. 00:41
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. Image Segmentation Image Segmentation은 영상/이미지에서 의미있는 부분들을 구별해내는 기술이다. 이미지를 영역별로 나눠준 후, 각 개체에 맞게 합쳐주는 task이다. Object Detection, Classfication 과 비교해봤을 때, 정확하게 개체들의 경계선까지 추출해 의미있는 영역들로 나누어져야하므로 더 어려운 작업이다. Image Segmentation는 Semantic과 Instance로 나뉜다. Semantic Segmentation Semantic Segementation은 동일한 객체들끼리는 한 번에 Masking을 수행하는 방법이다. 위의 사진과 같이 segment..
CV - EfficientDet
2022. 6. 2. 18:55
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 EfficientNet EfficientNet Architecture 개요 EfficientNet 개별 Scaling 요소에 따른 성능 향상 테스트 EfficientNet Compound Scaling EfficientDet EfficientDet 성능 EfficientDet = BiFPN + Compound Scaling BiFPN (Bi directional FPN) Cross-Scale Connection Weighted Feature Fusion Compound Scaling Backbone network BiFPN network Box/class prediction network Input image..
CV - Focal loss
2022. 6. 2. 15:29
🖼 Computer Vision/Object Detection
목차 Focal Loss의 필요성 Focal Loss Cross Entropy Loss를 안쓰고 Focal Loss를 쓰는 이유 Balanced Cross Entropy Loss를 안쓰고 Focal Loss를 쓰는 이유 Focal Loss 적용 RetinaNet = Focal Loss + FPN FPN(Feature Pyramid Network) Object Detection : 여러 object들을 Bounding Box를 통해 Localization(위치를 찾고) 하고, Classification(어떤 물체인지 분류) 하는 작업 Object Detection의 2가지 종류의 알고리즘 R-CNN 계열의 two-stage detector YOLO, SSD 계열의 one-stage detector two-..
CV - Ultralytics YOLO v3 (Oxford Pet Dataset)
2022. 5. 27. 17:15
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 Ultalytics YOLO Custom Dataset 만들기 Oxford Pet Dataset Download Ultralytics YOLO 포멧 디렉토리 구조 만들기 Oxford Pet Train / Valid 메타데이터 만들기 Oxford Pet annotation을 Ultralytics YOLO 포멧으로 만들기 전체 xml 파일들을 YOLO 포멧으로 변환 후 Ultralytics 디렉토리 구조로 입력하기 Oxford Pet Dataset yaml 파일 만들기 Oxford Pet Dataset 학습 수행 학습된 모델 파일을 이용하여 Inference 수행 test.py를 이용하여 Test 데이터를 Eva..
CV - Ultralytics YOLO v3 (coco128 Dataset)
2022. 5. 26. 19:45
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 Ultralytics YOLO v3 설치하기 wandb(weight and bias) 모듈 설치 Ultralytics YOLO Train 개요 - coco128 Dataset Ultralytics YOLO Dataset 개요 Ultralytics YOLO Annotation 포맷 Config 개요 Dataset config와 Pretrained model을 사용할 때 weight 파일의 상대 경로, 절대 경로 Ultralytics YOLO v3 설치하기 colab 환경에서 진행하였다. !git clone https://github.com/ultralytics/yolov3 !cd yolov3;pip instal..
CV - YOLO V1, V2, V3 (You Only Look Once)
2022. 5. 19. 19:29
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 YOLO - V1 YOLO V1 개요 YOLO V1 Prediction YOLO V1 Loss Bounding Box (x, y) 좌표 loss Bounding Box 너비(w), 높이(h) loss Object Confidence loss Classification loss NMS로 최종 Bounding Box 예측 YOLO V1의 한계 YOLO - V2 YOLO V2 개요 YOLO V2 Architecture 1개의 그리드 Cell이 가지고 있는 정보 크기가 서로 다른 Anchor Box 5개 - Direct Location Prediction YOLO V2 Loss Passthrough module을 통..
CV - SSD (Single Shot Detector)
2022. 5. 17. 16:01
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 SSD 개요 SSD(Single Shot Detector) 란? Multi-Scale Feature Layer Default Box(=Anchor Box) SSD Architecture Anchor Box를 활용한 Convolution Predictors for detection SSD의 마지막은 NMS SSD의 Loss function SSD 개요 그동안 우리가 배웠던 RCNN, SPP, Fast RCNN, Faster RCNN 모델은 Two-Stage Detector 모델이었다. 여기서 Two란, Region Proposal과 Object Detection 단계를 분리해 전개되는 모델들이다. 이번에 설명할..
CV - 60분 컷 Image Classifier 파이토치 튜토리얼
2022. 5. 13. 15:29
🖼 Computer Vision/Object Detection
Deep Learning with PyTorch: A 60 Minute Blitz — PyTorch Tutorials 1.11.0+cu102 documentation Shortcuts pytorch.org 목차 Tensors torch.autograd Neural Network (with PyTorch) 신경망 학습은 2단계로 이루어진다. nn(Neural Networks) General Training Process 손실 함수 (Loss Function) 역전파(Backprop) Optimizer : Gradient Descent 최적화 Classifier 학습하기 CIFAR10 Data Load CNN 정의하기 Loss function & Optimizer 정의하기 Training Neural Net..
CV - MMDetection
2022. 5. 4. 10:49
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 MMDetection MMDetection Config MMDetection Model Architecture MMDetection Training Pipeline MMDetection Dataset MMDetection Custom Dataset Format 실습 MMDetection 설치 MS-COCO 데이터 기반으로 Faster RCNN Pretrained 모델을 활용하여 Inference 수행 Model의 Config 설정 확인하기 array를 inference_detector()에 입력할 경우에는 원본 array를 BGR 형태로 입력 필요(RGB 변환은 내부에서 수행하므로 BGR로 입력 필요) sho..
CV - Faster RCNN
2022. 4. 29. 23:34
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 Faster RCNN 개요 Faster RCNN 구조 Region Proposal Network Anchor Box Anchor Targeting Prediction Loss function Faster RCNN 개요 Faster RCNN은 RPN(Region Proposal Network) + Fast RCNN이 합쳐진 네트워크이다. Faster RCNN의 논문에서 Region Proposal 방법을 GPU를 통한 학습으로 진행하면 확실히 성능이 증가할 것이라고 말한다. Region Proposal 단계도 딥러닝과 같은 네트워크 구조로 만들어 탐지 속도를 높이자는 목표를 설정했다. 따라서 Faster RCN..
CV - Fast RCNN
2022. 4. 28. 23:50
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 SPPNet의 한계 Fast RCNN과 SPPNet의 차이 Fast RCNN ROI Pooling Softmax Fast RCNN의 구조 Fast RCNN의 Loss function Contribution SPPNet의 한계 SPPNet에 대해 요약해 보면, SPP-Net은 인풋 이미지를 바로 CNN에 넣고 특징을 추출해서 피쳐맵을 만든다. 그리고 그것을 Spatial Pyramid Pooling layer에 집어넣어서 Region단위 연산으로 RoI를 만들어낸다. 이 SPP layer는 CNN에서 올라온 Feature map을 분면으로 나누면서 Max pooling하고 그 결과를 하나의 벡터로 결합하므로써 ..
CV - SPPNet (Spatial Pyramid Pooling)
2022. 4. 28. 20:05
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 RCNN 모델의 단점 SPP layer SPPNet 구조 SPP(Spatial Pyramid Pooling) SPM(Spatial Pyramid Matching) 요약 1. Selective Search로 인풋 이미지에 대해 많은 Region Proposal들을 추출 2. Region Proposal 들의 크기가 서로 다름 3. 고정된 사이즈의 벡터로 결합(Spatial Pyramid Pooling) 4. SPP = Bag of Visual Words + 분면 테크닉을 통한 Max Pooling 과정 RCNN 모델의 단점 각 Region Proposal 마다 Object Detection을 별개로 수행해주어야..
CV - RCNN (Region with CNN features)
2022. 4. 28. 19:41
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 RCNN(Region with CNN features) Region Proposal 방식 적극 도입 Region Proposal 에서 예측이 된 Object를 CNN 모델에 적용 RCNN 과정 Stage 1. Region Proposal 단계 (Selective Search) : 2000개의 (Object가 있을만한)Region 영역 Proposal Stage 2. CNN Detection 단계 : 이미지가 Feature Extractor를 통과해 Object 클래스를 최종 분류하고 Bounding Box 회귀 문제를 수행하는 단계 RCNN의 문제점 RCNN(Region with CNN features) RC..
CV - Object Detection Architecture
2022. 4. 28. 17:29
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 Feature Extractor Network Region Proposal Object Detection Network Object Detection Architecture Feature Extractor Network VGG, ResNet 등이 있음 보통 ImageNet Dataset 기반으로 pretrained 됨. Image Classification 에서 자주 쓰이는 CNN 모델 CNN 구조는 Feature Extractor와 Classifier로 구성됨 Feature Extractor : 최적의 Feature를 추출 Classifier : 최적의 Feature 추출을 위해서 최적의 weight 값을 ..
CV - OpenCV
2022. 4. 23. 02:25
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 OpenCV OpenCV 이미지 로딩 BGR을 RGB로 변환하기 OpenCV 이미지 배열을 파일에 쓰기 OpenCV로 이미지 로드하기 반환된 BGR image Numpy array 시각화 하기 BGR에서 RGB로 변환하기 OpenCV 오픈소스 기반의 최고 인기 컴퓨터 비전 라이브러리 컴퓨터 비전 기능 일반화에 크게 기여 (어려운 기능도 API 몇 줄로 간단하게 구현) C++ 기반이나 Python도 지원 (JAVA, C# 등 다양한 언어 지원) OpenCV 이미지 로딩 imread('파일명')를 이용한 이미지 로딩 파일을 읽어 Numpy array로 변환 주의해야할 점 : 색감이 원본 이미지와 다르게 나타남 이..
CV - Object Detection 주요 데이터셋
2022. 4. 23. 02:10
🖼 Computer Vision/Object Detection
📌 이 글은 권철민님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 정리한 내용입니다. 목차 Object Detection 주요 데이터셋 Annotation 이란? PASCAL VOC Dataset Annotation 파일 예시 MS-COCO Dataset Object Detection 주요 데이터셋 1. PASCAL VOC XML Format 20개의 오브젝트 카테고리 2. MS COCO json Format 80개의 오브젝트 카테고리 : 여러가지 이미지 PASCAL의 평이한 오브젝트 문제 해결 3. Google Open Images csv Format 600개의 오브젝트 카테고리 많은 Detection과 Segmentation 딥러닝 패키지가 위 Dataset들을 기반으로 Pretrained 되어..