GAN (Generative Adversarial Network)
2022. 6. 14. 20:29
💡 AI/토이 프로젝트
GAN (Generative Adversarial Network) GAN은 Data를 만들어내는 Generator와 만들어진 Data를 평가하는 Discriminator가 서로 대립(Adversarial)적으로 학습해가며 성능을 점차 개선해 나가자는 개념이다. 여기서 GAN의 목표는 Generator 를 잘 학습시키는 것이다. ML은 input이 데이터, output은 label 인 정형화된 틀이 있다. 그러나 input이 노이즈, output이 data 인 것도 있다. 그게 바로 GAN이다. 두 개의 네트워크가 경쟁을 해가면서 학습을 한다? 그 당시에 존재하지 않았던 개념이다. 딥러닝의 아버지라고도 불리우는 Yann Lecun 교수는 GAN을 가리켜 최근 10년 동안 머신러닝 분야에서 가장 혁신적인 아..
💣 배틀그라운드 리뷰 자연어처리
2022. 3. 29. 17:36
💡 AI/토이 프로젝트
목차 Sentence Transformer 설치 및 실행 Clustering 예제 배틀그라운드 리뷰 크롤링 전처리 배틀그라운드 리뷰 임베딩 Clustering 워드클라우드 만들기 BERT : 문장의 문맥을 양방향으로 이해해서 숫자의 형태로 바꿔주는 딥러닝 모델 Bidirectional : 양방향 Encoder : 입력값을 숫자 형태로 바꾸는 Representations from Transformers : 인코더 디코더 모델을 지닌 딥러닝 모델 SBERT : BERT의 문장 임베딩의 성능을 개선시킨 모델, BERT의 문장 임베딩을 응용하여 BERT를 fine tuning 한다. Sentence Transformer 설치 및 실행 !pip install -q -U sentence-transformers Pr..
🤬 Speech-to-text(STT)를 이용한 욕설 필터링 프로그램
2022. 2. 22. 20:21
💡 AI/토이 프로젝트
목차 STT(Speech-To-Text)란? STT 연결 및 동작 확인 코드 및 설명 느낀점 STT(Speech-To-Text)란? Google AI 기술로 지원되는 API를 사용하여 음성을 텍스트로 변환하는 기술 Google Cloud Platform(GCP)의 Cloud Speech API를 이용 기존의 Google Assistant API와는 다름 Key 발급을 통해 쉽게 사용할 수 있는 Cloud API 적당히 조용한 환경에서의 인식률은 DeepSpeech와 겨루지만, 노이즈 환경에서는 부족함 STT 연결 및 동작확인 빠른시작 페이지를 참고하여 API활성화 후 다음 코드를 실행한다 과정 요약 GC에서 프로젝트 생성 프로젝트 결제 사용 설정(신용카드 등록) - 60분 이내 무료 프로젝트내에 서비스 ..
😷 마스크 탐지 인공지능
2022. 2. 15. 20:13
💡 AI/토이 프로젝트
마스크를 썼는지 안썼는지 실시간으로 확인하는인공지능을 구현해보자. 목차 Load dataset Training model Labeling Construct model Training Use pre-trained model Result Load Dataset 마스크 쓴 사람과 마스크 안쓴 사람의 데이터로 학습이 끝난 마스크 classifier를 활용한 마스크 detector로 진행이 됩니다. 아래와 같이 마스크 안 쓴사람의 이미지를 구해서, Face detection을 한번 하고, 잘라낸 face 에서 랜드마크 detection을 합니다. 그 다음에 배경이 투명한 마스크 이미지를 구해서 랜드마크를 기준으로 마스크를 씌워줍니다. 요런 식으로 해서 마스크를 안쓴 이미지에서 마스크를 쓴 이미지를 만들었습니다. ..
LSTM 이란?
2022. 2. 8. 19:08
💡 AI/토이 프로젝트
목차 빈칸에 들어갈 단어는? (he, she) 간단한 RNN 구조 좀더 간략화한 RNN 구조 Gradient descent weight optimization Error3 derivative caculation Gradient Vanishing Gradient Exploding Long sequence에 대한 해결책 : LSTM (Long Short Term Memory) LSTM : RNN에 memory cell 도입 LSTM cell LSTM cell : forget mechanism LSTM cell : input mechanism LSTM cell : output mechanism 아래의 빈칸에 들어갈 단어는? (He/She) 정답 : He 빈칸의 이전 문장에서 John에 대한 이야기를 하고 있기..
📈 LSTM을 이용한 TSLA 주식 예측
2022. 2. 1. 12:18
💡 AI/토이 프로젝트
간단한 코드로 테슬라, 삼전 주식을 예측해보자. 목차 Load Dataset Compute Mid Price Create Windows Normalize Data Build a Model Training Prediction Load Dataset import pandas as pd # csv 파일 로드 import numpy as np # 행렬 연산 import matplotlib.pyplot as plt # 데이터 시각화 from keras.models import Sequential # deep learning model from keras.layers import LSTM, Dropout, Dense, Activation import datetime https://finance.yahoo.com 야..
🧙 해리포터 투명망토 만들기
2022. 1. 24. 18:06
💡 AI/토이 프로젝트
투명 망토 만들기 특정 색깔을 뽑아서 마스크를 만든다. 미리 찍어놓은 background 이미지에 마스크를 입힌다. (res1) 지금 카메라(또는 비디오)에서 들어온 이미지를 마스크만큼 뺀다. (res2) 두 개를 합친다. (res1 + res2) 파란색 HSV range 수정 lower_blue = np.array([105,120,70]) upper_blue = np.array([135,255,255]) mask1 = cv2.inRange(hsv, lower_blue, upper_blue) import cv2 import numpy as np import time, argparse parser = argparse.ArgumentParser() # 인자값을 받을 수 있는 인스턴스 parser.add_ar..
Image Super Resolution
2022. 1. 24. 10:46
💡 AI/토이 프로젝트
Image Super Resolution Super Resolution (초고해상도) : 주로 모델로 생성된 이미지를 의미 High Resolution (고해상도) : 주로 Output 이미지를 의미 Low Resolution (저해상도) : 주로 Input 이미지를 의미 Image Super Resolution의 정의 저해상도 이미지를 고해상도로 변환시키는 문제 미디어, 의료, 보안 등 다양한 산업 분야에서 중요한 문제로 대두되고 있다. Image Super Resolution 문제의 어려움 Image Super Resolution은 유일한 정답이 존재하지 않는 ill-posed problem이 존재한다. 저해상도 이미지를 고해상도로 복원할 때 정답이 단 1개만 존재하지 않는다. Computer Vis..
🖕 뻐큐 모자이크 알고리즘 만들기
2022. 1. 18. 16:50
💡 AI/토이 프로젝트
https://google.github.io/mediapipe/ MediaPipe MediaPipe란 구글에서 제공하는 AI 프레임워크로써, 비디오 형식 데이터를 이용한 다양한 비전 AI 기능을 파이프라인 형태로 손쉽게 사용할 수 있도록 제공됩니다. AI 모델 개발 및 수많은 데이터셋을 이용한 학습도 마친 상태로 제공되므로 라이브러리를 불러 사용하듯이 간편하게 호출하여 사용하기만 하면 되는 형태로, 비전 AI 기능을 개발할 수 있습니다. 제공되는 여러가지 모델 MediaPipe는 오픈소스 프로젝트로서 소스가 공개되기 때문에 원하는 부분을 수정하여 추가 개발할 수도 있습니다. 또한 솔루션 별로 상세한 기술자료 및 예제 등이 풍부하게 제공되고 있습니다. 학습모델을 범위나 용도별에 따라 구분하여 사용할 수 있..
🍊 내 얼굴로 어노잉 오렌지 만들기
2022. 1. 11. 19:25
💡 AI/토이 프로젝트
1. 환경설정 아나콘다 가상환경에서 작업 cmake, dlib, imutils 필요한 라이브러리 설치 $ conda activate swc $ pip install cmake $ pip install opencv-contrib-python dlib $ pip install imutils 2. 코드 import cv2 # opencv : 이미지 합성 import dlib # 얼굴 영역 탐지, 랜드마크 탐지 from imutils import face_utils, resize # import numpy as np orange_img = cv2.imread('orange.jpg') # 이미지를 opencv로 읽어와서 orange_img에 저장 orange_img = cv2.resize(orange_img, d..
YOLOv5 커스텀 학습 튜토리얼
2021. 10. 18. 17:52
💡 AI/토이 프로젝트
파일 받아오기 from urllib import request url = "https://public.roboflow.com/ds/FbPSJa257p?key=2mKwetv7pn" savename = "roboflow.zip" request.urlretrieve(url,savename) print("저장되었습니다.") 압축파일 풀기 import zipfile roboflow_zip = zipfile.ZipFile('/home/soon5770/roboflow.zip') roboflow_zip.extractall('/home/soon5770/') roboflow_zip.close() YOLOv5 git clone # YOLOv5 github clone %cd /home/soon5770 !git clone ht..
물체추적으로 레드벨벳 누나들 따라다니는 직캠 만들기
2021. 10. 9. 18:46
💡 AI/토이 프로젝트
OpenCV 로 레드벨벳 누나들 따라다니는 직캠 만들기 VScode python interpreter 변경하기 command + shift + p select interpreter /Users/seon-uchan/opt/anaconda3/bin 선택 $ /Users/seon-uchan/opt/anaconda3/bin/python /Users/seon-uchan/Desktop/ML/BBang/main.py 돌릴 때는 아나콘다로 설치한 파이썬을 이용해야 opencv, numpy 등의 라이브러리를 이용 가능하므로 이렇게 해준다. Run 마우스로 ROI 선택 space 바로 선택 완료 q로 종료 트래킹은 계속 하지만, 영상이 짤릴 경우에도 예외처리 해주어야 한다. 그리고 핸드폰 사이즈로 볼 수 있게 영상을 저장..