MySQL 수동 설치
2021. 6. 25. 13:50
🚦 Server/AWS
1. MySQL 컴파일에 필요한 패키지 설치 $ apt-get upgrade $ apt-get update $ apt-get install cmake $ apt-get install libssl-dev $ apt-get install libboost-all-dev $ apt-get install libncurses5-dev libncursesw5-dev 공식 홈페이지 참조 https://dev.mysql.com/doc/refman/8.0/en/source-installation-prerequisites.html 2. MySQL community server download $ cd /usr/local $ wget https://dev.mysql.com/get/Downloads/MySQL-8.0/mysql..
Docker로 Apache 수동 설치
2021. 6. 24. 12:49
🚦 Server/AWS
Docker는 컨테이너 기반의 오픈소스 가상화 플랫폼이다. VM은 호스트 OS위에 게스트 OS 전체를 가상화하여 사용하는 방식 Docker는 전체 OS를 가상화하는 방식이 아니라 프로세스를 격리 하는 방식 Container는 뜻 그대로 화물 수송용 박스를 생각하면 된다. container에 다양한 화물을 넣고 다양한 운송수단에 적재되어 쉽게 옮길 수 있는데 서버에서도 마찬가지입니다. 서버 실행에 필요한 모든 것(코드, 런타임, 시스템도구)들을 container에 넣어 쉽게 추상화하고 어디서에든(GCP, AWS, Local-machine) 실행할 수 있다. Docker image는 container의 모든 정보를 포함한 하나의 단위로 볼 수 있다. Docker 를 사용하는 이유는 container를 활용하..
선형대수 - 행렬 곱에 대한 또 다른 시각
2021. 6. 23. 11:38
✏️ Mathemathics/Linear Algebra
일반적으로 이용하는 행렬곱의 방법 행렬의 곱은 일반적으로 다음과 같이 생각한다. 수식을 이용해 조금 더 정확하게 쓰면 다음과 같다. 이것을 잘 뜯어 생각해보면, 왼쪽에 있는 행렬에서 행 하나를 가져오고 오른쪽에 있는 행렬에서 열 하나를 가져와서 계산하게 된다는 것을 알 수 있다. 또, 가져온 행 혹은 열을 벡터로 생각한다면 계산된 행렬의 각 원소값은 벡터의 내적을 표현한 것임을 알 수 있다. 즉, 식(2)의 계산 결과에서 1행 1열의 원소값은 계산 되기 전 두 행렬 중 왼쪽 행렬의 1행의 행벡터와 오른쪽 행렬의 1열의 열벡터를 가져와 계산한 것임을 알 수 있다. 즉, 일반적으로 이용하는 행렬곱의 관점은 행벡터와 열벡터 간의 내적(inner product)을 계산함으로써 행렬곱이 이루어진다는 것을 알 수 ..
선형대수 - 벡터의 정의, 기본 연산
2021. 6. 23. 10:43
✏️ Mathemathics/Linear Algebra
벡터란 무엇인가? 벡터의 기본 연산에 대해 이야기 하기 전에 벡터란 무엇인지부터 생각해보도록 하자. 1) 벡터란 화살표 같은 것 우선 바로 떠오르는 것은 벡터란 물리학에서 말하는 ‘크기와 방향으로 정의되는 값’이라고 할 수 있다. 이것은 기하학적인 벡터의 특성을 잘 반영하고 있는 정의라고 할 수 있으며, 특히 벡터의 좌표계의 변환에 대한 불변성(invariance)을 잘 표현하고 있다. 좌표계의 변환에 대해 불변적이라는 말은 아래 그림에서 처럼 좌표계가 변하더라도 벡터 그 자체는 가만히 있다는 것을 의미한다. 기하학적 특성을 반영 좌표계의 변환에 대해 불변함 이러한 벡터 정의에 대해 첨언하자면 이러한 ‘크기와 방향으로 정의되는 값’이라는 설명은 Euclidean 벡터에 한해서만 적용해 설명할 수 있다는게..
나는 나답게 살기로 했다
2021. 6. 22. 12:51
📌 Book
적당한 거리가 지켜주는 것 우리는 늘 잊지 말아야 한다. 기억에 대한 경험은 얼마든지 다르게 해석될 수 있으며, 적당한 긴장감은 되레 건강한 관계를 만드는 수단이 될 수 있음을. 긴장감과 거리감은 관계의 익숙함에서 비롯되는 무례함을 방지할 수 있는 브레이크 역할을 해준다. 그러므로 가까운 사이라 할지라도 늘 말을 조심해야 하며, 감정을 분명히 드러내 전달해야 하는 건 당연하다. 어떤 관계에서든 적당한 거리를 지킬 줄 알아야 상대와 가까워질 수도 있고 필요할 때 멀어질 수도 있는 법이다. 고요할수록 밝게 빛나다. 허전함 때문에 휴대전화를 손에 놓지 않은 채 끈임없이 다른 사람의 삶을 엿보고 내 삶을 전시한다. 일정을 끝내고 혼자 있는 시간에도 타인과의 연결을 놓지 않는 셈이다. 외로움이나 고립감은 달래질지..
Mac - Conda가 안될 때, anaconda 터미널이 안켜질 때
2021. 6. 16. 22:26
📌 Python
conda를 실행했는데 zsh: command not found: conda 위와 같은 메시지가 뜰 때가 있다. 이때 해결하는 방법이다. vim ~/.zshrc 입력 source ~/.bash_profile 추가해주기 ss 누르고 ./source ~/.bash_profile 추가후 :wq 입력으로 저장 source ~/.zshrc 입력 끝
ML W14 - Representing and Mining Text
2021. 6. 12. 10:48
💡 AI/ML
IDF : term이 rare하면 올라가고, term이 보편적이면 값이 떨어진다. 엔트로피가 가장 크게 나타나는 곳은 그래프가 겹칠 때이다. Beyond Bag of words N-gram Sequences 시퀀스를 보호해주는 것 전후좌우 몇개까지 봐줘야 될까? = N개 Named Entity Extraction Topic Models 문서를 요약하는 방법은 키워드이다. 그럴려면 document와 키워드를 연결해주어야 하고 그것을 가능하게 해주는 것이 Topic layer이다. 또한 이러한 모델을 Topic Model 이라고 한다. Topic Models Text Mining Example Problems and Assumptions Mining News Stories to Predict Stock Pr..
ML W13 - Representing and Mining Text
2021. 6. 11. 12:25
💡 AI/ML
Dealing with Text 텍스트의 형태 Why Text is Difficult 문맥 : 앞 뒤 전 후 상황 Text Representation document를 모아놓은 것을 corpus 라고 한다. document 안에는 token 이 있다. token = 그냥 단어 document를 하나의 instance로 본다. “Bag of Words” Bag of words 는 문법이나 순서나 마침표 같은 것을 구분하지 않고 그냥 bag에 넣었을 때 Value는 무엇인가? -> 그 단어가 존재하지 않으면 그 document는 boolean으로 0으로 표현하고 있으면 1로 표현한다. Pre-processing of Text Stop-words : the and of 같은 그렇게 의미 없는 단어들 이것을 찾..
ML W12-2 - Evidence and Probabilities: Prediction via Evidence Combination
2021. 6. 10. 22:26
💡 AI/ML
Evidence and Probabilities 데이터로부터 결론을 낼 적에는 데이터 인스턴스가 우리들한테는 하나의 evidence로 작동하고 있고 얼마나 strong 한지 weak 한지가 중요하다. 통계학적으로 중요한 evidence evidence의 strength를 알 수 있다면 타겟을 결정 지을 수 있다. Example: Targeting Online Consumers with Ads 광고의 효과를 보기 위해서는 인스턴스가 무엇인지 정확히 정의해야 한다. Example: Targeting Online Consumers with Ads Target variable : 고객이 광고를 본 후 그 방을 예약을 할까 안할까 하는 binary value가 있다. Prediction : 얼마나 이 광고에 반응..
ML W12-2 - Visualizing Model Performance
2021. 6. 10. 19:09
💡 AI/ML
나이브 베이즈는 낮은 정확도 였는데 높은 AUC 값이 나왔다. KNN은 Y로 예측 하는데 거의 0%이다. 전혀 못하고 있다. 반면 나이브 베이즈는 굉장히 실수를 많이 한다. 그러나 맞추는 거도 많이 한다. ROC curve 위 그래프를 보면 높은 정확도를 갖는 kNN은 오버피팅 되었다는 것을 알 수 있다. 나이브 베이즈 > Decision 트리 > 선형 회귀 > kNN 순으로 정확도가 높은 것을 확인할 수 있다. 단, 일반화는 하지 말라. 데이터에 따라 다를 수 있다. Lift Curve Lift Curve에서는 x축이 테스트 인스턴스의 비율이다. 영양가 좋은 테스트 인스턴스를 주었을 때 거기에 얼마나 부응하느냐, 얼마나 퍼포먼스가 좋으냐 물어보는 것이다. 아무리 좋은 밥을 줘도 제 성능을 못하는 것은 ..
Tensor 에 대한 이해
2021. 6. 9. 11:55
🖼 Computer Vision/CNN
컴파일러 vs 인터프리터 방식 ▪ 컴파일러 방식 프로그램 전체를 번역한 다음 한꺼번에 실행 실행이 빠른 장점 C, C++ 등 ▪ 인터프리터 방식 한라인씩번역하고실행하는일을순차적으로수행 일부 코드만 선택하여 실행하는 일이 가능한 장점, 이 장점을 잘 활용하길 권유함 (스파이더에서는 실행하고자 하는 코드를 마우스로 선택한 다음 [F9] 키를 누름) 기초 라이브러리 ▪ 넘파이(Numpy): 다차원 배열 지원 ▪ 맷플롯립(Matplotlib): 데이터 시각화 인공지능 라이브러리 ▪ 사이킷런(Scikit-learn): 고전적인 기계 학습 지원 ▪ 텐서플로(TensorFlow): 딥러닝 지원 ▪ 케라스(Keras): 텐서플로를 한 단계 추상화한 라이브러리 ▪ 파이토치(PyTorch): 딥러닝 라이브러리 딥러닝에서 ..
우울한 날엔 니체
2021. 5. 31. 17:50
📌 Book
허무주의, 인간적인 너무나 인간적인 질병 고통의 단순한 결과에 불과한 비관주의는 받아들일 수 없다. 그러면 우리는 영혼도 의지도 본능도 없는 존재가 될 것이다. 고통의 정점에서 니체는 이렇게 소리친다. "우리가 고통받고 있다는 사실 때문에 비관주의자가 되어야 하는 것은 아니다." 그리고 그는 "낙관주의라는 약을 처방한다. 이것은 어느 날 비관주의가 되어도 좋다는 허락을 새롭게 얻고자 재구축하려는 목적을 위한 처방이다." '후퇴', 어떤 의미에서 뒤로 돌기는 절대 불가능하다. 거기서 할 수 있는 것은 아무것도 없다. 전진하는 것, 나는 퇴락 속에서 한 걸음 한 걸음 계속 나아가는 것이라고 말하고 싶다. 이러한 발전 과정을 저지할 수 있다. 이렇게 저지함으로써 퇴락 자체를 저지할 수 있다. 질문 당신 자신에..
나이브 베이즈 분류기
2021. 5. 29. 16:23
✏️ Mathemathics/Statistics and Probability
나이브 베이즈 분류기는 각 클래스에 대한 가능도(Likelihood) 비교를 통한 분류이다. 또한 베이즈 정리의 철학을 기반으로 작동하는 분류기이다. 베이즈 정리 : 확률을 갱신해 나가는 정리 사전 지식을 이용한 분류 : prior 확률적인 배경 지식을 가지고 특별한 추가 정보 없이 어떤 샘플을 분류하는 예시를 생각해보자. 가령 아무 사람이나 데리고 와서 어떤 정보도 없이 이 사람이 남자인지 여자인지 분류하라고 하면 어떻게 생각할 수 있을까? 세상에 절반은 남자고, 절반은 여자라고 생각한다면 50% 확률로 어림짐작 할 수 밖에 없다. 아마 랜덤하게 두 성별 중 하나를 얘기할 수 밖에 없을 것이다. 이것이 사전적인 정보만으로 어림짐작을 하는 방법이다. 그런데, 가령 삼색이 고양이를 데리고 와서 고양이의 성..