정형데이터보다 비정형데이터가 훨씬 더 많이 나오고 있다.

텍스트, 그림 등 비정형데이터가 훨씬 많다.

 

 

지금 당장 손해를 보더라도 데이터를 수집해야 한다.

 

데이터 특성 파악 

 

데이터 모델링 : 파악한 관계를 수학적으로, 통계적으로 표현하는 것

 

 

 

 

 

 

str() : 데이터 내용 요약

 

시각화 함수

 

 plot(대상, col = '색깔', xlab = 'x축 이름', ylab = 'y축 이름', pch='기호 모양') 

 

 

?도움말

 

 

한줄만 실행 : Ctrl + Enter

여러줄 실행 : 드래그 + Ctrl + Enter

모든 명령문 : Ctrl + Alt + R

직전 명령문 : Ctrl + Shift + P

 

 

 

작업 디렉토리의 지정

getwd() : 현재 작업 디렉토리
setwd() : 디렉토리 변경

라이브러리의 사용

 

 

 


데이터 다루기 : iris


데이터 다루기 : tip

데이터를 10개정도 뽑고 어떤 데이터인지 확인한다.

 

summary 함수로 분석에 앞서서 요약 통계를 볼 수 있다.

 

두개의 함수를 통해 시각화 해보자.

 

(a) 몇명이 먹었는지

(b) 계산서 금액에 따라서

(c) 색깔을 추가해보자

 

(d) 여자와 남자와의 구분

 

분석

 

새로운 전략을 짤 때는 모델링을 통해 예측을 할 수 있다.

복사했습니다!