정형데이터보다 비정형데이터가 훨씬 더 많이 나오고 있다.
텍스트, 그림 등 비정형데이터가 훨씬 많다.
지금 당장 손해를 보더라도 데이터를 수집해야 한다.
데이터 특성 파악
데이터 모델링 : 파악한 관계를 수학적으로, 통계적으로 표현하는 것
str() : 데이터 내용 요약
시각화 함수
plot(대상, col = '색깔', xlab = 'x축 이름', ylab = 'y축 이름', pch='기호 모양')
?도움말
한줄만 실행 : Ctrl + Enter
여러줄 실행 : 드래그 + Ctrl + Enter
모든 명령문 : Ctrl + Alt + R
직전 명령문 : Ctrl + Shift + P
작업 디렉토리의 지정
getwd() : 현재 작업 디렉토리
setwd() : 디렉토리 변경
라이브러리의 사용
데이터 다루기 : iris
데이터 다루기 : tip
데이터를 10개정도 뽑고 어떤 데이터인지 확인한다.
summary 함수로 분석에 앞서서 요약 통계를 볼 수 있다.
두개의 함수를 통해 시각화 해보자.
(a) 몇명이 먹었는지
(b) 계산서 금액에 따라서
(c) 색깔을 추가해보자
(d) 여자와 남자와의 구분
분석
새로운 전략을 짤 때는 모델링을 통해 예측을 할 수 있다.
'📌 R' 카테고리의 다른 글
R (6) - 자료의 종류, table, barplot, pie, quantile, hist, boxplot (0) | 2020.09.23 |
---|---|
R (5) - if else, 반복문, 결측값, 이상값 (0) | 2020.09.22 |
R (4) - 엑셀, csv, txt 파일 가져오기, 데이터 추출, 조건문 (0) | 2020.09.15 |
R (3) - 배열, 매트릭스, 데이터프레임, 리스트, 팩터 (0) | 2020.09.14 |
R (2) - 변수, 데이터형, 연산자, 벡터, 배열, 데이터 프레임, 리스트 (0) | 2020.09.09 |