📌 R
R (1) - 데이터 과학이란, R studio 설치하기
U-chan Seon
2020. 9. 4. 18:14
정형데이터보다 비정형데이터가 훨씬 더 많이 나오고 있다.
텍스트, 그림 등 비정형데이터가 훨씬 많다.
지금 당장 손해를 보더라도 데이터를 수집해야 한다.
데이터 특성 파악
데이터 모델링 : 파악한 관계를 수학적으로, 통계적으로 표현하는 것
str() : 데이터 내용 요약
시각화 함수
plot(대상, col = '색깔', xlab = 'x축 이름', ylab = 'y축 이름', pch='기호 모양')
?도움말
한줄만 실행 : Ctrl + Enter
여러줄 실행 : 드래그 + Ctrl + Enter
모든 명령문 : Ctrl + Alt + R
직전 명령문 : Ctrl + Shift + P
작업 디렉토리의 지정
getwd() : 현재 작업 디렉토리
setwd() : 디렉토리 변경
라이브러리의 사용
데이터 다루기 : iris
데이터 다루기 : tip
데이터를 10개정도 뽑고 어떤 데이터인지 확인한다.
summary 함수로 분석에 앞서서 요약 통계를 볼 수 있다.
두개의 함수를 통해 시각화 해보자.
(a) 몇명이 먹었는지
(b) 계산서 금액에 따라서
(c) 색깔을 추가해보자
(d) 여자와 남자와의 구분
분석
새로운 전략을 짤 때는 모델링을 통해 예측을 할 수 있다.