산점도 : plot()
두개의 변수로 구성된 자료의 분포를 알아보는 그래프
pch 번호
두 변수 사이의 관련성을 확인하는데에 산점도가 쓰인다.
여러 변수들 간의 산점도 : pairs()
4개 중 2개씩 짝지어 지므로 다양한 산점도가 나타난다.
대각선을 기준으로 대칭되는 특징이 있다.
속성값이 많을 때에는 다중 산점도로 표현할 수 있다.
그룹 정보가 있는 두 변수의 산점도 : plot()
꽃잎의 길이와
폭의 상관관계를 알 수 있다.
관측값의 비교 뿐만 아니라 그룹간의 관계도 알 수 있다.
상관분석 : cor()
r이 1이면 거의 선의 모양
r이 0.5이면 선형성이 있긴 하지만 약간 분포가 되어 있다. 약한 선형성을 가진다.
r이 0인 경우엔 선형성의 거의 없다라고 판단할 수 있다.
cor() : 두 변수 사이의 상관성 분석
iris는 4개의 변수가 있고 각각의 변수들의 상관성을 분석할 수 있다.
선그래프 : plot()
시간의 변화에 따라서 증감의 추이를 알기 위해선 선그래프가 좋다.
type 을 L 로 해주어야 한다.
선의 종류를 다르게 해서 나타낼 수 있다.
데이터 자체가 무슨 상황인지 먼저 파악하고 왜 줄었는지 왜 늘어났는지 다시 분석할 수 있다.
선 그래프는 시계열 자료를 판단하는 기본적인 자료이다.
여러개의 선 그래프의 작성 : plot(), lines()
'📌 R' 카테고리의 다른 글
R (9) - 데이터 시각화, 상관관계, legend, matplot, treetop (0) | 2020.10.07 |
---|---|
R (8) - 데이터 가공, apply(), select(), filter(), group_by(), summaries() (0) | 2020.10.04 |
R (6) - 자료의 종류, table, barplot, pie, quantile, hist, boxplot (0) | 2020.09.23 |
R (5) - if else, 반복문, 결측값, 이상값 (0) | 2020.09.22 |
R (4) - 엑셀, csv, txt 파일 가져오기, 데이터 추출, 조건문 (0) | 2020.09.15 |