산점도 : plot() 

두개의 변수로 구성된 자료의 분포를 알아보는 그래프

 

 

pch 번호

 

두 변수 사이의 관련성을 확인하는데에 산점도가 쓰인다.

 

 여러 변수들 간의 산점도 : pairs() 

4개 중 2개씩 짝지어 지므로 다양한 산점도가 나타난다.

 

 

대각선을 기준으로 대칭되는 특징이 있다.

 

속성값이 많을 때에는 다중 산점도로 표현할 수 있다.

 

 그룹 정보가 있는 두 변수의 산점도 : plot() 

꽃잎의 길이와

 

폭의 상관관계를 알 수 있다.

관측값의 비교 뿐만 아니라 그룹간의 관계도 알 수 있다.

 

 

 상관분석 : cor() 

r이 1이면 거의 선의 모양

r이 0.5이면 선형성이 있긴 하지만 약간 분포가 되어 있다. 약한 선형성을 가진다.

r이 0인 경우엔 선형성의 거의 없다라고 판단할 수 있다.

 

 

 

cor() : 두 변수 사이의 상관성 분석

iris는 4개의 변수가 있고 각각의 변수들의 상관성을 분석할 수 있다.

 

 

 선그래프 : plot() 

시간의 변화에 따라서 증감의 추이를 알기 위해선 선그래프가 좋다.

type 을 L 로 해주어야 한다.

 

선의 종류를 다르게 해서 나타낼 수 있다.

데이터 자체가 무슨 상황인지 먼저 파악하고 왜 줄었는지 왜 늘어났는지 다시 분석할 수 있다.

 

선 그래프는 시계열 자료를 판단하는 기본적인 자료이다.

 

 여러개의 선 그래프의 작성 : plot(), lines() 

 

 

 

 

 

 

복사했습니다!