범주형 자료

 

연속형 자료

 

단일변수 자료 & 다중변수 자료

벡터는 여러개의 변수를 사용할 수 없기 때문에 단일변수 자료는 벡터에 넣는다.

 

 

 

 

 

크기를 측정할 수 없는 자료 : 범주형 자료

 

 

도수분포표 : table()

 

막대그래프 : barplot()

 

원 그래프 : pie()

 

자료값의 이름을 colors로 바꾼다.

col = colors 라고 하면 실제로도 색깔을 지정하게 된다.

 

 

 

평균과 중앙값

 

사분위 수 : quantile()

사분위 수 : 4등분 하는 지점의 값

제2 사분위 수 : 중앙값

3개를 기준으로 판단하기 때문에 더 많은 정보를 얻을 수 있다.

 

 

산포 

분산고 표준편차가 작으면 자료의 관측값이 평균값 부근에 많이 모여있다는 뜻

 

range() : 자료값의 범위를 알려준다.

diff(range()) : 어느정도의 차이를 보이는지

 

히스토그램 : hist()

히스토그램은 구간에도 의미가 있다.

 

 

상자그림 : boxplot()

단일변수 자료를 파악하는데 매우 유용하다.

 

 

정확한 수치를 알지는 못한다.

 

bloxplot.stats()

$stats : 먼저 사분위 수의 값이 표시된다.

최솟값 Q1 중앙값 Q3 최댓값

 

$n : 관측값의 개수

 

$conf : 중앙값에 관련된 실내구간

 

$out : 구간 밖의 최댓값

 

그룹정보가 포함된 상자그림

품종별로 나누어져서 표시가 된다.

 

한 화면에 그래프 분할해서 출력하기

복사했습니다!