범주형 자료
연속형 자료
단일변수 자료 & 다중변수 자료
벡터는 여러개의 변수를 사용할 수 없기 때문에 단일변수 자료는 벡터에 넣는다.
크기를 측정할 수 없는 자료 : 범주형 자료
도수분포표 : table()
막대그래프 : barplot()
원 그래프 : pie()
자료값의 이름을 colors로 바꾼다.
col = colors 라고 하면 실제로도 색깔을 지정하게 된다.
평균과 중앙값
사분위 수 : quantile()
사분위 수 : 4등분 하는 지점의 값
제2 사분위 수 : 중앙값
3개를 기준으로 판단하기 때문에 더 많은 정보를 얻을 수 있다.
산포
분산고 표준편차가 작으면 자료의 관측값이 평균값 부근에 많이 모여있다는 뜻
range() : 자료값의 범위를 알려준다.
diff(range()) : 어느정도의 차이를 보이는지
히스토그램 : hist()
히스토그램은 구간에도 의미가 있다.
상자그림 : boxplot()
단일변수 자료를 파악하는데 매우 유용하다.
정확한 수치를 알지는 못한다.
bloxplot.stats()
$stats : 먼저 사분위 수의 값이 표시된다.
최솟값 Q1 중앙값 Q3 최댓값
$n : 관측값의 개수
$conf : 중앙값에 관련된 실내구간
$out : 구간 밖의 최댓값
그룹정보가 포함된 상자그림
품종별로 나누어져서 표시가 된다.
한 화면에 그래프 분할해서 출력하기
'📌 R' 카테고리의 다른 글
R (8) - 데이터 가공, apply(), select(), filter(), group_by(), summaries() (0) | 2020.10.04 |
---|---|
R (7) - 산점도, 상관분석, 선그래프 (0) | 2020.09.24 |
R (5) - if else, 반복문, 결측값, 이상값 (0) | 2020.09.22 |
R (4) - 엑셀, csv, txt 파일 가져오기, 데이터 추출, 조건문 (0) | 2020.09.15 |
R (3) - 배열, 매트릭스, 데이터프레임, 리스트, 팩터 (0) | 2020.09.14 |