매트릭스(matrix) : 모든 셀의 자료형이 동일한 컬럼들로 구성
데이터프레임(data frame) : 자료형이 다른 컬럼들로 구성
한칸 = 셀
matrix(매트릭스에 저장될 값, nrow = 행의 수, ncol = 열의 수)
matrix(매트릭스에 저장될 값, nrow = 행의 수, ncol = 열의 수, byrow=T)
행의 방향으로 값을 대입한다.
cbind() : 열방향 결합 rbind() : 행방향 결합
cbind(x,y) : 열들로 만들어서 결합하여 매트릭스 생성
rbind(x,y) : 행들로 만들어서 결합하여 매트릭스 생성
인덱스값을 이용하여 매트릭스에서의 값 추출하기
매트릭스에서 여러개의 값을 추출하기
매트릭스의 행과 열에 이름을 지정하기
데이터 프레임
표 형태의 데이터구조이다.
행렬과 달리 여러 데이터형을 저장하는 것이 가능하다.
리스트와 달리 행의 수를 일치시켜서 저장해야 한다.
data.frame
벡터를 만든 다음 벡터를 데이터 프레임에 넣어준다.
attach, detach : 데이터프레임의 속성명을 변수로 변경하여 이용할 수 있게 한다.
with 함수를 쓰는 이유 : attach를 안하고 데이터 프레임 안에 있는 함수의 내용을 가지고 적용할 수 있다.
속성값을 변수인 것처럼 이용할 수 있다.
na.omit() 함수 : NA가 포함된 값을 제외하여 추출함
merge 함수 : 병합이 될만한 것으로 데이터프레임을 병합한다.
리스트
벡터 : 하나의 주제를 가지고 여러개의 데이터를 갖는 1차원 데이터
배열 : 2차원 형태의 표의 형태로 여러개의 주제를 가진 데이터의 융합 (단 배열은 같은 데이터 형을 가지고 있어야 한다.)
데이터프레임 : 다른 데이터 형을 가지고 있어도 상관 없다.
리스트 : 데이터형이 같을 필요도 속성의 크기가 같을 필요도 없는 데이터의 모임
여기서 patients 와 no.patients 는 아직 리스트가 아니다. 데이터 프레임이다.
리스트 요소에 접근하기 : $, [[]]
lapply, sapply
표현 방법이 다르다.
factor : 문자형 데이터가 저장된 벡터의 일종
문자 값들이 몇 종류로 정해져 있을 때 사용한다.
'📌 R' 카테고리의 다른 글
R (6) - 자료의 종류, table, barplot, pie, quantile, hist, boxplot (0) | 2020.09.23 |
---|---|
R (5) - if else, 반복문, 결측값, 이상값 (0) | 2020.09.22 |
R (4) - 엑셀, csv, txt 파일 가져오기, 데이터 추출, 조건문 (0) | 2020.09.15 |
R (2) - 변수, 데이터형, 연산자, 벡터, 배열, 데이터 프레임, 리스트 (0) | 2020.09.09 |
R (1) - 데이터 과학이란, R studio 설치하기 (0) | 2020.09.04 |