변수, 데이터형, 연산자, 벡터, 배열, 데이터 프레임, 리스트
2. 변수
= 으로 해도되고 화살표 <- 로 해도 된다.
변수를 지정할 때 약간의 규칙이 있다.
변수의 자료형은 어떤 값을 저장하는가에 따라 유동적으로 바뀐다.
변수의 값을 교환하는 방식
3. 데이터의 형태
NULL : 빈칸
NA : 결측값 (응답이 누락된 항목)
NaN : 연산자체가 불가능한 값
Inf : 무한대
데이터형 확인 & 변환 함수
데이터형을 확인하기 위한 함수 : is
데이터형을 변환하기 위한 함수 : as
4. 연산자
산술연산자 : + - * /
몫 : %/%
나머지 : %%
비교연산자 : == !=
논리연산자 or and
함수를 알고있다면 코딩하지 않아도 쓸 수 있다.
5. 벡터
벡터 : 하나의 벡터 변수로 여러 단일값을 저장할 수 있다.
벡터의 생성
3가지 방법
(1) 백터 생성 연산자 이용하기 -> : 이용하기
(2) 빈 벡터 만들기 -> vector() 함수 이용하기
(3) c 함수 이용하기
변수 하나에 벡터를 넣음으로써 여러개의 수를 하나의 변수에 저장할 수 있다.
seq(처음, 끝, by=증감) : 순열 벡터 생성
seq 함수를 이용하여 순열벡터를 생성할 수 있다.
by = 증가값
length.out = 요소의 개수대로 일정한 증가값으로 만들어라
rep(벡터, 벡터or요소의 반복 횟수) : 반복 벡터 생성
times = 벡터의 반복 횟수
each = 각 요소의 반복 횟수
벡터를 만드는 방법은 다양하므로 어떤 데이터를 만들지 생각한 후에 그것에 맞게끔 기능을 쓰면 된다.
벡터의 요소를 구할 때 x[1,2,3] 이렇게 쓰지 않도록 주의한다.
벡터의 요소라고 인식을 하지 못하기 때문이다.
x[c(1,2,3)] 이라고 써주어야 한다.
1,2,3 번 요소를 제외한 벡터의 요소 = x[-c(1,2,3)]
x[c(1:3)] 이렇게 쓰는게 일반적이고 더 편하다. 개수가 많아지기 때문에
벡터의 연산
벡터의 수가 다르다면 순환하면서 더해진다. x+z
sum()
mean() : 평균
median() : 중앙값
max(), min() : 최대, 최솟값
var() : 분산
sd() : 표준편차
sort() : 정렬
range() : 벡터의 범위
length() : 벡터의 길이
백터의 연산
오름차순 sort
평균 mean
최대값 max
조건을 변수안에 넣을 수 있다.
all(), any() 함수 : 조건 검토하기
조건을 검토하기
all
any
head(), tail() 함수
앞의 요소 일부만 추출 : head()
뒤의 요소 일부만 추출 : tail()
합집합 : union
교집합 : intersect
차집합 : setdiff
요소가 모두 동일한가 : setequal
6. 배열 : 열과 행으로 구성된 데이터
array(벡터의 데이터, c(차원을 정의하는 벡터))
arrray(1:5, c(2,4)) = 1부터 5까지의 수를 2행 4열의 행열을 만든다.
matrix(벡터, nrow='숫자', byrow='행단위 배치 여부') : 2차원 배열 생성 함수
배열을 matrix 로 행열 만들기
cbind() : 벡터를 열단위로 묶기, rbind() : 벡터를 행단위로 묶기
벡터를 묶어서 배열 만들기
행렬의 연산
apply(데이터, 값, 연산할함수) : 배열의 행 또는 열별로 함수 적용하기
dim : 몇행 몇열인지 보여주기 = dimension
sample 함수 : 샘플을 보여주라
'📌 R' 카테고리의 다른 글
R (6) - 자료의 종류, table, barplot, pie, quantile, hist, boxplot (0) | 2020.09.23 |
---|---|
R (5) - if else, 반복문, 결측값, 이상값 (0) | 2020.09.22 |
R (4) - 엑셀, csv, txt 파일 가져오기, 데이터 추출, 조건문 (0) | 2020.09.15 |
R (3) - 배열, 매트릭스, 데이터프레임, 리스트, 팩터 (0) | 2020.09.14 |
R (1) - 데이터 과학이란, R studio 설치하기 (0) | 2020.09.04 |