변수, 데이터형, 연산자, 벡터, 배열, 데이터 프레임, 리스트

 

 


 2. 변수 

 

 

 

= 으로 해도되고 화살표 <- 로 해도 된다.

 

 

변수를 지정할 때 약간의 규칙이 있다.

 

 

변수의 자료형은 어떤 값을 저장하는가에 따라 유동적으로 바뀐다.

 

 

변수의 값을 교환하는 방식

 


 3. 데이터의 형태 

NULL : 빈칸
NA : 결측값 (응답이 누락된 항목)

NaN : 연산자체가 불가능한 값

Inf : 무한대

 

 

 

 

데이터형 확인 & 변환 함수

데이터형을 확인하기 위한 함수 : is

데이터형을 변환하기 위한 함수 : as


 4. 연산자 

산술연산자 : + - * /
몫 : %/%
나머지 : %%

비교연산자 : == !=
논리연산자 or and

 

 

 

 

 

 

 

함수를 알고있다면 코딩하지 않아도 쓸 수 있다.

 


 5. 벡터 

벡터 : 하나의 벡터 변수로 여러 단일값을 저장할 수 있다.

 

벡터의 생성

3가지 방법

(1) 백터 생성 연산자 이용하기 -> : 이용하기

(2) 빈 벡터 만들기 -> vector() 함수 이용하기

(3) c 함수 이용하기

 

 

변수 하나에 벡터를 넣음으로써 여러개의 수를 하나의 변수에 저장할 수 있다.

 


 seq(처음, 끝, by=증감) : 순열 벡터 생성 

seq 함수를 이용하여 순열벡터를 생성할 수 있다.

by = 증가값

length.out = 요소의 개수대로 일정한 증가값으로 만들어라


 rep(벡터, 벡터or요소의 반복 횟수) : 반복 벡터 생성

times = 벡터의 반복 횟수

each = 각 요소의 반복 횟수

벡터를 만드는 방법은 다양하므로 어떤 데이터를 만들지 생각한 후에 그것에 맞게끔 기능을 쓰면 된다.

 

벡터의 요소를 구할 때 x[1,2,3] 이렇게 쓰지 않도록 주의한다.
벡터의 요소라고 인식을 하지 못하기 때문이다.
x[c(1,2,3)] 이라고 써주어야 한다.

 

1,2,3 번 요소를 제외한 벡터의 요소 = x[-c(1,2,3)]

x[c(1:3)] 이렇게 쓰는게 일반적이고 더 편하다. 개수가 많아지기 때문에

 

벡터의 연산

벡터의 수가 다르다면 순환하면서 더해진다. x+z

 

sum()
mean() : 평균
median() : 중앙값
max(), min() : 최대, 최솟값
var() : 분산
sd() : 표준편차
sort() : 정렬
range() : 벡터의 범위 
length() : 벡터의 길이

 

 

백터의 연산

오름차순 sort

평균 mean

최대값 max

 

 

 

 

 

 

 

 

조건을 변수안에 넣을 수 있다.

 

 all(), any() 함수 : 조건 검토하기 

조건을 검토하기

all

any

 

 head(), tail() 함수 

앞의 요소 일부만 추출 : head()

뒤의 요소 일부만 추출 : tail()

 

합집합 : union
교집합 : intersect
차집합 : setdiff
요소가 모두 동일한가 : setequal

 


 6. 배열 : 열과 행으로 구성된 데이터 


 array(벡터의 데이터, c(차원을 정의하는 벡터)) 

arrray(1:5, c(2,4)) = 1부터 5까지의 수를 2행 4열의 행열을 만든다.

 


 matrix(벡터, nrow='숫자', byrow='행단위 배치 여부') : 2차원 배열 생성 함수 

배열을 matrix 로 행열 만들기 

 

 cbind() : 벡터를 열단위로 묶기, rbind() : 벡터를 행단위로 묶기 

벡터를 묶어서 배열 만들기

 

 

 

 

 

행렬의 연산

 

 

apply(데이터, 값, 연산할함수) : 배열의 행 또는 열별로 함수 적용하기

dim : 몇행 몇열인지 보여주기 = dimension

 

 

sample 함수 : 샘플을 보여주라

 

 

 

복사했습니다!