article thumbnail image
Published 2020. 10. 27. 16:29

 

모델링과 예측

모델 = 수학식

모델을 이용하여 예측을 할 수 있다.

 

 

 

 

훈련 집합 : 주어진 데이터

독립 변수 : 설명 변수

종속 변수 : 반응 변수 

 

모델링 = 훈련 집합을 이용하여 최적의 모델을 찾아내는 과정

 

 

 

모델 선택

 

 

모델을 가지게 되면 x값이 어떤 값이 오던지 y값을 예측할 수 있다.

모델을 완성하면 무엇을 해야할까?

 

 

모델의 품질 평가

 

 

평균 제곱 오차(MSE, Mean Squared Error)

평균 제곱 오차

 

평균 제곱 오차는 작을수록 좋다.

 

 

 

모델 적합

모델피팅을 하기위해서 데이터 입력을 한다.

m이라는 변수에 모델 피팅을 한다. 

lm 이라는 함수에 반응변수와 설명변수를 입력해준다.

m을 출력하면 학습된 모델이 출력된다.

모델 m에 해당하는 직선의 매개변수가 출력된다.

 

최적의 모델을 구할 수 있게 된다.

 

lm함수는 가장 작은 평균제곱 오차를 찾아준다. 

 

coef() : 매개변수 값을 알려준다.

fitted() : 예측을 하였을 때 값을 알려준다.

 

 

summary 함수를 이용하면 더 많은 것을 알 수 있다.

 

예측

x에 대한 새로운 모델을 넣어주고 

predict() 함수를 통해 예측할 수 있다.

 

 

 

고차 다항식 분산 분석(ANOVA)

lm은 1차 방정식에 더 적합하지만 poly라는 옵션을 사용하면 고차방정식도 적용이 가능하다.

 

 

어떠한 유의성이 있는지

 

 

오차가 크다면 p값이 높게 나온다.

오차가 크지 않다면 p값이 작게 나오고 더 정확하게 예측할 수 있겠다고 할 수 있다.

p값을 가지고 오차가 있겠다, 없겠다라고 예측할 수 있다.

 

다중 선형 회귀

평균 제곱 오차

 

 

예측해보자

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'📌 R' 카테고리의 다른 글

R (15) - 회귀, 결정트리  (0) 2020.11.06
R (14) - 일반화 선형 모델, 로지스틱 회귀  (0) 2020.11.06
R (12) - 워드클라우드  (0) 2020.10.15
R (11) - 구글맵  (0) 2020.10.15
R (10) - ggplot2  (0) 2020.10.14
복사했습니다!