상관 계수에 대한 주요 결과 해석
상관 분석을 해석하려면 다음 단계를 수행하십시오. 주요 결과에는 Pearson 상관 계수, Spearman 상관 계수 및 p-값이 포함됩니다.
이 항목의 내용
1단계: 변수 사이의 선형 관계 조사(Pearson)
두 계량형 변수 사이의 선형 관계의 강도와 방향을 조사하려면 Pearson 상관 계수를 사용합니다.
강도
상관 계수 값의 범위는 −1부터 +1까지입니다. 계수의 절대값이 클수록 변수 사이에 강한 관계가 있습니다.
Pearson 상관의 경우 절대값 1은 완전한 선형 관계를 나타냅니다. 0에 가까운 상관 값은 변수 사이에 선형 관계가 없음을 나타냅니다.
방향
계수의 부호는 관계의 방향을 나타냅니다. 두 변수가 함께 증가하거나 감소하는 경향이 있으면 계수가 양수이며, 상관을 나타내는 선이 위쪽 방향으로 기울어집니다. 한 변수가 증가할 때 다른 변수는 감소하는 경향이 있으면 계수는 음수이며, 상관을 나타내는 선이 아래쪽 방향으로 기울어집니다.
다음 그림은 변수 사이 관계의 강도 및 방향의 여러 패턴을 보여주기 위해 특정한 상관 값을 갖는 데이터를 표시합니다.
아무런 관계도 없음: Pearson r = 0
점들이 그림에 랜덤하게 위치합니다. 이는 변수 사이에 선형 관계가 없다는 것을 나타냅니다.
적절한 양의 관계: Pearson r = 0.476
일부 점은 선에 가깝고 일부 점은 선에서 멀리 떨어져 있습니다. 이는 변수 사이에 적절한 선형 관계만 있다는 것을 나타냅니다.
강한 양의 관계: Pearson r = 0.93
점들이 선에 가깝게 위치합니다. 이는 변수 사이에 강한 선형 관계가 있다는 것을 나타냅니다. 한 변수가 증가하면 다른 변수도 증가하기 때문에 양의 관계가 있습니다.
강한 음의 관계: Pearson r = −0.968
점들이 선에 가깝게 위치합니다. 이는 변수 사이에 강한 음의 선형 관계가 있다는 것을 나타냅니다. 한 변수가 증가하면 다른 변수도 감소하기 때문에 음의 관계가 있습니다.
상관 계수를 해석하려면 다음과 같은 점을 고려하십시오.
- 상관 계수만을 기초로 하여 한 변수의 변화가 다른 변수의 변화를 유발한다는 결론을 내리는 것은 적절하지 않습니다. 적절히 통제된 실험에서만 인과 관계를 확인할 수 있습니다.
- Pearson 상관 계수는 극단 데이터 값의 영향을 상당히 많이 받습니다. 데이터 집합에 나머지 값들과 매우 다른 값이 하나 있으면 상관 계수의 값이 크게 변경될 수 있습니다. 따라서 극단값의 원인을 식별해야 합니다. 모든 데이터 입력 또는 측정 오류를 수정합니다. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제합니다(특수 원인). 그런 다음 분석을 반복합니다.
- 낮은 Pearson 상관 계수는 변수 사이에 관계가 없다는 것을 의미하지 않습니다. 변수 사이에 비선형 관계가 있을 수도 있습니다. 비선형 관계를 그래픽으로 확인하려면 산점도을 생성하거나 적합선 그림을 사용하십시오.
상관 분석: 수소, 다공성, 강도
수소 | 다공성 | |
다공성 | 0.625 | |
0.017 | ||
강도 | -0.790 | -0.527 |
0.001 | 0.053 |
셀 내용: Pearson 상관 계수 P-값
주요 결과: Pearson 상관 계수
이 결과에서 다공성과 수소 사이의 Pearson 상관 계수는 0.625로, 변수 사이에 양의 관계가 있다는 것을 나타냅니다. 강도와 수소 사이의 Pearson 상관 계수는 -0.790이고 강도와 다공성 사이의 Pearson 상관 계수는 -0.527입니다. 이 변수들 사이에는 음의 관계가 있으며, 이는 수소와 다공성이 증가하면 강도가 감소한다는 것을 나타냅니다.
2단계: 상관 계수가 유의한지 여부 확인
유의수준 (Significant level) : 데이터의 차이가 유의미한 것인지 아닌지를 판단하는 기준
p-값이 유의수준보다 작다면 차이가 통계적으로 유의미하다
p-값이 유의수준보다 크면 우연히라도 충분히 일어날 수 있는 그저 그런 차이인 것으로 판단할 수 있다.
유의성 검정 (Significnace Test) : 말 그대로 p-값과 유의수준을 활용해서 차이의 유의성을 판단한다.
변수 사이에 유의한 상관 관계가 있는지 여부를 확인하려면 p-값을 유의 수준과 비교하십시오. 일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 좋습니다. 0.05의 α는 실제로 상관 관계가 존재하지 않는데 상관 관계가 존재한다는 결론을 내릴 위험이 5%라는 것을 나타냅니다.
p-값을 통해 상관 계수가 0과 유의하게 다른지 알 수 있습니다. 상관 계수가 0이면 선형 관계가 없음을 나타냅니다.
p-값 ≤ α : 상관 관계가 통계적으로 유의합니다.
: p-값이 유의 수준보다 작거나 같으면 상관 계수가 0과 다르다는 결론을 내릴 수 있습니다.
p-값 > α : 상관 관계가 통계적으로 유의하지 않습니다.
: p-값이 유의 수준보다 크면 상관 관계가 0과 다르다는 결론을 내릴 수 없습니다.
상관 분석: 수소, 다공성, 강도
수소 | 다공성 | |
다공성 | 0.625 | |
p- | 0.017 | |
강도 | -0.790 | -0.527 |
p- | 0.001 | 0.053 |
셀 내용: Pearson 상관 계수 P-값
주요 결과: P-값
이 결과에서 다공성과 수소 사이, 강도와 수소 사이의 상관에 대한 p-값은 모두 유의 수준 0.05보다 작으며, 이는 상관 계수가 유의하다는 것을 나타냅니다. 강도와 다공성 사이의 p-값은 0.053입니다. p-값이 유의 수준 0.05보다 크기 때문에 변수 사이 연관성의 유의성에 대한 결정적인 증거가 없습니다.
3단계: 변수 사이의 단순 관계 조사(Spearman)
두 계량형 변수 또는 순서형 변수 사이의 단순 관계의 강도와 방향을 조사하려면 Spearman 상관 계수를 사용합니다. 단순 관계에서 두 변수는 동일한 상대적인 방향으로 이동하는 경향이 있지만 반드시 일정한 비율로 변화하는 것은 아닙니다. Spearman 상관을 계산하기 위해 Minitab에서는 원시 데이터에 순위를 매깁니다. 그런 다음 순위 매긴 데이터에 대해 상관 계수를 계산합니다.
강도
상관 계수 값의 범위는 −1부터 +1까지입니다. 계수의 절대값이 클수록 변수 사이에 강한 관계가 있습니다.
Spearman 상관의 경우 절대값 1은 순위가 매겨진 데이터가 완전히 선형임을 나타냅니다. 예를 들어, Spearman 상관 계수가 −1이면 변수 A의 가장 큰 값이 변수 B의 가장 작은 값과 연관되어 있고, 변수 A의 두 번째로 큰 값이 변수 B의 두 번째로 큰 값과 연관되어 있으며, 이런 식으로 계속된다는 것을 의미합니다.
방향
계수의 부호는 관계의 방향을 나타냅니다. 두 변수가 함께 증가하거나 감소하는 경향이 있으면 계수가 양수이며, 상관을 나타내는 선이 위쪽 방향으로 기울어집니다. 한 변수가 증가할 때 다른 변수는 감소하는 경향이 있으면 계수는 음수이며, 상관을 나타내는 선이 아래쪽 방향으로 기울어집니다.
다음 그림은 변수 사이 관계의 강도 및 방향의 여러 패턴을 보여주기 위해 특정한 Spearman 상관 계수 값을 갖는 데이터를 표시합니다.
아무런 관계도 없음: Spearman 로 = 0
점들이 그림에 랜덤하게 위치합니다. 이는 변수 사이에 아무런 관계도 없다는 것을 나타냅니다.
강한 양의 관계: Spearman 로 = 0.948
점들이 선에 가깝게 위치합니다. 이는 변수 사이에 강한 관계가 있다는 것을 나타냅니다. 변수가 동시에 증가하기 때문에 양의 관계가 있습니다.
강한 음의 관계: Spearman 로 = 1.0
점들이 선에 가깝게 위치합니다. 이는 변수 사이에 강한 관계가 있다는 것을 나타냅니다. 한 변수가 증가하면 다른 변수도 감소하기 때문에 음의 관계가 있습니다.
상관 계수만을 기초로 하여 한 변수의 변화가 다른 변수의 변화를 유발한다는 결론을 내리는 것은 적절하지 않습니다. 적절히 통제된 실험에서만 인과 관계를 확인할 수 있습니다.
Spearman의 로: 수소, 다공성, 강도
상관계수 수소 다공성 다공성 0.590 0.026 강도 -0.859 -0.675 0.000 0.008
셀 내용: Spearman의 로 P-값
주요 결과: Spearman 로
이 결과에서 다공성과 수소 사이의 Spearman 상관 계수는 0.590으로, 변수 사이에 양의 관계가 있다는 것을 나타냅니다. 강도와 수소 사이의 Spearman 상관 계수는 -0.859이고 강도와 다공성 사이의 Spearman 상관 계수는 -0.675입니다. 이 변수들 사이에는 음의 관계가 있으며, 이는 수소와 다공성이 증가하면 강도가 감소한다는 것을 나타냅니다.
'✏️ Mathemathics > Statistics and Probability' 카테고리의 다른 글
음이항 분포(Negative Binomial Distribution) (0) | 2020.03.12 |
---|---|
기하 분포 (Geometric distribution) (1) | 2020.03.09 |
이항 분포 (Binomial Distribution) (0) | 2020.03.09 |
베르누이 분포 (0) | 2020.03.09 |
t-분포 (0) | 2020.02.05 |