Excel에서 상관 계수를 계산하는 방법. Excel의 상관 관계 및 회귀 분석: 실행 지침

에 대한 상관 계수와 공분산을 계산해 봅시다. 다른 유형랜덤 변수의 관계.

상관 계수(상관관계 기준 피어슨, 영어 Pearson Product Moment 상관 계수)정도를 결정 선의랜덤 변수 간의 관계.

정의에서 다음과 같이 계산하려면 상관 계수확률 변수 X와 Y의 분포를 알아야 합니다. 분포를 알 수 없는 경우 다음을 추정합니다. 상관 계수사용된 샘플 상관 계수아르 자형 (그것은 또한 Rxy 또는 rxy) :

여기서 S x – 표준 편차샘플 랜덤 변수 x, 다음 공식으로 계산:

계산 공식에서 알 수 있듯이 상관 관계, 분모(표준 편차의 곱)는 단순히 다음과 같이 분자를 정규화합니다. 상관관계-1에서 1까지의 무차원 수로 밝혀졌습니다. 상관관계그리고 공분산동일한 정보를 제공합니다(알려진 경우 표준 편차), 하지만 상관관계사용하기 더 편리하기 때문에 그것은 차원이 없습니다.

계산하다 상관 계수그리고 샘플 공분산 MS EXCEL에서는 이를 위한 CORREL() 및 COVAR() 특수 함수가 있기 때문에 어렵지 않습니다. 얻은 값을 해석하는 방법을 파악하는 것이 훨씬 더 어렵습니다. 대부분의 기사는 이에 대해 설명합니다.

이론적 여담

기억해 상관관계통계적 관계라고 하며, 이는 다음과 같은 사실로 구성됩니다. 다른 의미하나의 변수는 서로 다른 중간다른 값(X의 값이 변경됨) 평균 Y는 정기적으로 변경됩니다). 다음과 같이 가정합니다. 둘 다변수 X와 Y는 무작위의값에 상대적인 임의의 분산이 있습니다. 평균값.

메모. 예를 들어 Y와 같은 하나의 변수만 임의의 특성을 갖고 다른 변수의 값은 결정론적(연구원이 설정)인 경우 회귀에 대해서만 이야기할 수 있습니다.

예를 들어 의존성을 연구할 때 연평균 기온말할 수 없다 상관 관계온도 및 관찰 연도에 따라 지표 적용 상관 관계각자의 해석으로.

상관관계변수 사이는 여러 가지 방식으로 발생할 수 있습니다.

변수 사이에 인과 관계가 존재합니다. 예를 들어 과학 연구에 대한 투자 금액(변수 X)과 받은 특허 수(Y)가 있습니다. 첫 번째 변수는 다음과 같이 나타납니다. 독립 변수(요인), 초 - 종속 변수(결과). 양의 의존성은 그들 사이의 상관관계의 존재를 결정하지만 그 반대는 아님을 기억해야 합니다.
활용의 존재 (공통 원인). 예를 들어, 조직이 성장함에 따라 급여 기금(PAY)과 구내 임대 비용이 증가합니다. 분명히 건물 임대가 급여에 달려 있다고 가정하는 것은 잘못된 것입니다. 이 두 변수는 많은 경우 직원 수에 선형적으로 의존합니다.
변수의 상호 영향(하나의 변수가 변경되면 두 번째 변수가 변경되고 그 반대도 마찬가지임). 이 접근 방식을 사용하면 문제에 대한 두 가지 공식이 허용됩니다. 모든 변수는 독립 변수와 종속 변수로 작용할 수 있습니다.

이런 식으로, 상관 지수얼마나 강한지 보여줍니다 선형 관계두 요인(있는 경우) 사이에 있으며 회귀를 사용하면 다른 요인을 기반으로 한 요인을 예측할 수 있습니다.

상관관계, 다른 통계와 마찬가지로 올바른 적용유용할 수 있지만 사용에 제한이 있습니다. 명확하게 정의된 선형 관계 또는 관계가 완전히 결여된 경우 상관관계훌륭하게 반영합니다. 그러나 데이터가 비선형 관계(예: 2차), 별도의 값 그룹 또는 이상치의 존재를 나타내는 경우 계산된 값 상관 계수오해의 소지가 있습니다(예제 파일 참조).

상관관계 1 또는 -1에 가까움(즉, 절대값이 1에 가까움)은 변수의 강한 선형 관계를 나타내고 0에 가까운 값은 관계가 없음을 나타냅니다. 긍정적인 상관관계한 지표가 증가하면 다른 지표는 평균적으로 증가하고 음수 지표는 감소합니다.

상관계수를 계산하기 위해서는 일치된 변수가 다음 조건을 만족해야 합니다.

변수의 수는 2와 같아야 합니다.
변수는 정량적이어야 합니다(예: 빈도, 중량, 가격). 이러한 변수의 계산된 평균은 의미가 있습니다. 평균 가격또는 평균 체중인내심 있는. 정량적 변수와 달리 정성적(명목적) 변수는 유한한 범주 집합(예: 성별 또는 혈액형)에서만 값을 가져옵니다. 숫자 값은 이러한 값과 조건부로 비교됩니다(예: 여성 - 1, 남성 - 2). 이 경우 계산이 평균값, 찾는 데 필요합니다. 상관 관계, 잘못되었습니다. 즉, 상관 관계;
변수는 무작위여야 하며 .

2차원 데이터는 다른 구조를 가질 수 있습니다. 그들 중 일부는 다음 작업에 특정 접근 방식이 필요합니다.

비선형 데이터의 경우 상관관계주의해서 사용해야 합니다. 일부 문제의 경우 선형 관계를 얻는 방식으로 하나 또는 두 변수를 변환하는 것이 유용할 수 있습니다(원하는 유형의 변환을 제안하기 위해 비선형 관계의 형식에 대한 가정이 필요함).
사용하여 산점도일부 데이터에서는 불평등한 변동(분산)이 관찰될 수 있습니다. 불균일 변동의 문제는 변동이 많은 장소가 가장 정확하지 않은 정보를 제공할 뿐만 아니라 가장 큰 영향계산할 때 통계 지표. 이 문제는 로그를 사용하는 것과 같이 데이터를 변환하여 종종 해결됩니다.
일부 데이터에서는 클러스터링이 관찰될 수 있으며 이는 모집단을 여러 부분으로 나눌 필요가 있음을 나타낼 수 있습니다.
이상치(outlier)는 계산된 상관 계수 값을 왜곡할 수 있습니다. 이상값은 우연, 데이터 수집 오류로 인한 것일 수도 있고 실제로 관계의 일부 기능을 반영할 수도 있습니다. 이상값은 평균값에서 크게 벗어나므로 지표 계산에 크게 기여합니다. 종종 통계는 이상치를 포함하거나 포함하지 않고 계산됩니다.

MS EXCEL을 사용하여 상관 관계 계산

2개의 변수를 예로 들어보겠습니다. 엑스그리고 와이그에 따라 견본 추출여러 쌍의 값으로 구성됩니다 (Х i ; Y i). 명확성을 위해 .

메모: 차트 구성에 대한 자세한 내용은 문서를 참조하세요. 빌드 예제 파일에서 산점도때문에 사용 여기서 우리는 변수 X가 임의적이어야 한다는 요구 사항에서 벗어났습니다(이는 생성을 단순화합니다. 다양한 방식관계: 빌드 트렌드 및 주어진 스프레드). 실제 데이터의 경우 분산형 차트(아래 참조)를 사용해야 합니다.

계산 상관 관계다양한 경우에 대해 변수 간의 관계를 그려 보겠습니다. 선형, 2차그리고 에서 의사 소통의 부족.

메모: 샘플 파일에서 선형 추세(기울기, Y축과의 교차점)의 매개 변수와 이 추세선을 중심으로 퍼진 정도를 설정할 수 있습니다. 2차 종속성 설정을 조정할 수도 있습니다.

빌드 예제 파일에서 산점도변수의 종속성이 없는 경우 산포도가 사용됩니다. 이 경우 다이어그램의 점은 구름 형태로 배열됩니다.

메모: 세로 또는 가로 축을 따라 차트의 배율을 변경하여 포인트 클라우드에 세로 또는 가로 선 모양을 지정할 수 있습니다. 이 경우 변수는 독립적으로 남을 것이 분명합니다.

위에서 언급했듯이 계산하려면 상관 계수 MS EXCEL에는 CORREL() 함수가 있습니다. 동일한 결과를 반환하는 유사한 PEARSON() 함수를 사용할 수도 있습니다.

계산을 확인하려면 상관 관계위 공식에 따라 CORREL() 함수에 의해 생성되며 예제 파일은 계산을 보여줍니다. 상관 관계더 자세한 공식을 사용하여:

=공분산.Y(B28:B88;D28:D88)/STDEV.Y(B28:B88)/STDEV.Y(D28:D88)

=공변량.V(B28:B88;D28:D88)/STDEV.V(B28:B88)/STDEV.V(D28:D88)

메모: 정사각형 상관 계수 r은 결정계수 R2는 QVPIRSON() 함수를 사용하여 회귀선을 만들 때 계산됩니다. R2 값도 표시할 수 있습니다. 산포도, MS EXCEL의 표준 기능을 사용하여 선형 추세를 구축하여(차트 선택, 탭 선택 형세, 그런 다음 그룹에서 분석버튼을 누르십시오 추세선그리고 선택 선형 근사). 추세선 그리기에 대한 자세한 내용은 예를 들어 를 참조하십시오.

MS EXCEL을 사용하여 공분산 계산

공분산 2개의 변수에 대해 정의된다는 차이점과 함께 의미상 유사합니다(또한 분산의 척도임). 분산- 하나. 따라서 cov(x;x)=VAR(x)입니다.

MS EXCEL(버전 2010부터)에서 공분산을 계산하기 위해 COVARIATION.G() 및 COVARIATION.V() 함수가 사용됩니다. 첫 번째 경우 계산 공식은 위와 유사합니다 (끝 .G~을 의미하다 인구 ), 두 번째 - 계수 1/n 대신 1/(n-1)이 사용됩니다. 결말 .에~을 의미하다 견본.

메모: MS EXCEL에 있는 COVAR() 함수 more 초기 버전, COVARIANCE.G() 함수와 유사합니다.

메모: 영어 버전의 CORREL() 및 COVAR() 함수는 CORREL 및 COVAR로 표시됩니다. 함수 COVARIANCE.G() 및 COVARIANCE.V()를 COVARIANCE.P 및 COVARIANCE.S로 사용합니다.

계산을 위한 추가 공식 공분산:

=SUMPRODUCT(B28:B88-AVERAGE(B28:B88),(D28:D88-AVERAGE(D28:D88)))/횟수(D28:D88)

=SUMPRODUCT(B28:B88-AVERAGE(B28:B88),(D28:D88))/횟수(D28:D88)

=SUMPRODUCT(B28:B88,D28:D88)/횟수(D28:D88)-평균(B28:B88)*평균(D28:D88)

이 수식은 속성을 사용합니다. 공분산:

변수인 경우 엑스그리고 와이독립이면 공분산은 0입니다. 변수가 독립적이지 않으면 합계의 분산은 다음과 같습니다.

VAR(x+y)= VAR(x)+ VAR(y)+2COV(x;y)

하지만 분산그들의 차이점은

VAR(x-y)= VAR(x)+ VAR(y)-2COV(x;y)

상관 계수의 통계적 유의성 평가

가설을 테스트하기 위해서는 확률 변수의 분포를 알아야 합니다. 상관 계수아르 자형. 일반적으로 가설 검정은 r이 아니라 임의 변수 t r에 대해 수행됩니다.

이것은 n-2 자유도를 가집니다.

임의 변수 |t r | 임계값 t α,n-2(α 지정)보다 크면 귀무 가설이 기각됩니다(값 간의 관계는 통계적으로 유의함).

애드인 분석 팩

공분산과 상관관계를 계산하기 위한 B 같은 이름의 도구가 있습니다 분석.

도구를 호출하면 다음 필드가 포함된 대화 상자가 나타납니다.

입력 간격: 2개의 변수에 대한 초기 데이터가 있는 범위에 대한 링크를 입력해야 합니다.
그룹화: 일반적으로 raw data는 2열에 입력
첫 번째 줄의 레이블: 체크하면 입력 간격열 머리글을 포함해야 합니다. Add-in 결과에 정보 열이 포함되도록 확인란을 선택하는 것이 좋습니다.
출력 간격: 계산 결과가 들어갈 셀의 범위. 이 범위의 왼쪽 위 셀을 지정하면 됩니다.

추가 기능은 계산된 상관 및 공분산 값을 반환합니다(공분산의 경우 두 임의 변수의 분산도 계산됨).

상관 계수(또는 선형 상관 계수)는 "r"(에서 드문 경우"ρ"로) 및 특성화 선형 상관(즉, 어떤 값과 방향에 의해 주어지는 관계) 둘 이상의 변수. 계수의 값은 -1과 +1 사이에 있습니다. 즉, 상관관계는 양수와 음수가 모두 가능합니다. 상관 계수가 -1이면 완벽한 음의 상관 관계가 있습니다. 상관 계수가 +1이면 완벽한 양의 상관 관계가 있습니다. 다른 경우에는 두 변수 사이에 양의 상관관계, 음의 상관관계 또는 상관관계가 없습니다. 상관 계수는 무료 온라인 계산기 또는 우수한 그래프 계산기를 사용하여 수동으로 계산할 수 있습니다.

단계

상관 계수 수동 계산

데이터를 수집합니다.상관 계수 계산을 시작하기 전에 주어진 숫자 쌍을 조사하십시오. 세로나 가로로 정리할 수 있는 표에 적어두는 것이 좋다. 각 행 또는 열에 "x" 및 "y" 레이블을 지정합니다.

예를 들어 변수 "x"와 "y"의 네 쌍의 값(숫자)이 주어집니다. 다음 테이블을 만들 수 있습니다.
- 엑스 || 와이
- 1 || 1
- 2 || 3
- 4 || 5
- 5 || 7

산술 평균 "x"를 계산합니다.이렇게하려면 "x"의 모든 값을 더한 다음 결과를 값의 수로 나눕니다.
- 이 예에서는 변수 "x"에 대해 4개의 값이 제공됩니다. 산술 평균 "x"를 계산하려면 이 값을 더한 다음 합계를 4로 나눕니다. 계산은 다음과 같이 작성됩니다.
- μ x = (1 + 2 + 4 + 5) / 4 (\displaystyle \mu _(x)=(1+2+4+5)/4)
- μ x = 12 / 4 (\displaystyle \mu _(x)=12/4)
- μ x = 3 (\displaystyle \mu _(x)=3)
산술 평균 "y"를 찾습니다.이렇게하려면 동일한 단계, 즉 "y"의 모든 값을 더한 다음 합계를 값 수로 나눕니다.
- 이 예에서는 변수 "y"에 대해 4개의 값이 제공됩니다. 이 값을 더한 다음 합계를 4로 나눕니다. 계산은 다음과 같이 작성됩니다.
- μy = (1 + 3 + 5 + 7) / 4 (\displaystyle \mu _(y)=(1+3+5+7)/4)
- μ y = 16 / 4 (\displaystyle \mu _(y)=16/4)
- μy = 4 (\displaystyle \mu _(y)=4)
"x"의 표준 편차를 계산합니다. x와 y의 평균을 계산했으면 이들 변수의 표준 편차를 찾으십시오. 표준 편차는 다음 공식을 사용하여 계산됩니다.
- σ x = 1n − 1 Σ (x − μ x) 2 (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(n-1))\Sigma (x-\mu _( x))^(2))))
- σ x = 14 − 1 ∗ ((1 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (5 − 3) 2) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(4-1))*((1-3)^(2)+(2-3)^(2)+(4-3)^(2)+(5-3) ^(2))))
- σ x = 1 3 ∗ (4 + 1 + 1 + 4) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(4+1+1+4)) ))
- σ x = 1 3 ∗ (10) (\displaystyle \sigma _(x)=(\sqrt ((\frac (1)(3))*(10))))
- σ x = 10 3 (\displaystyle \sigma _(x)=(\sqrt (\frac (10)(3))))
- σ x = 1 , 83 (\displaystyle \sigma _(x)=1.83)
표준 편차 "y"를 계산합니다.이전 단계의 단계를 따릅니다. 동일한 수식을 사용하지만 "y"값을 대체하십시오.
- 이 예에서 계산은 다음과 같이 작성됩니다.
- σ y = 14 − 1 ∗ ((1 − 4) 2 + (3 − 4) 2 + (5 − 4) 2 + (7 − 4) 2) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(4-1))*((1-4)^(2)+(3-4)^(2)+(5-4)^(2)+(7-4) ^(2))))
- σ y = 1 3 ∗ (9 + 1 + 1 + 9) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(9+1+1+9)) ))
- σ y = 1 3 ∗ (20) (\displaystyle \sigma _(y)=(\sqrt ((\frac (1)(3))*(20))))
- σ y = 20 3 (\displaystyle \sigma _(y)=(\sqrt (\frac (20)(3))))
- σ y = 2 , 58 (\displaystyle \sigma _(y)=2.58)
상관 계수를 계산하기 위한 기본 공식을 작성하십시오.이 수식에는 평균, 표준 편차 및 두 변수의 수 쌍 수(n)가 포함됩니다. 상관 계수는 "r"로 표시됩니다(드물게는 "ρ"로 표시됨). 이 문서에서는 수식을 사용하여 Pearson 상관 계수를 계산합니다.
- 여기와 다른 출처에서 수량은 다른 방식으로 표시될 수 있습니다. 예를 들어 일부 수식에는 "ρ"와 "σ"가 있고 다른 수식에는 "r"과 "s"가 있습니다. 일부 교과서는 다른 공식을 제공하지만 위의 공식과 수학적으로 동일합니다.
두 변수의 평균과 표준 편차를 계산했으므로 공식을 사용하여 상관 계수를 계산할 수 있습니다. "n"은 두 변수의 값 쌍 수입니다. 다른 수량의 값은 이전에 계산되었습니다.
- 이 예에서 계산은 다음과 같이 작성됩니다.
- ρ = (1n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \시그마 \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\시그마 _(y)))\오른쪽))
- ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1.83))\right)*\left((\frac (1-4)(2.58))\right)+\left((\frac (2-3)(1.83))\right) *\left((\ frac (3-4)(2,58))\right))
  + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3 )(1.83))\right)*\left((\frac (5-4)(2.58))\right)+\left((\frac (5-3)(1.83))\ right)*\left( (\frac (7-4)(2,58))\오른쪽))]
- ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6 +1+1+6)(4,721))\right))
- ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2.965)
- ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
- ρ = 0 . 988 (\디스플레이스타일 \rho =0.988)
결과를 분석합니다.이 예에서 상관 계수는 0.988입니다. 이 값은 어떤 방식으로 주어진 숫자 쌍의 특성을 나타냅니다. 값의 부호와 크기에 주의하십시오.
- 상관 계수의 값이 양수이므로 변수 "x"와 "y" 사이에는 양의 상관 관계가 있습니다. 즉, "x"의 값이 증가하면 "y"의 값도 증가합니다.
- 상관 계수의 값이 +1에 매우 가깝기 때문에 x 및 y 변수의 값은 높은 상관 관계가 있습니다. 점을 찍으면 좌표평면, 그들은 어떤 직선에 가깝게 위치할 것입니다.
온라인 계산기를 사용하여 상관 계수 계산
1. 상관 계수를 계산하려면 인터넷에서 계산기를 찾으십시오.이 계수는 종종 통계에서 계산됩니다. 숫자 쌍이 많은 경우 상관 계수를 수동으로 계산하는 것은 사실상 불가능합니다. 따라서 상관 계수를 계산하기 위한 온라인 계산기가 있습니다. 검색 엔진에 "상관 계수 계산기"(따옴표 제외)를 입력합니다.
2. 데이터를 입력합니다.데이터를 올바르게 입력하려면 사이트의 지침을 읽으십시오(숫자 쌍). 적절한 숫자 쌍을 입력하는 것이 매우 중요합니다. 그렇지 않으면 잘못된 결과를 얻게 됩니다. 웹사이트마다 데이터 입력 형식이 다르다는 점에 유의하세요.
  - 예를 들어 http://ncalculators.com/statistics/correlation-coefficient-calculator.htm 사이트에서 변수 "x"와 "y"의 값은 두 개의 수평선에 입력됩니다. 값은 쉼표로 구분됩니다. 즉, 이 예에서 "x"의 값은 1,2,4,5와 같이 입력되고 "y"의 값은 1,3,5,7과 같이 입력됩니다.
  - 다른 사이트인 http://www.alcula.com/calculators/statistics/correlation-coefficient/에서는 데이터가 세로로 입력됩니다. 이 경우 해당 숫자 쌍을 혼동하지 마십시오.
3. 상관 계수를 계산합니다.데이터를 입력한 후 "계산", "계산" 또는 유사한 버튼을 클릭하면 결과를 얻을 수 있습니다.
  
  그래프 계산기 사용
  1. 데이터를 입력합니다.그래프 계산기를 잡고 통계 계산 모드로 전환한 다음 편집 명령을 선택합니다.
    - 다른 계산기에서는 다른 키를 눌러야 합니다. 이 기사는 Texas Instruments TI-86 계산기에 중점을 둡니다.
    - 통계 계산 모드로 전환하려면 - Stat("+" 키 위)을 누릅니다. 그런 다음 F2 - 편집(Edit)을 누릅니다.
  2. 이전에 저장된 데이터를 삭제합니다.대부분의 계산기는 입력한 통계를 지울 때까지 보관합니다. 이전 데이터와 새 데이터가 혼동되지 않도록 먼저 저장된 정보를 삭제하십시오.
    - 화살표 키를 사용하여 커서를 이동하고 "xStat" 제목을 강조 표시합니다. 그런 다음 Clear 및 Enter를 눌러 xStat 열에 입력된 모든 값을 지웁니다.
    - 화살표 키를 사용하여 "yStat" 제목을 강조 표시합니다. 그런 다음 Clear와 Enter를 눌러 yStat 열에 입력된 모든 값을 지웁니다.
  3. 초기 데이터를 입력합니다.화살표 키를 사용하여 커서를 "xStat" 제목 아래의 첫 번째 셀로 이동합니다. 첫 번째 값을 입력하고 Enter 키를 누릅니다. 화면 하단에 공백 대신 입력한 값과 함께 "xStat (1) = __"가 표시됩니다. Enter 키를 누르면 입력한 값이 표에 나타나고 커서가 다음 줄로 이동합니다. 그러면 화면 하단에 "xStat(2) = __"가 표시됩니다.
    - 변수 "x"의 모든 값을 입력하십시오.
    - x 변수에 대한 모든 값을 입력했으면 화살표 키를 사용하여 yStat 열로 이동하고 y 변수에 대한 값을 입력합니다.
    - 숫자 쌍을 모두 입력한 후 종료를 눌러 화면을 지우고 집계 모드를 종료합니다.
  4. 상관 계수를 계산합니다.데이터가 직선에 얼마나 가까운지를 나타냅니다. 그래핑 계산기는 적절한 직선을 빠르게 결정하고 상관 계수를 계산할 수 있습니다.
    - 통계(통계) - 계산(계산)을 클릭합니다. TI-86에서 - - 를 누릅니다.
    - "선형 회귀" 함수( 선형 회귀). TI-86에서 "LinR"이라고 표시된 를 누릅니다. 깜박이는 커서와 함께 화면에 "LinR _" 줄이 표시됩니다.
    - 이제 xStat 및 yStat라는 두 변수의 이름을 입력합니다.
      - TI-86에서 이름 목록을 엽니다. 이렇게 하려면 – – 를 누르십시오.
      - 사용 가능한 변수는 화면 하단에 표시됩니다. 선택하고(대부분 F1 또는 F2를 누름) 쉼표를 입력한 다음 을 선택합니다.
      - Enter를 눌러 입력된 데이터를 처리하십시오.
  5. 결과를 분석합니다. Enter 키를 누르면 다음 정보가 화면에 표시됩니다.
    - y = a + b x (\displaystyle y=a+bx): 직선을 나타내는 함수입니다. 함수는 표준 형식(y = kx + b)으로 작성되지 않습니다.
    - a = (\디스플레이스타일 a=). 선이 y축과 교차하는 점의 y좌표입니다.
    - b = (\디스플레이스타일 b=). 그것 경사똑바로.
    - corr = (\displaystyle (\text(corr))=). 이것은 상관 계수입니다.
    - n = (\디스플레이스타일 n=). 이것은 계산에 사용된 숫자 쌍의 수입니다.

실험실 작업

상관관계 분석뛰어나다

1.1 상관 분석 MS 엑셀에서

상관 분석은 두 확률 변수 X와 Y 사이의 연결 정도를 결정하는 것으로 구성됩니다. 상관 계수는 이러한 연결의 척도로 사용됩니다. 상관 계수는 공동 일반 모집단 X와 Y의 관련 관측 쌍(xi , y i)의 부피 n 샘플에서 추정됩니다. 양적 척도에서 측정된 X와 Y 사이의 관계 정도를 평가하기 위해 다음을 사용합니다. 선형 상관 계수(Pearson 계수), 표본 X와 Y가 정규 법칙에 따라 분포한다고 가정합니다.

상관 계수는 -1(엄격한 역선형 관계)에서 1(엄격한 정비례 관계)까지 다양합니다. 값이 0이면 두 샘플 간에 선형 관계가 없습니다.

일반적인 상관관계 분류(Ivanter E.V., Korosov A.V., 1992에 따름):

X 및 Y 변수에 따라 다양한 척도에서 측정할 수 있는 여러 유형의 상관 계수가 있습니다. 적절한 상관 계수의 선택을 결정하는 것은 바로 이 사실입니다(표 13 참조).

MS Excel에서는 쌍을 이룬 선형 상관 계수를 계산하기 위해 특수 함수가 사용됩니다. CORREL(배열1; 배열2),

№ 테스트 대상

여기서 array1은 첫 번째 선택(X)의 셀 범위에 대한 참조입니다.

예 1: 10명의 학생이 시각-비유적 사고와 언어적 사고에 대한 테스트를 받았습니다. 테스트 작업을 해결하는 평균 시간은 초 단위로 측정되었습니다. 연구원은 다음 질문에 관심이 있습니다. 이러한 문제를 해결하는 시간 사이에 관계가 있습니까? 변수 X는 시각적-비유적 테스트를 푸는 데 걸리는 평균 시간을 나타내고, 변수 Y는 테스트의 언어 문제를 푸는 데 걸리는 평균 시간을 나타냅니다.

아르 자형 해결책:관계의 정도를 파악하기 위해서는 먼저 MS Excel 표에 데이터를 입력해야 합니다(표, 그림 1 참조). 그런 다음 상관 계수 값이 계산됩니다. 이렇게 하려면 C1 셀에 커서를 놓습니다. 도구 모음에서 함수 삽입(fx) 버튼을 클릭합니다.

나타나는 함수 마법사 대화 상자에서 범주를 선택합니다. 통계및 기능 코렐을 클릭한 다음 확인을 클릭합니다. 마우스 포인터를 사용하여 array1 필드(A1:A10)에 샘플 데이터 범위 X를 입력합니다. array2 필드에 샘플 데이터 범위 Y(B1:B10)를 입력합니다. 확인을 클릭합니다. C1 셀에 상관 계수 값(0.54119)이 나타납니다. 다음으로 상관계수의 절대 수치를 보고 관계의 종류(근접, 약, 중간 등)를 판단해야 합니다.

쌀. 1. 상관계수 산출 결과

따라서 시각적 비 유적 해결 시간과 테스트의 구두 작업 간의 연관성은 입증되지 않았습니다.

연습 1. 20개의 농업 지주에 대한 데이터를 사용할 수 있습니다. 찾다 상관 계수곡식 작물의 수확량과 토지의 질 사이를 비교하고 그 중요성을 평가합니다. 데이터는 표에 나와 있습니다.

표 2. 토지 품질에 대한 곡물 수확량의 의존성

집 번호	토지 품질, 점수	생산성, c/ha

작업 2.스포츠 피트니스 기계의 작동 시간(천 시간)과 수리 비용(천 루블) 사이에 관계가 있는지 확인합니다.

시뮬레이터 가동시간(천시간)	수리비(천 루블)

1.2 MS Excel의 다중 상관 관계

관측치가 많은 경우 여러 샘플에 대해 상관계수를 순차적으로 계산해야 하는 경우 편의상 결과 계수를 다음과 같은 표로 요약합니다. 상관 행렬.

상관 행렬해당 행과 열의 교차점에 해당 매개 변수 간의 상관 계수가 있는 정사각형 테이블입니다.

MS Excel에서 프로시저는 상관 행렬을 계산하는 데 사용됩니다. 상관관계패키지에서 데이터 분석.이 절차를 통해 서로 다른 매개변수 사이의 상관 계수를 포함하는 상관 행렬을 얻을 수 있습니다.

절차를 구현하려면 다음을 수행해야 합니다.

1. 실행 명령 서비스 - 분석 데이터;

2. 나타나는 목록에서 분석 도구행 선택 상관관계그리고 버튼을 누르세요 확인;

3. 표시되는 대화 상자에서 다음을 지정합니다. 입력 간격즉, 분석된 데이터가 포함된 셀에 대한 링크를 입력합니다. 입력 간격에는 적어도 두 개의 열이 포함되어야 합니다.

4. 섹션 그룹화입력한 데이터에 따라 스위치를 설정합니다(열 또는 행 기준).

5. 나타내다 휴일 간격즉, 분석 결과가 표시되는 셀에 대한 참조를 입력합니다. 출력 범위의 크기는 자동으로 결정되며 출력 범위가 원본 데이터와 겹칠 수 있는 경우 화면에 메시지가 표시됩니다. 누름 단추 확인.

각 행과 열의 교차점에 해당 매개변수 사이의 상관 계수가 있는 상관 행렬이 출력 범위에 표시됩니다. 동일한 행 및 열 좌표를 갖는 출력 범위의 셀은 입력 범위의 각 열이 자신과 완전히 상관되기 때문에 값 1을 포함합니다.

예 2기상 조건 관찰과 박물관 및 공원 방문에 대한 월별 데이터를 사용할 수 있습니다(표 3 참조). 날씨 상태와 박물관 및 공원 출석 사이에 관계가 있는지 여부를 확인할 필요가 있습니다.

표 3. 관찰 결과

맑은 날의 수	박물관 방문객 수	공원 방문객 수

해결책. 상관 분석을 수행하려면 초기 데이터를 A1:G3 범위에 입력하십시오(그림 2). 그럼 메뉴에서 서비스물품을 고르시 오 분석 데이터그런 다음 줄을 추가하십시오 상관관계. 나타나는 대화 상자에 다음을 입력하십시오. 입력 간격(A2:C7). 열에서 데이터를 고려하도록 지정합니다. 출력 범위(E1)를 지정하고 버튼을 누릅니다. 확인.

무화과. 33 기상조건과 박물관 관람간 상관관계는 -0.92, 기상조건과 공원 관람간 상관관계는 0.97, 공원과 박물관 관람간 상관관계는 0.92임을 알 수 있다.

따라서 분석 결과 종속성이 밝혀졌습니다. 박물관 참석자와 맑은 날 수 사이에는 강한 역선형 관계가 있고 공원 참석자와 날씨 조건 사이에는 거의 선형(매우 강한 직접) 관계가 있습니다. 박물관과 공원 참석 사이에는 강한 반비례 관계가 있습니다.

쌀. 2. 예제 2의 상관 행렬 계산 결과

작업 3. 리더 성격의 심리적 특성에 대한 전문가 평가 방법론에 따라 10 명의 관리자를 평가했습니다. 15명의 전문가가 5점 체계에 따라 각 심리적 특성을 평가했습니다(표 4 참조). 심리학자는 리더의 이러한 특성이 서로 어떤 관계에 있는지에 대한 질문에 관심이 있습니다.

표 4. 연구 결과

피험자 p / p	재치	정확성	임계

1.엑셀 프로그램을 연다

2. 데이터가 포함된 열을 만듭니다. 이 예에서 우리는 1학년 학생들의 공격성과 자기 의심 사이의 관계 또는 상관 관계를 고려할 것입니다. 실험에는 30명의 어린이가 참여했으며 데이터는 Excel 표에 표시됩니다.

1 열 - 주제 번호

2열 - 공격포인트

3열 - 자존감 부족포인트

3. 그런 다음 테이블 옆의 빈 셀을 선택하고 아이콘을 클릭해야 합니다. 에프엑스엑셀 패널에서

4. 선택해야 하는 범주 중에서 기능 메뉴가 열립니다. 통계 , 그런 다음 알파벳순으로 함수 목록 중에서 코렐확인을 클릭합니다.

5. 그러면 필요한 데이터 열을 선택할 수 있는 함수 인수 메뉴가 열립니다. 첫 번째 열을 선택하려면 공격선 옆에 있는 파란색 버튼을 클릭해야 합니다. 어레이1

6. 다음에 대한 데이터를 선택합시다. 어레이1열에서 공격대화 상자에서 파란색 버튼을 클릭합니다.

7. 그런 다음 배열 1과 유사하게 라인 옆에 있는 파란색 버튼을 클릭합니다. 어레이2

8. 다음에 대한 데이터를 선택합시다. 배열2- 열 자존감 부족파란색 버튼을 다시 누른 다음 OK

9. 여기에서 r-Pearson 상관 계수를 계산하여 선택한 셀에 기록합니다. 우리의 경우 양수이며 거의 같습니다. 0,225 . 이것은 말한다 보통 긍정적 1학년 학생들의 공격성과 자기 의심 사이의 연결

이런 식으로, 통계적 추론실험은 다음과 같습니다: r = 0.225, 변수 사이의 적당한 양의 관계가 밝혀졌습니다. 공격그리고 자존감 부족.

일부 연구에서는 상관계수의 p-significance level을 표시하도록 요구하고 있는데 Excel은 SPSS와 달리 그러한 기회를 제공하지 않는다. 괜찮아요 (A.D. Nasledov)가 있습니다.

연구 결과에 첨부할 수도 있습니다.

상관 계수는 값 간의 관계 값을 결정해야 할 때 사용됩니다. 나중에 이러한 데이터는 상관 행렬로 정의되는 하나의 테이블에 제공됩니다. 프로그램의 도움으로 마이크로 소프트 엑셀상관관계를 계산할 수 있습니다.

상관 계수는 일부 데이터에 의해 결정됩니다. 표시기 수준이 0에서 0.3 사이이면 연결이 없는 것입니다. 표시기가 0.3에서 0.5 사이이면 연결이 약한 것입니다. 지표가 0.7에 도달하면 관계가 평균입니다. 지표가 0.7-0.9에 도달하면 높음을 호출할 수 있습니다. 표시기가 1이면 가장 강한 연결입니다.

첫 번째 단계는 데이터 분석 패키지를 연결하는 것입니다. 활성화하지 않으면 추가 작업을 수행할 수 없습니다. "홈" 섹션을 열고 메뉴에서 "옵션"을 선택하여 연결할 수 있습니다.

다음으로 새 창이 열립니다. 여기에서 "추가 기능"을 선택하고 매개 변수 제어 필드에서 "Excel 추가 기능" 목록의 요소 중에서 선택해야 합니다.
왼쪽 수직 메뉴를 통해 매개 변수 창을 시작한 후 "추가 기능" 섹션으로 이동합니다. 그런 다음 "이동"을 클릭하십시오.

이 단계 후에 작업을 시작할 수 있습니다. 데이터가 포함된 테이블이 생성되었으며 해당 예제를 사용하여 다중 상관 계수를 찾을 수 있습니다.
시작하려면 "데이터" 섹션을 열고 툴킷에서 "데이터 분석"을 선택하십시오.

분석 도구가 있는 특수 창이 열립니다. "상관 관계"를 선택하고 조치를 확인하십시오.

옵션이 있는 새 창이 사용자 앞에 나타납니다. 입력 간격이 테이블의 값 범위를 지정하는 방법. 수동으로 설정하거나 특수 필드에 표시될 데이터를 선택하여 설정할 수 있습니다. 테이블 요소를 그룹 해제할 수도 있습니다. 현재 페이지에 출력을 만들 것입니다. 즉, 출력 매개 변수 설정에서 "출력 간격"을 선택합니다. 그 후 조치를 확인합니다.