Spearman의 상관 계수.  Spearman의 순위 상관 계수.  Spearman 상관 분석

Spearman의 상관 계수. Spearman의 순위 상관 계수. Spearman 상관 분석

실제로 두 특성 간의 관계의 근접성을 결정하기 위해 계수가 자주 사용됩니다. 순위 상관 관계스피어맨(R). 각 기능의 값은 오름차순(1에서 n까지)으로 순위가 매겨진 다음 하나의 관찰에 해당하는 순위 간의 차이(d)가 결정됩니다.

예 #1. 볼륨 사이의 관계 공산품 2003 년 러시아 연방 지역 중 하나의 10 개 지역에 대한 고정 자본 투자는 다음 데이터가 특징입니다.
계산하다 순위 계수스피어맨 상관관계그리고 켄달라. α=0.05에서 유의성을 확인합니다. 고려중인 러시아 연방 지역의 산업 생산량과 고정 자산 투자 사이의 관계에 대한 결론을 공식화하십시오.

특성 Y와 요인 X에 순위를 지정합니다. 제곱 d 2 의 차이의 합을 구합니다.
계산기를 사용하여 Spearman의 순위 상관 계수를 계산합니다.

엑스 와이 랭크 X, dx 순위 Y, d y (dx - dy) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

특성 Y 요인 X 간의 관계는 강력하고 직접적입니다.

Spearman의 순위 상관 계수 추정



Student's table에 따르면, 우리는 Ttable을 찾습니다.
T 테이블 \u003d (18, 0.05) \u003d 1.734
Tobs > Ttabl 때문에 순위 상관 계수가 0과 같다는 가설을 기각합니다. 즉, Spearman의 순위 상관 계수는 통계적으로 유의합니다.

순위 상관 계수에 대한 구간 추정값(신뢰 구간)
신뢰 구간 Spearman의 순위 상관 계수: p(0.5431;0.9095).

예 #2. 초기 데이터.

5 4
3 4
1 3
3 1
6 6
2 2
행렬에는 첫 번째 행의 관련 순위(같은 순위 번호)가 있으므로 모양을 변경합니다. 순위는 순위의 중요도를 변경하지 않고 다시 구성됩니다. 즉, 해당 비율(보다 크거나 작거나 같음)이 순위 번호 사이에 유지되어야 합니다. 또한 순위를 매개변수 수와 동일한 값(in 이 경우 n = 6). 순위 개혁은 표에서 이루어집니다.
새로운 계급
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
행렬에 두 번째 행의 경계 순위가 있으므로 모양을 변경합니다. 순위 개혁은 표에서 이루어집니다.
정렬된 행의 좌석 번호전문가의 평가에 따른 요인의 위치새로운 계급
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
순위 매트릭스.
랭크 X, dx순위 Y, d y(dx - dy) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
기능 x와 y의 값 중에는 동일한 값이 여러 개 있기 때문에, 즉 경계 순위가 형성되면 이 경우 Spearman 계수는 다음과 같이 계산됩니다.

어디


j - 기능 x에 대한 링크 수
그리고 j는 동일한 순위의 수입니다. j번째 번들 x로;
k - 특징 y에 대한 도르래의 수;
k에서 - y의 k번째 번들에 있는 동일한 순위의 수입니다.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

특징 Y와 요인 X 사이의 관계는 보통이고 직접적입니다.

Spearman의 순위 상관 관계(순위 상관 관계). Spearman의 순위 상관은 요인 간의 연관성 정도를 결정하는 가장 간단한 방법입니다. 방법의 이름은 순위, 즉 얻은 정량적 값의 시리즈 사이에서 관계가 결정되고 내림차순 또는 오름차순으로 순위가 지정됨을 나타냅니다. 첫째, 쌍의 연결이 4개 미만 20개 이상인 경우 순위 상관 관계가 권장되지 않는다는 점을 염두에 두어야 합니다. 둘째, 순위 상관 관계를 통해 다른 경우의 관계를 결정할 수 있습니다. 값이 반 정량적 인 경우, 즉 숫자 표현식이 없으면 이러한 값의 명확한 순서를 반영합니다. 셋째, 대략적인 데이터를 얻기에 충분한 경우 순위 상관을 사용하는 것이 좋습니다. 질문을 결정하기 위해 순위 상관 계수를 계산하는 예: 설문지는 X와 Y가 피험자의 유사한 개인적 자질을 측정합니다. "예" 또는 "아니오"의 대체 답변이 필요한 두 개의 설문지(X 및 Y)를 사용하여 15명의 대상자(N = 10)의 답변을 얻었습니다. 그 결과는 설문지 X와 설문지 B에 대해 별도로 긍정 응답의 합으로 제시하였다. 이러한 결과를 표 1에 요약하였다. 5.19.

표 5.19. Spearman 순위 상관 계수(p)를 계산하기 위한 1차 결과의 표 *

요약 상관 행렬 분석. 상관 플레이아데스 방법.

예시. 테이블에서. 6.18은 Wechsler 방법에 따라 테스트된 11개 변수의 해석을 보여줍니다. 데이터는 18세에서 25세 사이의 균질한 샘플에서 얻었습니다(n = 800).

계층화하기 전에 상관 행렬의 순위를 매기는 것이 좋습니다. 이를 위해 원래 행렬에서 다른 모든 변수와 각 변수의 상관 계수의 평균 값이 계산됩니다.

그런 다음 표에 따라. 5.20 주어진 신뢰 확률 0.95에 대한 상관 행렬의 허용 가능한 계층화 수준을 결정하고 n - 숫자

표 6.20. 오름차순 상관 행렬

변수 1 2 3 4 ~일 것이다 0 7 8 0 10 11 엠(리지) 계급
1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
7 1 0,310 0,388 0,264 0,266 0,310 9
8 1 0,897 0,363 0,388 0,363 5
9 1 0,388 0,430 0,846 6
10 1 0,336 0,310 8
11 1 0,300 10

지정: 1 - 일반 인식; 2 - 개념성; 3 - 주의력; 4 - vdatnist K 일반화; b - 직접 암기(숫자) 6 - 모국어 숙달 수준; 7 - 감각 운동 기술 습득 속도(기호로 코딩) 8 - 관찰, 9 - 조합 능력(분석 및 종합용) 10 - 부분을 의미 있는 전체로 구성하는 능력 11 - 발견적 합성 능력; M (rij) - 나머지 관찰 변수와 변수의 상관 계수의 평균 값(이 경우 n = 800): r (0) - 0 "절단" 평면의 값 - 최소 유의 절대 절대값 상관 계수의 값(n - 120, r(0) = 0.236, n = 40, r(0) = 0.407) | Δr | - 허용 가능한 분리 단계(n = 40, | Δr | = 0.558) c - 허용 가능한 분리 수준 수(n = 40, s = 1, n = 120, s = 2) r(1), r(2), ..., r(9)는 절단 평면의 절대값입니다(n=40, r(1)=0.965).

n = 800의 경우, 우리는 rtype과 경계 ri의 값을 찾습니다. 그 후 Stratifying은 상관 행렬의 범위를 지정하여 레이어 내부의 상관 플레이아데스를 강조 표시하거나 상관 행렬의 일부를 분리하여 상관 플레이아데스의 합집합을 그립니다. 위의 레이어(그림 5.5).

수신된 플레이아데스에 대한 의미 있는 분석은 그 이상 수학 통계. 플레이아데스의 의미 있는 해석에 도움이 되는 두 가지 형식적 지표에 주목해야 합니다. 중요한 지표 중 하나는 꼭짓점의 정도, 즉 꼭짓점에 인접한 가장자리의 수입니다. 변수 가장 큰 숫자가장자리는 은하의 "핵심"이며 이 은하의 나머지 변수를 나타내는 지표로 간주될 수 있습니다. 또 다른 중요한 지표는 의사 소통의 밀도입니다. 변수는 하나의 은하에서 더 적은 수의 연결을 가질 수 있지만 더 가깝고 더 많은 연결다른 은하계에 있지만 덜 가깝습니다.

예측 및 추정. 방정식 y = b1x + b0이 호출됩니다. 일반 방정식똑바로. 점 쌍(x, y)이 있음을 나타냅니다.

쌀. 5.5. 행렬 분할로 얻은 상관 플레이아데스

x의 모든 값에 대해 x에 어떤 숫자 b1을 곱하여 이 곱에 두 번째 숫자 b0을 더하여 x의 값과 쌍을 이루는 값을 찾을 수 있는 방식으로 연결된 직선 위에 놓여 있습니다.

회귀 계수를 사용하면 인과 요인이 한 단위 변경될 때 조사 요인의 변화 정도를 결정할 수 있습니다. 절대값은 변수 요인 간의 관계를 절대값으로 특성화합니다. 회귀 계수는 다음 공식으로 계산됩니다.

실험 계획 및 분석. 실험 설계 및 분석은 변수 간의 인과 관계를 찾고 테스트하기 위해 개발된 통계 방법의 세 번째 주요 분기입니다.

다인자 종속성을 연구하기 위해 최근 몇 년 동안 실험의 수학적 계획 방법이 점점 더 많이 사용되었습니다.

모든 요인에 의한 동시 변동 가능성은 다음을 허용합니다.

b) 실험 오차를 최소로 줄인다.

c) 수신된 데이터의 처리를 단순화합니다.

d) 결과의 명확성과 비교 용이성을 제공합니다.

각 요소는 일부 해당 수량을 얻을 수 있습니다. 다른 의미, 수준이라고 하고 -1, 0 및 1을 나타냅니다. 고정된 요인 수준 집합은 가능한 실험 중 하나의 조건을 결정합니다.

가능한 모든 조합의 총계는 다음 공식으로 계산됩니다.

완전 요인 실험은 요인 수준의 가능한 모든 조합이 구현되는 실험입니다. 완전 요인 실험은 직교성을 가질 수 있습니다. 직교 계획을 사용하면 실험의 요인이 상관 관계가 없으며 결과적으로 계산되는 회귀 계수가 서로 독립적으로 결정됩니다.

실험의 수학적 계획 방법의 중요한 이점은 많은 연구 분야에서 다양성과 적합성입니다.

컬러 TV 컨트롤러의 정신적 스트레스 수준 형성에 대한 특정 요인의 영향을 비교하는 예를 고려해 보겠습니다.

실험은 직교 계획 2 3을 기반으로 합니다(세 요소는 두 수준에서 변경됨).

실험은 3회 반복으로 완전한 파트 2+3으로 수행되었습니다.

직교 계획은 회귀 방정식의 구성을 기반으로 합니다. 세 가지 요인에 대해 다음과 같이 보입니다.

이 예의 결과 처리에는 다음이 포함됩니다.

a) 계산을 위한 직교 계획 2 +3 테이블의 구성;

b) 회귀 계수의 계산;

c) 중요성 확인

d) 수신된 데이터의 해석.

언급된 방정식의 회귀 계수에 대해 반복 횟수 K가 3인 계수의 유의성을 평가할 수 있도록 N = 2 3 = 8 옵션을 넣어야 했습니다.

컴파일된 실험 계획 매트릭스는 다음과 같습니다.

- 이것은 부량비모수적 방법에 사용되는 현상 간의 관계에 대한 통계적 연구.

표시기는 순위 간의 관찰된 차이 제곱합의 합이 연결이 없는 경우와 어떻게 다른지 보여줍니다.

서비스 할당. 이 온라인 계산기를 사용하여 다음을 수행할 수 있습니다.

  • Spearman의 순위 상관 계수 계산;
  • 계수에 대한 신뢰 구간 계산 및 그 중요성 평가;

Spearman의 순위 상관 계수의사 소통의 친밀도 평가 지표를 나타냅니다. 순위 상관 계수 및 기타 상관 계수의 관계의 견고성의 질적 특성은 Chaddock 척도를 사용하여 평가할 수 있습니다.

계수 계산다음 단계로 구성됩니다.

Spearman의 순위 상관 계수의 속성

적용분야. 순위 상관 계수두 세트 간의 통신 품질을 평가하는 데 사용됩니다. 또한 이분산성에 대한 데이터를 분석할 때 통계적 유의성을 사용합니다.

예시. 관측된 변수 X 및 Y의 데이터 샘플에서:

  1. 순위표를 만드십시오.
  2. Spearman의 순위 상관 계수를 찾고 수준 2a에서 유의성을 테스트합니다.
  3. 중독의 본질을 평가하다
해결책. 특성 Y 와 요인 X 에 순위를 지정합니다.
엑스와이랭크 X, dx순위 Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

순위 매트릭스.
랭크 X, dx순위 Y, d y(dx - dy) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

체크섬 계산을 기반으로 한 행렬 컴파일의 정확성 확인:

행렬의 열에 대한 합은 서로 동일하고 체크섬은 행렬이 올바르게 구성되었음을 의미합니다.
공식을 사용하여 Spearman의 순위 상관 계수를 계산합니다.


특성 Y와 요인 X 사이의 관계는 강력하고 직접적입니다.
Spearman의 순위 상관 계수의 의의
유의 수준 α에서 귀무 가설을 테스트하기 위해 일반 Spearman 순위 상관 계수가 경쟁 가설 H i 에서 0과 같습니다. p ≠ 0인 경우 임계점을 계산해야 합니다.

여기서 n은 샘플 크기입니다. ρ는 Spearman의 표본 순위 상관 계수입니다. t(α, k)는 양측 임계 영역의 임계점으로, 유의 수준 α와 자유도 k = n-2.
만약 |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp - 귀무 가설이 기각됩니다. 질적 특성 사이에는 상당한 순위 상관 관계가 있습니다.
스튜던트 테이블에 따르면 t(α/2, k) = (0.1/2;12) = 1.782

T kp 이후< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Spearman의 순위 상관 방법을 사용하면 두 기능 또는 기능의 두 프로필(계층 구조) 간의 상관 관계의 견고성(강도)과 방향을 결정할 수 있습니다.

순위 상관 관계를 계산하려면 두 가지 계열의 값이 필요합니다.

순위를 매길 수 있는 것. 이러한 값 범위는 다음과 같습니다.

1) 동일한 피험자 그룹에서 측정된 2개의 징후;

2) 동일한 특성 세트에 대해 두 주제에서 식별된 특성의 두 개별 계층;

3) 기능의 두 그룹 계층,

4) 기능의 개별 및 그룹 계층.

첫째, 지표는 각 기능에 대해 별도로 순위가 매겨집니다.

일반적으로 기능의 값이 낮을수록 순위가 낮아집니다.

첫 번째 경우(두 가지 기능)는 순위가 매겨집니다. 개별 가치다른 주제에 의해 얻은 첫 번째 특징에 대해, 그리고 두 번째 특징에 대한 개별 값.

두 속성이 양의 관계에 있으면 그 중 하나의 순위가 낮은 주제는 다른 속성의 순위가 낮고 순위가 높은 주제는

특성 중 하나는 다른 특성에서도 높은 순위를 갖습니다. rs를 계산하려면 두 가지 근거에서 주어진 주제가 얻은 순위 간의 차이(d)를 결정해야 합니다. 그런 다음 이러한 지표 d는 특정 방식으로 변환되고 1에서 뺍니다.

랭크의 차이가 작을수록 rs가 클수록 +1에 가까워집니다.

상관 관계가 없으면 모든 순위가 혼합되고 상관 관계가 없습니다.

일치하지 않습니다. 공식은 이 경우 rs가 0에 가깝도록 설계되었습니다.

음의 상관관계의 경우 한 속성에 대한 주제의 낮은 순위

다른 속성의 높은 순위에 해당하며 그 반대의 경우도 마찬가지입니다. 두 변수에 대한 피험자의 순위 차이가 클수록 rs는 -1에 가깝습니다.

두 번째 경우(2개의 개별 프로필), 개별

특정 (둘 모두에 대해 동일) 기능 세트에 따라 2 명의 주제 각각이 얻은 값. 첫 번째 순위는 가장 낮은 값을 가진 특성을 받습니다. 두 번째 순위는 더 높은 값을 갖는 기능입니다. 분명히 모든 기능은 동일한 단위로 측정되어야 합니다. 그렇지 않으면 순위를 매길 수 없습니다. 예를 들어, Cattell Personality Questionnaire (16PF)에 따라 지표의 순위를 매기는 것은 불가능합니다. 지표가 "원시" 점수로 표현되면 0에서 13까지, 0에서 13까지 다양한 요인에 대한 값의 범위가 다르기 때문에

20 및 0에서 26까지. 우리는 모든 값을 단일 척도로 가져올 때까지 심각도 측면에서 어떤 요인이 1 위를 차지할 것인지 말할 수 없습니다 (대부분의 경우 이것은 벽 척도입니다).

두 주제의 개별 계층이 양의 관계에 있으면 그 중 하나에 대한 순위가 낮은 기능이 다른 주제에 대해 낮은 순위를 가지며 그 반대의 경우도 마찬가지입니다. 예를 들어, 한 주제에 대해 요인 E(우성)가 가장 낮은 순위를 갖고 있으면 다른 주제에 대해 낮은 순위를 가져야 합니다. 한 주제에 요인 C가 있다면

(정서적 안정)이 가장 높은 순위를 차지하면 다른 과목도

이 요소는 높은 순위 등을 갖습니다.

세 번째 경우(두 그룹 프로필)에서 두 그룹의 피험자 그룹에서 얻은 평균 그룹 값은 두 그룹에 대해 동일한 특정 기능 집합에 따라 순위가 매겨집니다. 다음에서 추론의 방향은 앞의 두 경우와 동일합니다.

4차(개인 및 그룹 프로필)의 경우, 원칙적으로 이 개인을 제외하여 얻은 동일한 특성 집합에 따라 주제의 개별 값과 평균 그룹 값이 별도로 순위가 매겨집니다. 주제 - 그는 비교할 평균 그룹 프로필에 참여하지 않습니다. 순위 상관 관계를 통해 개인 및 그룹 프로필의 일관성을 확인할 수 있습니다.

네 가지 경우 모두에서 얻은 상관 계수의 중요성은 순위 값 N의 수에 의해 결정됩니다. 첫 번째 경우이 숫자는 샘플 크기 n과 일치합니다. 두 번째 경우에 관측치의 수는 계층을 구성하는 피처의 수입니다. 세 번째와 네 번째 경우에 N은 비교된 기능의 수이며 그룹의 대상 수가 아닙니다. 자세한 설명은 예제에 나와 있습니다. rs의 절대값이 임계값에 도달하거나 초과하면 상관관계가 유의합니다.

가설.

두 가지 가능한 가설이 있습니다. 첫 번째는 경우 1을 나타내고 두 번째는 다른 세 가지 경우를 나타냅니다.

가설의 첫 번째 버전

H0: 변수 A와 B 사이의 상관관계는 0과 다르지 않습니다.

H1: 변수 A와 B 사이의 상관 관계는 0과 크게 다릅니다.

가설의 두 번째 버전

H0: 계층 A와 B 간의 상관 관계는 0과 다르지 않습니다.

H1: 계층 A와 B 간의 상관 관계는 0과 크게 다릅니다.

순위 상관 계수의 한계

1. 각 변수에 대해 최소 5개의 관찰을 제출해야 합니다. 샘플의 상한은 사용 가능한 임계값 표에 의해 결정됩니다.

2. Spearman의 순위 상관 계수 rs at 많은 수로비교된 변수 중 하나 또는 둘 모두에 대한 동일한 순위는 거친 값을 제공합니다. 이상적으로는 두 개의 상관 계열이 일치하지 않는 값의 두 시퀀스여야 합니다. 이 조건이 충족되지 않으면 동일한 순위에 대한 조정이 필요합니다.

Spearman의 순위 상관 계수는 다음 공식으로 계산됩니다.

두 비교 순위 시리즈에 동일한 순위의 그룹이 있는 경우 순위 상관 계수를 계산하기 전에 동일한 순위 Ta 및 Tv를 수정해야 합니다.

Ta \u003d Σ (a3-a) / 12,

TV \u003d Σ (v3-c) / 12,

여기서 는 순위 시리즈 A에서 동일한 순위의 각 그룹의 볼륨이고, c는 각 그룹의 볼륨입니다.

순위 시리즈 B에서 동일한 순위의 그룹.

rs의 경험적 값을 계산하려면 다음 공식을 사용하십시오.

Spearman의 순위 상관 계수 rs의 계산

1. 어떤 2개의 특성 또는 2개의 특성 계층이 참여할 것인지 결정합니다.

변수 A와 B로 비교.

2. 순위 규칙에 따라 순위 1을 가장 작은 값에 할당하여 변수 A의 값을 순위 지정합니다(A.2.3 참조). 표의 첫 번째 열에 제목 또는 기호의 번호 순서대로 순위를 입력합니다.

3. 동일한 규칙에 따라 변수 B의 값을 주문하십시오. 표의 두 번째 열에 제목 또는 기호의 번호 순서대로 순위를 입력합니다.

5. 각 차이를 제곱합니다. d2. 표의 네 번째 열에 이러한 값을 입력합니다.

Ta \u003d Σ (a3-a) / 12,

TV \u003d Σ (v3-c) / 12,

여기서 a는 순위 행 A에서 동일한 순위의 각 그룹의 볼륨입니다. c - 각 그룹의 볼륨

순위 시리즈 B와 같은 순위.

a) 동일한 순위가 없는 경우

rs  1 − 6 ⋅

b) 같은 계급이 있을 때

Σd 2  T  T

r  1 − 6 ⋅ a in,

여기서 Σd2는 순위 간의 차이 제곱의 합입니다. Ta와 TV는 같은 것에 대한 수정입니다.

N은 순위에 참여한 주제 또는 기능의 수입니다.

9. 주어진 N에 대한 rs의 임계값을 표(부록 4.3 참조)에서 결정합니다. rs가 임계값보다 크거나 같으면 상관 관계는 0과 크게 다릅니다.

실시예 4.1 실험군의 안구운동반응에 대한 음주반응의 의존도를 측정할 때 음주 전과 음주 후에 자료를 얻었다. 피험자의 반응은 만취 상태에 따라 달라지나요?

실험 결과:

이전: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. 이후: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. 가설을 세웁시다.

H0: 음주 전과 음주 후 반응의 의존도 사이의 상관관계는 0과 다르지 않습니다.

H1: 음주 전과 음주 후 반응의 의존도 사이의 상관관계는 0과 유의하게 다르다.

표 4.1. 실험 전후의 안구운동 반응의 매개변수를 비교할 때 Spearman 순위 상관 계수 rs에 대한 d2 계산(N=17)

가치

가치

중복 순위가 있으므로 이 경우 동일한 순위에 대해 조정된 공식을 적용합니다.

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Tb =((23-2)+(23-2)+(33-3))/12=3

Spearman 계수의 경험적 값을 찾으십시오.

rs = 1-6*((767.75+6+3)/(17*(172-1)))=0.05

표 (부록 4.3)에 따르면 상관 계수의 임계 값을 찾습니다.

0.48 (p ≤ 0.05)

0.62 (p ≤ 0.01)

우리는 얻는다

rs=0.05∠rcr(0.05)=0.48

결론: H1 가설은 기각되고 H0는 채택됩니다. 저것들. 정도의 상관관계

알코올 소비 전과 후 반응의 의존성은 0과 다르지 않습니다.

피어슨 상관 계수

계수 아르 자형- Pearson은 동일한 표본에서 측정된 두 측정변수의 관계를 연구하는 데 사용됩니다. 그것을 사용하는 것이 적절한 상황이 많이 있습니다. 지능이 학부 성과에 영향을 줍니까? 직원의 급여가 동료에 대한 호의와 관련이 있습니까? 복잡한 산수 문제를 푸는 데 학생의 기분이 영향을 줍니까? 이러한 질문에 답하기 위해 연구자는 표본의 각 구성원에 대해 두 가지 관심 지표를 측정해야 합니다.

상관 계수의 값은 기능이 표시되는 단위의 영향을 받지 않습니다. 따라서 피쳐의 선형 변환(상수 곱하기, 상수 추가)은 상관 계수 값을 변경하지 않습니다. 예외는 부호 중 하나에 음수 상수를 곱하는 것입니다. 상관 계수는 부호를 반대로 변경합니다.

Spearman 및 Pearson 상관 관계의 적용.

Pearson 상관 관계는 두 변수 간의 선형 관계를 측정한 것입니다. 두 변수의 변동성이 얼마나 비례하는지 결정할 수 있습니다. 변수가 서로 비례하면 두 변수 간의 관계를 양(정비) 또는 음(역비) 기울기를 가진 직선으로 그래픽으로 나타낼 수 있습니다.

실제로 두 변수 사이의 관계는 확률적이며 그래픽으로 보면 타원체 산포 구름처럼 보입니다. 그러나 이 타원체는 직선 또는 회귀선으로 표시(근사)할 수 있습니다. 회귀선은 방법에 의해 구성된 직선입니다. 최소제곱: 산점도의 각 점에서 직선까지의 거리 제곱(Y축을 따라 계산)의 합이 최소입니다.

예측의 정확성을 평가하는 데 특히 중요한 것은 종속 변수 추정치의 분산입니다. 본질적으로 종속 변수 Y의 추정치 분산은 독립 변수 X의 영향으로 인한 전체 분산의 일부입니다. 즉, 종속 변수 추정치의 분산 대 실제 분산의 비율 상관 계수의 제곱과 같습니다.

종속변수와 독립변수의 상관계수의 제곱은 독립변수의 영향으로 인한 종속변수의 분산 비율을 나타내며, 이를 결정계수라고 한다. 따라서 결정 계수는 한 변수의 변동성이 다른 변수의 영향으로 인해 발생하는(결정되는) 정도를 보여줍니다.

결정 계수는 상관 계수보다 중요한 이점이 있습니다. 상관 관계는 두 변수 간의 관계에 대한 선형 함수가 아닙니다. 따라서 여러 샘플에 대한 상관 계수의 산술 평균은 이러한 샘플의 모든 대상에 대해 즉시 계산된 상관과 일치하지 않습니다(즉, 상관 계수가 가산되지 않음). 반대로 결정 계수는 관계를 선형으로 반영하므로 가산적입니다. 여러 샘플에 대해 평균을 낼 수 있습니다.

추가 정보관계의 강도에 대해 상관 계수의 제곱 값을 제공합니다. 결정 계수: 이것은 다른 변수의 영향으로 설명할 수 있는 한 변수의 분산 부분입니다. 상관 계수와 달리 결정 계수는 연결 강도가 증가함에 따라 선형적으로 증가합니다.

Spearman의 상관 계수 및 τ - 켄달 (순위 상관 관계 )

관계가 연구되는 두 변수가 모두 순서 척도로 표시되거나 그 중 하나가 순서 척도이고 다른 하나가 미터 척도인 경우 순위 상관 계수가 적용됩니다. Spearman 또는 τ - 켄델. 두 계수 모두 적용을 위해 두 변수의 사전 순위가 필요합니다.

Spearman의 순위 상관 계수는 현상 간의 관계를 통계적으로 연구하는 데 사용되는 비모수적 방법입니다. 이 경우 둘 사이의 실제 병렬도는 정량적 시리즈연구 된 징후의 및 확립 된 연결의 견고성에 대한 평가는 정량적으로 표현 된 계수를 사용하여 제공됩니다.

그룹의 구성원이 x 변수에 의해 먼저 순위가 매겨진 다음 y 변수에 의해 순위가 매겨진 경우 x 및 y 변수 간의 상관 관계는 두 순위 계열에 대한 Pearson 계수를 간단히 계산하여 얻을 수 있습니다. 두 변수에 대한 순위에 링크가 없는 경우(즉, 반복되는 순위가 없는 경우) Pearson에 대한 공식은 계산적으로 상당히 단순화되고 Spearman으로 알려진 공식으로 변환될 수 있습니다.

Spearman 순위 상관 계수의 검정력은 모수 상관 계수의 검정력보다 다소 열등합니다.

적은 수의 관측치가 있는 경우 순위 상관 계수를 사용하는 것이 좋습니다. 이 방법은 정량화된 데이터뿐만 아니라 기록된 값이 다양한 강도의 기술적인 특징에 의해 결정되는 경우에도 사용할 수 있습니다.

비교 변수 중 하나 또는 둘 모두에 대해 동일한 순위가 많은 Spearman의 순위 상관 계수는 거친 값을 제공합니다. 이상적으로는 두 개의 상관 계열이 일치하지 않는 값의 두 시퀀스여야 합니다.

순위에 대한 Spearman 상관 관계의 대안은 상관 관계 τ입니다. - 켄달. M. Kendall이 제안한 상관관계는 연결의 방향이 대상을 쌍으로 비교하여 판단할 수 있다는 아이디어를 기반으로 합니다. 일치하지 않는 경우 긍정적인 관계를 나타냅니다. 부정적인 관계에 대한 것입니다.

상관 계수는 수치 척도(미터법 또는 순위)로 측정된 두 속성 간의 관계의 강도와 방향을 수치적으로 결정하도록 특별히 설계되었습니다. 이미 언급했듯이 상관 값 +1(엄격한 직접 또는 직접 비례 관계) 및 -1(엄격한 반비례 또는 반비례 관계)은 관계의 최대 강도에 해당하며 0과 같은 상관은 관계. 연결 강도에 대한 추가 정보는 결정 계수 값으로 제공됩니다. 이는 다른 변수의 영향으로 설명할 수 있는 한 변수의 분산 부분입니다.

9. 데이터 비교를 위한 매개변수 방법

변수가 메트릭 척도로 측정된 경우 매개변수 비교 방법이 적용됩니다.

분산 비교 2- Fisher의 검정에 의한 x 표본 .


이 방법을 사용하면 비교 표본을 추출한 두 일반 모집단의 분산이 서로 다르다는 가설을 테스트할 수 있습니다. 방법의 한계 - 두 샘플의 특징 분포는 정상과 다르지 않아야 합니다.

분산 비교의 대안은 정규 분포를 테스트할 필요가 없는 Lieven 테스트입니다. 이 방법은 크기가 다른 독립 표본에 대한 스튜던트 t-검정으로 평균 차이의 신뢰도를 확인하기 전에 분산의 동일성(균질성) 가정을 테스트하는 데 사용할 수 있습니다.