순위 상관 계수.  Spearman 상관 분석

순위 상관 계수. Spearman 상관 분석

실제로 두 특성 사이의 연관성을 확인하기 위해 계수가 자주 사용됩니다. 순위 상관스피어맨(R). 각 특성의 값은 증가 정도(1에서 n까지)에 따라 순위가 매겨진 다음 하나의 관찰에 해당하는 순위 간의 차이(d)가 결정됩니다.

예 1. 볼륨 간의 관계 산업용 제품 2003년 러시아연방 연방지구 중 10개 지역의 고정자본에 대한 투자는 다음과 같은 데이터로 특징지어집니다.
계산하다 순위 계수스피어먼 상관관계그리고 켄달. α=0.05에서 유의성을 확인합니다. 고려 중인 러시아 연방 지역의 산업 생산량과 고정 자본 투자 간의 관계에 대한 결론을 공식화합니다.

특징 Y와 요인 X에 순위를 할당해 보겠습니다. 제곱 d 2의 차이의 합을 구해 봅시다.
계산기를 사용하여 Spearman 순위 상관 계수를 계산합니다.

엑스 와이 랭크 X, d x 순위 Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

특성 Y와 요인 X 사이의 연결은 강력하고 직접적입니다.

Spearman의 순위 상관 계수 추정



Student 테이블을 사용하여 Ttable을 찾습니다.
T 테이블 = (18;0.05) = 1.734
Tob > Ttabl이므로 순위 상관 계수가 0이라는 가설을 기각합니다. 즉, Spearman의 순위 상관계수는 통계적으로 유의미합니다.

순위 상관 계수에 대한 구간 추정(신뢰 구간)
신뢰 구간 Spearman의 순위 상관 계수: p(0.5431;0.9095).

예 2. 초기 데이터.

5 4
3 4
1 3
3 1
6 6
2 2
행렬에는 첫 번째 행의 관련 순위(동일한 순위 번호)가 포함되어 있으므로 이를 재정렬하겠습니다. 순위의 재편성은 순위의 중요도를 변경하지 않고 진행되는데, 즉 순위 번호 간에는 해당 관계(이상, 이하, 같음)가 유지되어야 한다. 또한 순위를 1보다 크고 매개변수 수와 동일한 값으로 설정하는 것은 권장되지 않습니다. 이 경우 n = 6). 순위 재구성은 표에서 수행됩니다.
새로운 순위
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
행렬에는 두 번째 행의 순위가 연관되어 있으므로 이를 다시 포맷하겠습니다. 순위 재구성은 표에서 수행됩니다.
정렬된 행의 좌석 번호전문가 평가에 따른 요소 배열새로운 순위
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
순위 행렬.
랭크 X, d x순위 Y, d y(d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
특성 x와 y의 값 중에는 동일한 특성이 여러 개 있으므로, 즉 연관된 순위가 형성되면 이 경우 Spearman 계수는 다음과 같이 계산됩니다.

어디


j - 특성 x에 따른 연결 수;
j는 동일한 순위의 수입니다. j번째 인대 x로;
k - 특성 y에 대한 순서대로의 연결 수;
k에서 - y의 k번째 연결에서 동일한 순위의 수입니다.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

특성 Y와 요인 X 사이의 관계는 중간 정도이고 직접적입니다.

피어슨 상관관계는 두 변수 사이의 선형 관계를 측정한 것입니다. 이를 통해 두 변수의 변동성이 얼마나 비례하는지 확인할 수 있습니다. 변수가 서로 비례하는 경우 변수 간의 관계는 양(정비) 또는 음(역비) 기울기를 갖는 직선으로 그래픽으로 표시될 수 있습니다.

실제로 두 변수 사이의 관계는 확률적이며 그래픽적으로는 타원체 분산 구름처럼 보입니다. 그러나 이 타원체는 직선이나 회귀선으로 표현(근사)될 수 있습니다. 회귀선은 다음 방법을 사용하여 구성된 직선입니다. 최소제곱: 산점도의 각 점에서 직선까지의 거리 제곱의 합(Y축을 따라 계산됨)이 최소값입니다.

예측의 정확성을 평가하는 데 특히 중요한 것은 종속변수 추정치의 분산입니다. 기본적으로 종속변수 Y 추정치의 분산은 전체 분산 중 독립변수 X의 영향으로 인한 부분입니다. 즉, 실제 분산에 대한 종속변수 추정치 분산의 비율은 다음과 같습니다. 상관계수의 제곱과 같습니다.

종속변수와 독립변수 사이의 상관계수의 제곱은 독립변수의 영향으로 인한 종속변수의 변동 비율을 나타내며 결정계수라고 합니다. 따라서 결정 계수는 한 변수의 변동성이 다른 변수의 영향으로 인해 발생(결정)되는 정도를 나타냅니다.

결정계수는 상관계수에 비해 중요한 이점을 가지고 있습니다. 상관관계 __________은(는) 두 변수 사이의 관계에 대한 선형 함수가 아닙니다. 따라서 여러 샘플에 대한 상관 계수의 산술 평균은 이러한 샘플의 모든 대상에 대해 즉시 계산된 상관 관계와 일치하지 않습니다(즉, 상관 계수는 가산되지 않습니다). 반대로 결정 계수는 관계를 선형적으로 반영하므로 가산적입니다. 즉, 여러 샘플에 대해 평균을 낼 수 있습니다.

추가 정보연결의 강도는 상관 계수의 제곱 값으로 표시됩니다. 즉 결정 계수는 다른 변수의 영향으로 설명할 수 있는 한 변수의 분산 부분입니다. 상관계수와 달리 결정계수는 연결 강도가 증가함에 따라 선형적으로 증가합니다.

Spearman 및 τ-Kendall 상관 계수(순위 상관)

관계를 연구하는 두 변수가 모두 순서 척도로 표시되거나 그 중 하나는 순서 척도이고 다른 하나는 척도 척도로 표시되는 경우 순위 상관 계수(Spearman 또는 τ-Kendell)가 사용됩니다. 두 계수 모두 적용을 위해 두 변수의 예비 순위가 필요합니다.

Spearman의 순위 상관 계수는 현상 간의 관계를 통계적으로 연구하는 목적으로 사용되는 비모수적 방법입니다. 이 경우 둘 사이의 실제 병렬성 수준이 결정됩니다. 양적 시리즈연구된 특성에 대한 평가와 확립된 연결의 근접성에 대한 평가는 정량적으로 표현된 계수를 사용하여 제공됩니다.

크기 그룹의 구성원이 먼저 변수 x로 순위가 매겨진 다음 변수 y로 순위가 매겨지면 두 순위 계열에 대한 피어슨 계수를 계산하여 변수 x와 y 간의 상관 관계를 간단히 얻을 수 있습니다. 두 변수 모두에 대해 순위 관계(즉, 반복 순위 없음)가 없는 경우 Pearson 공식은 계산적으로 크게 단순화될 수 있으며 Spearman 공식으로 알려진 것으로 변환될 수 있습니다.

Spearman 순위 상관 계수의 검정력은 모수 상관 계수의 검정력보다 다소 낮습니다.

관측치 수가 적을 때는 순위상관계수를 사용하는 것이 좋습니다. 이 방법은 정량적 데이터뿐만 아니라 기록된 값이 다양한 강도의 설명적 특징에 의해 결정되는 경우에도 사용할 수 있습니다.

Spearman의 순위 상관 계수는 다음과 같습니다. 대량하나 또는 두 비교 변수의 순위가 동일하면 거친 값이 제공됩니다. 이상적으로는 두 상관 계열이 서로 다른 값의 두 시퀀스를 나타내야 합니다.

순위에 대한 Spearman 상관관계의 대안은 τ-Kendall 상관관계입니다. M. Kendall이 제안한 상관관계는 대상을 쌍으로 비교하여 연결 방향을 판단할 수 있다는 생각에 기반을 두고 있습니다. 즉, 대상 쌍의 x 변화가 y 변화 방향과 일치하는 경우 이는 다음을 나타냅니다. 일치하지 않으면 긍정적인 연결 - 부정적인 연결에 관한 것입니다.

순위 상관 계수 할당

Spearman 순위 상관 방법을 사용하면 두 요소 간의 상관 관계의 친밀도(강도)와 방향을 결정할 수 있습니다. 두 개의 표지판또는 두 개의 프로필(계층)표지판.

방법 설명

순위 상관관계를 계산하려면 순위를 매길 수 있는 두 행의 값이 필요합니다. 이러한 일련의 값은 다음과 같습니다.

1) 두 개의 표지판동일한 피험자 그룹에서 측정되었습니다.

2) 두 가지 개별 특성 계층,동일한 특성 세트에 따라 두 피험자에서 식별됩니다(예: R. B. Cattell의 16요소 설문지에 따른 성격 프로필, R. Rokeach의 방법에 따른 가치 계층, 여러 대안 중에서 선택할 때 선호하는 순서 , 등.);

3) 특성의 두 그룹 계층;

4) 개인 및 그룹기능의 계층 구조.

첫째, 지표는 각 특성에 대해 별도로 순위가 매겨집니다. 일반적으로 낮은 속성 값에는 낮은 순위가 할당됩니다.

사례 1(두 개의 기호)을 고려해 보겠습니다.여기에서는 서로 다른 피험자가 얻은 첫 번째 특성에 대한 개별 값의 순위가 매겨지고, 그런 다음 두 번째 특성에 대한 개별 값이 순위가 매겨집니다.

두 특성이 긍정적인 관련이 있는 경우, 그 중 하나의 순위가 낮은 대상은 다른 특성의 순위도 낮고, 특성 중 하나의 순위가 높은 대상은 다른 특성에서도 높은 순위를 갖습니다. 계산하기 아르 자형 에스 두 가지 특성에 대해 주어진 피험자가 얻은 순위 간의 차이(d)를 결정하는 것이 필요합니다. 그런 다음 이러한 지표 d는 특정 방식으로 변환되어 1에서 뺍니다. 순위 간의 차이가 작을수록 r s가 커질수록 +1에 가까워집니다.

상관관계가 없으면 모든 순위가 혼합되어 순위 간에 대응이 없게 됩니다. 이 경우 공식은 다음과 같이 설계되었습니다. 아르 자형 에스, 0에 가깝습니다.

음의 상관관계가 있는 경우 한 속성의 낮은 순위가 다른 속성의 높은 순위에 해당하고 그 반대의 경우도 마찬가지입니다.

두 변수에 대한 피험자의 순위 간의 불일치가 클수록 r s는 -1에 가까워집니다.

사례 2(두 개의 개별 프로필)를 고려해 보겠습니다.여기서 두 피험자 각각이 얻은 개별 값은 특정(두 피험자 모두 동일) 특성 세트에 따라 순위가 매겨집니다. 첫 번째 순위는 가장 낮은 값을 가진 기능에 부여됩니다. 두 번째 순위는 더 높은 값을 갖는 특성입니다. 분명히 모든 특성은 동일한 단위로 측정되어야 하며 그렇지 않으면 순위를 매기는 것이 불가능합니다. 예를 들어, Cattell Personality Inventory(16)에서는 지표 순위를 매기는 것이 불가능합니다. PF), 값의 범위가 0에서 13, 0에서 20, 0에서 26까지 다양한 요소에 따라 다르기 때문에 "원시"포인트로 표현되는 경우 어떤 요소가 첫 번째 위치를 차지할지 말할 수 없습니다. 심각도 조건은 모든 값을 단일 척도로 가져오지 않을 것입니다(대부분 벽 규모입니다).

두 개체의 개별 계층이 긍정적으로 관련되어 있는 경우 그 중 하나의 순위가 낮은 기능은 다른 항목의 순위도 낮고 그 반대의 경우도 마찬가지입니다. 예를 들어, 한 개체의 요인 E(지배력)가 가장 낮은 순위를 가지면 다른 개체의 요인도 낮은 순위를 가져야 하며, 한 개체의 요인 C(정서적 안정성)가 가장 높은 순위를 가지면 다른 개체의 요인은 높은 순위를 가져야 합니다. 이 요소 순위 등

사례 3(두 개의 그룹 프로필)을 고려해 보겠습니다.여기서 두 그룹의 피험자에서 얻은 평균 그룹 값은 두 그룹에 대해 동일한 특정 특성 세트에 따라 순위가 지정됩니다. 다음의 추론 노선은 이전 두 사례와 동일합니다.

사례 4(개인 및 그룹 프로필)를 고려해 보겠습니다.여기서 피험자의 개별 값과 그룹 평균값은 동일한 특성 세트에 따라 별도로 순위가 매겨지며 원칙적으로이 개별 피험자를 제외하여 얻어지며 그룹 평균에 참여하지 않습니다. 그의 개인 프로필과 비교할 프로필입니다. 순위 상관 관계는 개인 및 그룹 프로필이 얼마나 일관성이 있는지 테스트합니다.

네 가지 경우 모두 결과 상관 계수의 유의성은 순위가 매겨진 값의 수에 따라 결정됩니다. N.첫 번째 경우 이 숫자는 샘플 크기 n과 일치하며, 두 번째 경우 관측치 수는 계층 구조를 구성하는 기능의 수입니다. 세 번째와 네 번째 경우에는 N-이는 또한 비교되는 기능의 수이지 그룹 내 피험자의 수가 아닙니다. 자세한 설명은 예제에 나와 있습니다.

rs 의 절대값이 임계값에 도달하거나 초과하면 상관관계가 신뢰할 수 있습니다.

가설

두 가지 가능한 가설이 있습니다. 첫 번째는 사례 1에 적용되고 두 번째는 나머지 세 가지 경우에 적용됩니다.

가설의 첫 번째 버전

H 0: 변수 A와 B 사이의 상관관계가 0과 다르지 않습니다.

H 1: 변수 A와 B 사이의 상관관계가 0과 크게 다릅니다.

가설의 두 번째 버전

H 0: 계층 A와 B 간의 상관 관계는 0과 다르지 않습니다.

H1: 계층 A와 B 사이의 상관 관계는 0과 상당히 다릅니다.

순위 상관 방법의 그래픽 표현

대부분의 경우 상관 관계는 점 구름 형태 또는 두 축, 즉 특징 A의 축과 특징 B의 공간에 점을 배치하는 일반적인 경향을 반영하는 선 형태로 그래픽으로 표시됩니다(그림 6.2 참조). ).

선으로 쌍으로 연결된 두 행의 순위 값 형태로 순위 상관 관계를 묘사해 보겠습니다(그림 6.3). 특성 A와 특성 B의 순위가 일치하면 둘 사이에 수평선이 생기고, 순위가 일치하지 않으면 선이 기울어집니다. 순위 간의 차이가 클수록 선이 더 기울어집니다. 그림의 왼쪽에 있습니다. 그림 6.3은 가능한 가장 높은 양의 상관관계(r =+1.0)를 보여줍니다. 실제로 이는 "사다리"입니다. 중앙에는 상관 관계가 없습니다. 불규칙한 직조가있는 브레이드입니다. 여기에는 모든 순위가 섞여 있습니다. 오른쪽에는 가장 높은 음의 상관관계(rs = -1.0)가 있습니다. 즉, 규칙적으로 선이 얽혀 있는 웹입니다.

쌀. 6.3. 순위 상관 관계의 그래픽 표현:

a) 높은 양의 상관관계;

b) 상관관계 없음;

c) 높은 음의 상관관계

제한순위계수상관관계

1. 각 변수에 대해 최소 5개의 관측치가 제시되어야 합니다. 샘플의 상한은 사용 가능한 임계 값 표 (표 XVI 부록 1)에 의해 결정됩니다. 즉 N40.

2. 하나 또는 두 비교 변수에 대해 다수의 동일한 순위가 있는 Spearman의 순위 상관 계수 rs는 대략적인 값을 제공합니다. 이상적으로는 두 상관 계열이 서로 다른 값의 두 시퀀스를 나타내야 합니다. 이 조건이 충족되지 않으면 동등한 순위에 대한 조정이 필요합니다. 해당 공식은 예제 4에 나와 있습니다.

예시 1 - 상관관계둘 사이표지판

항공 교통 관제사(Oderyshev B.S., Shamova E.P., Sidorenko E.V., Larchenko N.N., 1978)의 활동을 시뮬레이션하는 연구에서 레닌그라드 주립 대학 물리학부 학생들은 작업을 시작하기 전에 훈련을 받았습니다. 모의 실험 장치. 피험자들은 주어진 유형의 항공기에 대한 최적의 활주로 유형을 선택하는 문제를 해결해야 했습니다. D. Wechsler의 방법을 사용하여 측정된 언어적 및 비언어적 지능 지표와 관련된 교육 세션에서 피험자가 범하는 오류 수가 있습니까?

표 6.1

훈련 세션의 오류 수에 대한 지표와 물리학 학생(N=10)의 언어 및 비언어적 지능 수준에 대한 지표

주제

실수 횟수

언어 지능 지수

비언어적 지능 지수

먼저, 오류 횟수 지표와 언어 지능이 관련되어 있는지에 대한 질문에 답해 보겠습니다.

가설을 세우자.

H 0: 훈련 세션의 오류 수와 언어 지능 수준 간의 상관 관계는 0과 다르지 않습니다.

H 1 : 훈련 세션의 오류 수와 언어 지능 수준 간의 상관 관계는 통계적으로 0과 크게 다릅니다.

다음으로, 더 작은 값에 더 낮은 순위를 할당하여 두 지표의 순위를 매긴 다음, 두 변수(속성)에 대해 각 피험자가 받은 순위 간의 차이를 계산하고 이러한 차이를 제곱해야 합니다. 표에서 필요한 모든 계산을 해보자.

표에서. 6.2 왼쪽의 첫 번째 열에는 오류 수에 대한 값이 표시됩니다. 다음 열에는 순위가 표시됩니다. 왼쪽에서 세 번째 열은 언어 지능 점수를 보여줍니다. 다음 열에는 순위가 표시됩니다. 왼쪽에서 다섯 번째는 차이점을 나타냅니다. 변수 A(오류 수)와 변수 B(언어 지능)의 순위 사이입니다. 마지막 열은 차이의 제곱을 나타냅니다. 2 .

표 6.2

계산 2 물리학과 학생(N=10)의 오류 수와 언어 지능 지표를 비교할 때 Spearman의 순위 상관 계수 r s 에 대해

주제

변수 A

실수의 수

변수 B

언어지능.

(랭크 A -

제이 2

개인

가치

개인

가치

Spearman의 순위 상관 계수는 다음 공식을 사용하여 계산됩니다.

어디 - 각 과목에 대한 두 변수의 순위 차이;

N-순위가 매겨진 값의 수, c. 이 경우에는 과목 수입니다.

rs의 경험적 값을 계산해 보겠습니다.

얻은 r s의 경험적 값은 0에 가깝습니다. 그럼에도 불구하고 우리는 표에 따라 N = 10에서 r s의 임계 값을 결정합니다. XVI 부록 1:

답변: H 0이 허용됩니다. 훈련 세션의 오류 수와 언어 지능 수준 간의 상관 관계는 0과 다르지 않습니다.

이제 오류 수 지표와 비언어적 지능이 관련되어 있는지에 대한 질문에 답해 보겠습니다.

가설을 세우자.

H 0: 훈련 세션의 오류 수와 비언어적 지능 수준 간의 상관 관계는 0과 다르지 않습니다.

H 1: 훈련 세션의 오류 수와 비언어적 지능 수준 간의 상관 관계는 통계적으로 0과 크게 다릅니다.

순위 및 순위 비교 결과는 표에 나와 있습니다. 6.3.

표 6.3

계산 2 물리학과 학생(N=10)의 오류 수와 비언어적 지능 지표를 비교할 때 Spearman의 순위 상관 계수 r s 에 대해

주제

변수 A

실수의 수

변수 E

비언어적 지능

(랭크 A -

2

개인

개인

가치

가치

r s의 중요성을 결정하려면 그것이 양수인지 음수인지는 중요하지 않으며 단지 절대값만 중요하다는 것을 기억합니다. 이 경우:

응 답이야

답변: H 0이 허용됩니다. 훈련 세션의 오류 수와 비언어적 지능 수준 간의 상관 관계는 무작위이며, rs는 0과 다르지 않습니다.

그러나 우리는 특정 추세에 주목할 수 있습니다. 부정적인이 두 변수 사이의 관계. 표본 크기를 늘리면 통계적으로 유의미한 수준으로 이를 확인할 수 있을 것입니다.

예시 2 - 개별 프로필 간의 상관관계

가치 방향 전환 문제에 관한 연구에서 부모와 성인 자녀 사이에서 M. Rokeach의 방법에 따라 최종 가치의 계층이 확인되었습니다 (Sidorenko E.V., 1996). 모녀 쌍(어머니 - 66세, 딸 - 42세)을 검사하는 동안 얻은 최종 값의 순위가 표에 나와 있습니다. 6.4. 이러한 가치 계층이 서로 어떻게 연관되어 있는지 확인해 보겠습니다.

표 6.4

어머니와 딸의 개별 계층에서 M. Rokeach의 목록에 따른 최종 가치 순위

터미널 값

가치 순위

가치 순위

2

어머니의 계층

딸의 계층

1 활동적인 활동적인 생활

2 생활의 지혜

3 건강

4 흥미로운 작품

5 자연과 예술의 아름다움

7 경제적으로 안정된 삶

8 선하고 충성스러운 친구를 갖는 것

9 대중의 인정

10 인지

11 생산적인 삶

12 개발

13 엔터테인먼트

14 자유

15 행복한 가정생활

16 타인의 행복

17 창의성

18 자신감

가설을 세우자.

H 0: 어머니와 딸 최종 가치 계층 간의 상관 관계는 0과 다르지 않습니다.

H 1: 어머니와 딸 최종 가치 계층 간의 상관 관계는 통계적으로 0과 크게 다릅니다.

값의 순위는 연구 절차 자체에서 가정되므로 두 계층의 18개 값 순위 간의 차이만 계산할 수 있습니다. 표의 3번째와 4번째 열에 있습니다. 6.4는 차이점을 제시합니다. 그리고 이 차이의 제곱은 2 .

다음 공식을 사용하여 rs의 경험적 값을 결정합니다.

어디 - 각 변수에 대한 순위 간의 차이(이 경우에는 각 최종 값에 대한)

N- 계층 구조를 형성하는 변수의 수(이 경우 값의 수)입니다.

이 예의 경우:

표에 따르면. XVI 부록 1은 중요한 값을 결정합니다.

답변: H 0은 거부됩니다. H 1이 허용됩니다. 엄마와 딸의 최종 가치 계층 간의 상관 관계는 통계적으로 유의미합니다(p<0,01) и является положительной.

표에 따르면. 6.4 우리는 "행복한 가정 생활", "대중의 인정", "건강"이라는 가치에서 주요 차이점이 발생하고 다른 가치의 순위는 매우 유사하다는 것을 알 수 있습니다.

예시 3 - 두 그룹 계층 간의 상관관계

Joseph Wolpe는 그의 아들과 공동으로 쓴 책(Wolpe J., Wolpe D., 1981)에서 현대인에게 나타나는 가장 흔한 "쓸모없는" 두려움의 순서화된 목록을 제공합니다. 의미를 알리고 완전한 삶과 행동을 방해할 뿐입니다. M.E.가 실시한 국내 연구에서. Rakhova(1994) 32명의 피험자는 Wolpe의 목록에 있는 이러한 유형의 두려움이 자신에게 얼마나 관련성이 있는지 10점 척도로 평가해야 했습니다 3 . 조사 대상 표본은 상트페테르부르크 수문기상학 및 교육학 연구소의 학생들로 구성되었습니다. 남학생 15명, 여학생 17명(17~28세, 평균 연령 23세).

10점 척도로 얻은 데이터는 32명의 피험자를 대상으로 평균을 내고 그 평균값을 순위로 매겼다. 표에서. 표 6.5는 J. Volpe와 M. E. Rakhova가 얻은 순위 지표를 나타냅니다. 20가지 공포 유형의 순위 순서가 일치합니까?

가설을 세우자.

H 0: 미국 표본과 국내 표본의 공포 유형 목록 간의 상관관계는 0과 다르지 않습니다.

H 1: 미국과 국내 표본의 공포 유형 목록 간의 상관관계는 통계적으로 0과 크게 다릅니다.

두 샘플에서 서로 다른 유형의 공포 순위 간의 차이를 계산하고 제곱하는 것과 관련된 모든 계산이 표에 나와 있습니다. 6.5.

표 6.5

계산 미국 및 국내 표본의 공포 유형 순서 목록을 비교할 때 Spearman 순위 상관 계수

두려움의 종류

미국 표본 순위

러시아어 순위

대중 연설에 대한 두려움

비행 공포증

실수하는 것에 대한 두려움

실패에 대한 두려움

비승인에 대한 두려움

거절에 대한 두려움

악한 사람들에 대한 두려움

외로움에 대한 두려움

피에 대한 두려움

열린 상처에 대한 두려움

치과의사에 대한 두려움

주사에 대한 두려움

시험을 보는 것에 대한 두려움

경찰에 대한 두려움 ^민병대)

고소공포증

개에 대한 두려움

거미에 대한 두려움

불구가 된 사람들에 대한 두려움

병원에 대한 두려움

어둠에 대한 두려움

우리는 rs의 경험적 값을 결정합니다.

표에 따르면. XVI 부록 1에서는 N=20에서 gs의 임계 값을 결정합니다.

답변: H 0이 허용됩니다. 미국과 국내 표본의 공포 유형 순서 목록 간의 상관 관계는 통계적 유의 수준에 도달하지 않습니다. 즉, 0과 크게 다르지 않습니다.

예시 4 - 개인 평균 프로필과 그룹 평균 프로필 간의 상관관계

20~78세의 상트페테르부르크 주민 표본(남성 31명, 여성 46명)에게 55세 이상의 인구가 50%를 차지하도록 연령 균형을 맞추면서 다음 질문에 답하도록 요청했습니다. "상트페테르부르크 시의회 의원에게 요구되는 자질은 어느 정도 수준입니까?" (Sidorenko E.V., Dermanova I.B., Anisimova O.M., Vitenberg E.V., Shulga A.P., 1994). 평가는 10점 척도로 이루어졌습니다. 이와 병행하여 상트페테르부르크 시의회 의원 및 의원 후보자(n=14) 표본을 조사했습니다. 정치인과 후보자에 대한 개별 진단은 유권자 표본에게 제시된 것과 동일한 개인 특성 세트를 사용하여 Oxford Express 비디오 진단 시스템을 사용하여 수행되었습니다.

표에서. 6.6은 각 품질에 대해 얻은 평균값을 보여줍니다. V유권자 샘플 ( "참조 시리즈") 및 시의회 의원 중 한 사람의 개별 가치.

K-va 대리인의 개인 프로필이 참조 프로필과 얼마나 상관관계가 있는지 확인해 보겠습니다.

표 6.6

익스프레스 비디오 진단의 18가지 개인 특성에 대한 유권자(n=77) 및 K-va 대리인의 개별 지표에 대한 평균 참조 평가

품질 이름

평균 벤치마크 유권자 점수

K-va 대리인의 개별 지표

1. 문화의 전반적인 수준

2. 학습능력

4. 새로운 것을 창조하는 능력

5.. 자기비판

6. 책임

7. 독립

8. 에너지, 활동

9. 결의

10. 자제력, 자제력

I. 지속성

12. 개인적 성숙

13. 품위

14. 인본주의

15. 사람들과 소통하는 능력

16. 다른 사람의 의견에 대한 관용

17. 행동의 유연성

18. 호감을 주는 능력

표 6.7

계산 2 대리인의 개인 자질에 대한 참조 프로필과 개인 프로필 간의 Spearman 순위 상관 계수

품질 이름

참조 프로필의 품질 순위

2행: 개별 프로필의 품질 순위

2

1 책임

2 품위

3 사람들과의 의사소통 능력

4 자제력, 자제력

5 문화의 일반적인 수준

6 에너지, 활동

8 자기비판

9 독립

10 개인적 성숙

그리고 결단력

12 학습능력

13 휴머니즘

14 다른 사람의 의견에 대한 관용

15 인내

16 행동의 유연성

17 호감을 주는 능력

18 새로운 것을 창조하는 능력

표에서 볼 수 있듯이. 6.6, 유권자의 평가와 개별 대리인 지표는 범위에 따라 다릅니다. 실제로 유권자의 평가는 10점 만점으로, 고속영상진단에 대한 개별 지표는 20점 만점으로 측정됐다. 순위를 사용하면 두 측정 척도를 단일 척도로 변환할 수 있습니다. 여기서 측정 단위는 1순위이고 최대값은 18순위입니다.

우리가 기억하는 것처럼 순위는 값의 각 행에 대해 별도로 수행되어야 합니다. 이 경우 중요도(유권자) 또는 심각도(대리인) 측면에서 특정 품질의 순위를 즉시 확인할 수 있도록 낮은 순위를 높은 값에 할당하는 것이 좋습니다.

순위 결과는 표에 나와 있습니다. 6.7. 품질은 참조 프로필을 반영하는 순서로 나열됩니다.

가설을 세우자.

H 0: K-va 대리인의 개인 프로필과 유권자 평가에 따라 구성된 참조 프로필 간의 상관 관계는 0과 다르지 않습니다.

H 1: K-va 대리인의 개인 프로필과 유권자 평가에 따라 구성된 참조 프로필 간의 상관 관계는 통계적으로 0과 크게 다릅니다. 두 비교 순위 시리즈에는 모두

순위 계수를 계산하기 전의 동일한 순위 그룹

T a 의 동일한 순위에 대해 상관 관계를 수정해야 합니다. :

어디 ㅏ -순위 행 A에서 동일한 순위의 각 그룹의 볼륨,

- 순위 시리즈 B에서 동일한 순위의 각 그룹의 볼륨.

이 경우 A행(참조 프로필)에는 동일한 순위의 그룹이 하나 있습니다. "학습 능력"과 "인본주의" 특성은 동일한 순위 12.5를 갖습니다. 따라서, =2.

T a =(2 3 -2)/12=0.50.

B행(개인 프로필)에는 동일한 순위의 두 그룹이 있고, 1 =2 그리고 2 =2.

T a =[(2 3 -2)+(2 3 -2)]/12=1.00

경험적 값 r s를 계산하기 위해 다음 공식을 사용합니다.

이 경우:

동일한 순위에 대한 수정을 수행하지 않았다면 r s 값은 (0.0002)만 더 높았을 것입니다.

동일한 순위가 많으면 r 5의 변화가 훨씬 더 커질 수 있습니다. 동일한 순위가 존재한다는 것은 정렬된 변수의 분화 정도가 낮다는 것을 의미하며, 따라서 이들 사이의 연결 정도를 평가할 기회가 적다는 것을 의미합니다(Sukhodolsky G.V., 1972, p. 76).

표에 따르면. XVI 부록 1에서는 N = 18에서 r의 임계 값을 결정합니다.

답변:본사가 거부되었습니다. K-va 대리인의 개인 프로필과 유권자의 요구 사항을 충족하는 참조 프로필 간의 상관 관계는 통계적으로 유의미합니다(p<0,05) и является положи­тельной.

테이블에서. 6.7 K-v 대리인은 선거 기준에 규정된 것보다 사람들과의 의사소통 능력 척도에서 더 낮은 순위를 갖고 있으며 결단력 및 지속성 척도에서는 더 높은 순위를 갖고 있음이 분명합니다. 이러한 불일치는 주로 획득된 rs의 약간의 감소를 설명합니다.

r s를 계산하기 위한 일반적인 알고리즘을 공식화해 보겠습니다.

순위를 매기는 값 계열이 두 개 있는 경우 Spearman 순위 상관 관계를 계산하는 것이 합리적입니다.

이러한 계열은 다음과 같이 나타낼 수 있습니다.

  • 연구 중인 동일한 객체 그룹에서 결정된 한 쌍의 특성;
  • 동일한 특성 세트에 따라 2개의 연구 대상에서 결정된 한 쌍의 개별 하위 특성;
  • 한 쌍의 그룹 하위 특성;
  • 특성의 개인 및 그룹 종속.

이 방법에는 각 특성에 대해 개별적으로 지표의 순위를 매기는 작업이 포함됩니다.

가장 작은 값의 순위가 가장 낮습니다.

이 방법은 연구 중인 현상 간의 관계 존재를 확립하기 위해 고안된 비모수적 통계 방법을 의미합니다.

  • 두 계열의 정량적 데이터 간의 실제 병렬 정도를 결정합니다.
  • 식별된 연결의 친밀도를 정량적으로 표현한 평가입니다.

상관관계 분석

2개 이상의 임의의 값(변수) 사이의 관계 존재 및 그 강도를 확인하기 위해 고안된 통계적 방법을 상관 분석이라고 합니다.

상관관계(lat.) - 비율에서 이름을 얻었습니다.

이를 사용할 때 다음과 같은 시나리오가 가능합니다.

  • 상관관계의 존재(양수 또는 음수);
  • 상관관계 없음(0).

변수 사이에 관계가 설정되면 상관 관계에 대해 이야기합니다. 즉, X의 값이 변하면 Y의 값도 그에 비례하는 변화가 필연적으로 관찰된다고 말할 수 있습니다.

다양한 의사소통 척도(계수)가 도구로 사용됩니다.

그들의 선택은 다음의 영향을 받습니다.

  • 난수 측정 방법;
  • 난수 사이의 연결의 성격.

상관 관계의 존재는 그래픽(그래프)과 계수(수치 표시)를 사용하여 표시할 수 있습니다.

상관관계의 특징은 다음과 같습니다.

  • 연결 강도(상관 계수 ±0.7 ~ ±1 – 강함, ±0.3 ~ ±0.699 – 평균, 0 ~ ±0.299 – 약함)
  • 통신 방향(직접 또는 역방향).

상관관계 분석의 목표

상관 분석을 통해 연구 중인 변수 간의 인과 관계를 설정할 수는 없습니다.

이는 다음과 같은 목적으로 수행됩니다.

  • 변수 간의 관계 설정;
  • 다른 변수를 기반으로 변수에 대한 특정 정보를 얻는 단계;
  • 이 의존성의 근접성(연결)을 결정합니다.
  • 설정된 연결의 방향을 결정합니다.

상관 분석 방법


이 분석은 다음을 사용하여 수행할 수 있습니다.

  • 정사각형 또는 Pearson 방법;
  • 순위 방법 또는 Spearman.

Pearson 방법은 변수 사이에 존재하는 힘을 정확하게 결정해야 하는 계산에 적용할 수 있습니다. 이를 통해 연구된 특성은 정량적으로만 표현되어야 합니다.

Spearman 방법이나 순위 상관관계를 적용하려면 특성 표현에 대한 엄격한 요구 사항이 없습니다. 이는 정량적일 수도 있고 속성적일 수도 있습니다. 이 방법 덕분에 연결 강도의 정확한 결정에 대한 정보가 아니라 대략적인 성격의 정보를 얻을 수 있습니다.

변수 행에는 공개 변형이 포함될 수 있습니다. 예를 들어 근무경력을 1년 이하, 5년 이상 등의 값으로 표현하는 경우.

상관 계수

두 변수의 변화 특성을 나타내는 통계량을 상관 계수 또는 쌍 상관 계수라고 합니다. 정량적으로 말하면 -1부터 +1까지입니다.

가장 일반적인 확률은 다음과 같습니다.

  • 피어슨– 간격 척도에 속하는 변수에 적용 가능합니다.
  • 창병– 순서척도변수의 경우.

상관계수 사용의 한계

다음과 같은 경우 상관 계수를 계산할 때 신뢰할 수 없는 데이터를 얻을 수 있습니다.

  • 사용 가능한 변수 값이 충분합니다(관찰 쌍 25-100개).
  • 예를 들어 연구 대상 변수 사이에는 선형 관계가 아닌 2차 관계가 설정됩니다.
  • 각각의 경우 데이터에는 둘 이상의 관측치가 포함됩니다.
  • 변수의 비정상적인 값(이상치)의 존재;
  • 연구 중인 데이터는 명확하게 구별되는 관찰 하위 그룹으로 구성됩니다.
  • 상관 관계가 있다고 해서 어떤 변수가 원인으로 간주될 수 있고 어떤 변수가 결과로 간주될 수 있는지 확인할 수는 없습니다.

상관관계의 유의성 확인

통계량을 평가하기 위해 수량 또는 극단 값이 무작위로 발생할 확률을 나타내는 중요성 또는 신뢰성의 개념이 사용됩니다.

상관관계의 유의성을 결정하는 가장 일반적인 방법은 스튜던트 t 검정입니다.

그 값을 테이블 값과 비교하여 자유도를 2로 취합니다. 계산된 기준 값이 테이블 값보다 큰 경우 이는 상관 계수의 유의성을 나타냅니다.

경제적 계산을 수행할 때 신뢰 수준 0.05(95%) 또는 0.01(99%)이 충분한 것으로 간주됩니다.

스피어맨 계급

Spearman의 순위 상관 계수를 사용하면 현상 간의 관계 존재를 통계적으로 설정할 수 있습니다. 계산에는 각 속성에 대한 일련 번호(순위) 설정이 포함됩니다. 순위는 오름차순 또는 내림차순일 수 있습니다.

순위가 적용되는 기능의 수는 얼마든지 가능합니다. 이는 숫자를 제한하는 다소 노동 집약적 프로세스입니다. 20개의 표지판에 도달하면 어려움이 시작됩니다.

Spearman 계수를 계산하려면 다음 공식을 사용하십시오.

여기서:

n - 순위가 매겨진 기능의 수를 표시합니다.

d는 두 변수의 순위 차이에 지나지 않습니다.

∑(d2)는 순위 차이의 제곱합입니다.

심리학에서의 상관 분석 적용

심리학 연구의 통계적 지원을 통해 심리학 연구를 보다 객관적이고 대표성이 높은 것으로 만들 수 있습니다. 심리 실험을 통해 얻은 데이터를 통계적으로 처리하면 유용한 정보를 최대한 추출하는 데 도움이 됩니다.

결과를 처리하기 위해 가장 널리 사용되는 방법은 상관 분석입니다.

연구 중에 얻은 결과에 대한 상관 분석을 수행하는 것이 적절합니다.

  • 불안 (R. Temml, M. Dorca, V. Amen의 테스트에 따름);
  • 가족 관계(E.G. Eidemiller, V.V. Yustitskis의 "가족 관계 분석"(AFV) 설문지);
  • 내부성-외부성 수준(E.F. Bazhin, E.A. Golynkina 및 A.M. Etkind의 설문지)
  • 교사의 정서적 소진 수준(V.V. Boyko의 설문지)
  • 다학문적 훈련 중 학생들의 언어 지능 요소 간 연결(K.M. Gurevich 및 기타 방법론)
  • 공감 수준(V.V. Boyko의 방법)과 결혼 만족도(V.V. Stolin, T.L. Romanova, G.P. Butenko의 설문지) 사이의 연결
  • 청소년의 사회계측적 지위(Jacob L. Moreno 테스트)와 가족 교육 스타일의 특성(E.G. Eidemiller, V.V. Yustitskis의 설문지) 간의 연관성;
  • 양부모 및 편부모 가정에서 자란 청소년의 삶의 목표 구조(설문지 Edward L. Deci, Richard M. Ryan Ryan).

Spearman 기준을 사용한 상관 분석 수행에 대한 간략한 지침

Spearman의 방법을 이용한 상관분석을 수행합니다. 다음 알고리즘에 따라:

  • 쌍을 이루는 비교 가능한 특성은 2개의 행으로 배열되며, 그 중 하나는 X로 지정되고 다른 하나는 Y로 지정됩니다.
  • X 시리즈의 값은 오름차순 또는 내림차순으로 정렬됩니다.
  • Y 시리즈 값의 배열 순서는 X 시리즈 값과의 대응에 따라 결정됩니다.
  • X 시리즈의 각 값에 대해 순위를 결정합니다. 최소값에서 최대값까지 일련번호를 할당합니다.
  • 계열 Y의 각 값에 대해 순위도 결정합니다(최소값에서 최대값까지).
  • D=X-Y 공식을 사용하여 X와 Y 순위 간의 차이(D)를 계산합니다.
  • 결과 차이 값은 제곱됩니다.
  • 순위 차이의 제곱의 합을 수행합니다.
  • 다음 공식을 사용하여 계산을 수행합니다.

Spearman 상관관계 예

다음 데이터를 사용할 수 있는 경우 업무 경험과 부상률 사이의 상관 관계를 확립하는 것이 필요합니다.

가장 적합한 분석 방법은 순위 방법입니다. 특징 중 하나는 개방형 옵션의 형태로 제시됩니다: 최대 1년의 업무 경험과 7년 이상의 업무 경험.

문제 해결은 작업 테이블로 컴파일되고 수동으로 수행할 수 있는 데이터 순위를 지정하는 것에서 시작됩니다. 볼륨이 크지 않습니다.

업무 경험 부상자 수 일련번호 (순위) 순위 차이 순위 차이의 제곱
d(x-y)
최대 1년 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 이상 6 5 1 +4 16
Σ d2 = 38.5

열에 분수 순위가 나타나는 이유는 동일한 크기의 변형이 나타나면 순위의 산술 평균이 발견되기 때문입니다. 이 예에서 부상 표시기 12는 두 번 발생하고 순위 2와 3에 할당됩니다. 이러한 순위(2+3)/2= 2.5의 산술 평균을 찾아 이 값을 2개의 표시기에 대한 워크시트에 배치합니다.
얻은 값을 작업 공식에 대입하고 간단한 계산을 통해 -0.92와 동일한 Spearman 계수를 얻습니다.

음의 계수 값은 특성 사이에 반비례 관계가 있음을 나타내며 짧은 근무 경험에 많은 부상이 수반된다는 것을 주장할 수 있습니다. 더욱이, 이들 지표들 사이의 연결 강도는 상당히 크다.
계산의 다음 단계는 얻은 계수의 신뢰성을 결정하는 것입니다.
오류와 학생의 시험이 계산됩니다.

아래 계산기는 두 확률변수 사이의 Spearman 순위 상관계수를 계산합니다. 계산기에서 주의가 산만해지지 않도록 이론적인 부분은 전통적으로 계산기 아래에 배치됩니다.

추가하다 수입 수출 모드_편집 삭제

확률변수의 변화

arrow_upwardarrow_downward엑스arrow_upwardarrow_downward와이
페이지 크기: 5 10 20 50 100 쉐브론_왼쪽 chevron_right

확률변수의 변화

데이터 가져오기가져오기 오류

탭, ";" 기호 중 하나를 사용하여 필드를 구분할 수 있습니다. 또는 "," 예: -50.5;-50.5

가져오기 뒤로 취소

Spearman 순위 상관 계수를 계산하는 방법은 실제로 매우 간단하게 설명됩니다. 이는 동일한 Pearson 상관 계수이며, 확률 변수 자체의 측정 결과에 대해서만 계산되지 않고 해당 변수에 대해 계산됩니다. 순위 값.

그건,

남은 것은 순위 값이 무엇인지, 이 모든 것이 필요한 이유를 파악하는 것입니다.

변형 시리즈의 요소가 오름차순 또는 내림차순으로 정렬된 경우 계급요소는 이 정렬된 시리즈의 번호가 됩니다.

예를 들어 변형 계열(17,26,5,14,21)이 있다고 가정해 보겠습니다. 해당 요소를 내림차순(26,21,17,14,5)으로 정렬해 보겠습니다. 26은 1순위, 21은 2순위 등입니다. 순위 값의 변형 계열은 다음과 같습니다(3,1,5,4,2).

즉, 스피어만 계수를 계산할 때 원래의 변이 계열을 순위 값의 변이 계열로 변환한 후 Pearson 공식을 적용합니다.

한 가지 미묘함이 있습니다. 반복되는 값의 순위는 순위의 평균으로 간주됩니다. 즉, 계열 (17, 15, 14, 15)의 경우 순위 값 계열은 (1, 2.5, 4, 2.5)와 같습니다. 15와 동일한 첫 번째 요소는 순위 2를 갖고 두 번째 요소는 랭크 3이 있고 .

반복되는 값이 없는 경우, 즉 순위 계열의 모든 값이 1부터 n까지의 숫자인 경우 Pearson 공식은 다음과 같이 단순화될 수 있습니다.

그런데 이 공식은 Spearman 계수를 계산하는 공식으로 가장 자주 제공됩니다.

가치 자체에서 순위 가치로의 전환의 본질은 무엇입니까?
요점은 순위 값의 상관관계를 연구함으로써 두 변수의 종속성이 단조 함수로 얼마나 잘 설명되는지 확인할 수 있다는 것입니다.

계수의 부호는 변수 간의 관계 방향을 나타냅니다. 부호가 양수이면 X 값이 증가함에 따라 Y 값도 증가하는 경향이 있습니다. 부호가 음수이면 X 값이 증가함에 따라 Y 값이 감소하는 경향이 있으며 계수가 0이면 추세가 없습니다. 계수가 1 또는 -1이면 X와 Y 사이의 관계는 단조 함수 형태를 갖습니다. 즉, X가 증가하면 Y도 증가하고, 그 반대의 경우 X가 증가하면 Y도 감소합니다.

즉, 한 변수의 다른 변수에 대한 선형 의존성을 나타낼 수 있는 Pearson 상관 계수와 달리 Spearman 상관 계수는 직접적인 선형 관계가 감지되지 않는 단조로운 종속성을 나타낼 수 있습니다.

예를 들어 설명하겠습니다. y=10/x 함수를 조사한다고 가정해 보겠습니다.
다음과 같은 X 및 Y 측정값이 있습니다.
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
이러한 데이터의 경우 Pearson 상관 계수는 -0.4686입니다. 즉, 관계가 약하거나 없습니다. 그러나 Spearman 상관 계수는 -1과 동일하며 이는 Y가 X에 대해 엄격한 음의 단조 의존성을 가지고 있음을 연구원에게 암시하는 것 같습니다.