Spearman 상관 계수를 온라인으로 계산하십시오.  순위 상관과 Spearman의 순위 상관 계수

Spearman 상관 계수를 온라인으로 계산하십시오. 순위 상관과 Spearman의 순위 상관 계수

37. Spearman의 순위 상관 계수.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearman의 순위 상관 계수는 다음과 같은 경우에 사용됩니다.
- 변수가 있습니다 순위 척도측정;
- 데이터 분포가 너무 다릅니다. 정상아니면 전혀 알려지지 않았거나;
- 샘플의 부피가 작습니다(N< 30).

해석 순위계수 Spearman 상관관계는 Pearson 계수와 다르지 않지만 그 의미는 다소 다릅니다. 이러한 방법의 차이점을 이해하고 해당 적용 영역을 논리적으로 정당화하기 위해 해당 공식을 비교해 보겠습니다.

피어슨 상관 계수:

Spearman 상관 계수:

보시다시피 공식은 크게 다릅니다. 공식을 비교해 보자

Pearson 상관 공식은 상관 계열의 산술 평균과 표준 편차를 사용하지만 Spearman 공식은 사용하지 않습니다. 따라서 Pearson 공식을 사용하여 적절한 결과를 얻으려면 상관 계열이 정규 분포에 가까워야 합니다(평균과 표준 편차는 다음과 같습니다). 정규분포 모수). 이는 Spearman 공식과 관련이 없습니다.

Pearson 공식의 요소는 각 계열의 표준화입니다. z 스케일.

보시다시피, 변수를 Z 척도로 변환하는 것은 Pearson 상관 계수 공식에 있습니다. 따라서 Pearson 계수의 경우 데이터 규모는 전혀 중요하지 않습니다. 예를 들어 두 변수를 연관시킬 수 있으며 그 중 하나는 최소값을 갖습니다. = 0 및 최대 = 1, 두 번째 분. = 100 및 최대 = 1000. 값의 범위가 아무리 달라도 모두 척도가 동일한 표준 z 값으로 변환됩니다.

이러한 정규화는 Spearman 계수에서는 발생하지 않으므로

SPEARMAN 계수를 사용하기 위한 필수 조건은 두 변수의 범위가 동일하다는 것입니다.

범위가 다른 데이터 계열에 대해 Spearman 계수를 사용하기 전에 다음이 필요합니다. 계급. 동일한 최소값 = 1(최소 순위) 및 값의 수와 동일한 최대값(최대값, 마지막 순위 = N, 즉 표본의 최대 사례 수)을 획득하는 이러한 계열의 값에 대한 순위 지정 결과 .

어떤 경우에 순위를 매기지 않고 할 수 있나요?

데이터가 처음에 생성되는 경우입니다. 순위 척도. 예를 들어 Rokeach의 가치 지향 테스트가 있습니다.

또한 값 옵션 수가 적고 샘플에 고정된 최소값과 최대값이 포함되어 있는 경우도 있습니다. 예를 들어 의미 차이에서는 최소값 = 1, 최대값 = 7입니다.

Spearman의 순위 상관 계수 계산 예

Rokeach의 가치 지향 테스트는 두 개의 샘플 X와 Y에 대해 수행되었습니다. 작업: 이 샘플의 값 계층이 얼마나 가까운지(문자 그대로 얼마나 유사한지) 알아내는 것입니다.

결과 값 r=0.747은 다음과 같이 확인됩니다. 임계값 표. 표에 따르면 N=18인 경우 얻은 값은 p 수준에서 유의미합니다.<=0,005

Spearman 및 Kendal 순위 상관 계수

순서척도에 속하는 변수나 정규분포를 따르지 않는 변수, 구간척도에 속하는 변수에 대해서는 Pearson 계수 대신 Spearman 순위 상관관계를 계산합니다. 이를 위해 개별 변수 값에 순위가 할당되고 이후에 적절한 수식을 사용하여 처리됩니다. 순위 상관관계를 탐지하려면 이변량 상관관계... 대화 상자에서 기본 Pearson 상관관계 확인란을 선택 취소하세요. 대신 Spearman 상관 계산을 활성화하십시오. 이 계산은 다음과 같은 결과를 제공합니다. 순위 상관 계수는 Pearson 계수의 해당 값과 매우 가깝습니다(원래 변수는 정규 분포를 가짐).

titkova-matmetody.pdf p. 45

Spearman의 순위 상관 방법을 사용하면 견고성(강도)과 방향을 결정할 수 있습니다.

사이의 상관관계 두 개의 표지판또는 두 개의 프로필(계층)표지판.

순위 상관관계를 계산하려면 두 행의 값이 필요합니다.

순위를 매길 수 있는 것입니다. 이러한 일련의 값은 다음과 같습니다.

1) 두 개의 표지판동일하게 측정 그룹과목;

2) 두 가지 개별 특성 계층,동일한 항목을 사용하여 두 개체에서 식별됨

기능 세트;

3) 둘 특성의 그룹 계층 구조,

4) 개인 및 그룹기능의 계층 구조.

첫째, 지표는 각 특성에 대해 별도로 순위가 매겨집니다.

일반적으로 낮은 속성 값에는 낮은 순위가 할당됩니다.

첫 번째 경우(두 가지 기능)의 순위가 매겨집니다. 개인의 가치처음에

다른 과목에서 얻은 특성, 그리고 두 번째에 대한 개별 값

징후.

두 특성이 긍정적으로 관련되어 있으면 순위가 낮은 개체

그 중 한 사람은 다른 사람의 순위가 낮을 것이고, 다른 사람의 순위가 높은 피험자는

특성 중 하나는 다른 특성에 대해서도 높은 순위를 갖습니다. RS를 계산하려면

차이점을 결정해야합니다 (디)두 과목 모두에서 주어진 과목에 의해 획득된 순위 사이

표지판. 그런 다음 이러한 지표 d는 특정 방식으로 변환되어 1에서 뺍니다.

순위 간의 차이가 작을수록 rs가 커질수록 +1에 가까워집니다.

상관관계가 없으면 모든 순위가 혼합되어 순위가 나오지 않습니다.

서신이 없습니다. 이 경우 rs가 0에 가까워지도록 공식이 설계되었습니다.

음의 상관관계가 있는 경우한 가지 기준으로 낮은 순위의 과목

다른 기준으로 높은 순위가 일치하며 그 반대도 마찬가지입니다. 불일치가 클수록

두 변수에 대한 피험자 순위 사이에서 rs는 -1에 더 가깝습니다.

두 번째 경우(두 개의 개별 프로필), 개별 항목의 순위가 매겨집니다.

특정에 따라 두 과목 각각이 얻은 값(그들에게도 동일함)

둘 다) 기능 세트. 첫 번째 순위는 가장 낮은 값을 가진 기능에 부여됩니다. 두 번째 순위 –

더 높은 가치를 지닌 기호 등 분명히 모든 특성은 다음과 같이 측정되어야 합니다.

동일한 단위가 아니면 순위 지정이 불가능합니다. 예를 들면 불가능하다

Cattell Personality Inventory(16PF)에서 지표가 다음과 같이 표현된 경우 순위를 매깁니다.

값의 범위는 0에서 13까지, 0에서 13까지 다양한 요소에 따라 다르기 때문에 "원시"포인트입니다.

20 및 0부터 26까지. 어떤 요소가 1위를 차지할지 말할 수 없습니다.

모든 값을 단일 스케일로 가져올 때까지 표현합니다(대부분 벽 스케일입니다).

두 피험자의 개별 계층이 긍정적으로 관련되어 있으면 징후는 다음과 같습니다.

그 중 하나의 순위가 낮으면 다른 하나의 순위도 낮고 그 반대도 마찬가지입니다.

예를 들어, 한 대상의 요인 E(지배력)가 가장 낮은 순위를 갖는 경우

다른 테스트 대상, 한 테스트 대상이 요인 C를 가지고 있으면 낮은 순위를 가져야 합니다.

(정서적 안정)이 가장 높은 순위를 가지며, 다른 과목도 반드시 가져야 합니다.

이 요소는 순위가 높습니다.

세 번째 경우(2개의 그룹 프로필)에는 그룹 평균값을 순위로 매기고,

특정 세트에 따라 두 그룹의 피험자에서 얻었으며 두 그룹 모두 동일합니다.

표지판. 다음의 추론 노선은 이전 두 사례와 동일합니다.

사례 4(개인 및 그룹 프로필)의 경우 별도로 순위가 매겨집니다.

동일한 세트에 대한 주제 및 그룹 평균 값의 개별 값

원칙적으로 이 개별 주제를 제외하여 얻은 표시 - 그는

자신의 개인 프로필과 비교되는 평균 그룹 프로필에 참여하지 않습니다.

프로필. 순위 상관관계를 통해 개인과 개인이 얼마나 일관성이 있는지 확인할 수 있습니다.

그룹 프로필.

네 가지 경우 모두 결과 상관 계수의 유의성이 결정됩니다.

순위가 매겨진 값의 수에 따라 N.첫 번째 경우, 이 수량은 다음과 일치합니다.

표본 크기 n. 두 번째 경우에는 관측치 수가 특징의 수가 됩니다.

계층 구조를 구성합니다. 세 번째와 네 번째 경우에도 N은 비교 대상의 수입니다.

특성이지 그룹 내 피험자의 수가 아닙니다. 자세한 설명은 예제에 나와 있습니다. 만약에

rs의 절대값이 임계값에 도달하거나 초과합니다.

믿을 수 있는.

가설.

두 가지 가능한 가설이 있습니다. 첫 번째는 사례 1에 적용되고 두 번째는 나머지 세 가지에 적용됩니다.

가설의 첫 번째 버전

H0: 변수 A와 B 사이의 상관관계는 0과 다르지 않습니다.

H2: 변수 A와 B 사이의 상관관계는 0과 크게 다릅니다.

가설의 두 번째 버전

H0: 계층 A와 B 사이의 상관관계는 0과 다르지 않습니다.

H2: 계층 A와 B 간의 상관 관계가 0과 크게 다릅니다.

순위 상관 계수의 한계

1. 각 변수에 대해 최소 5개의 관측치가 제시되어야 합니다. 높은

샘플링 경계는 사용 가능한 임계값 테이블에 의해 결정됩니다. .

2. Spearman의 순위 상관 계수 rs는 다음과 같습니다. 대량동일한

하나 또는 두 비교 변수의 순위는 대략적인 값을 제공합니다. 이상적으로는

두 상관 계열은 모두 발산하는 두 수열을 나타내야 합니다.

가치. 이 조건이 충족되지 않으면 수정이 필요합니다.

같은 계급.

Spearman의 순위 상관 계수는 다음 공식을 사용하여 계산됩니다.

두 비교 순위 계열 모두 동일한 순위의 그룹을 포함하는 경우

순위 상관 계수를 계산하기 전에 동일한 보정을 해야 합니다.

Ta 및 TV 순위:

Ta = Σ(a3 – a)/12,

Тв = Σ (в3 – в)/12,

어디 ㅏ - A행에 있는 동일한 순위의 각 그룹의 볼륨 각각의 볼륨

랭크 시리즈 B에서 동일한 랭크의 그룹입니다.

rs의 경험적 값을 계산하려면 다음 공식을 사용하십시오.

38. 점-이중 상관 계수.

일반적인 상관관계에 대해서는 질문 36번을 참조하세요.와 함께. 56 (64) 063.JPG

harchenko-korranaliz.pdf

변수 X를 강력한 척도로 측정하고 변수 Y를 이분법 척도로 측정한다고 가정합니다. 점 이직렬 상관 계수 rpb는 다음 공식을 사용하여 계산됩니다.

여기서 x 1은 Y에 대해 "1"의 값을 갖는 X 객체에 대한 평균 값입니다.

x 0 – Y에 대해 "0" 값을 갖는 X 객체에 대한 평균값;

s x – X를 따른 모든 값의 표준 편차;

n 1 – Y에서 "1" 개체 수, n 0 – Y에서 "0" 개체 수;

n = n 1 + n 0 – 표본 크기.

점 이직열 상관 계수는 다른 등가 표현식을 사용하여 계산할 수도 있습니다.

여기 x– 변수의 전체 평균값 엑스.

점 이차 상관 계수 rpb–1에서 +1까지 다양합니다. 변수가 1인 경우 그 값은 0입니다. 와이평균을 가지고 있다 와이, 0이 넘는 변수의 평균과 같습니다. 와이.

시험 유의성 가설포인트 이차 상관 계수를 확인하는 것입니다 귀무 가설시간일반 상관 계수와 0의 동일성에 대한 0: ρ = 0, 이는 스튜던트 t-테스트를 ​​사용하여 수행됩니다. 경험적 의의

임계값과 비교 (df) 자유도 수에 대해 df = N– 2

조건 | | ≤ (df) 귀무가설 ρ = 0은 기각되지 않습니다. 경험적 값 | | 즉, 조건 | | > (N– 2). 점 이차 상관계수를 이용하여 계산된 관계의 신뢰도 rpb, 기준을 사용하여 결정될 수도 있습니다. χ 자유도 수는 2 df= 2.

점 이차 상관

모멘트 곱의 상관 계수에 대한 후속 수정은 포인트 바이시리얼에 반영되었습니다. 아르 자형. 이 통계. 두 변수 사이의 관계를 보여줍니다. 그 중 하나는 연속적이고 정규 분포를 따르는 것으로 추정되며, 다른 하나는 엄밀한 의미에서 이산적입니다. 점 이직열 상관 계수는 다음과 같이 표시됩니다. 아르 자형 피비스이후 아르 자형 피비스이분법은 이산변수의 실제 성격을 반영하며, 경우처럼 인위적이지 않습니다. 아르 자형 두번, 그 부호는 임의로 결정됩니다. 따라서 모든 실제적인 목적을 위해. 목표 아르 자형 피비스 0.00에서 +1.00 범위로 간주됩니다.

두 변수가 연속적이고 정규분포를 갖는다고 가정하지만, 이차 상관관계의 경우처럼 둘 다 인위적으로 이분화되는 경우도 있습니다. 이러한 변수 간의 관계를 평가하기 위해 사중 상관 계수가 사용됩니다. 아르 자형 테트, 이는 또한 Pearson에 의해 자란 것입니다. 기초적인 (정확한) 계산 공식 및 절차 아르 자형 테트꽤 복잡해요. 그러므로 실용적으로 이 방법은 근사치를 사용합니다. 아르 자형 테트,축약된 절차와 표를 기반으로 얻은 것입니다.

/on-line/dictionary/dictionary.php?term=511

포인트 바이시리얼 계수두 변수 사이의 상관 계수입니다. 하나는 이분법 척도로 측정되고 다른 하나는 구간 척도로 측정됩니다. 이는 테스트 작업의 품질(신뢰성과 일관성)을 나타내는 지표로 클래식 및 현대 테스트에서 사용됩니다. 종합점수테스트에 따르면.

측정된 변수를 상관시키려면 이분법 및 간격 척도사용 점-이중 상관 계수.
점 이차 상관 계수는 다음과 같은 방법입니다. 상관관계 분석변수의 관계 중 하나는 이름 척도로 측정되고 2개의 값만 취하고(예: 남성/여성, 참/거짓 대답, 속성 존재/부재) 두 번째는 비율 척도 또는 간격 척도. 점-이중 상관 계수 계산 공식:

어디:
m1과 m0은 Y의 값이 1 또는 0인 X의 평균값입니다.
σx – X에 의한 모든 값의 표준 편차
n1,n0 – 1 또는 0에서 Y까지의 X 값 수.
n - 값 쌍의 총 개수

더 자주 이 유형상관계수는 테스트 항목과 전체 척도 간의 관계를 계산하는 데 사용됩니다. 이는 유효성 검사의 한 유형입니다.

39. 순위-이중 상관 계수.

일반적인 상관관계에 대해서는 질문 36번을 참조하세요.와 함께. 56 (64) 063.JPG

harchenko-korranaliz.pdf p. 28

순위 이직렬 상관 계수는 변수 중 하나가 다음인 경우에 사용됩니다( 엑스)는 순서 척도로 제시되고, 다른 하나는 ( 와이) – 이분법, 공식으로 계산

.

다음은 하나를 갖는 개체의 평균 순위입니다. 와이; – 0부터 개체의 평균 순위 와이, N- 표본의 크기.

시험 유의성 가설순위-이차 상관 계수는 공식에서 치환을 사용하여 스튜던트 테스트를 사용하여 점 이차 상관 계수와 유사하게 수행됩니다. 아르 자형pb~에 아르 자형rb.

하나의 변수를 이분형 척도(변수)로 측정하는 경우 엑스),순위 척도(변수 Y)에서는 순위-이중열 상관 계수가 사용됩니다. 우리는 변수가 엑스,이분법적 척도로 측정하면 0과 1의 두 값(코드)만 취합니다. 우리는 특히 강조합니다. 이 계수가 -1에서 +1 범위에서 다양하다는 사실에도 불구하고 그 부호는 해석에 중요하지 않습니다. 결과. 이는 일반 규칙의 또 다른 예외입니다.

이 계수는 다음 공식을 사용하여 계산됩니다.

어디` 엑스 1변수의 해당 요소에 대한 평균 순위 와이, 이는 변수의 코드(부호) 1에 해당합니다. 엑스;

`X 0 – 변수의 해당 요소에 대한 평균 순위 와이,이는 변수의 코드(부호) 0에 해당합니다. 엑스\

N -변수의 총 요소 수 엑스.

순위-이중열 상관계수를 적용하려면 다음 조건을 충족해야 합니다.

1. 비교되는 변수는 다양한 척도로 측정되어야 합니다. 엑스 -이분법적으로; 다른 와이-순위로 보면.

2. 비교변수의 다양한 특성의 수 엑스그리고 와이동일해야합니다.

3. 순위-이중 상관 계수의 신뢰도 수준을 평가하려면 공식 (11.9)과 스튜던트 테스트의 임계값 표를 사용해야 합니다. k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

변수 중 하나가 다음으로 표현되는 경우 이분법적 척도, 그리고 다른 하나는 순위(순수), 신청이 필요합니다 순위-이중 상관 계수:

rpb=2 / n * (m1 - m0)

어디:
n – 측정 대상 수
m1 및 m0 - 두 번째 변수가 1 또는 0인 개체의 평균 순위입니다.
이 계수는 테스트의 유효성을 확인할 때도 사용됩니다.

40. 선형 상관 계수.

일반적인 상관관계(특히 선형 상관관계)에 대해서는 질문 36번을 참조하세요.와 함께. 56 (64) 063.JPG

피어슨 씨의 계수

아르 자형-피어슨 (피어슨 아르 자형)는 두 측정항목 간의 관계를 연구하는 데 사용됩니다.동일한 샘플에서 측정된 다양한 변수.그 사용이 적절한 상황이 많이 있습니다. 지능이 대학 시절 학업 성과에 영향을 미치나요? 직원의 급여 규모는 동료에 대한 친근감과 관련이 있습니까? 학생의 기분이 복잡한 산수 문제 해결의 성공에 영향을 줍니까? 이러한 질문에 답하기 위해 연구자는 표본의 각 구성원에 대해 두 가지 관심 지표를 측정해야 합니다. 그런 다음 관계를 연구하기 위한 데이터는 아래 예와 같이 표로 작성됩니다.

예 6.1

표는 8학년 학생 20명을 대상으로 두 가지 지능 지표(언어적 및 비언어적)를 측정하기 위한 초기 데이터의 예를 보여줍니다.

이들 변수 사이의 관계는 산점도를 사용하여 묘사할 수 있습니다(그림 6.3 참조). 다이어그램은 측정된 지표들 사이에 어떤 관계가 있음을 보여줍니다. 즉, 언어 지능의 값이 클수록 (대체로) 비언어 지능의 값도 커집니다.

상관 계수에 대한 공식을 제시하기 전에 예제 6.1의 데이터를 사용하여 상관 계수의 발생 논리를 추적해 보겠습니다. 다른 점(그림 6.3)을 기준으로 산점도에서 각 /-점(번호 /가 있는 주제)의 위치는 해당 변수 값의 평균값과의 편차 값 및 부호로 지정할 수 있습니다. : (xj - 엠제이 그리고 (정신 ~에 ). 이러한 편차의 징후가 일치하면 이는 긍정적인 관계를 나타냅니다( 큰 값에 의해 엑스큰 값은 다음에 해당합니다. ~에또는 더 낮은 값 엑스더 작은 값은 와이).

1번 과목의 경우 평균과의 편차 엑스그리고 ~에긍정적이고, 대상 번호 3의 경우 두 편차 모두 부정적입니다. 결과적으로, 두 데이터 모두 연구된 특성 사이에 긍정적인 관계가 있음을 나타냅니다. 반대로 평균에서 벗어난 징후가 나타나면 엑스그리고 ~에다르다면 이는 특성 간의 부정적인 관계를 나타냅니다. 따라서 4 번 과목의 경우 평균과의 편차 엑스음수입니다. y -긍정적이고 주제 번호 9의 경우 - 반대의 경우도 마찬가지입니다.

따라서 편차의 곱(x,- 엑스 ) 엑스 (정신 ~에 ) 긍정적이면 /-주어의 데이터는 직접적인(긍정적) 관계를 나타내고, 부정적이면 역(부정적) 관계를 나타냅니다. 따라서 만약에 엑스y y일반적으로 정비례로 관련되어 있으면 편차 곱의 대부분이 양수이고, 역관계로 관련되어 있으면 대부분의 곱이 음수입니다. 따라서 관계의 강도와 방향에 대한 일반적인 지표는 주어진 표본에 대한 모든 편차 곱의 합계일 수 있습니다.

변수 간의 직접 비례 관계에서 이 값은 크고 양수입니다. 대부분의 대상에서 편차는 부호가 일치합니다(한 변수의 큰 값은 다른 변수의 큰 값에 해당하고 그 반대도 마찬가지입니다). 만약에 엑스그리고 ~에피드백을 받으면 대부분의 피험자에 대해 한 변수의 더 큰 값은 다른 변수의 더 작은 값에 해당합니다. 즉, 제품의 부호는 음수가 되고 전체 제품의 합도 커집니다. 절대값은 음수이지만 부호는 음수입니다. 변수 사이에 체계적인 연결이 없으면 양수 항(편차의 곱)이 음수 항과 균형을 이루고 모든 편차 곱의 합은 0에 가까워집니다.

제품의 합이 표본 크기에 의존하지 않도록 하려면 평균을 내는 것으로 충분합니다. 그러나 우리는 일반적인 매개 변수가 아니라 계산된 추정치인 통계로서 상호 연결 측정에 관심이 있습니다. 따라서 분산 공식에 관해서는 이 경우에도 동일한 작업을 수행하고 편차 곱의 합을 다음과 같이 나누지 않습니다. N, TV에서 - 1. 이로 인해 물리학 및 기술 과학에서 널리 사용되는 연결 척도가 생성됩니다. 공분산(코바핸스):


안에 심리학은 물리학과 달리 심리학자들은 기호의 절대값에 관심이 없지만 대부분의 변수는 임의의 척도로 측정됩니다. 상호 합의그룹의 주제. 또한 공분산은 특성이 측정되는 척도(분산)의 규모에 매우 민감합니다. 두 특성의 측정 단위와 관계없이 연결 측정값을 만들려면 공분산을 해당 표준 편차로 나누는 것으로 충분합니다. 그리하여 얻은 을 위한-K. Pearson 상관 계수의 뮬:

또는 o x 및


두 변수의 값을 다음 공식을 사용하여 r-값으로 변환하면


그러면 r-Pearson 상관 계수에 대한 공식이 더 단순해 보입니다(071.JPG).

/dict/sociology/article/soc/soc-0525.htm

상관관계 선형- 두 양적 변수 사이의 비인과적 성격의 통계적 선형 관계 엑스그리고 ~에. "K.L 계수"를 사용하여 측정됩니다. Pearson은 공분산을 두 변수의 표준 편차로 나눈 결과입니다.

,

어디 에스 xy- 변수 간의 공분산 엑스그리고 ~에;

에스 엑스 , 에스 와이- 변수의 표준편차 엑스그리고 ~에;

엑스 , 와이 - 변수 값 엑스그리고 ~에숫자가 있는 객체의 경우 ;

엑스, 와이- 변수에 대한 산술 평균 엑스그리고 ~에.

피어슨 계수 아르 자형간격 [-1; +1]. 의미 r = 0변수 사이에 선형 관계가 없음을 의미합니다. 엑스그리고 ~에(그러나 비선형 통계 관계를 배제하지는 않습니다). 양의 계수 값 ​( 아르 자형> 0) 직접 선형 연결을 나타냅니다. 그 값이 +1에 가까울수록 더 강한 연결통계선. 음의 계수 값 ​​( 아르 자형 < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения 아르 자형= ±1은 직접 또는 역방향으로 완전한 선형 연결이 있음을 의미합니다. 완전한 연결의 경우 좌표( 엑스 , 와이 ) 직선으로 누워 와이 = + bx.

"계수 K.L." Pearson은 선형 쌍별 회귀 모델에서 연결 강도를 측정하는 데에도 사용됩니다.

41. 상관 행렬 및 상관 그래프.

일반적인 상관관계에 대해서는 질문 36번을 참조하세요.와 함께. 56 (64) 063.JPG

상관 행렬.종종 상관 분석에는 두 개가 아닌 하나의 표본에서 정량적 규모로 측정된 많은 변수 간의 관계에 대한 연구가 포함됩니다. 이 경우 이 변수 ​​세트의 각 쌍에 대해 상관관계가 계산됩니다. 계산은 일반적으로 컴퓨터에서 수행되며 결과는 상관 행렬입니다.

상관 행렬(상관관계 행렬) 세트의 각 쌍에 대해 한 가지 유형의 상관관계를 계산한 결과입니다. 아르 자형하나의 샘플에서 정량적 규모로 측정된 변수.

5개 변수(vl, v2,..., v5; = 5) 샘플로 측정한 결과 N=30인간. 아래는 소스 데이터와 상관 행렬의 테이블입니다.

그리고
유사한 데이터:

상관 행렬:

상관 행렬은 주 대각선(takkak,y = /) y에 대해 정사각형이고 대칭이며 주 대각선에 단위가 있음을 쉽게 알 수 있습니다(이후 G 그리고 = 구 = 1).

상관 행렬은 다음과 같습니다. 정사각형:행과 열의 개수는 변수의 개수와 같습니다. 그녀 대칭상관관계가 있기 때문에 주대각선을 기준으로 엑스와 함께 ~에상관관계와 같음 ~에와 함께 엑스.특성 자체와의 상관관계가 1이기 때문에 단위는 주 대각선에 위치합니다. 결과적으로 상관 행렬의 모든 요소가 분석 대상이 되는 것은 아니지만 주대각선 위 또는 아래에 있는 요소는 분석 대상입니다.

상관 계수의 수,관계를 연구할 때 분석할 기능은 다음 공식에 의해 결정됩니다. 피(피- 1)/2. 위의 예에서 이러한 상관 계수의 수는 5(5 - 1)/2 = 10입니다.

상관행렬을 분석하는 주요 작업은많은 기능 간의 관계 구조를 식별합니다. 이 경우 시각적 분석이 가능합니다. 상관 은하- 그래픽 이미지 통계적으로 구조의미있는 연결,그러한 연결이 그리 많지 않은 경우(최대 10-15개) 또 다른 방법은 다중 회귀, 요인 또는 군집 분석과 같은 다변량 방법을 사용하는 것입니다("다변량 방법..." 섹션 참조). 요인 분석이나 군집 분석을 사용하면 다른 변수보다 서로 더 밀접하게 관련된 변수 그룹을 식별할 수 있습니다. 예를 들어 징후가 많고 균질하지 않은 경우 이러한 방법을 조합하는 것도 매우 효과적입니다.

상관관계 비교 -두 가지 옵션이 있는 상관 행렬을 분석하는 추가 작업입니다. 상관 행렬 행 중 하나(변수 중 하나에 대해)의 상관 관계를 비교해야 하는 경우 종속 표본에 대한 비교 방법이 사용됩니다(p. 148-149). 서로 다른 표본에 대해 계산된 동일한 이름의 상관관계를 비교할 때는 독립 표본 비교 방법을 사용합니다(p.147~148).

비교 방법상관관계 대각선으로상관 행렬(무작위 프로세스의 정상성을 평가하기 위해) 및 비교 여러 개의서로 다른 표본(동질성을 위해)에 대해 얻은 상관 행렬은 노동 집약적이며 이 책의 범위를 벗어납니다. G.V. Sukhodolsky 1의 책에서 이러한 방법을 알 수 있습니다.

상관관계의 통계적 유의성 문제.문제는 통계적 가설 검정 절차가 다음과 같이 가정한다는 것입니다. 하나-다수의하나의 샘플에 대해 테스트를 수행했습니다. 같은 방법을 적용하면 자꾸,다른 변수와 관련하여라도 순전히 우연히 결과를 얻을 확률이 높아집니다. 안에 일반적인 경우, 동일한 가설 검정 방법을 반복하면 한 번다양한 변수 또는 샘플과 관련하여 확립된 값 a를 사용하면 다음에서 가설의 확인을 받을 수 있습니다. 아아경우의 수.

15개의 변수에 대해 상관행렬을 분석한다고 가정하면, 즉 15(15-1)/2 = 105개의 상관계수가 계산된다. 가설검증을 위해 a=0.05 수준으로 설정하고, 가설을 105번 확인하면 실제 연결여부와 관계없이 5번(!) 확인을 받게 됩니다. 이를 알고 가령 15개의 "통계적으로 유의미한" 상관 계수를 가지고 있으면 어떤 것이 우연히 획득되었는지, 어떤 것이 실제 관계를 반영하는지 알 수 있습니까?

엄밀히 말하면 수용을 위해 통계적 해법검정하는 가설의 수만큼 수준 a를 줄여야 합니다. 그러나 실제로 존재하는 연결을 무시할 확률(제2종 오류 발생)이 예측할 수 없는 방식으로 증가하기 때문에 이는 거의 권장되지 않습니다.

상관 행렬만으로는 충분한 기초가 되지 않습니다.여기에 포함된 개별 계수에 관한 통계적 결론상관관계!

이 문제를 해결하는 정말 설득력 있는 방법은 단 하나뿐입니다. 표본을 무작위로 두 부분으로 나누고 표본의 두 부분 모두에서 통계적으로 유의미한 상관관계만 고려하는 것입니다. 대안으로는 다변량 방법(요인, 군집 또는 다중 회귀 분석)을 사용하여 통계적으로 유의미하게 관련된 변수 그룹을 식별하고 해석하는 것일 수 있습니다.

누락된 값 문제.데이터에 누락된 값이 있는 경우 상관 행렬을 계산하는 데 두 가지 옵션이 가능합니다. a) 행별로 값 제거 (들어오지 못하게 하다사례목록별로); b) 값의 쌍별 삭제 (들어오지 못하게 하다사례쌍으로). ~에 한 줄씩 삭제결측값이 있는 관측값의 경우, 변수 중 하나에 대해 하나 이상의 결측값이 있는 개체(주제)에 대한 전체 행이 삭제됩니다. 이 방법을 사용하면 모든 계수가 동일한 개체 집합에서 계산된다는 점에서 "올바른" 상관 행렬이 생성됩니다. 그러나 결측값이 변수에 무작위로 분포되어 있는 경우 이 방법을 사용하면 고려 중인 데이터 세트에 개체가 하나도 남지 않는다는 사실이 발생할 수 있습니다(각 행에 결측값이 하나 이상 존재하게 됩니다). . 피하려면 비슷한 상황, 라는 다른 방법을 사용하십시오. 쌍 제거.이 방법은 선택된 각 열-변수 쌍의 간격만 고려하고 다른 변수의 간격은 무시합니다. 변수 쌍의 상관 관계는 간격이 없는 개체에 대해 계산됩니다. 많은 상황에서, 특히 간격의 수가 상대적으로 작고(예: 10%) 간격이 매우 무작위로 분포되어 있는 경우 이 방법은 심각한 오류로 이어지지 않습니다. 그러나 때로는 그렇지 않은 경우도 있습니다. 예를 들어, 평가의 체계적인 편향(이동)은 누락의 체계적인 배열을 "숨길" 수 있으며, 이는 서로 다른 하위 집합(예: 개체의 서로 다른 하위 그룹)에 대해 구성된 상관 계수의 차이가 발생하는 이유입니다. 다음과 같이 계산된 상관행렬과 관련된 또 다른 문제 쌍으로다른 유형의 분석(예: 다중 회귀 분석 또는 요인 분석). 그들은 "올바른" 상관 행렬이 일정 수준의 일관성과 다양한 계수의 "준수"와 함께 사용된다고 가정합니다. "나쁜"(편향된) 추정값이 포함된 행렬을 사용하면 프로그램이 해당 행렬을 분석할 수 없거나 결과가 잘못될 수 있다는 사실이 발생합니다. 따라서 결측 데이터를 제외하는 쌍별 방법을 사용하는 경우 결측 데이터의 분포에 체계적인 패턴이 있는지 확인하는 것이 필요합니다.

누락된 데이터를 쌍으로 삭제해도 평균과 분산(표준 편차)이 체계적으로 이동하지 않는 경우 이러한 통계는 누락된 데이터를 삭제하는 행별 방법을 사용하여 계산된 통계와 유사합니다. 유의미한 차이가 관찰되면 추정치에 변화가 있다고 가정할 이유가 있습니다. 예를 들어, 변수 값의 평균(또는 표준편차)이 ㅏ,변수와의 상관관계를 계산하는 데 사용되었습니다. 안에,동일한 변수 값의 평균(또는 표준편차)보다 훨씬 작습니다. ㅏ,변수 C와의 상관 관계를 계산하는 데 사용된 경우 이 두 상관 관계가 다음과 같이 예상되는 모든 이유가 있습니다. (A-B우리를)다양한 데이터 하위 집합을 기반으로 합니다. 변수 값의 간격이 무작위로 배치되지 않아 상관관계에 편향이 발생합니다.

상관 은하 분석.상관행렬의 요소들의 통계적 유의성 문제를 해결한 후, 통계적으로 유의미한 상관관계를 상관은하 또는 은하의 형태로 그래픽적으로 표현할 수 있다. 상관은하 -꼭지점과 이를 연결하는 선으로 구성된 도형입니다. 정점은 특성에 해당하며 일반적으로 숫자(변수 번호)로 지정됩니다. 선은 통계적으로 유의미한 연결에 해당하며 연결의 부호와 때로는 j-레벨 유의성을 그래픽으로 표현합니다.

상관 은하계는 다음을 반영할 수 있습니다. 모두통계적으로 유의미한 상관 행렬의 연결(때때로 상관 그래프 ) 또는 의미 있게 선택된 부분(예를 들어 요인 분석 결과에 따라 하나의 요인에 해당)만 선택됩니다.

상관 플레이아드 구성의 예


졸업생의 주 (최종) 인증 준비 : 통합 주 시험 기반 형성 ( 공통 목록과목을 나타내는 모든 카테고리의 통합 상태 시험 참가자) - 과목이 일치하는 경우 예비일을 고려합니다.

  • 업무 계획 (27)

    해결책

    2. 과학 및 수학 교육 과목의 내용을 개선하고 질을 평가하기 위한 교육 기관의 활동 시립 교육 기관 중등 학교 No. 4, Litvinovskaya, Chapaevskaya,

  • 연구 중인 특성의 측정이 순서 척도로 수행되거나 관계의 형태가 선형과 다른 경우 두 특성 사이의 관계를 연구합니다. 무작위 변수순위 상관 계수를 사용하여 수행됩니다. Spearman 순위 상관 계수를 고려하십시오. 이를 계산할 때 샘플 옵션의 순위(순서)가 필요합니다. 순위는 실험 데이터를 오름차순 또는 내림차순의 특정 순서로 그룹화하는 것입니다.

    순위 작업은 다음 알고리즘에 따라 수행됩니다.

    1. 값이 낮을수록 순위가 낮아집니다. 가장 높은 값에는 순위가 매겨진 값의 수에 해당하는 순위가 할당됩니다. 가장 작은 값에는 순위 1이 할당됩니다. 예를 들어, n=7이면 가장 높은 가치두 번째 규칙에 제공된 경우를 제외하고 순위 번호 7을 받게 됩니다.

    2. 여러 값이 동일하면 동일하지 않은 경우 받을 순위의 평균인 순위가 할당됩니다. 예를 들어, 22, 23, 25, 25, 25, 28, 30의 7개 요소로 구성된 오름차순 샘플을 생각해 보세요. 값 22와 23은 각각 한 번씩 나타나므로 해당 순위는 각각 R22=1이고, R23=2 . 값 25가 3번 나타납니다. 이 값이 반복되지 않으면 순위는 3, 4, 5가 됩니다. 따라서 R25 순위는 3, 4 및 5의 산술 평균과 같습니다. 28과 30의 값은 반복되지 않으므로 순위는 각각 R28=6, R30=7이다. 마지막으로 다음과 같은 서신이 있습니다.

    3. 순위의 총합은 다음 공식에 의해 결정되는 계산된 순위와 일치해야 합니다.

    여기서 n은 순위가 매겨진 값의 총 개수입니다.

    실제 순위 합계와 계산된 순위 합계가 일치하지 않으면 순위를 계산하거나 합산할 때 오류가 발생했음을 나타냅니다. 이런 경우에는 오류를 찾아 수정해야 합니다.

    Spearman의 순위 상관 계수는 두 가지 특성 또는 두 가지 특성 계층 간의 관계의 강도와 방향을 결정할 수 있는 방법입니다. 순위 상관 계수를 사용하면 다음과 같은 여러 가지 제한 사항이 있습니다.

    • a) 가정된 상관관계 의존성은 단조로워야 합니다.
    • b) 각 샘플의 부피는 5 이상이어야 합니다. 샘플의 상한을 결정하려면 임계값 표(부록의 표 3)를 사용하십시오. 테이블에서 n의 최대값은 40입니다.
    • c) 분석 과정에서 동일한 순위가 다수 발생할 가능성이 높습니다. 이 경우에는 수정이 이루어져야 합니다. 가장 유리한 경우는 연구 중인 두 샘플이 서로 다른 값의 두 시퀀스를 나타내는 경우입니다.

    상관관계 분석을 수행하려면 연구자는 순위를 매길 수 있는 두 개의 샘플이 있어야 합니다. 예를 들면 다음과 같습니다.

    • - 동일한 피험자 그룹에서 측정된 두 가지 특성
    • - 동일한 특성 세트를 사용하는 두 피험자에서 식별된 특성의 두 가지 개별 계층 구조
    • - 특성의 두 그룹 계층;
    • - 특성의 개인 및 그룹 계층.

    우리는 각 특성에 대해 개별적으로 연구된 지표의 순위를 매기는 것으로 계산을 시작합니다.

    동일한 피험자 그룹에서 두 가지 징후가 측정된 사례를 분석해 보겠습니다. 먼저, 서로 다른 과목에서 얻은 개별 값을 첫 번째 특성에 따라 순위를 매긴 다음, 개별 값을 두 번째 특성에 따라 순위를 매깁니다. 한 지표의 낮은 순위가 다른 지표의 낮은 순위에 해당하고, 한 지표의 높은 순위가 다른 지표의 높은 순위에 해당하는 경우 두 특성은 긍정적인 관련이 있습니다. 한 지표의 높은 순위가 다른 지표의 낮은 순위와 일치하는 경우 두 특성은 음의 관련이 있습니다. rs를 찾기 위해 각 주제에 대한 순위(d) 간의 차이를 확인합니다. 순위 간의 차이가 작을수록 순위 상관 계수 rs는 "+1"에 가까워집니다. 관계가 없으면 둘 사이에 대응이 없으므로 rs는 0에 가까워집니다. 두 변수에 대한 피험자 순위의 차이가 클수록 rs 계수 값은 "-1"에 가까워집니다. 따라서 Spearman 순위 상관 계수는 연구 중인 두 특성 간의 단조로운 관계를 측정한 것입니다.

    동일한 특성 세트를 사용하는 두 피험자에서 식별된 특성의 두 개별 계층이 있는 경우를 고려해 보겠습니다. 이 상황에서 두 피험자 각각이 얻은 개별 값은 특정 특성 집합에 따라 순위가 매겨집니다. 가장 낮은 값을 가진 기능에는 첫 번째 순위가 할당되어야 합니다. 더 높은 값을 갖는 특성은 2순위 등입니다. 지불해야 함 특별한 관심모든 특성이 동일한 단위로 측정되도록 합니다. 예를 들어, 지표가 서로 다른 "가격" 지점으로 표현되는 경우 지표의 순위를 매기는 것은 불가능합니다. 모든 값이 단일 척도가 될 때까지 심각도 측면에서 어떤 요소가 1위를 차지할지 결정하는 것이 불가능하기 때문입니다. 개체 중 하나에서 낮은 순위를 갖는 기능이 다른 개체에서도 낮은 순위를 갖고, 그 반대의 경우 개별 계층은 긍정적으로 관련되어 있습니다.

    두 그룹 특성 계층의 경우 두 피험자 그룹에서 얻은 평균 그룹 값은 연구 그룹에 대한 동일한 특성 세트에 따라 순위가 매겨집니다. 다음으로 이전 사례에 제공된 알고리즘을 따릅니다.

    개인과 집단의 특성 계층을 사용하여 사례를 분석해 보겠습니다. 그들은 개별 계층이 그것과 비교하면. 순위 상관관계를 통해 개인 및 그룹 특성 계층 구조의 일관성 정도를 평가할 수 있습니다.

    위에 나열된 경우에 상관계수의 유의성이 어떻게 결정되는지 살펴보겠습니다. 두 가지 특성이 있는 경우 표본 크기에 따라 결정됩니다. 두 개의 개별 기능 계층이 있는 경우 중요성은 계층에 포함된 기능 수에 따라 달라집니다. 마지막 두 경우에서 중요성은 그룹 수가 아니라 연구되는 특성의 수에 따라 결정됩니다. 따라서 모든 경우에 있어서 rs의 유의성은 순위가 매겨진 값 n의 개수에 따라 결정됩니다.

    rs의 통계적 유의성을 확인할 때, 그들은 순위 상관 계수의 임계값 테이블을 사용합니다. 다양한 수량순위 값과 다양한 레벨중요성. rs의 절대값이 임계값에 도달하거나 초과하면 상관 관계가 신뢰할 수 있습니다.

    첫 번째 옵션(동일한 피험자 그룹에서 두 개의 징후가 측정된 경우)을 고려할 때 다음과 같은 가설이 가능합니다.

    H0: 변수 x와 y 사이의 상관관계는 0과 다르지 않습니다.

    H1: 변수 x와 y 사이의 상관관계는 0과 크게 다릅니다.

    나머지 세 가지 사례 중 하나를 다루려면 또 다른 한 쌍의 가설을 제시해야 합니다.

    H0: 계층 x와 y 간의 상관 관계는 0과 다르지 않습니다.

    H1: 계층 x와 y 간의 상관 관계는 0과 크게 다릅니다.

    Spearman 순위 상관 계수 rs를 계산할 때의 동작 순서는 다음과 같습니다.

    • - 어떤 두 기능 또는 두 기능 계층이 변수 x 및 y로 비교에 참여할지 결정합니다.
    • - 순위 규칙에 따라 변수 x 값의 순위를 매기고 가장 작은 값에 순위 1을 할당합니다. 표의 첫 번째 열에 시험 대상이나 특성의 순서대로 순위를 매기십시오.
    • - 변수 y의 값에 순위를 매깁니다. 표의 두 번째 열에 시험 대상이나 특성의 순서대로 순위를 매기십시오.
    • - 테이블의 각 행에 대해 순위 x와 y 사이의 차이 d를 계산합니다. 결과를 표의 다음 열에 배치하십시오.
    • - 차이의 제곱(d2)을 계산합니다. 결과 값을 표의 네 번째 열에 배치하십시오.
    • - 차이의 제곱의 합을 계산하시나요? d2.
    • - 동일한 순위가 발생하면 수정 사항을 계산합니다.

    여기서 tx는 샘플 x에서 동일한 순위의 각 그룹의 볼륨입니다.

    ty는 샘플 y에서 동일한 순위의 각 그룹의 볼륨입니다.

    동일한 순위의 유무에 따라 순위 상관계수를 계산합니다. 동일한 순위가 없는 경우 다음 공식을 사용하여 순위 상관 계수 rs를 계산합니다.

    동일한 순위가 있는 경우 다음 공식을 사용하여 순위 상관 계수 rs를 계산합니다.

    여기서 d2는 순위 간의 차이 제곱의 합입니다.

    Tx 및 Ty - 동일한 순위에 대한 수정;

    n은 순위에 참여하는 주제 또는 기능의 수입니다.

    주어진 수의 피험자 n에 대해 부록 표 3에서 rs의 임계값을 결정합니다. rs가 임계값보다 작지 않으면 상관 계수의 0과 큰 차이가 관찰됩니다.

    피어슨 상관관계는 두 변수 사이의 선형 관계를 측정한 것입니다. 이를 통해 두 변수의 변동성이 얼마나 비례하는지 확인할 수 있습니다. 변수가 서로 비례하는 경우 변수 간의 관계는 양수(정비) 또는 음수(역비례) 기울기를 갖는 직선으로 그래픽으로 표시될 수 있습니다.

    실제로 두 변수 사이의 관계는 확률적이며 그래픽적으로는 타원체 분산 구름처럼 보입니다. 그러나 이 타원체는 직선이나 회귀선으로 표현(근사)될 수 있습니다. 회귀선은 다음 방법을 사용하여 구성된 직선입니다. 최소제곱: 산점도의 각 점에서 직선까지의 거리 제곱의 합(Y축을 따라 계산됨)이 최소값입니다.

    예측의 정확성을 평가하는 데 특히 중요한 것은 종속변수 추정치의 분산입니다. 기본적으로 종속 변수 Y의 추정치 분산은 전체 분산 중 독립 변수 X의 영향으로 인한 부분입니다. 즉, 실제 분산에 대한 종속 변수 추정치의 분산 비율은 다음과 같습니다. 상관계수의 제곱과 같습니다.

    종속변수와 독립변수 사이의 상관계수의 제곱은 독립변수의 영향으로 인한 종속변수의 분산 비율을 나타내며 결정계수라고 합니다. 따라서 결정 계수는 한 변수의 변동성이 다른 변수의 영향으로 인해 발생(결정)되는 정도를 나타냅니다.

    결정계수는 상관계수에 비해 중요한 장점이 있습니다. 상관관계 __________은(는) 두 변수 사이의 관계에 대한 선형 함수가 아닙니다. 따라서 여러 샘플에 대한 상관 계수의 산술 평균은 이러한 샘플의 모든 대상에 대해 즉시 계산된 상관 관계와 일치하지 않습니다(즉, 상관 계수는 가산되지 않습니다). 반대로 결정 계수는 관계를 선형적으로 반영하므로 가산적입니다. 즉, 여러 샘플에 대해 평균을 낼 수 있습니다.

    추가 정보연결의 강도는 상관 계수의 제곱 값으로 표시됩니다. 즉 결정 계수는 다른 변수의 영향으로 설명할 수 있는 한 변수의 분산 부분입니다. 상관계수와 달리 결정계수는 연결 강도가 증가함에 따라 선형적으로 증가합니다.

    Spearman 및 τ-Kendall 상관 계수(순위 상관)

    관계를 연구하는 두 변수가 모두 순서 척도로 표시되거나 그 중 하나는 순서 척도이고 다른 하나는 척도 척도로 표시되는 경우 순위 상관 계수(Spearman 또는 τ-Kendell)가 사용됩니다. 두 계수 모두 적용을 위해 두 변수의 예비 순위가 필요합니다.

    Spearman의 순위 상관 계수는 현상 간의 관계를 통계적으로 연구하는 목적으로 사용되는 비모수적 방법입니다. 이 경우 둘 사이의 실제 병렬성 수준이 결정됩니다. 정량적 시리즈연구된 특성에 대한 평가와 확립된 연결의 근접성에 대한 평가는 정량적으로 표현된 계수를 사용하여 제공됩니다.

    크기 그룹의 구성원이 먼저 변수 x로 순위가 매겨진 다음 변수 y로 순위가 매겨지면 두 순위 계열에 대한 피어슨 계수를 계산하여 변수 x와 y 간의 상관 관계를 간단히 얻을 수 있습니다. 두 변수 모두에 대해 순위 관계(즉, 반복 순위 없음)가 없는 경우 Pearson 공식은 계산적으로 크게 단순화될 수 있으며 Spearman 공식으로 알려진 것으로 변환될 수 있습니다.

    Spearman 순위 상관 계수의 검정력은 모수 상관 계수의 검정력보다 다소 낮습니다.

    관측치 수가 적을 때는 순위상관계수를 사용하는 것이 좋습니다. 이 방법은 정량적 데이터뿐만 아니라 기록된 값이 다양한 강도의 설명적 특징에 의해 결정되는 경우에도 사용할 수 있습니다.

    하나 또는 두 비교 변수에 대해 다수의 동일한 순위가 있는 Spearman의 순위 상관 계수는 대략적인 값을 제공합니다. 이상적으로는 두 상관 계열이 서로 다른 값의 두 시퀀스를 나타내야 합니다.

    순위에 대한 Spearman 상관관계의 대안은 τ-Kendall 상관관계입니다. M. Kendall이 제안한 상관관계는 연결 방향을 쌍으로 된 대상을 비교하여 판단할 수 있다는 아이디어에 기반을 두고 있습니다. 즉, 한 쌍의 대상이 y의 변화와 방향이 일치하는 x의 변화가 있는 경우 이는 다음을 나타냅니다. 일치하지 않으면 긍정적인 연결 - 부정적인 연결에 관한 것입니다.

    순위를 매기는 값 계열이 두 개 있는 경우 Spearman 순위 상관 관계를 계산하는 것이 합리적입니다.

    이러한 계열은 다음과 같이 나타낼 수 있습니다.

    • 연구 중인 동일한 객체 그룹에서 결정된 한 쌍의 특성;
    • 동일한 특성 세트에 따라 2개의 연구 대상에서 결정된 한 쌍의 개별 하위 특성;
    • 한 쌍의 그룹 하위 특성;
    • 특성의 개인 및 그룹 종속.

    이 방법에는 각 특성에 대해 별도로 지표의 순위를 매기는 작업이 포함됩니다.

    가장 작은 값의 순위가 가장 낮습니다.

    이 방법은 연구 중인 현상 간의 관계 존재를 확립하기 위해 고안된 비모수적 통계 방법을 의미합니다.

    • 두 계열의 정량적 데이터 간의 실제 병렬 정도를 결정합니다.
    • 식별된 연결의 친밀도를 정량적으로 표현한 평가입니다.

    상관관계 분석

    2개 이상의 임의의 값(변수) 사이의 관계 존재 및 그 강도를 확인하기 위해 고안된 통계적 방법을 상관 분석이라고 합니다.

    상관관계(lat.) - 비율에서 이름을 얻었습니다.

    이를 사용할 때 다음과 같은 시나리오가 가능합니다.

    • 상관관계의 존재(양수 또는 음수);
    • 상관관계 없음(0).

    변수들 사이에 관계가 확립된 경우 우리 얘기 중이야그들의 상관관계에 대해. 즉, X의 값이 변하면 Y의 값도 그에 비례하는 변화가 필연적으로 관찰된다고 말할 수 있습니다.

    다양한 의사소통 척도(계수)가 도구로 사용됩니다.

    그들의 선택은 다음의 영향을 받습니다.

    • 난수 측정 방법;
    • 난수 사이의 연결의 성격.

    상관 관계의 존재는 그래픽(그래프)과 계수(수치 표시)를 사용하여 표시할 수 있습니다.

    상관관계의 특징은 다음과 같습니다.

    • 연결 강도(상관 계수 ±0.7 ~ ±1 – 강함, ±0.3 ~ ±0.699 – 평균, 0 ~ ±0.299 – 약함)
    • 통신 방향(직접 또는 역방향).

    상관관계 분석의 목표

    상관 분석을 통해 연구 중인 변수 간의 인과 관계를 설정할 수는 없습니다.

    이는 다음과 같은 목적으로 수행됩니다.

    • 변수 간의 관계 설정;
    • 다른 변수를 기반으로 변수에 대한 특정 정보를 얻는 단계;
    • 이 의존성의 근접성(연결)을 결정합니다.
    • 설정된 연결의 방향을 결정합니다.

    상관 분석 방법


    이 분석다음을 사용하여 수행할 수 있습니다.

    • 정사각형 또는 Pearson 방법;
    • 순위 방법 또는 Spearman.

    Pearson 방법은 변수 사이에 존재하는 힘을 정확하게 결정해야 하는 계산에 적용할 수 있습니다. 이를 통해 연구된 특성은 정량적으로만 표현되어야 합니다.

    Spearman 방법이나 순위 상관관계를 적용하려면 특성 표현에 대한 엄격한 요구 사항이 없습니다. 이는 정량적일 수도 있고 속성적일 수도 있습니다. 이 방법 덕분에 연결 강도의 정확한 결정에 대한 정보가 아니라 대략적인 성격의 정보를 얻을 수 있습니다.

    변수 행에는 공개 변형이 포함될 수 있습니다. 예를 들어 근무경력을 1년 이하, 5년 이상 등의 값으로 표현하는 경우.

    상관 계수

    두 변수의 변화 특성을 나타내는 통계량을 상관 계수 또는 쌍 상관 계수라고 합니다. 정량적으로 말하면 -1부터 +1까지입니다.

    가장 일반적인 확률은 다음과 같습니다.

    • 피어슨– 간격 척도에 속하는 변수에 적용 가능합니다.
    • 창병– 순서척도변수의 경우.

    상관계수 사용의 한계

    다음과 같은 경우 상관 계수를 계산할 때 신뢰할 수 없는 데이터를 얻을 수 있습니다.

    • 사용 가능한 변수 값이 충분합니다(관찰 쌍 25-100개).
    • 예를 들어 연구 대상 변수 사이에는 선형 관계가 아닌 2차 관계가 설정됩니다.
    • 각각의 경우 데이터에는 둘 이상의 관측치가 포함됩니다.
    • 변수의 비정상적인 값(이상치)의 존재;
    • 연구 중인 데이터는 명확하게 구별되는 관찰 하위 그룹으로 구성됩니다.
    • 상관 관계가 있다고 해서 어떤 변수가 원인으로 간주될 수 있고 어떤 변수가 결과로 간주될 수 있는지 확인할 수는 없습니다.

    상관관계의 유의성 확인

    통계량을 평가하기 위해 수량 또는 극단 값이 무작위로 발생할 확률을 나타내는 중요성 또는 신뢰성의 개념이 사용됩니다.

    상관관계의 유의성을 결정하는 가장 일반적인 방법은 스튜던트 t 검정입니다.

    그 값을 테이블 값과 비교하여 자유도를 2로 취합니다. 계산된 기준 값이 테이블 값보다 큰 경우 이는 상관 계수의 유의성을 나타냅니다.

    경제적 계산을 수행할 때 신뢰 수준 0.05(95%) 또는 0.01(99%)이 충분한 것으로 간주됩니다.

    스피어맨 계급

    Spearman의 순위 상관 계수를 사용하면 현상 간의 관계 존재를 통계적으로 설정할 수 있습니다. 계산에는 각 속성에 대한 일련 번호(순위) 설정이 포함됩니다. 순위는 오름차순 또는 내림차순일 수 있습니다.

    순위가 적용되는 기능의 수는 얼마든지 가능합니다. 이는 숫자를 제한하는 다소 노동 집약적 프로세스입니다. 20개의 표지판에 도달하면 어려움이 시작됩니다.

    Spearman 계수를 계산하려면 다음 공식을 사용하십시오.

    여기서:

    n - 순위가 매겨진 기능의 수를 표시합니다.

    d는 두 변수의 순위 차이에 지나지 않습니다.

    ∑(d2)는 순위 차이의 제곱합입니다.

    심리학에서의 상관 분석 적용

    심리학 연구의 통계적 지원을 통해 심리학 연구를 보다 객관적이고 대표성이 높은 것으로 만들 수 있습니다. 심리 실험을 통해 얻은 데이터를 통계적으로 처리하면 유용한 정보를 최대한 추출하는 데 도움이 됩니다.

    결과를 처리하기 위해 가장 널리 사용되는 방법은 상관 분석입니다.

    연구 중에 얻은 결과에 대한 상관 분석을 수행하는 것이 적절합니다.

    • 불안 (R. Temml, M. Dorca, V. Amen의 테스트에 따름);
    • 가족 관계(E.G. Eidemiller, V.V. Yustitskis의 "가족 관계 분석"(AFV) 설문지);
    • 내부성-외부성 수준(E.F. Bazhin, E.A. Golynkina 및 A.M. Etkind의 설문지)
    • 수준 정서적 소진교사 중 (V.V. Boyko의 설문지);
    • 다학문적 훈련 중 학생들의 언어 지능 요소 간 연결(K.M. Gurevich 및 기타 방법론)
    • 공감 수준(V.V. Boyko의 방법)과 결혼 만족도(V.V. Stolin, T.L. Romanova, G.P. Butenko의 설문지) 간의 연결
    • 청소년의 사회 측정적 상태(Jacob L. Moreno 테스트)와 스타일 특징 간의 연관성 가족 교육(E.G. Eidemiller, V.V. Yustitskis의 설문지);
    • 양부모 및 편부모 가정에서 자란 청소년의 삶의 목표 구조(설문지 Edward L. Deci, Richard M. Ryan Ryan).

    Spearman 기준을 사용한 상관 분석 수행에 대한 간략한 지침

    Spearman의 방법을 이용한 상관분석을 수행합니다. 다음 알고리즘에 따라:

    • 쌍을 이루는 비교 가능한 특성은 2개의 행으로 배열되며, 그 중 하나는 X로 지정되고 다른 하나는 Y로 지정됩니다.
    • X 시리즈의 값은 오름차순 또는 내림차순으로 정렬됩니다.
    • Y 시리즈 값의 배열 순서는 X 시리즈 값과의 대응에 따라 결정됩니다.
    • X 시리즈의 각 값에 대해 순위를 결정합니다. 최소값에서 최대값까지 일련번호를 할당합니다.
    • 계열 Y의 각 값에 대해 순위도 결정합니다(최소값에서 최대값까지).
    • D=X-Y 공식을 사용하여 X와 Y 순위 간의 차이(D)를 계산합니다.
    • 결과 차이 값은 제곱됩니다.
    • 순위 차이의 제곱의 합을 수행합니다.
    • 다음 공식을 사용하여 계산을 수행합니다.

    Spearman 상관관계 예

    다음 데이터를 사용할 수 있는 경우 업무 경험과 부상률 사이의 상관 관계를 확립하는 것이 필요합니다.

    가장 적합한 분석 방법은 순위 방법입니다. 특징 중 하나는 개방형 옵션의 형태로 제시됩니다: 최대 1년의 업무 경험과 7년 이상의 업무 경험.

    문제 해결은 작업 테이블로 컴파일되고 수동으로 수행할 수 있는 데이터 순위를 지정하는 것에서 시작됩니다. 볼륨이 크지 않습니다.

    업무 경험 부상자 수 일련번호 (순위) 순위 차이 순위 차이의 제곱
    d(x-y)
    최대 1년 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,5
    7 이상 6 5 1 +4 16
    Σ d2 = 38.5

    열에 분수 순위가 나타나는 이유는 동일한 크기의 변형이 나타나면 순위의 산술 평균이 발견되기 때문입니다. 안에 이 예에서는부상 지표 12는 두 번 발생하고 순위 2와 3이 할당됩니다. 이러한 순위(2+3)/2= 2.5의 산술 평균을 구하고 이 값을 2개 지표에 대한 워크시트에 배치합니다.
    얻은 값을 작업 공식에 대입하고 간단한 계산을 통해 -0.92와 동일한 Spearman 계수를 얻습니다.

    음수 계수 값은 존재를 나타냅니다. 피드백표지판 사이에 짧은 근무 경험이 많은 부상을 동반한다는 것을 암시합니다. 더욱이, 이들 지표들 사이의 연결 강도는 상당히 크다.
    계산의 다음 단계는 얻은 계수의 신뢰성을 결정하는 것입니다.
    오류와 학생의 시험이 계산됩니다.

    Spearman 순위 상관 방법을 사용하면 두 특성 또는 특성의 두 프로필(계층) 간의 상관 관계의 근접성(강도)과 방향을 결정할 수 있습니다.

    순위 상관관계를 계산하려면 두 행의 값이 필요합니다.

    순위를 매길 수 있는 것입니다. 이러한 일련의 값은 다음과 같습니다.

    1) 동일한 피험자 그룹에서 측정된 두 가지 징후;

    2) 동일한 특성 세트를 사용하는 두 피험자에서 식별된 특성의 두 가지 개별 계층;

    3) 특성의 두 그룹 계층,

    4) 특성의 개인 및 그룹 계층.

    첫째, 지표는 각 특성에 대해 별도로 순위가 매겨집니다.

    일반적으로 낮은 속성 값에는 낮은 순위가 할당됩니다.

    첫 번째 경우(두 가지 특성)에는 서로 다른 피험자에서 얻은 첫 번째 특성에 대한 개별 값의 순위가 매겨지고, 그런 다음 두 번째 특성에 대한 개별 값이 순위가 매겨집니다.

    두 특성이 긍정적인 관련이 있는 경우, 그 중 하나의 순위가 낮은 대상은 다른 하나의 순위도 낮고, 다른 특성의 순위도 높은 대상은

    특성 중 하나는 다른 특성에 대해서도 높은 순위를 갖습니다. rs를 계산하려면 두 특성에 대해 특정 대상이 얻은 순위 간의 차이(d)를 결정해야 합니다. 그런 다음 이러한 지표 d는 특정 방식으로 변환되어 1에서 뺍니다.

    순위 간의 차이가 작을수록 rs가 커질수록 +1에 가까워집니다.

    상관관계가 없으면 모든 순위가 혼합되어 순위가 나오지 않습니다.

    서신이 없습니다. 이 경우 rs가 0에 가까워지도록 공식이 설계되었습니다.

    하나의 속성에 대해 낮은 순위의 피험자 간에 음의 상관관계가 있는 경우

    다른 기준으로 높은 순위가 일치하며 그 반대도 마찬가지입니다. 두 변수에 대한 피험자의 순위 차이가 클수록 rs는 -1에 가까워집니다.

    두 번째 경우(두 개의 개별 프로필), 개별

    특정 (둘 다 동일) 특성 세트에 대해 두 피험자 각각이 얻은 값. 첫 번째 순위는 가장 낮은 값을 가진 기능에 부여됩니다. 두 번째 순위는 더 높은 값을 갖는 특성입니다. 분명히 모든 특성은 동일한 단위로 측정되어야 하며 그렇지 않으면 순위를 매기는 것이 불가능합니다. 예를 들어, "원시" 포인트로 표현된 경우 Cattell Personality Inventory(16PF)에서 지표의 순위를 매기는 것은 불가능합니다. 다양한 요인에 대한 값의 범위가 0에서 13까지, 0에서 0까지 다르기 때문입니다.

    20 및 0부터 26까지. 모든 값을 단일 척도로 가져올 때까지 심각도 측면에서 어떤 요소가 첫 번째가 될지 말할 수 없습니다(대부분 벽 척도입니다).

    두 개체의 개별 계층이 긍정적으로 관련되어 있는 경우 그 중 하나의 순위가 낮은 기능은 다른 항목의 순위도 낮고 그 반대의 경우도 마찬가지입니다. 예를 들어, 한 개체의 요인 E(지배력)가 가장 낮은 순위를 갖는 경우 다른 개체의 요인 C도 낮은 순위를 가져야 합니다.

    (정서적 안정)이 가장 높은 순위를 가지며, 다른 과목도 반드시 가져야 합니다.

    이 요소는 순위가 높습니다.

    세 번째 경우(두 개의 그룹 프로필), 두 그룹의 피험자에서 얻은 그룹 평균값은 두 그룹에 대해 동일한 특정 특성 집합에 따라 순위가 매겨집니다. 다음의 추론 노선은 이전 두 사례와 동일합니다.

    사례 4(개인 및 그룹 프로필)의 경우 피험자의 개별 값과 그룹 평균 값은 원칙적으로 이 개별 피험자를 제외하여 얻은 동일한 특성 세트에 따라 별도로 순위가 매겨집니다. 그는 개인 프로필과 비교되는 그룹 평균 프로필에 참여하지 않습니다. 순위 상관 관계는 개인 및 그룹 프로필이 얼마나 일관성이 있는지 테스트합니다.

    네 가지 경우 모두 결과 상관 계수의 유의성은 순위 값의 수 N에 의해 ​​결정됩니다. 첫 번째 경우 이 수는 표본 크기 n과 일치합니다. 두 번째 경우 관측치 수는 계층 구조를 구성하는 기능의 수입니다. 세 번째와 네 번째 경우에서 N은 그룹 내 피험자의 수가 아니라 비교된 특징의 수이기도 합니다. 자세한 설명은 예제에 나와 있습니다. rs의 절대값이 임계값에 도달하거나 초과하면 상관 관계가 신뢰할 수 있습니다.

    가설.

    두 가지 가능한 가설이 있습니다. 첫 번째는 사례 1에 적용되고 두 번째는 나머지 세 가지 경우에 적용됩니다.

    가설의 첫 번째 버전

    H0: 변수 A와 B 사이의 상관관계는 0과 다르지 않습니다.

    H1: 변수 A와 B 사이의 상관관계는 0과 크게 다릅니다.

    가설의 두 번째 버전

    H0: 계층 A와 B 사이의 상관관계는 0과 다르지 않습니다.

    H1: 계층 A와 B 간의 상관 관계가 0과 크게 다릅니다.

    순위 상관 계수의 한계

    1. 각 변수에 대해 최소 5개의 관측치가 제시되어야 합니다. 샘플의 상한은 사용 가능한 임계값 표에 의해 결정됩니다.

    2. 하나 또는 두 비교 변수에 대해 다수의 동일한 순위가 있는 Spearman의 순위 상관 계수 r은 대략적인 값을 제공합니다. 이상적으로는 두 상관 계열이 서로 다른 값의 두 시퀀스를 나타내야 합니다. 이 조건이 충족되지 않으면 동등한 순위에 대한 조정이 필요합니다.

    Spearman의 순위 상관 계수는 다음 공식을 사용하여 계산됩니다.

    비교된 순위 계열 모두에 동일한 순위의 그룹이 있는 경우 순위 상관 계수를 계산하기 전에 동일한 순위 Ta 및 Tv에 대해 수정해야 합니다.

    Ta = Σ(a3 – a)/12,

    Тв = Σ (в3 – в)/12,

    여기서 a는 순위 시리즈 A에서 동일한 순위의 각 그룹의 볼륨이고, b는 각 그룹의 볼륨입니다.

    랭크 시리즈 B에서 동일한 랭크의 그룹입니다.

    rs의 경험적 값을 계산하려면 다음 공식을 사용하십시오.

    Spearman의 순위 상관 계수 rs 계산

    1. 어떤 두 가지 특성 또는 두 가지 특성 계층이 참여할지 결정합니다.

    변수 A와 B로 비교합니다.

    2. 순위 규칙(P.2.3 참조)에 따라 가장 작은 값에 순위 1을 할당하여 변수 A의 값에 순위를 매깁니다. 표의 첫 번째 열에 피험자의 수나 특성에 따라 순위를 입력하세요.

    3. 동일한 규칙에 따라 변수 B의 값의 순위를 매깁니다. 표의 두 번째 열에는 과목 수나 특성의 순서대로 순위를 입력합니다.

    5. 각 차이를 제곱합니다: d2. 표의 네 번째 열에 이 값을 입력합니다.

    Ta = Σ(a3 – a)/12,

    Тв = Σ (в3 – в)/12,

    여기서 a는 순위 시리즈 A에서 동일한 순위의 각 그룹의 볼륨입니다. c – 각 그룹의 볼륨

    순위 계열 B에서 동일한 순위입니다.

    a) 동일한 순위가 없는 경우

    RS  1 − 6 ⋅

    b) 동일한 순위가 있는 경우

    Σd 2  T  T

    r  1 − 6 ⋅ a in,

    여기서 Σd2는 순위 간 차이 제곱의 합입니다. Ta 및 TV - 동일한 수정 사항

    N - 순위에 참여하는 주제 또는 기능의 수입니다.

    9. 주어진 N에 대한 rs의 임계값을 표(부록 4.3 참조)에서 결정합니다. rs가 임계값을 초과하거나 최소한 그와 같으면 상관관계는 0과 크게 다릅니다.

    실시예 4.1 시험군의 안구 운동 반응에 대한 알코올 소비 반응의 의존도를 결정할 때 알코올 소비 전후에 데이터를 얻었습니다. 피험자의 반응은 중독 상태에 따라 달라지나요?

    실험 결과:

    이전: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. 이후: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. 가설을 세워보겠습니다.

    H0: 음주 전후 반응의 의존성 정도 사이의 상관관계는 0과 다르지 않습니다.

    H1: 음주 전후 반응의 의존성 정도 사이의 상관관계가 0과 크게 다릅니다.

    표 4.1. 실험 전후의 안구운동 반응 지표를 비교할 때 Spearman 순위 상관계수 rs에 대한 d2 계산(N=17)

    가치

    가치

    반복되는 순위가 있으므로 이 경우동일한 순위에 맞게 조정된 공식을 적용합니다.

    Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

    Тb =((23-2)+(23-2)+(33-3))/12=3

    Spearman 계수의 경험적 값을 찾아 보겠습니다.

    rs = 1- 6*((767.75+6+3)/(17*(172-1)))=0.05

    표 (부록 4.3)를 사용하여 상관 계수의 임계 값을 찾습니다.

    0.48(p ≤ 0.05)

    0.62 (p ≤ 0.01)

    우리는 얻는다

    RS=0.05∠rcr(0.05)=0.48

    결론: H1 가설은 기각되고 H0은 채택됩니다. 저것들. 정도 사이의 상관관계

    음주 전후의 반응 의존성은 0과 다르지 않습니다.