Spearman과 Pearson 상관관계의 적용.  순위 상관과 Spearman의 순위 상관 계수

Spearman과 Pearson 상관관계의 적용. 순위 상관과 Spearman의 순위 상관 계수

피어슨 상관 계수

계수 아르 자형- Pearson은 동일한 샘플에서 측정된 두 측정변수 간의 관계를 연구하는 데 사용됩니다. 그 사용이 적절한 상황이 많이 있습니다. 지능이 대학 시절 학업 성과에 영향을 미치나요? 직원의 급여 규모가 동료에 대한 친근감과 관련이 있습니까? 학생의 기분이 복잡한 산수 문제 해결의 성공에 영향을 줍니까? 이러한 질문에 답하기 위해 연구자는 표본의 각 구성원에 대해 두 가지 관심 지표를 측정해야 합니다.

상관계수의 값은 특성이 나타나는 측정 단위에 영향을 받지 않습니다. 결과적으로 특성의 선형 변환(상수 곱하기, 상수 추가)은 상관 계수 값을 변경하지 않습니다. 예외는 부호 중 하나에 음수 상수를 곱하는 것입니다. 상관 계수는 부호를 반대 방향으로 변경합니다.

Spearman과 Pearson 상관관계의 적용.

피어슨 상관관계는 두 변수 사이의 선형 관계를 측정한 것입니다. 이를 통해 두 변수의 변동성이 얼마나 비례하는지 확인할 수 있습니다. 변수가 서로 비례하는 경우 변수 간의 관계는 양수(정비) 또는 음수(역비례) 기울기를 갖는 직선으로 그래픽으로 표시될 수 있습니다.

실제로 두 변수 사이의 관계는 확률적이며 그래픽적으로는 타원체 분산 구름처럼 보입니다. 그러나 이 타원체는 직선이나 회귀선으로 표현(근사)될 수 있습니다. 회귀선은 다음 방법을 사용하여 구성된 직선입니다. 최소제곱: 산점도의 각 점에서 직선까지의 거리 제곱(Y축을 따라 계산)의 합이 최소값입니다.

예측의 정확성을 평가하는 데 특히 중요한 것은 종속변수 추정치의 분산입니다. 기본적으로 종속 변수 Y의 추정치 분산은 전체 분산 중 독립 변수 X의 영향으로 인한 부분입니다. 즉, 실제 분산에 대한 종속 변수 추정치의 분산 비율은 다음과 같습니다. 상관계수의 제곱과 같습니다.

종속변수와 독립변수 사이의 상관계수의 제곱은 독립변수의 영향으로 인한 종속변수의 분산 비율을 나타내며 결정계수라고 합니다. 따라서 결정 계수는 한 변수의 변동성이 다른 변수의 영향으로 인해 발생(결정)되는 정도를 나타냅니다.

결정계수는 상관계수에 비해 중요한 장점이 있습니다. 상관관계는 두 변수 사이의 관계에 대한 선형 함수가 아닙니다. 따라서 여러 샘플에 대한 상관 계수의 산술 평균은 이러한 샘플의 모든 대상에 대해 즉시 계산된 상관 관계와 일치하지 않습니다(즉, 상관 계수는 가산되지 않습니다). 반대로 결정 계수는 관계를 선형적으로 반영하므로 가산적입니다. 즉, 여러 샘플에 대해 평균을 낼 수 있습니다.

추가 정보연결의 강도는 상관 계수의 제곱 값으로 표시됩니다. 즉 결정 계수는 다른 변수의 영향으로 설명할 수 있는 한 변수의 분산 부분입니다. 상관계수와 달리 결정계수는 연결 강도가 증가함에 따라 선형적으로 증가합니다.

Spearman 상관 계수 및 τ - 켄달 (순위 상관관계 )

관계가 연구되는 두 변수가 순서 척도로 표시되거나 그 중 하나가 순서 척도이고 다른 변수가 척도 척도로 표시되는 경우 순위 상관 계수가 사용됩니다: Spearman 또는 τ - 켄델라. 두 계수 모두 적용을 위해 두 변수의 예비 순위가 필요합니다.

Spearman의 순위 상관 계수는 현상 간의 관계를 통계적으로 연구하는 목적으로 사용되는 비모수적 방법입니다. 이 경우 둘 사이의 실제 병렬성 수준이 결정됩니다. 양적 시리즈연구된 특성에 대한 평가와 확립된 연결의 근접성에 대한 평가는 정량적으로 표현된 계수를 사용하여 제공됩니다.

크기 그룹의 구성원이 x 변수에서 먼저 순위가 매겨진 다음 y 변수에서 순위가 ​​매겨지면 x와 y 변수 간의 상관 관계는 두 순위 계열에 대한 Pearson 계수를 계산하여 간단히 얻을 수 있습니다. 두 변수 모두에 대해 순위 관계(즉, 반복 순위 없음)가 없는 경우 Pearson 공식은 계산적으로 크게 단순화될 수 있으며 Spearman 공식으로 알려진 것으로 변환될 수 있습니다.

Spearman 순위 상관 계수의 검정력은 모수 상관 계수의 검정력보다 다소 낮습니다.

관측치 수가 적을 때는 순위상관계수를 사용하는 것이 좋습니다. 이 방법은 정량적 데이터뿐만 아니라 기록된 값이 다양한 강도의 설명적 특징에 의해 결정되는 경우에도 사용할 수 있습니다.

Spearman의 순위 상관 계수는 다음과 같습니다. 대량하나 또는 두 비교 변수의 순위가 동일하면 거친 값이 제공됩니다. 이상적으로는 상관관계가 있는 두 계열 모두 서로 다른 값의 두 시퀀스를 나타내야 합니다.

순위에 대한 Spearman 상관관계의 대안은 τ 상관관계입니다. - 켄달. M. Kendall이 제안한 상관관계는 대상을 쌍으로 비교하여 연결 방향을 판단할 수 있다는 생각에 기반을 두고 있습니다. 즉, 대상 쌍의 x 변화가 y 변화 방향과 일치하는 경우 이는 다음을 나타냅니다. 일치하지 않으면 긍정적인 연결 - 부정적인 연결에 관한 것입니다.

상관 계수는 수치 척도(미터법 또는 순위)로 측정된 두 속성 간의 관계의 강도와 방향을 정량화하기 위해 특별히 설계되었습니다. 이미 언급한 바와 같이 연결의 최대 강도는 +1(엄격한 직접 또는 정비례 연결) 및 -1(엄격한 역비례 또는 반비례 연결)의 상관 값에 해당하며, 연결이 없으면 상관 관계가 0에 해당합니다. . 관계의 강도에 대한 추가 정보는 결정 계수에 의해 제공됩니다. 이는 다른 변수의 영향으로 설명될 수 있는 한 변수의 분산 부분입니다.

9. 데이터 비교를 위한 매개변수적 방법

변수가 미터법 규모로 측정된 경우 모수적 비교 방법이 사용됩니다.

분산 비교 2- x Fisher의 기준에 따른 샘플 .


이 방법을 사용하면 비교 표본이 추출된 두 일반 모집단의 분산이 서로 다르다는 가설을 검정할 수 있습니다. 방법의 한계 - 두 샘플의 특성 분포는 정상 분포와 다르지 않아야 합니다.

분산 비교의 대안으로 Levene 검정이 있는데, 이 검정에서는 분포의 정규성을 검정할 필요가 없습니다. 이 방법은 다양한 크기의 독립 표본에 대한 스튜던트 검정을 사용하여 평균 차이의 유의성을 확인하기 전에 분산의 동일성(동질성) 가정을 확인하는 데 사용할 수 있습니다.

심리학을 전공하는 학생(사회학자, 관리자, 관리자 등)은 종종 두 가지 또는 많은 분량하나 이상의 연구 그룹의 변수.

수학에서는 변수 수량 간의 관계를 설명하기 위해 독립 변수 X의 각 특정 값을 종속 변수 Y의 특정 값과 연관시키는 함수 F의 개념이 사용됩니다. 결과 종속성은 다음과 같이 표시됩니다. Y=F( 엑스).

동시에 측정된 특성 간의 상관 관계 유형은 다를 수 있습니다. 예를 들어 상관 관계는 선형 및 비선형, 양수 및 음수일 수 있습니다. 이는 선형입니다. 하나의 변수 X가 증가하거나 감소하면 평균적으로 두 번째 변수 Y도 증가하거나 감소합니다. 한 양의 증가에 따라 두 번째 변화의 성격이 선형이 아니고 다른 법칙에 의해 설명되는 경우 이는 비선형입니다.

변수 X가 증가하면 평균적으로 변수 Y도 증가하고 X가 증가하면 변수 Y가 평균적으로 감소하는 경향이 있으면 상관 관계는 양수입니다. 상관관계. 변수들 사이의 관계를 확립하는 것이 불가능할 수도 있습니다. 이런 경우에는 상관관계가 없다고 합니다.

상관 분석의 임무는 다양한 특성 간의 관계의 방향(양수 또는 음수)과 형태(선형, 비선형)를 설정하고 그 친밀도를 측정하며 마지막으로 얻은 상관 계수의 유의 수준을 확인하는 것입니다.

K. Spearman이 제안한 순위 상관 계수는 순위 척도에서 측정된 변수 간의 관계에 대한 비모수적 측정을 나타냅니다. 이 계수를 계산할 때 특성 분포의 성격에 대한 가정은 필요하지 않습니다. 인구. 이 계수는 순서 특성 간의 연결 근접도를 결정하며, 이 경우 비교 수량의 순위를 나타냅니다.

순위계수 선형 상관 Spearman은 다음 공식을 사용하여 계산됩니다.

여기서 n은 순위가 매겨진 특징(지표, 주제)의 수입니다.
D는 각 대상에 대한 두 변수의 순위 차이입니다.
D2는 순위 차이의 제곱의 합입니다.

Spearman 순위 상관 계수의 임계 값은 다음과 같습니다.

Spearman의 선형 상관 계수 값은 +1과 -1 범위에 있습니다. Spearman의 선형 상관 계수는 순위 척도에서 측정된 두 특성 간의 관계 방향을 나타내는 양수 또는 음수일 수 있습니다.

모듈러스의 상관 계수가 1에 가까운 것으로 판명되면 이는 다음과 같습니다. 높은 레벨변수 사이의 연결. 따라서 특히 변수가 자신과 상관관계가 있는 경우 상관계수 값은 +1이 됩니다. 이러한 관계는 직접적으로 비례하는 의존성을 특징으로 합니다. X 변수의 값을 오름차순으로 정렬하고 동일한 값(현재 Y 변수로 지정됨)을 내림차순으로 정렬하면 이 경우 X 변수와 Y 변수 간의 상관관계는 정확히 다음과 같습니다. -1. 이 상관 계수 값은 반비례 관계를 나타냅니다.

상관계수의 부호는 결과 관계를 해석하는 데 매우 중요합니다. 선형 상관 계수의 부호가 플러스인 경우 상관 특성 간의 관계는 한 특성(변수)의 더 큰 값이 다른 특성(다른 변수)의 더 큰 값에 해당하는 것과 같습니다. 즉, 하나의 지표(변수)가 증가하면 다른 지표(변수)도 그에 따라 증가합니다. 이러한 의존성을 정비례 의존성이라고 합니다.

마이너스 기호가 수신되면 한 특성의 더 큰 값이 다른 특성의 더 작은 값에 해당합니다. 즉, 마이너스 기호가 있으면 한 변수(부호, 값)가 증가하면 다른 변수는 감소하는 것입니다. 이러한 의존성을 반비례 의존성이라고 합니다. 이 경우 증가의 성격(경향)을 부여하는 변수의 선택은 임의적이다. 변수 X 또는 변수 Y일 수 있습니다. 그러나 변수 X가 증가하는 것으로 간주되면 변수 Y는 그에 따라 감소하고 그 반대도 마찬가지입니다.

Spearman 상관관계의 예를 살펴보겠습니다.

심리학자는 11명의 1학년 학생 중 학교가 시작하기 전에 얻은 개별 학교 준비 지표가 서로 어떻게 관련되어 있는지, 그리고 학년 말 평균 성적이 어떻게 연관되어 있는지 알아냅니다.

이 문제를 해결하기 위해 먼저 지표의 값을 순위로 매겼습니다. 학교 준비둘째, 동일한 학생들의 평균적으로 연말에 최종 성과 지표를 받습니다. 결과를 표에 제시합니다.

얻은 데이터를 위의 공식에 대입하고 계산을 수행합니다. 우리는 다음을 얻습니다:

유의성 수준을 찾기 위해 계수에 대한 임계값을 보여주는 "Spearman 순위 상관 계수의 임계값" 표를 참조합니다. 순위 상관.

우리는 상응하는 "의미의 축"을 구성합니다:

결과 상관계수는 유의수준 1%에 대한 임계값과 일치했습니다. 결과적으로 취학준비도 지표와 1학년 최종 성적은 양의 상관관계에 의해 연결되어 있다고 할 수 있다. 즉, 취학준비도 지표가 높을수록 1학년 학업 성적이 더 좋다는 것이다. 통계적 가설의 관점에서 심리학자는 유사성에 대한 귀무가설(H0)을 기각하고 차이의 대안(H1)을 받아들여야 합니다. 이는 학교 준비 지표와 평균 학업 성취도 간의 관계가 0과 다르다는 것을 의미합니다.

스피어먼 상관관계. 상관관계 분석 Spearman 방법에 따르면. 스피어맨 순위. 스피어만 상관계수. 스피어맨 순위 상관관계

순위 상관 계수 할당

Spearman 순위 상관 방법을 사용하면 두 요소 간의 상관 관계의 친밀도(강도)와 방향을 결정할 수 있습니다. 두 개의 표지판또는 두 개의 프로필(계층)표지판.

방법 설명

순위 상관관계를 계산하려면 순위를 매길 수 있는 두 행의 값이 필요합니다. 이러한 일련의 값은 다음과 같습니다.

1) 두 개의 표지판동일한 피험자 그룹에서 측정되었습니다.

2) 두 가지 개별 특성 계층,동일한 특성 세트에 따라 두 주제에서 식별됩니다(예: R. B. Cattell의 16요인 설문지에 따른 성격 프로필, R. Rokeach의 방법에 따른 가치 계층, 여러 대안 중에서 선택할 때 선호하는 순서 등) ;

3) 특성의 두 그룹 계층;

4) 개인 및 그룹기능의 계층 구조.

첫째, 지표는 각 특성에 대해 별도로 순위가 매겨집니다. 일반적으로 낮은 속성 값에는 낮은 순위가 할당됩니다.

사례 1(두 개의 기호)을 고려해 보겠습니다.여기에서는 서로 다른 피험자가 얻은 첫 번째 특성에 대한 개별 값의 순위가 매겨지고, 그런 다음 두 번째 특성에 대한 개별 값이 순위가 매겨집니다.

두 특성이 긍정적인 관련이 있는 경우, 그 중 하나의 순위가 낮은 대상은 다른 특성의 순위도 낮고, 특성 중 하나의 순위가 높은 대상은 다른 특성에서도 높은 순위를 갖습니다. 계산하기 아르 자형 에스 두 가지 특성에 대해 주어진 피험자가 얻은 순위 간의 차이(d)를 결정하는 것이 필요합니다. 그런 다음 이러한 지표 d는 특정 방식으로 변환되어 1에서 뺍니다. 순위 간의 차이가 작을수록 r s가 커질수록 +1에 가까워집니다.

상관관계가 없으면 모든 순위가 혼합되어 순위 간에 대응이 없게 됩니다. 이 경우 공식은 다음과 같이 설계되었습니다. 아르 자형 에스, 0에 가깝습니다.

음의 상관관계가 있는 경우 한 속성의 낮은 순위가 다른 속성의 높은 순위에 해당하고 그 반대의 경우도 마찬가지입니다.

두 변수에 대한 피험자의 순위 간의 불일치가 클수록 r s는 -1에 가까워집니다.

사례 2(두 개의 개별 프로필)를 고려해 보겠습니다.여기서 두 피험자 각각이 얻은 개별 값은 특정(두 피험자 모두 동일) 특성 세트에 따라 순위가 매겨집니다. 첫 번째 순위는 가장 낮은 값을 가진 기능에 부여됩니다. 두 번째 순위는 더 높은 값을 갖는 특성입니다. 분명히 모든 특성은 동일한 단위로 측정되어야 하며 그렇지 않으면 순위를 매기는 것이 불가능합니다. 예를 들어, Cattell Personality Inventory(16)에서는 지표 순위를 매기는 것이 불가능합니다. PF), 값의 범위가 0에서 13, 0에서 20, 0에서 26까지 다양한 요소에 따라 다르기 때문에 "원시"포인트로 표현되는 경우 어떤 요소가 첫 번째 위치를 차지할지 말할 수 없습니다. 심각도 조건은 모든 값을 단일 척도로 가져오지 않을 것입니다(대부분 벽 규모입니다).

두 개체의 개별 계층이 긍정적으로 관련되어 있는 경우 그 중 하나의 순위가 낮은 기능은 다른 항목의 순위도 낮고 그 반대의 경우도 마찬가지입니다. 예를 들어, 한 개체의 요인 E(지배력)가 가장 낮은 순위를 가지면 다른 개체의 요인도 낮은 순위를 가져야 하며, 한 개체의 요인 C(정서적 안정성)가 가장 높은 순위를 가지면 다른 개체의 요인은 높은 순위를 가져야 합니다. 이 요소 순위 등

사례 3(두 개의 그룹 프로필)을 고려해 보겠습니다.여기서 두 그룹의 피험자에서 얻은 평균 그룹 값은 두 그룹에 대해 동일한 특정 특성 세트에 따라 순위가 지정됩니다. 다음의 추론 노선은 이전 두 사례와 동일합니다.

사례 4(개인 및 그룹 프로필)를 고려해 보겠습니다.여기서 피험자의 개별 값과 그룹 평균값은 동일한 특성 세트에 따라 별도로 순위가 매겨지며 원칙적으로이 개별 피험자를 제외하여 얻어지며 그룹 평균에 참여하지 않습니다. 그의 개인 프로필과 비교할 프로필입니다. 순위 상관 관계는 개인 및 그룹 프로필이 얼마나 일관성이 있는지 테스트합니다.

네 가지 경우 모두 결과 상관 계수의 유의성은 순위가 매겨진 값의 수에 따라 결정됩니다. N.첫 번째 경우 이 숫자는 샘플 크기 n과 일치하며, 두 번째 경우 관측치 수는 계층 구조를 구성하는 기능의 수입니다. 세 번째와 네 번째 경우에는 N-이는 또한 비교되는 기능의 수이지 그룹 내 피험자의 수가 아닙니다. 자세한 설명은 예제에 나와 있습니다.

rs 의 절대값이 임계값에 도달하거나 초과하면 상관관계가 신뢰할 수 있습니다.

가설

두 가지 가능한 가설이 있습니다. 첫 번째는 사례 1에 적용되고 두 번째는 나머지 세 가지 경우에 적용됩니다.

가설의 첫 번째 버전

H 0: 변수 A와 B 사이의 상관관계가 0과 다르지 않습니다.

H 1: 변수 A와 B 사이의 상관관계가 0과 크게 다릅니다.

가설의 두 번째 버전

H 0: 계층 A와 B 간의 상관 관계는 0과 다르지 않습니다.

H1: 계층 A와 B 사이의 상관 관계는 0과 상당히 다릅니다.

순위 상관 방법의 그래픽 표현

대부분의 경우 상관 관계는 점 구름 형태 또는 두 축, 즉 특징 A의 축과 특징 B의 공간에 점을 배치하는 일반적인 경향을 반영하는 선 형태로 그래픽으로 표시됩니다(그림 6.2 참조). ).

선으로 쌍으로 연결된 두 행의 순위 값 형태로 순위 상관 관계를 묘사해 보겠습니다(그림 6.3). 특성 A와 특성 B의 순위가 일치하면 둘 사이에 수평선이 생기고, 순위가 일치하지 않으면 선이 기울어집니다. 순위 간의 차이가 클수록 선이 더 기울어집니다. 그림의 왼쪽에 있습니다. 그림 6.3은 가능한 가장 높은 양의 상관관계(r =+1.0)를 보여줍니다. 실제로 이는 "사다리"입니다. 중앙에는 상관 관계가 없습니다. 불규칙한 직조가있는 브레이드입니다. 여기에는 모든 순위가 섞여 있습니다. 오른쪽에는 가장 높은 음의 상관관계(rs = -1.0)가 있습니다. 즉, 규칙적으로 선이 얽혀 있는 웹입니다.

쌀. 6.3. 순위 상관 관계의 그래픽 표현:

a) 높은 양의 상관관계;

b) 상관관계 없음;

c) 높은 음의 상관관계

제한순위계수상관관계

1. 각 변수에 대해 최소 5개의 관측치가 제시되어야 합니다. 샘플의 상한은 사용 가능한 임계 값 표 (표 XVI 부록 1)에 의해 결정됩니다. 즉 N40.

2. 하나 또는 두 비교 변수에 대해 다수의 동일한 순위가 있는 Spearman의 순위 상관 계수 rs는 대략적인 값을 제공합니다. 이상적으로는 두 상관 계열이 서로 다른 값의 두 시퀀스를 나타내야 합니다. 이 조건이 충족되지 않으면 동등한 순위에 대한 조정이 필요합니다. 해당 공식은 예제 4에 나와 있습니다.

예시 1 - 상관관계둘 사이표지판

항공 교통 관제사(Oderyshev B.S., Shamova E.P., Sidorenko E.V., Larchenko N.N., 1978)의 활동을 시뮬레이션하는 연구에서 레닌그라드 주립 대학 물리학부 학생들은 작업을 시작하기 전에 훈련을 받았습니다. 모의 실험 장치. 피험자들은 주어진 유형의 항공기에 대한 최적의 활주로 유형을 선택하는 문제를 해결해야 했습니다. D. Wechsler의 방법을 사용하여 측정된 언어적 및 비언어적 지능 지표와 관련된 교육 세션에서 피험자가 범하는 오류 수가 있습니까?

표 6.1

훈련 세션의 오류 수에 대한 지표와 물리학 학생(N=10)의 언어 및 비언어적 지능 수준에 대한 지표

주제

실수 횟수

언어 지능 지수

비언어적 지능 지수

먼저, 오류 횟수 지표와 언어 지능이 관련되어 있는지에 대한 질문에 답해 보겠습니다.

가설을 세우자.

H 0: 훈련 세션의 오류 수와 언어 지능 수준 간의 상관 관계는 0과 다르지 않습니다.

H 1 : 훈련 세션의 오류 수와 언어 지능 수준 간의 상관 관계는 통계적으로 0과 크게 다릅니다.

다음으로, 더 작은 값에 더 낮은 순위를 할당하여 두 지표의 순위를 매긴 다음, 두 변수(속성)에 대해 각 피험자가 받은 순위 간의 차이를 계산하고 이러한 차이를 제곱해야 합니다. 표에서 필요한 모든 계산을 해보자.

표에서. 6.2 왼쪽의 첫 번째 열에는 오류 수에 대한 값이 표시됩니다. 다음 열에는 순위가 표시됩니다. 왼쪽에서 세 번째 열은 언어 지능 점수를 보여줍니다. 다음 열에는 순위가 표시됩니다. 왼쪽에서 다섯 번째는 차이점을 나타냅니다. 변수 A(오류 수)와 변수 B(언어 지능)의 순위 사이입니다. 마지막 열은 차이의 제곱을 나타냅니다. 2 .

표 6.2

계산 2 물리학과 학생(N=10)의 오류 수와 언어 지능 지표를 비교할 때 Spearman의 순위 상관 계수 r s 에 대해

주제

변수 A

실수의 수

변수 B

언어지능.

(랭크 A -

제이 2

개인

가치

개인

가치

Spearman의 순위 상관 계수는 다음 공식을 사용하여 계산됩니다.

어디 - 각 과목에 대한 두 변수의 순위 차이;

N-순위가 매겨진 값의 수, c. 이 경우에는 과목 수입니다.

rs의 경험적 값을 계산해 보겠습니다.

얻은 r s의 경험적 값은 0에 가깝습니다. 그럼에도 불구하고 우리는 표에 따라 N = 10에서 r s의 임계 값을 결정합니다. XVI 부록 1:

답변: H 0이 허용됩니다. 훈련 세션의 오류 수와 언어 지능 수준 간의 상관 관계는 0과 다르지 않습니다.

이제 오류 수 지표와 비언어적 지능이 관련되어 있는지에 대한 질문에 답해 보겠습니다.

가설을 세우자.

H 0: 훈련 세션의 오류 수와 비언어적 지능 수준 간의 상관 관계는 0과 다르지 않습니다.

H 1: 훈련 세션의 오류 수와 비언어적 지능 수준 간의 상관 관계는 통계적으로 0과 크게 다릅니다.

순위 및 순위 비교 결과는 표에 나와 있습니다. 6.3.

표 6.3

계산 2 물리학과 학생(N=10)의 오류 수와 비언어적 지능 지표를 비교할 때 Spearman의 순위 상관 계수 r s 에 대해

주제

변수 A

실수의 수

변수 E

비언어적 지능

(랭크 A -

2

개인

개인

가치

가치

r s의 중요성을 결정하려면 그것이 양수인지 음수인지는 중요하지 않으며 단지 절대값만 중요하다는 것을 기억합니다. 이 경우:

응 답이야

답변: H 0이 허용됩니다. 훈련 세션의 오류 수와 비언어적 지능 수준 간의 상관 관계는 무작위이며, rs는 0과 다르지 않습니다.

그러나 우리는 특정 추세에 주목할 수 있습니다. 부정적인이 두 변수 사이의 관계. 표본 크기를 늘리면 통계적으로 유의미한 수준으로 이를 확인할 수 있을 것입니다.

예시 2 - 개별 프로필 간의 상관관계

가치 방향 전환 문제에 관한 연구에서 부모와 성인 자녀 사이에서 M. Rokeach의 방법에 따라 최종 가치의 계층이 확인되었습니다 (Sidorenko E.V., 1996). 모녀 쌍(어머니 - 66세, 딸 - 42세)을 검사하는 동안 얻은 최종 값의 순위가 표에 나와 있습니다. 6.4. 이러한 가치 계층이 서로 어떻게 연관되어 있는지 확인해 보겠습니다.

표 6.4

어머니와 딸의 개별 계층에서 M. Rokeach의 목록에 따른 최종 가치 순위

터미널 값

가치 순위

가치 순위

2

어머니의 계층

딸의 계층

1 활동적인 활동적인 생활

2 생활의 지혜

3 건강

4 흥미로운 작품

5 자연과 예술의 아름다움

7 경제적으로 안정된 삶

8 선하고 충성스러운 친구를 갖는 것

9 대중의 인정

10 인지

11 생산적인 삶

12 개발

13 엔터테인먼트

14 자유

15 행복한 가정생활

16 타인의 행복

17 창의성

18 자신감

가설을 세우자.

H 0: 어머니와 딸 최종 가치 계층 간의 상관 관계는 0과 다르지 않습니다.

H 1: 어머니와 딸 최종 가치 계층 간의 상관 관계는 통계적으로 0과 크게 다릅니다.

값의 순위는 연구 절차 자체에서 가정되므로 두 계층의 18개 값 순위 간의 차이만 계산할 수 있습니다. 표의 3번째와 4번째 열에 있습니다. 6.4는 차이점을 제시합니다. 그리고 이 차이의 제곱은 2 .

다음 공식을 사용하여 rs의 경험적 값을 결정합니다.

어디 - 각 변수에 대한 순위 간의 차이(이 경우에는 각 최종 값에 대한)

N- 계층 구조를 형성하는 변수의 수(이 경우 값의 수)입니다.

이 예의 경우:

표에 따르면. XVI 부록 1은 중요한 값을 결정합니다.

답변: H 0은 거부됩니다. H 1이 허용됩니다. 엄마와 딸의 최종 가치 계층 간의 상관 관계는 통계적으로 유의미합니다(p<0,01) и является положительной.

표에 따르면. 6.4 우리는 "행복한 가정 생활", "대중의 인정", "건강"이라는 가치에서 주요 차이점이 발생하고 다른 가치의 순위는 매우 유사하다는 것을 알 수 있습니다.

예시 3 - 두 그룹 계층 간의 상관관계

Joseph Wolpe는 그의 아들과 공동으로 쓴 책(Wolpe J., Wolpe D., 1981)에서 현대인에게 나타나는 가장 흔한 "쓸모없는" 두려움의 순서화된 목록을 제공합니다. 의미를 알리고 완전한 삶과 행동을 방해할 뿐입니다. M.E.가 실시한 국내 연구에서. Rakhova(1994) 32명의 피험자는 Wolpe의 목록에 있는 이러한 유형의 두려움이 자신에게 얼마나 관련성이 있는지 10점 척도로 평가해야 했습니다 3 . 조사 대상 표본은 상트페테르부르크 수문기상학 및 교육학 연구소의 학생들로 구성되었습니다. 남학생 15명, 여학생 17명(17~28세, 평균 연령 23세).

10점 척도로 얻은 데이터는 32명의 피험자를 대상으로 평균을 내고 그 평균값을 순위로 매겼다. 표에서. 표 6.5는 J. Volpe와 M. E. Rakhova가 얻은 순위 지표를 나타냅니다. 20가지 공포 유형의 순위 순서가 일치합니까?

가설을 세우자.

H 0: 미국 표본과 국내 표본의 공포 유형 목록 간의 상관관계는 0과 다르지 않습니다.

H 1: 미국과 국내 표본의 공포 유형 목록 간의 상관관계는 통계적으로 0과 크게 다릅니다.

두 샘플에서 서로 다른 유형의 공포 순위 간의 차이를 계산하고 제곱하는 것과 관련된 모든 계산이 표에 나와 있습니다. 6.5.

표 6.5

계산 미국 및 국내 표본의 공포 유형 순서 목록을 비교할 때 Spearman 순위 상관 계수

두려움의 유형

미국 표본 순위

러시아어 순위

대중 연설에 대한 두려움

비행 공포증

실수하는 것에 대한 두려움

실패에 대한 두려움

비승인에 대한 두려움

거절에 대한 두려움

악한 사람들에 대한 두려움

외로움에 대한 두려움

피에 대한 두려움

열린 상처에 대한 두려움

치과의사에 대한 두려움

주사에 대한 두려움

시험을 보는 것에 대한 두려움

경찰에 대한 두려움 ^민병대)

고소공포증

개에 대한 두려움

거미에 대한 두려움

불구가 된 사람들에 대한 두려움

병원에 대한 두려움

어둠에 대한 두려움

우리는 rs의 경험적 값을 결정합니다.

표에 따르면. XVI 부록 1에서는 N=20에서 gs의 임계 값을 결정합니다.

답변: H 0이 허용됩니다. 미국과 국내 표본의 공포 유형 순서 목록 간의 상관 관계는 통계적 유의 수준에 도달하지 않습니다. 즉, 0과 크게 다르지 않습니다.

예시 4 - 개인 평균 프로필과 그룹 평균 프로필 간의 상관관계

20~78세의 상트페테르부르크 주민 표본(남성 31명, 여성 46명)에게 55세 이상의 인구가 50%를 차지하도록 연령 균형을 맞추면서 다음 질문에 답하도록 요청했습니다. "상트페테르부르크 시의회 의원에게 요구되는 자질은 어느 정도 수준입니까?" (Sidorenko E.V., Dermanova I.B., Anisimova O.M., Vitenberg E.V., Shulga A.P., 1994). 평가는 10점 척도로 이루어졌습니다. 이와 병행하여 상트페테르부르크 시의회 의원 및 의원 후보자(n=14) 표본을 조사했습니다. 정치인과 후보자에 대한 개별 진단은 유권자 표본에게 제시된 것과 동일한 개인 특성 세트를 사용하여 Oxford Express 비디오 진단 시스템을 사용하여 수행되었습니다.

표에서. 6.6은 각 품질에 대해 얻은 평균값을 보여줍니다. V유권자 샘플 ( "참조 시리즈") 및 시의회 의원 중 한 사람의 개별 가치.

K-va 대리인의 개인 프로필이 참조 프로필과 얼마나 상관관계가 있는지 확인해 보겠습니다.

표 6.6

익스프레스 비디오 진단의 18가지 개인 특성에 대한 유권자(n=77) 및 K-va 대리인의 개별 지표에 대한 평균 참조 평가

품질 이름

평균 벤치마크 유권자 점수

K-va 대리인의 개별 지표

1. 문화의 전반적인 수준

2. 학습능력

4. 새로운 것을 창조하는 능력

5.. 자기비판

6. 책임

7. 독립

8. 에너지, 활동

9. 결의

10. 자제력, 자제력

I. 지속성

12. 개인적 성숙

13. 품위

14. 인본주의

15. 사람들과 소통하는 능력

16. 다른 사람의 의견에 대한 관용

17. 행동의 유연성

18. 호감을 주는 능력

표 6.7

계산 2 대리인의 개인 자질에 대한 참조 프로필과 개인 프로필 간의 Spearman 순위 상관 계수

품질 이름

참조 프로필의 품질 순위

2행: 개별 프로필의 품질 순위

2

1 책임

2 품위

3 사람들과의 의사소통 능력

4 자제력, 자제력

5 문화의 일반적인 수준

6 에너지, 활동

8 자기비판

9 독립

10 개인적 성숙

그리고 결단력

12 학습능력

13 휴머니즘

14 다른 사람의 의견에 대한 관용

15 인내

16 행동의 유연성

17 호감을 주는 능력

18 새로운 것을 창조하는 능력

표에서 볼 수 있듯이. 6.6, 유권자의 평가와 개별 대리인 지표는 범위에 따라 다릅니다. 실제로 유권자의 평가는 10점 만점으로 이루어졌고, 고속영상진단에 대한 개별 지표는 20점 만점으로 측정됐다. 순위를 사용하면 두 측정 척도를 단일 척도로 변환할 수 있습니다. 여기서 측정 단위는 1순위이고 최대값은 18순위입니다.

우리가 기억하는 것처럼 순위는 값의 각 행에 대해 별도로 수행되어야 합니다. 이 경우 중요도(유권자) 또는 심각도(대리인) 측면에서 특정 품질의 순위를 즉시 확인할 수 있도록 낮은 순위를 높은 값에 할당하는 것이 좋습니다.

순위 결과는 표에 나와 있습니다. 6.7. 품질은 참조 프로필을 반영하는 순서로 나열됩니다.

가설을 세우자.

H 0: K-va 대리인의 개인 프로필과 유권자 평가에 따라 구성된 참조 프로필 간의 상관 관계는 0과 다르지 않습니다.

H 1: K-va 대리인의 개인 프로필과 유권자 평가에 따라 구성된 참조 프로필 간의 상관 관계는 통계적으로 0과 크게 다릅니다. 두 비교 순위 시리즈에는 모두

순위 계수를 계산하기 전의 동일한 순위 그룹

동일한 순위의 T a 에 대해 상관 관계를 수정해야 합니다. :

어디 ㅏ -랭크 행 A에서 동일한 랭크의 각 그룹의 볼륨,

- 순위 시리즈 B에서 동일한 순위의 각 그룹의 볼륨.

이 경우 A행(참조 프로필)에는 동일한 순위의 그룹이 하나 있습니다. "학습 능력"과 "인본주의" 특성은 동일한 순위 12.5를 갖습니다. 따라서, =2.

T a =(2 3 -2)/12=0.50.

B행(개인 프로필)에는 동일한 순위의 두 그룹이 있고, 1 =2 그리고 2 =2.

T a =[(2 3 -2)+(2 3 -2)]/12=1.00

경험적 값 r s를 계산하기 위해 다음 공식을 사용합니다.

이 경우:

동일한 순위에 대한 수정을 수행하지 않았다면 r s 값은 (0.0002)만 더 높았을 것입니다.

동일한 순위가 많으면 r 5의 변화가 훨씬 더 커질 수 있습니다. 동일한 순위가 존재한다는 것은 정렬된 변수의 분화 정도가 낮다는 것을 의미하며, 따라서 이들 사이의 연결 정도를 평가할 기회가 적다는 것을 의미합니다(Sukhodolsky G.V., 1972, p. 76).

표에 따르면. XVI 부록 1에서는 N = 18에서 r의 임계 값을 결정합니다.

답변:본사가 거부되었습니다. K-va 대리인의 개인 프로필과 유권자의 요구 사항을 충족하는 참조 프로필 간의 상관 관계는 통계적으로 유의미합니다(p<0,05) и является положи­тельной.

테이블에서. 6.7 K-v 대리인은 선거 기준에 규정된 것보다 사람들과의 의사소통 능력 척도에서 더 낮은 순위를 갖고 있으며 결단력 및 지속성 척도에서는 더 높은 순위를 갖고 있음이 분명합니다. 이러한 불일치는 주로 획득된 rs의 약간의 감소를 설명합니다.

r s를 계산하기 위한 일반적인 알고리즘을 공식화해 보겠습니다.

실제로 Spearman 순위 상관 계수(P)는 두 특성 간의 관계의 근접성을 결정하는 데 자주 사용됩니다. 각 특성의 값은 증가 정도(1에서 n까지)에 따라 순위가 매겨진 다음 하나의 관찰에 해당하는 순위 간의 차이(d)가 결정됩니다.

예 1. 2003년 러시아연방 연방지구 중 10개 지역의 산업생산량과 고정자본 투자 간의 관계는 다음과 같은 데이터로 특징지어집니다.
계산하다 Spearman 순위 상관 계수그리고 켄달. α=0.05에서 유의성을 확인합니다. 고려 중인 러시아 연방 지역의 산업 생산량과 고정 자본 투자 간의 관계에 대한 결론을 공식화합니다.

특징 Y와 요인 X에 순위를 할당해 보겠습니다. 제곱 d 2의 차이의 합을 구해 봅시다.
계산기를 사용하여 Spearman 순위 상관 계수를 계산합니다.

엑스 와이 랭크 X, d x 순위 Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

특성 Y와 요인 X 사이의 연결은 강력하고 직접적입니다.

Spearman의 순위 상관 계수 추정



Student 테이블을 사용하여 Ttable을 찾습니다.
T 테이블 = (18;0.05) = 1.734
Tob > Ttabl이므로 순위 상관 계수가 0이라는 가설을 기각합니다. 즉, Spearman의 순위 상관계수는 통계적으로 유의미합니다.

순위 상관 계수에 대한 구간 추정(신뢰 구간)
신뢰 구간 Spearman의 순위 상관 계수: p(0.5431;0.9095).

예 2. 초기 데이터.

5 4
3 4
1 3
3 1
6 6
2 2
행렬에는 첫 번째 행의 관련 순위(동일한 순위 번호)가 포함되어 있으므로 이를 재정렬하겠습니다. 순위의 재편성은 순위의 중요도를 변경하지 않고 진행되는데, 즉 순위 번호 간에는 해당 관계(이상, 이하, 같음)가 유지되어야 한다. 또한 순위를 1보다 크고 매개변수 수와 동일한 값(이 경우 n = 6)으로 설정하는 것은 권장되지 않습니다. 순위 재구성은 표에서 수행됩니다.
새로운 순위
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
행렬에는 두 번째 행의 순위가 연관되어 있으므로 이를 다시 포맷하겠습니다. 순위 재구성은 표에서 수행됩니다.
정렬된 행의 좌석 번호전문가 평가에 따른 요소 배열새로운 순위
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
순위 행렬.
랭크 X, d x순위 Y, d y(d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
특성 x와 y의 값 중에는 동일한 특성이 여러 개 있으므로, 즉 연관된 순위가 형성되면 이 경우 Spearman 계수는 다음과 같이 계산됩니다.

어디


j - 특성 x에 따른 연결 수;
그리고 j는 x의 j번째 연결사에서 동일한 순위의 수입니다.
k - 특성 y에 대한 순서대로의 연결 수;
k에서 - y의 k번째 연결에서 동일한 순위의 수입니다.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

특성 Y와 요인 X 사이의 관계는 중간 정도이고 직접적입니다.

37. Spearman의 순위 상관 계수.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearman의 순위 상관 계수는 다음과 같은 경우에 사용됩니다.
- 변수가 있습니다 순위 척도측정;
- 데이터 분포가 너무 다릅니다. 정상아니면 전혀 알려지지 않았거나;
- 샘플의 부피가 작습니다(N< 30).

Spearman 순위 상관 계수의 해석은 Pearson 계수와 다르지 않지만 그 의미는 다소 다릅니다. 이러한 방법의 차이점을 이해하고 해당 적용 영역을 논리적으로 정당화하기 위해 해당 공식을 비교해 보겠습니다.

피어슨 상관 계수:

Spearman 상관 계수:

보시다시피 공식은 크게 다릅니다. 공식을 비교해 보자

Pearson 상관 공식은 상관 계열의 산술 평균과 표준 편차를 사용하지만 Spearman 공식은 사용하지 않습니다. 따라서 Pearson 공식을 사용하여 적절한 결과를 얻으려면 상관 계열이 정규 분포에 가까워야 합니다(평균과 표준 편차는 다음과 같습니다). 정규분포 모수). 이는 Spearman 공식과 관련이 없습니다.

Pearson 공식의 요소는 각 계열의 표준화입니다. z 스케일.

보시다시피, 변수를 Z 척도로 변환하는 것은 Pearson 상관 계수 공식에 있습니다. 따라서 Pearson 계수의 경우 데이터 규모는 전혀 중요하지 않습니다. 예를 들어 두 변수를 연관시킬 수 있으며 그 중 하나는 최소값을 갖습니다. = 0 및 최대 = 1, 두 번째 분. = 100 및 최대 = 1000. 값의 범위가 아무리 달라도 모두 척도가 동일한 표준 z 값으로 변환됩니다.

이러한 정규화는 Spearman 계수에서는 발생하지 않으므로

SPEARMAN 계수를 사용하기 위한 필수 조건은 두 변수의 범위가 동일하다는 것입니다.

범위가 다른 데이터 계열에 대해 Spearman 계수를 사용하기 전에 다음이 필요합니다. 계급. 동일한 최소값 = 1(최소 순위) 및 값의 수와 동일한 최대값(최대값, 마지막 순위 = N, 즉 표본의 최대 사례 수)을 획득하는 이러한 계열의 값에 대한 순위 지정 결과 .

어떤 경우에 순위를 매기지 않고 할 수 있나요?

데이터가 처음에 생성되는 경우입니다. 순위 척도. 예를 들어 Rokeach의 가치 지향 테스트가 있습니다.

또한 값 옵션 수가 적고 샘플에 고정된 최소값과 최대값이 포함되어 있는 경우도 있습니다. 예를 들어 의미 차이에서는 최소값 = 1, 최대값 = 7입니다.

Spearman의 순위 상관 계수 계산 예

Rokeach의 가치 지향 테스트는 두 개의 샘플 X와 Y에 대해 수행되었습니다. 목표: 이 샘플의 값 계층이 얼마나 가까운지(문자 그대로 얼마나 유사한지) 알아내는 것입니다.

결과 값 r=0.747은 다음과 같이 확인됩니다. 임계값 표. 표에 따르면 N=18인 경우 얻은 값은 p 수준에서 유의미합니다.<=0,005

Spearman 및 Kendal 순위 상관 계수

순서척도에 속하는 변수나 정규분포를 따르지 않는 변수, 구간척도에 속하는 변수에 대해서는 Pearson 계수 대신 Spearman 순위 상관관계가 계산됩니다. 이를 위해 개별 변수 값에 순위가 할당되고 이후에 적절한 수식을 사용하여 처리됩니다. 순위 상관관계를 탐지하려면 이변량 상관관계... 대화 상자에서 기본 Pearson 상관관계 확인란을 선택 취소하세요. 대신 Spearman 상관 계산을 활성화하십시오. 이 계산은 다음과 같은 결과를 제공합니다. 순위 상관 계수는 Pearson 계수의 해당 값과 매우 가깝습니다(원래 변수는 정규 분포를 가짐).

titkova-matmetody.pdf p. 45

Spearman의 순위 상관 방법을 사용하면 견고성(강도)과 방향을 결정할 수 있습니다.

사이의 상관관계 두 개의 표지판또는 두 개의 프로필(계층)표지판.

순위 상관관계를 계산하려면 두 행의 값이 필요합니다.

순위를 매길 수 있는 것입니다. 이러한 일련의 값은 다음과 같습니다.

1) 두 개의 표지판동일하게 측정 그룹과목;

2) 두 가지 개별 특성 계층,동일한 항목을 사용하여 두 개체에서 식별됨

기능 세트;

3) 둘 특성의 그룹 계층 구조,

4) 개인 및 그룹기능의 계층 구조.

첫째, 지표는 각 특성에 대해 별도로 순위가 매겨집니다.

일반적으로 낮은 속성 값에는 낮은 순위가 할당됩니다.

첫 번째 경우(두 가지 특성)에는 첫 번째에 따라 개별 값의 순위가 지정됩니다.

다른 과목에서 얻은 특성, 그리고 두 번째에 대한 개별 값

징후.

두 특성이 긍정적으로 관련되어 있으면 순위가 낮은 개체

그 중 한 사람은 다른 사람의 순위가 낮을 것이고, 다른 사람의 순위가 높은 피험자는

특성 중 하나는 다른 특성에 대해서도 높은 순위를 갖습니다. RS를 계산하려면

차이점을 결정해야합니다 (디)두 과목 모두에서 주어진 과목에 의해 획득된 순위 사이

표지판. 그런 다음 이러한 지표 d는 특정 방식으로 변환되어 1에서 뺍니다.

순위 간의 차이가 작을수록 rs가 커질수록 +1에 가까워집니다.

상관관계가 없으면 모든 순위가 혼합되어 순위가 나오지 않습니다.

서신이 없습니다. 이 경우 rs가 0에 가까워지도록 공식이 설계되었습니다.

음의 상관관계가 있는 경우한 가지 기준으로 낮은 순위의 과목

다른 기준으로 높은 순위가 일치하며 그 반대도 마찬가지입니다. 불일치가 클수록

두 변수에 대한 피험자 순위 사이에서 rs는 -1에 더 가깝습니다.

두 번째 경우(두 개의 개별 프로필), 개별 항목의 순위가 매겨집니다.

특정에 따라 두 과목 각각이 얻은 값(그들에게도 동일함)

둘 다) 기능 세트. 첫 번째 순위는 가장 낮은 값을 가진 기능에 부여됩니다. 두 번째 순위 –

더 높은 가치를 지닌 기호 등 분명히 모든 특성은 다음과 같이 측정되어야 합니다.

동일한 단위가 아니면 순위 지정이 불가능합니다. 예를 들면 불가능하다

Cattell Personality Inventory(16PF)에서 지표가 다음과 같이 표현된 경우 순위를 매깁니다.

값의 범위는 0에서 13까지, 0에서 13까지 다양한 요소에 따라 다르기 때문에 "원시"포인트입니다.

20 및 0부터 26까지. 어떤 요소가 1위를 차지할지 말할 수 없습니다.

모든 값을 단일 스케일로 가져올 때까지 표현합니다(대부분 벽 스케일입니다).

두 피험자의 개별 계층이 긍정적으로 관련되어 있으면 징후는 다음과 같습니다.

그 중 하나의 순위가 낮으면 다른 하나의 순위도 낮고 그 반대도 마찬가지입니다.

예를 들어, 한 대상의 요인 E(지배력)가 가장 낮은 순위를 갖는 경우

다른 테스트 대상, 한 테스트 대상이 요인 C를 가지고 있으면 낮은 순위를 가져야 합니다.

(정서적 안정)이 가장 높은 순위를 가지며, 다른 과목도 반드시 가져야 합니다.

이 요소는 순위가 높습니다.

세 번째 경우(2개의 그룹 프로필)에는 그룹 평균값을 순위로 매기고,

특정 세트에 따라 두 그룹의 피험자에서 얻었으며 두 그룹 모두 동일합니다.

표지판. 다음의 추론 노선은 이전 두 사례와 동일합니다.

사례 4(개인 및 그룹 프로필)의 경우 별도로 순위가 매겨집니다.

동일한 세트에 대한 주제 및 그룹 평균 값의 개별 값

원칙적으로 이 개별 주제를 제외하여 얻은 표시 - 그는

자신의 개인 프로필과 비교되는 평균 그룹 프로필에 참여하지 않습니다.

프로필. 순위 상관관계를 통해 개인과 개인이 얼마나 일관성이 있는지 확인할 수 있습니다.

그룹 프로필.

네 가지 경우 모두 결과 상관 계수의 유의성이 결정됩니다.

순위가 매겨진 값의 수에 따라 N.첫 번째 경우, 이 수량은 다음과 일치합니다.

표본 크기 n. 두 번째 경우에는 관측치 수가 특징의 수가 됩니다.

계층 구조를 구성합니다. 세 번째와 네 번째 경우에도 N은 비교 대상의 수입니다.

특성이지 그룹 내 피험자의 수가 아닙니다. 자세한 설명은 예제에 나와 있습니다. 만약에

rs의 절대값이 임계값에 도달하거나 초과합니다.

믿을 수 있는.

가설.

두 가지 가능한 가설이 있습니다. 첫 번째는 사례 1에 적용되고 두 번째는 나머지 세 가지에 적용됩니다.

가설의 첫 번째 버전

H0: 변수 A와 B 사이의 상관관계는 0과 다르지 않습니다.

H2: 변수 A와 B 사이의 상관관계는 0과 크게 다릅니다.

가설의 두 번째 버전

H0: 계층 A와 B 사이의 상관관계는 0과 다르지 않습니다.

H2: 계층 A와 B 간의 상관 관계가 0과 크게 다릅니다.

순위 상관 계수의 한계

1. 각 변수에 대해 최소 5개의 관측치가 제시되어야 합니다. 높은

샘플링 경계는 사용 가능한 임계값 테이블에 의해 결정됩니다. .

2. 다수의 동일한 항목에 대한 Spearman의 순위 상관 계수 r

하나 또는 두 비교 변수의 순위는 대략적인 값을 제공합니다. 이상적으로는

두 상관 계열은 모두 발산하는 두 수열을 나타내야 합니다.

가치. 이 조건이 충족되지 않으면 수정이 필요합니다.

같은 계급.

Spearman의 순위 상관 계수는 다음 공식을 사용하여 계산됩니다.

두 비교 순위 계열 모두 동일한 순위의 그룹을 포함하는 경우

순위 상관 계수를 계산하기 전에 동일한 보정을 해야 합니다.

Ta 및 TV 순위:

Ta = Σ(a3 – a)/12,

Тв = Σ (в3 – в)/12,

어디 ㅏ - A행에 있는 동일한 순위의 각 그룹의 볼륨 각각의 볼륨

랭크 시리즈 B에서 동일한 랭크의 그룹입니다.

rs의 경험적 값을 계산하려면 다음 공식을 사용하십시오.

38. 점-이중 상관 계수.

일반적인 상관관계에 대해서는 질문 36번을 참조하세요.와 함께. 56 (64) 063.JPG

harchenko-korranaliz.pdf

변수 X를 강력한 척도로 측정하고 변수 Y를 이분법 척도로 측정한다고 가정합니다. 점 이직렬 상관 계수 rpb는 다음 공식을 사용하여 계산됩니다.

여기서 x 1은 Y에 대해 "1"의 값을 갖는 X 객체에 대한 평균 값입니다.

x 0 – Y에 대해 "0" 값을 갖는 X 객체에 대한 평균값;

s x – X를 따른 모든 값의 표준 편차;

n 1 – Y에서 "1" 개체 수, n 0 – Y에서 "0" 개체 수;

n = n 1 + n 0 – 표본 크기.

점 이직열 상관 계수는 다른 등가 표현식을 사용하여 계산할 수도 있습니다.

여기 x– 변수의 전체 평균값 엑스.

점 이차 상관 계수 rpb–1에서 +1까지 다양합니다. 변수가 1인 경우 그 값은 0입니다. 와이평균을 가지고 있다 와이, 0이 넘는 변수의 평균과 같습니다. 와이.

시험 유의성 가설포인트 이차 상관 계수를 확인하는 것입니다 귀무 가설시간일반 상관 계수와 0의 동일성에 대한 0: ρ = 0, 이는 스튜던트 t-테스트를 ​​사용하여 수행됩니다. 경험적 의의

임계값과 비교 (df) 자유도 수에 대해 df = N– 2

조건 | | ≤ (df) 귀무가설 ρ = 0은 기각되지 않습니다. 경험적 값 | | 즉, 조건 | | > (N– 2). 점 이차 상관계수를 이용하여 계산된 관계의 신뢰도 rpb, 기준을 사용하여 결정될 수도 있습니다. χ 자유도 수는 2 df= 2.

점 이차 상관

모멘트 곱의 상관 계수에 대한 후속 수정은 포인트 바이시리얼에 반영되었습니다. 아르 자형. 이 통계. 두 변수 사이의 관계를 보여줍니다. 그 중 하나는 연속적이고 정규 분포를 따르는 것으로 추정되며, 다른 하나는 엄밀한 의미에서 이산적입니다. 점 이직열 상관 계수는 다음과 같이 표시됩니다. 아르 자형 피비스이후 아르 자형 피비스이분법은 이산변수의 실제 성격을 반영하며, 경우처럼 인위적이지 않습니다. 아르 자형 두번, 그 부호는 임의로 결정됩니다. 따라서 모든 실제적인 목적을 위해. 목표 아르 자형 피비스 0.00에서 +1.00 범위로 간주됩니다.

또한, 두 변수가 연속적이고 정규 분포를 따른다고 가정하지만 이차 상관 관계의 경우처럼 둘 다 인위적으로 이분화되는 경우도 있습니다. 이러한 변수 간의 관계를 평가하기 위해 사중 상관 계수가 사용됩니다. 아르 자형 테트, 이는 또한 Pearson에 의해 자란 것입니다. 기초적인 (정확한) 계산 공식 및 절차 아르 자형 테트꽤 복잡해요. 그러므로 실용적으로 이 방법은 근사치를 사용합니다. 아르 자형 테트,축약된 절차와 표를 기반으로 얻은 것입니다.

/on-line/dictionary/dictionary.php?term=511

포인트 바이시리얼 계수두 변수 사이의 상관 계수입니다. 하나는 이분법 척도로 측정되고 다른 하나는 구간 척도로 측정됩니다. 이는 테스트 작업의 품질(전체 테스트 점수와의 신뢰성 및 일관성)을 나타내는 지표로 클래식 및 현대 테스트에서 사용됩니다.

측정된 변수를 상관시키려면 이분법 및 간격 척도사용 점-이중 상관 계수.
점-이배열 상관계수는 변수의 관계를 상관분석하는 방법으로 그 중 하나를 이름의 척도로 측정하여 2개의 값만 취한다(예를 들어 남자/여자, 정답/오답, 특징) 있음/없음), 두 번째는 척도 비율 또는 간격 척도입니다. 점-이중 상관 계수 계산 공식:

어디:
m1과 m0은 Y의 값이 1 또는 0인 X의 평균값입니다.
σx – X에 의한 모든 값의 표준 편차
n1,n0 – 1 또는 0에서 Y까지의 X 값 수.
n - 값 쌍의 총 개수

대부분 이러한 유형의 상관 계수는 테스트 항목과 전체 척도 간의 관계를 계산하는 데 사용됩니다. 이는 유효성 검사의 한 유형입니다.

39. 순위-이중 상관 계수.

일반적인 상관관계에 대해서는 질문 36번을 참조하세요.와 함께. 56 (64) 063.JPG

harchenko-korranaliz.pdf p. 28

순위 이직렬 상관 계수는 변수 중 하나가 다음인 경우에 사용됩니다( 엑스)는 순서 척도로 제시되고, 다른 하나는 ( 와이) – 이분법, 공식으로 계산

.

다음은 하나를 갖는 개체의 평균 순위입니다. 와이; – 0부터 개체의 평균 순위 와이, N- 표본의 크기.

시험 유의성 가설순위-이차 상관 계수는 공식에서 치환을 사용한 스튜던트 테스트를 사용하여 점 이차 상관 계수와 유사하게 수행됩니다. 아르 자형pb~에 아르 자형rb.

하나의 변수를 이분형 척도(변수)로 측정하는 경우 엑스),순위 척도(변수 Y)에서는 순위-이중열 상관 계수가 사용됩니다. 우리는 변수가 엑스,이분법적 척도로 측정하면 0과 1의 두 값(코드)만 취합니다. 우리는 특히 강조합니다. 이 계수가 -1에서 +1 범위에서 다양하다는 사실에도 불구하고 그 부호는 해석에 중요하지 않습니다. 결과. 이는 일반 규칙의 또 다른 예외입니다.

이 계수는 다음 공식을 사용하여 계산됩니다.

어디` 엑스 1변수의 해당 요소에 대한 평균 순위 와이, 이는 변수의 코드(부호) 1에 해당합니다. 엑스;

`X 0 – 변수의 해당 요소에 대한 평균 순위 와이,이는 변수의 코드(부호) 0에 해당합니다. 엑스\

N -변수의 총 요소 수 엑스.

순위-이중열 상관계수를 적용하려면 다음 조건을 충족해야 합니다.

1. 비교되는 변수는 다양한 척도로 측정되어야 합니다. 엑스 -이분법적으로; 다른 와이-순위로 보면.

2. 비교변수의 다양한 특성의 수 엑스그리고 와이동일해야합니다.

3. 순위-이중 상관 계수의 신뢰도 수준을 평가하려면 공식 (11.9)과 스튜던트 테스트의 임계값 표를 사용해야 합니다. k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

변수 중 하나가 다음으로 표현되는 경우 이분법적 척도, 그리고 다른 하나는 순위(순수), 신청이 필요합니다 순위-이중 상관 계수:

rpb=2 / n * (m1 - m0)

어디:
n – 측정 대상 수
m1 및 m0 - 두 번째 변수가 1 또는 0인 개체의 평균 순위입니다.
이 계수는 테스트의 유효성을 확인할 때도 사용됩니다.

40. 선형 상관 계수.

일반적인 상관관계(특히 선형 상관관계)에 대해서는 질문 36번을 참조하세요.와 함께. 56 (64) 063.JPG

피어슨 씨의 계수

아르 자형-피어슨 (피어슨 아르 자형)는 두 측정항목 간의 관계를 연구하는 데 사용됩니다.동일한 샘플에서 측정된 다양한 변수.그 사용이 적절한 상황이 많이 있습니다. 지능이 대학 시절 학업 성과에 영향을 미치나요? 직원의 급여 규모는 동료에 대한 친근감과 관련이 있습니까? 학생의 기분이 복잡한 산수 문제 해결의 성공에 영향을 줍니까? 이러한 질문에 답하기 위해 연구자는 표본의 각 구성원에 대해 두 가지 관심 지표를 측정해야 합니다. 그런 다음 관계를 연구하기 위한 데이터는 아래 예와 같이 표로 작성됩니다.

예 6.1

표는 8학년 학생 20명을 대상으로 두 가지 지능 지표(언어적 및 비언어적)를 측정하기 위한 초기 데이터의 예를 보여줍니다.

이들 변수 사이의 관계는 산점도를 사용하여 묘사할 수 있습니다(그림 6.3 참조). 다이어그램은 측정된 지표들 사이에 어떤 관계가 있음을 보여줍니다. 즉, 언어 지능의 값이 클수록 (대체로) 비언어 지능의 값도 더 커집니다.

상관 계수에 대한 공식을 제시하기 전에 예제 6.1의 데이터를 사용하여 상관 계수의 발생 논리를 추적해 보겠습니다. 다른 점(그림 6.3)을 기준으로 산점도에서 각 /-점(번호 /가 있는 주제)의 위치는 해당 변수 값의 평균값과의 편차 값 및 부호로 지정할 수 있습니다. : (xj - 엠제이 그리고 (정신 ~에 ). 이러한 편차의 징후가 일치하면 이는 양의 관계를 나타냅니다(더 큰 값 엑스큰 값은 다음에 해당합니다. ~에또는 더 낮은 값 엑스더 작은 값은 와이).

1번 과목의 경우 평균과의 편차 엑스그리고 ~에긍정적이고, 대상 번호 3의 경우 두 편차 모두 부정적입니다. 결과적으로, 두 데이터 모두 연구된 특성 사이에 긍정적인 관계가 있음을 나타냅니다. 반대로 평균에서 벗어난 징후가 나타나면 엑스그리고 ~에다르다면 이는 특성 간의 부정적인 관계를 나타냅니다. 따라서 4 번 과목의 경우 평균과의 편차 엑스음수입니다. y-긍정적이고 주제 번호 9의 경우 - 반대의 경우도 마찬가지입니다.

따라서 편차의 곱(x,- 엑스 ) 엑스 (정신 ~에 ) 긍정적이면 /-주어의 데이터는 직접적인(긍정적) 관계를 나타내고, 부정적이면 역(부정적) 관계를 나타냅니다. 따라서 만약에 엑스y y일반적으로 정비례로 관련되어 있으면 편차 곱의 대부분이 양수이고, 역관계로 관련되어 있으면 대부분의 곱이 음수입니다. 따라서 관계의 강도와 방향에 대한 일반적인 지표는 주어진 표본에 대한 모든 편차 곱의 합계일 수 있습니다.

변수 간의 직접 비례 관계에서 이 값은 크고 양수입니다. 대부분의 대상에서 편차는 부호가 일치합니다(한 변수의 큰 값은 다른 변수의 큰 값에 해당하고 그 반대도 마찬가지입니다). 만약에 엑스그리고 ~에피드백을 받으면 대부분의 피험자에 대해 한 변수의 더 큰 값은 다른 변수의 더 작은 값에 해당합니다. 즉, 제품의 부호는 음수가 되고 전체 제품의 합도 커집니다. 절대값은 음수이지만 부호는 음수입니다. 변수 사이에 체계적인 연결이 없으면 양수 항(편차의 곱)이 음수 항과 균형을 이루고 모든 편차 곱의 합은 0에 가까워집니다.

제품의 합이 표본 크기에 의존하지 않도록 하려면 평균을 내는 것으로 충분합니다. 그러나 우리는 일반적인 매개 변수가 아니라 계산된 추정치인 통계로서 상호 연결 측정에 관심이 있습니다. 따라서 분산 공식에 관해서는 이 경우에도 동일한 작업을 수행하고 편차 곱의 합을 다음과 같이 나누지 않습니다. N, TV에서 - 1. 이로 인해 물리학 및 기술 과학에서 널리 사용되는 연결 척도가 생성됩니다. 공분산(코바핸스):


안에 심리학에서는 물리학과 달리 대부분의 변수가 임의의 척도로 측정됩니다. 왜냐하면 심리학자들은 기호의 절대값이 아니라 그룹 내 피험자의 상대적 위치에 관심이 있기 때문입니다. 또한 공분산은 특성이 측정되는 척도(분산)의 규모에 매우 민감합니다. 두 특성의 측정 단위와 관계없이 연결 측정값을 만들려면 공분산을 해당 표준 편차로 나누는 것으로 충분합니다. 그리하여 얻은 을 위한-K. Pearson 상관 계수의 뮬:

또는 o x 및


두 변수의 값을 다음 공식을 사용하여 r-값으로 변환하면


그러면 r-Pearson 상관 계수에 대한 공식이 더 단순해 보입니다(071.JPG).

/dict/sociology/article/soc/soc-0525.htm

상관관계 선형- 두 양적 변수 사이의 비인과적 성격의 통계적 선형 관계 엑스그리고 ~에. "K.L 계수"를 사용하여 측정됩니다. Pearson은 공분산을 두 변수의 표준 편차로 나눈 결과입니다.

,

어디 에스 xy- 변수 간의 공분산 엑스그리고 ~에;

에스 엑스 , 에스 와이- 변수의 표준편차 엑스그리고 ~에;

엑스 , 와이 - 변수 값 엑스그리고 ~에숫자가 있는 객체의 경우 ;

엑스, 와이- 변수에 대한 산술 평균 엑스그리고 ~에.

피어슨 계수 아르 자형간격 [-1; +1]. 의미 r = 0변수 사이에 선형 관계가 없음을 의미합니다. 엑스그리고 ~에(그러나 비선형 통계 관계를 배제하지는 않습니다). 양의 계수 값 ​( 아르 자형> 0) 직접 선형 연결을 나타냅니다. 그 값이 +1에 가까울수록 통계선의 관계가 더 강해집니다. 음의 계수 값 ​​( 아르 자형 < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения 아르 자형= ±1은 직접 또는 역방향으로 완전한 선형 연결이 있음을 의미합니다. 완전한 연결의 경우 좌표( 엑스 , 와이 ) 직선으로 누워 와이 = + bx.

"계수 K.L." Pearson은 선형 쌍별 회귀 모델에서 연결 강도를 측정하는 데에도 사용됩니다.

41. 상관 행렬 및 상관 그래프.

일반적인 상관관계에 대해서는 질문 36번을 참조하세요.와 함께. 56 (64) 063.JPG

상관 행렬.종종 상관 분석에는 두 개가 아닌 하나의 표본에서 정량적 척도로 측정된 많은 변수 간의 관계에 대한 연구가 포함됩니다. 이 경우 이 변수 ​​세트의 각 쌍에 대해 상관관계가 계산됩니다. 계산은 일반적으로 컴퓨터에서 수행되며 결과는 상관 행렬입니다.

상관 행렬(상관관계 행렬) 세트의 각 쌍에 대해 한 가지 유형의 상관관계를 계산한 결과입니다. 아르 자형하나의 샘플에서 정량적 규모로 측정된 변수.

5개 변수(vl, v2,..., v5; = 5) 샘플로 측정한 결과 N=30인간. 아래는 소스 데이터와 상관 행렬의 테이블입니다.

그리고
유사한 데이터:

상관 행렬:

상관 행렬은 주 대각선(takkak,y = /) y에 대해 정사각형이고 대칭이며 주 대각선에 단위가 있음을 쉽게 알 수 있습니다(이후 G 그리고 = 구 = 1).

상관 행렬은 다음과 같습니다. 정사각형:행과 열의 개수는 변수의 개수와 같습니다. 그녀 대칭상관관계가 있기 때문에 주대각선을 기준으로 엑스와 함께 ~에상관관계와 같음 ~에와 함께 엑스.특성 자체와의 상관관계가 1이기 때문에 단위는 주 대각선에 위치합니다. 결과적으로 상관 행렬의 모든 요소가 분석 대상이 되는 것은 아니지만 주대각선 위 또는 아래에 있는 요소는 분석 대상입니다.

상관 계수의 수,관계를 연구할 때 분석할 기능은 다음 공식에 의해 결정됩니다. 피(피- 1)/2. 위의 예에서 이러한 상관 계수의 수는 5(5 - 1)/2 = 10입니다.

상관행렬을 분석하는 주요 작업은많은 기능 간의 관계 구조를 식별합니다. 이 경우 시각적 분석이 가능합니다. 상관 은하- 그래픽 이미지 통계적으로 구조의미있는 연결,그러한 연결이 그리 많지 않은 경우(최대 10-15개) 또 다른 방법은 다중 회귀, 요인 또는 군집 분석과 같은 다변량 방법을 사용하는 것입니다("다변량 방법..." 섹션 참조). 요인 분석이나 군집 분석을 사용하면 다른 변수보다 서로 더 밀접하게 관련된 변수 그룹을 식별할 수 있습니다. 예를 들어 징후가 많고 균질하지 않은 경우 이러한 방법을 조합하는 것도 매우 효과적입니다.

상관관계 비교 -두 가지 옵션이 있는 상관 행렬을 분석하는 추가 작업입니다. 상관 행렬 행 중 하나(변수 중 하나에 대해)의 상관 관계를 비교해야 하는 경우 종속 표본에 대한 비교 방법이 사용됩니다(p. 148-149). 서로 다른 표본에 대해 계산된 동일한 이름의 상관관계를 비교할 때는 독립 표본 비교 방법을 사용합니다(p.147~148).

비교 방법상관관계 대각선으로상관 행렬(무작위 프로세스의 정상성을 평가하기 위해) 및 비교 여러 개의서로 다른 표본(동질성을 위해)에 대해 얻은 상관 행렬은 노동 집약적이며 이 책의 범위를 벗어납니다. G.V. Sukhodolsky 1의 책에서 이러한 방법을 알 수 있습니다.

상관관계의 통계적 유의성 문제.문제는 통계적 가설 검정 절차가 다음과 같이 가정한다는 것입니다. 하나-다수의하나의 샘플에 대해 테스트를 수행했습니다. 같은 방법을 적용하면 자꾸,다른 변수와 관련하여라도 순전히 우연히 결과를 얻을 확률이 높아집니다. 일반적으로 동일한 가설검정 방법을 반복하면 한 번다양한 변수 또는 샘플과 관련하여 확립된 값 a를 사용하면 다음에서 가설의 확인을 받을 수 있습니다. 아아경우의 수.

15개의 변수에 대해 상관행렬을 분석한다고 가정하면, 즉 15(15-1)/2 = 105개의 상관계수가 계산된다. 가설검증을 위해 a=0.05 수준으로 설정하고, 가설을 105번 확인하면 실제 연결여부와 상관없이 5번(!) 확인을 받게 됩니다. 이를 알고 가령 15개의 "통계적으로 유의미한" 상관 계수를 가지고 있으면 어떤 것이 우연히 획득되었는지, 어떤 것이 실제 관계를 반영하는지 알 수 있습니까?

엄밀히 말하면, 통계적 결정을 내리려면 검정할 가설의 수만큼 수준 a를 줄여야 합니다. 그러나 실제로 존재하는 연결을 무시할 확률(제2종 오류 발생)이 예측할 수 없는 방식으로 증가하기 때문에 이는 거의 권장되지 않습니다.

상관 행렬만으로는 충분한 기초가 되지 않습니다.여기에 포함된 개별 계수에 관한 통계적 결론상관관계!

이 문제를 해결하는 정말 설득력 있는 방법은 단 하나뿐입니다. 표본을 무작위로 두 부분으로 나누고 표본의 두 부분 모두에서 통계적으로 유의미한 상관관계만 고려하는 것입니다. 대안으로는 다변량 방법(요인, 군집 또는 다중 회귀 분석)을 사용하여 통계적으로 유의미하게 관련된 변수 그룹을 식별하고 해석하는 것일 수 있습니다.

누락된 값 문제.데이터에 누락된 값이 있는 경우 상관 행렬을 계산하는 데 두 가지 옵션이 가능합니다. a) 행별로 값 제거 (들어오지 못하게 하다사례목록별로); b) 값의 쌍별 삭제 (들어오지 못하게 하다사례쌍으로). ~에 한줄씩 삭제결측값이 있는 관측치를 사용하는 경우 변수 중 하나에 대해 하나 이상의 결측값이 있는 개체(주제)에 대한 전체 행이 삭제됩니다. 이 방법을 사용하면 모든 계수가 동일한 개체 집합에서 계산된다는 점에서 "올바른" 상관 행렬이 생성됩니다. 그러나 결측값이 변수에 무작위로 분포되어 있는 경우 이 방법을 사용하면 고려 중인 데이터 세트에 개체가 하나도 남아 있지 않다는 사실이 발생할 수 있습니다(각 행에 적어도 하나의 결측값이 있게 됩니다). . 이러한 상황을 피하려면 다음과 같은 다른 방법을 사용하십시오. 쌍 제거.이 방법은 선택된 각 열-변수 쌍의 간격만 고려하고 다른 변수의 간격은 무시합니다. 변수 쌍의 상관 관계는 간격이 없는 개체에 대해 계산됩니다. 많은 상황에서, 특히 간격의 수가 상대적으로 작고(예: 10%) 간격이 매우 무작위로 분포되어 있는 경우 이 방법은 심각한 오류로 이어지지 않습니다. 그러나 때로는 그렇지 않은 경우도 있습니다. 예를 들어, 평가의 체계적인 편향(이동)은 누락의 체계적인 배열을 "숨길" 수 있으며, 이는 서로 다른 하위 집합(예: 개체의 서로 다른 하위 그룹)에 대해 구성된 상관 계수의 차이가 발생하는 이유입니다. 다음과 같이 계산된 상관행렬과 관련된 또 다른 문제 쌍으로다른 유형의 분석(예: 다중 회귀 분석 또는 요인 분석)에서 이 매트릭스를 사용할 때 간격이 제거됩니다. 그들은 "올바른" 상관 행렬이 일정 수준의 일관성과 다양한 계수의 "준수"와 함께 사용된다고 가정합니다. "나쁜"(편향된) 추정값이 포함된 행렬을 사용하면 프로그램이 해당 행렬을 분석할 수 없거나 결과가 잘못될 수 있다는 사실이 발생합니다. 따라서 결측 데이터를 제외하는 쌍별 방법을 사용하는 경우 결측 데이터의 분포에 체계적인 패턴이 있는지 확인하는 것이 필요합니다.

누락된 데이터를 쌍으로 삭제해도 평균과 분산(표준 편차)이 체계적으로 이동하지 않는 경우 이러한 통계는 누락된 데이터를 삭제하는 행별 방법을 사용하여 계산된 통계와 유사합니다. 유의미한 차이가 관찰되면 추정치에 변화가 있다고 가정할 이유가 있습니다. 예를 들어, 변수 값의 평균(또는 표준편차)이 ㅏ,변수와의 상관관계를 계산하는 데 사용되었습니다. 안에,동일한 변수 값의 평균(또는 표준편차)보다 훨씬 작습니다. ㅏ,변수 C와의 상관 관계를 계산하는 데 사용된 경우 이 두 상관 관계가 다음과 같이 예상되는 모든 이유가 있습니다. (A-B우리를)다양한 데이터 하위 집합을 기반으로 합니다. 변수 값의 간격이 무작위로 배치되지 않아 상관관계에 편향이 발생합니다.

상관 은하 분석.상관행렬의 요소들의 통계적 유의성 문제를 해결한 후, 통계적으로 유의미한 상관관계를 상관은하 또는 은하의 형태로 그래픽적으로 표현할 수 있다. 상관은하 -꼭지점과 이를 연결하는 선으로 구성된 도형입니다. 정점은 특성에 해당하며 일반적으로 숫자(변수 번호)로 지정됩니다. 선은 통계적으로 유의미한 연결에 해당하며 연결의 부호와 때로는 j-레벨 유의성을 그래픽으로 표현합니다.

상관 은하계는 다음을 반영할 수 있습니다. 모두통계적으로 유의미한 상관 행렬의 연결(때때로 상관 그래프 ) 또는 의미 있게 선택된 부분(예를 들어 요인 분석 결과에 따라 하나의 요인에 해당)만 선택됩니다.

상관 플레이아드 구성의 예


졸업생의 주(최종) 인증 준비: 통합 상태 시험 데이터베이스 구성(과목을 나타내는 모든 카테고리의 통합 상태 시험 참가자의 일반 목록) - 동일한 과목의 경우 예비일을 고려합니다.

  • 업무 계획 (27)

    해결책

    2. 과학 및 수학 교육 과목의 내용을 개선하고 질을 평가하기 위한 교육 기관의 활동 시립 교육 기관 중등 학교 No. 4, Litvinovskaya, Chapaevskaya,