엑셀 표준편차는 어디에 있나요?  Microsoft Excel에서 표준 편차 계산

엑셀 표준편차는 어디에 있나요? Microsoft Excel에서 표준 편차 계산

표준편차 함수는 이미 범주를 벗어났습니다. 고등 수학통계 관련. Excel에는 표준 편차 함수를 사용하기 위한 몇 가지 옵션이 있습니다.

  • STDEV 함수.
  • STDEV 함수.
  • STDEV 함수

판매의 안정성(XYZ 분석)을 식별하기 위해 판매 통계에서 이러한 기능이 필요합니다. 이 데이터는 가격 책정 및 구색 매트릭스의 형성(조정) 및 기타 유용한 판매 분석에 모두 사용할 수 있습니다. 이에 대해서는 향후 기사에서 확실히 설명하겠습니다.

머리말

수식을 먼저 수학적인 언어로 살펴보고, 그 다음(아래 텍스트) Excel에서 수식을 자세히 분석하고 그 결과가 판매 통계 분석에 어떻게 적용되는지 알아보겠습니다.

따라서 표준 편차는 표준 편차의 추정치입니다. 랜덤 변수 엑스그녀에 대해 수학적 기대편차에 대한 편견없는 추정치를 기반으로 함)))) 이해할 수없는 단어를 두려워하지 말고 인내심을 가지면 모든 것을 이해할 수 있습니다!

공식 설명: 표준 편차는 가장 확률이 높은 변수의 단위로 측정되며 계산에 사용됩니다. 표준 에러산술 평균, 구축할 때 신뢰 구간, 가설의 통계적 검정, 무작위 변수 간의 선형 관계 측정. 로써 정의 된 제곱근확률 변수의 분산에서

이제 표준 편차는 확률 변수의 표준 편차 추정치입니다. 엑스편향되지 않은 분산 추정치를 기반으로 한 수학적 기대치와 관련하여:

분산;

- -번째 샘플 요소;

표본의 크기;

샘플 산술 평균:

두 추정 모두 편향되어 있다는 점에 유의해야 합니다. 에 일반적인 경우편향되지 않은 추정치를 구성하는 것은 불가능합니다. 그러나 편향되지 않은 분산 추정치를 기반으로 한 추정치는 일관성이 있습니다.

세 시그마 규칙() - 정규 분포 확률 변수의 거의 모든 값은 구간에 있습니다. 더 엄격하게 말하면 약 0.9973의 확률로 정규 분포 확률 변수의 값은 지정된 간격에 있습니다(값이 참이고 표본 처리의 결과로 얻은 것이 아닌 경우). 0.1의 반올림된 간격을 사용합니다.

실제 값을 알 수 없는 경우 not을 사용해야 하지만 에스. 따라서 3 시그마의 규칙은 3의 규칙으로 변환됩니다. 에스. 판매의 안정성을 결정하는 데 도움이 되는 것은 이 규칙이지만 나중에 자세히 설명합니다.

이제 Excel의 표준편차 함수

내가 수학으로 널 압도하지 않았으면 좋겠어? 아마도 누군가는 추상 또는 다른 목적을 위해 이 정보가 필요할 것입니다. 이제 이 수식이 Excel에서 어떻게 작동하는지 알아보겠습니다...

판매의 안정성을 결정하기 위해 표준 편차 함수에 대한 모든 옵션을 조사할 필요는 없습니다. 우리는 하나만 사용할 것입니다:

STDEV 함수

STDEV(1번;2 번;... )

넘버1, 넘버2,..- 일반 인구에 해당하는 1에서 30까지의 숫자 인수.

이제 예를 살펴보겠습니다.

책과 임시 스프레드시트를 만들어 보겠습니다. 이 예 Excel의 경우 기사 끝 부분에서 다운로드합니다.

계속됩니다!!!

다시 안녕. 잘!? 1분 무료입니다. 계속하자?

그리고 도움으로 판매의 안정성 STDEV 함수

명확성을 위해 몇 가지 즉석 상품을 살펴보겠습니다.

분석에서는 예측이든 연구이든 통계와 관련된 다른 것이든 항상 세 개의 기간이 필요합니다. 주, 월, 분기 또는 연도가 될 수 있습니다. 가능한 한 많은 기간을 두는 것이 가능하고 가장 좋습니다. 그러나 3회 이상은 아닙니다.

특히 꾸준하게 팔리고 있는 것과 안 팔리는 것을 육안으로 확인할 수 있는 과장된 판매를 보여줬다. 이렇게 하면 공식이 작동하는 방식을 더 쉽게 이해할 수 있습니다.

판매가 있으므로 이제 기간별 평균 판매 가치를 계산해야 합니다.

평균값 공식 AVERAGE(기간 데이터) 제 경우에는 공식이 다음과 같습니다. =AVERAGE(C6:E6)

우리는 모든 제품에 대한 공식을 확장합니다. 이것은 선택한 셀의 오른쪽 모서리를 잡고 목록의 끝까지 끌어서 수행할 수 있습니다. 또는 제품이 있는 열에 커서를 놓고 다음 키 조합을 누릅니다.

Ctrl + Down 커서를 목록 맨 아래로 이동합니다.

Ctrl + 오른쪽, 커서 이동 오른쪽테이블. 오른쪽으로 한 번 더 가면 공식이 있는 열에 도달합니다.

이제 우리는 클램프

Ctrl + Shift 키를 누르고 위로 누릅니다. 그래서 우리는 수식을 늘리는 영역을 선택합니다.

그리고 Ctrl + D 키 조합은 우리가 필요한 곳에서 기능을 확장합니다.

이러한 조합을 기억하면 Excel에서 특히 큰 배열로 작업할 때 속도가 정말 빨라집니다.

다음 단계인 표준편차 함수 자체는 제가 말했듯이 하나만 사용할 것입니다. STDEV

우리는 함수를 처방하고 함수 값에 각 기간의 판매 값을 넣습니다. 테이블에 판매가 차례로 있는 경우 내 공식 =STDEV(C6:E6)에서와 같이 범위를 사용하거나 세미콜론으로 필요한 셀을 나열할 수 있습니다. =STDEV(C6;D6;E6)

여기 모든 계산과 준비가 있습니다. 그러나 지속적으로 판매되는 것과 그렇지 않은 것을 어떻게 알 수 있습니까? XYZ 규칙을 적용해 보겠습니다.

X는 안정적이다

Y - 작은 편차

Z - 안정적이지 않음

이를 위해 오류 간격을 사용합니다. 변동이 10% 이내이면 매출이 안정적이라고 가정합니다.

10~25%이면 Y가 됩니다.

그리고 변동 값이 25%를 초과하면 안정성이 아닙니다.

각 제품의 문자를 올바르게 설정하기 위해 IF 공식을 더 자세히 사용합니다. 내 테이블에 주어진 기능다음과 같이 보일 것입니다:

IF(H6<0,1;"X";ЕСЛИ(H6<0,25;"Y";"Z"))

따라서 모든 이름에 대한 모든 공식을 확장합니다.

나는 왜 10%와 25%의 간격인가?라는 질문에 즉시 대답하려고 노력할 것입니다.

실제로 간격은 다를 수 있으며 모두 특정 작업에 따라 다릅니다. 나는 특히 "눈"으로 차이가 보이는 과장된 판매 가치를 보여주었습니다. 제품 1이 지속적으로 판매되지 않는 것은 분명하지만 역학은 판매 증가를 보여줍니다. 이 항목을 그대로 두십시오 ...

그러나 제품 2는 이미 얼굴에 불안정성이 있습니다. 그리고 우리의 계산은 판매의 불안정성에 대해 알려주는 Z를 보여줍니다. 항목 3과 항목 5는 안정적인 성능을 보여주므로 편차는 10% 이내입니다.

저것들. 45, 46, 45점의 항목 5는 1% 변동을 보이며 안정적인 숫자 계열입니다.

그러나 점수가 10, 50, 5인 제품 2는 93% 변동을 보여 안정적인 숫자 계열이 아닙니다.

모든 계산이 끝나면 필터를 넣고 안정성을 걸러낼 수 있으므로 테이블이 수천 개의 항목으로 구성되어 있으면 판매가 안정적이지 않은 항목 또는 반대로 안정적인 항목을 쉽게 선택할 수 있습니다.

"Y"는 내 테이블에서 작동하지 않습니다. 숫자 시리즈의 명확성을 위해 추가해야 한다고 생각합니다. 굿즈6을 그려드립니다...

보시다시피, 숫자 시리즈 40, 50 및 30은 20% 변동을 보여줍니다. 큰 오차는 없는 것 같지만 그래도 퍼짐이 상당합니다...

요약하자면 다음과 같습니다.

10,50,5 - Z가 안정적이지 않습니다. 25% 이상의 변동

40,50,30 - Y 이 제품에주의를 기울이고 판매를 향상시킬 수 있습니다. 변동 25% 미만 10% 초과

45,46,45 - X는 안정성이며 아직 이 제품으로 할 필요가 없습니다. 10% 미만의 변동

그게 다야! 내가 모든 것을 명확하게 설명했으면 좋겠고, 그렇지 않으면 명확하지 않은 것을 물어보십시오. 그리고 칭찬이든 비판이든 모든 댓글에 감사드립니다. 그래서 나는 당신이 나와 당신을 읽고 있다는 것을 알게 될 것입니다. 이것은 매우 중요하고 흥미롭습니다. 따라서 새로운 교훈이 나타날 것입니다.

통계 분석의 주요 도구 중 하나는 표준 편차의 계산입니다. 이 지표를 사용하면 표본 또는 일반 모집단에 대한 표준 편차를 추정할 수 있습니다. Excel에서 표준편차 공식을 사용하는 방법을 알아보겠습니다.

표준 편차가 무엇이며 공식이 어떻게 생겼는지 즉시 정의합시다. 이 값은 계열의 모든 값과 산술 평균 간의 차이 제곱의 산술 평균의 제곱근입니다. 이 지표에는 표준 편차라는 동일한 이름이 있습니다. 두 이름은 완전히 동일합니다.

그러나 물론 Excel에서는 프로그램이 그를 위해 모든 것을 수행하기 때문에 사용자는 이것을 계산할 필요가 없습니다. Excel에서 표준편차를 계산하는 방법을 알아보겠습니다.

Excel에서 계산

두 가지 특수 함수를 사용하여 Excel에서 지정된 값을 계산할 수 있습니다. STDEV.V(샘플에 따라) 및 STDEV.G(일반 인구에 따르면). 작동 원리는 절대적으로 동일하지만 아래에서 논의할 세 가지 방법으로 호출할 수 있습니다.

방법 1: 함수 마법사


방법 2: 수식 탭


방법 3: 수동으로 수식 입력

인수 창을 전혀 호출하지 않아도 되는 방법도 있습니다. 이렇게 하려면 수식을 수동으로 입력하십시오.


보시다시피 Excel에서 표준 편차를 계산하는 메커니즘은 매우 간단합니다. 사용자는 모집단의 숫자를 입력하거나 이를 포함하는 셀에 대한 링크만 입력하면 됩니다. 모든 계산은 프로그램 자체에서 수행됩니다. 계산 된 지표가 무엇이며 계산 결과가 실제로 어떻게 적용될 수 있는지 이해하는 것이 훨씬 더 어렵습니다. 그러나 이것을 이해하는 것은 소프트웨어로 작업하는 방법을 배우는 것보다 통계의 영역에 더 속합니다.

지침

특성을 나타내는 여러 숫자 또는 균질한 양이 있게 하십시오. 예를 들어, 측정 결과, 칭량, 통계적 관찰 등 제시된 모든 양은 동일한 측정으로 측정되어야 합니다. 표준 편차를 찾으려면 다음을 수행하십시오.

모든 숫자의 산술 평균을 결정합니다. 모든 숫자를 더하고 합계를 총 숫자로 나눕니다.

숫자의 분산(산란) 결정: 이전에 발견된 편차의 제곱을 더하고 결과 합계를 숫자의 수로 나눕니다.

병동에는 7명의 환자가 있고 체온은 34도, 35도, 36도, 37도, 38도, 39도, 40도입니다.

평균에서 평균 편차를 결정해야 합니다.
해결책:
"와드에서": (34+35+36+37+38+39+40)/7=37ºС;

평균으로부터의 온도 편차(이 경우 정상값): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, 결과: -3, -2, -1, 0, 1, 2, 3(ºC);

이전에 얻은 숫자의 합을 숫자로 나눕니다. 계산의 정확성을 위해 계산기를 사용하는 것이 좋습니다. 나눗셈의 결과는 summands의 산술 평균입니다.

계산의 모든 단계에 세심한 주의를 기울이십시오. 계산 중 하나 이상에서 오류가 발생하면 최종 지표가 잘못되기 때문입니다. 각 단계에서 수신된 계산을 확인합니다. 산술 평균은 숫자의 합과 동일한 미터를 갖습니다. 즉, 평균 출석을 결정하면 모든 지표가 "사람"이 됩니다.

이 계산 방법은 수학 및 통계 계산에만 사용됩니다. 예를 들어, 컴퓨터 과학의 산술 평균은 계산 알고리즘이 다릅니다. 산술 평균은 매우 조건부 지표입니다. 요인이나 지표가 하나만 있는 경우 이벤트의 확률을 보여줍니다. 가장 심층적인 분석을 위해서는 많은 요소를 고려해야 합니다. 이를 위해보다 일반적인 수량 계산이 사용됩니다.

산술평균은 중심경향의 척도 중 하나로 수학과 통계계산에 널리 사용된다. 여러 값의 산술 평균을 찾는 것은 매우 간단하지만 각 작업에는 고유한 뉘앙스가 있으며 정확한 계산을 수행하기 위해 알아야 할 뉘앙스가 있습니다.

그러한 실험의 정량적 결과.

산술 평균을 찾는 방법

숫자 배열에 대한 산술 평균 검색은 이러한 값의 대수적 합을 결정하는 것으로 시작해야 합니다. 예를 들어, 배열에 숫자 23, 43, 10, 74 및 34가 포함된 경우 대수 합은 184가 됩니다. 쓸 때 산술 평균은 문자 μ(mu) 또는 x(막대가 있는 x)로 표시됩니다. . 다음으로, 대수 합을 배열의 숫자 수로 나누어야 합니다. 이 예에서는 5개의 숫자가 있으므로 산술 평균은 184/5가 되고 36.8이 됩니다.

음수 작업의 특징

배열에 음수가 있으면 유사한 알고리즘을 사용하여 산술 평균을 찾습니다. 프로그래밍 환경에서 계산할 때나 작업에 추가 조건이 있는 경우에만 차이가 있습니다. 이러한 경우 기호가 다른 숫자의 산술 평균을 찾는 것은 세 단계로 요약됩니다.

1. 표준 방법으로 공통 산술 평균을 구하는 것
2. 음수의 산술 평균 찾기.
3. 양수의 산술 평균 계산.

각 작업의 응답은 쉼표로 구분하여 작성됩니다.

자연 및 소수

숫자의 배열을 소수로 표현하면 정수의 산술평균을 구하는 방법에 따라 해가 나오지만 답의 정확성을 위해 문제의 요구사항에 따라 결과가 줄어듭니다.

자연 분수로 작업할 때 배열의 숫자 수를 곱한 공통 분모로 줄여야 합니다. 답의 분자는 원래 분수 요소의 주어진 분자의 합이 됩니다.

변이의 가장 완벽한 특성은 표준편차(또는 표준편차)라고 하는 표준편차입니다. 표준 편차()는 산술 평균에서 개별 기능 값의 편차의 평균 제곱의 제곱근과 같습니다.

표준 편차는 간단합니다.

가중 표준 편차는 그룹화된 데이터에 적용됩니다.

정규 분포 조건에서 평균 제곱과 평균 선형 편차 사이에 다음 관계가 발생합니다. ~ 1.25.

변동의 주요 절대 측정 인 표준 편차는 정규 분포 곡선의 세로 좌표 값을 결정하고 표본 관찰 구성과 관련된 계산 및 표본 특성의 정확도 설정에 사용됩니다. 동질 집단에서 형질의 변이의 경계를 평가하는 것.

분산, 그 유형, 표준 편차.

확률 변수의 분산- 주어진 랜덤 변수의 퍼짐 정도, 즉 수학적 기대치로부터의 편차. 통계에서 지정 또는 자주 사용됩니다. 분산의 제곱근을 표준 편차, 표준 편차 또는 표준 스프레드라고 합니다.

총 분산 (σ2) 이 변이를 일으킨 모든 요인의 영향을 받는 전체 인구의 특성 변이를 측정합니다. 동시에 그룹화 방법 덕분에 그룹화 특성으로 인한 변동과 설명되지 않은 요인의 영향으로 발생하는 변동을 분리하여 측정할 수 있습니다.

그룹간 분산 (σ 2 m.gr) 체계적인 변이, 즉 특성의 영향으로 발생하는 연구 특성의 크기 차이 - 그룹화의 기본 요소.

표준 편차(동의어: 표준 편차, 표준 편차, 표준 편차; 유사 용어: 표준 편차, 표준 확산) - 확률 이론 및 통계에서 수학적 기대치에 대한 확률 변수 값의 분산에 대한 가장 일반적인 지표입니다. 값 샘플의 제한된 배열에서는 수학적 기대값 대신 샘플 세트의 산술 평균이 사용됩니다.

표준편차는 확률변수 자체의 단위로 측정되며, 산술평균의 표준오차 계산, 신뢰구간 구성, 가설의 통계적 검정, 확률변수 간의 선형관계 측정에 사용된다. 확률 변수 분산의 제곱근으로 정의됩니다.


표준 편차:

표준 편차(확률변수의 표준편차 추정 엑스분산의 편향되지 않은 추정치를 기반으로 한 수학적 기대치에 대한 상대적):

분산은 어디에 있습니까? — -번째 샘플 요소; - 표본의 크기; - 샘플의 산술 평균:

두 추정 모두 편향되어 있다는 점에 유의해야 합니다. 일반적으로 편향되지 않은 추정치를 구성하는 것은 불가능합니다. 그러나 편향되지 않은 분산 추정치를 기반으로 한 추정치는 일관성이 있습니다.

모드와 중앙값을 결정하기 위한 본질, 범위 및 절차.

통계의 멱법칙 평균 외에도 다양한 형질의 크기와 분포 계열의 내부 구조의 상대적인 특성에 대해 구조적 평균이 사용되며 주로 다음과 같이 표현됩니다. 모드와 중앙값.

패션- 이것은 시리즈의 가장 일반적인 변형입니다. 예를 들어 패션은 구매자 사이에서 가장 수요가 많은 옷, 신발의 크기를 결정하는 데 사용됩니다. 개별 시리즈의 모드는 주파수가 가장 높은 변형입니다. 간격 변동 시리즈의 모드를 계산할 때 먼저 모달 간격(최대 빈도로)을 결정한 다음 공식에 따라 속성의 모달 값 값을 결정해야 합니다.

- - 패션 가치

- - 모달 간격의 하한

- - 간격 값

- - 모달 간격 주파수

- - 모달 이전 간격의 빈도

- - 모달 다음 간격의 빈도

중앙값 -이것은 순위가 매겨진 시리즈의 기초가 되고 이 시리즈를 숫자가 동일한 두 부분으로 나누는 기능의 값입니다.

빈도가 있는 이산 계열의 중앙값을 결정하려면 먼저 빈도의 절반 합을 계산한 다음 변이 값에 해당하는 값을 결정합니다. (정렬된 행에 홀수개의 피처가 포함된 경우 중앙값은 다음 공식으로 계산됩니다.

M e \u003d (n(집계의 기능 수) + 1) / 2,

특성이 짝수인 경우 중앙값은 행 중앙에 있는 두 특성의 평균과 같습니다.

계산할 때 중앙값구간 변동 계열의 경우 먼저 중위수가 있는 중위수 구간을 결정한 다음 공식에 따라 중위수 값을 결정합니다.

- 원하는 중앙값입니다.

- 중앙값을 포함하는 구간의 하한

- - 간격 값

- - 빈도의 합 또는 시리즈의 구성원 수

중위수 이전 구간의 누적 빈도 합계

- 중앙값 간격의 빈도입니다.

예시. 모드와 중앙값을 찾으십시오.

해결책:
이 예에서 모달 간격은 가장 높은 빈도(1054)를 설명하는 25-30세 연령 그룹 내에 있습니다.

모드 값을 계산해 보겠습니다.

이는 학생의 모달 연령이 27세임을 의미합니다.

중앙값 계산. 중간 간격은 25-30세 연령 그룹에 있습니다. 이 간격 내에 인구를 두 개의 동일한 부분으로 나누는 변형이 있기 때문입니다(Σf i /2 = 3462/2 = 1731). 다음으로 필요한 숫자 데이터를 공식에 대입하고 중앙값을 얻습니다.

이는 학생의 절반이 27.4세 미만이고 나머지 절반이 27.4세 이상임을 의미합니다.

모드 및 중앙값 외에도 사분위수와 같은 지표를 사용하여 순위가 지정된 시리즈를 4등분으로 나누고, 십분위- 10개 부품 및 백분위수 - 100개 부품당

선택적 관찰의 개념과 그 범위.

선택적 관찰연속관찰 적용시 적용 물리적으로 불가능많은 양의 데이터로 인해 경제적으로 비현실적인. 예를 들어 승객 흐름, 시장 가격, 가족 예산을 연구할 때 물리적 불가능이 발생합니다. 경제적 불편은 예를 들어 시식, 벽돌의 강도 테스트 등과 같이 파괴와 관련된 상품의 품질을 평가할 때 발생합니다.

관찰을 위해 선택된 통계 단위는 표본 또는 표본과 전체 배열인 일반 모집단(GS)을 구성합니다. 이 경우 표본의 단위 수는 다음을 나타냅니다. N, 그리고 전체 HS에서 - N. 태도 해당 없음표본의 상대적 크기 또는 비율이라고 합니다.

표본 추출 결과의 품질은 표본의 대표성, 즉 표본이 HS에서 얼마나 대표성을 나타내는지에 따라 달라집니다. 표본의 대표성을 확보하려면 다음을 준수해야 합니다. 무작위 단위 선택의 원리, 이는 표본에 HS 단위를 포함하는 것이 우연 이외의 다른 요인에 의해 영향을 받을 수 없다고 가정합니다.

존재 무작위 선택의 4가지 방법샘플:

  1. 실제로 무작위선택 또는 "로또 방식"은 일련 번호가 통계 값에 할당될 때 특정 개체(예: 술통)에 입력된 다음 일부 컨테이너(예: 가방)에 혼합되어 무작위로 선택됩니다. 실제로이 방법은 난수 생성기 또는 난수 수학 테이블을 사용하여 수행됩니다.
  2. 기계각각에 따라 선택( 해당 없음) 일반 인구의 값입니다. 예를 들어, 100,000개의 값이 포함되어 있고 1,000개를 선택하려는 경우 모든 100,000/1000 = 100번째 값이 샘플에 포함됩니다. 또한 순위가 지정되지 않은 경우 첫 번째 것은 처음 100에서 무작위로 선택되고 다른 숫자는 100이 더 됩니다. 예를 들어, 장치 번호 19가 첫 번째인 경우 번호 119는 다음, 번호 219, 번호 319 등이어야 합니다. 인구 단위의 순위가 지정되면 #50이 먼저 선택된 다음 #150, #250, 기타 등등이 선택됩니다.
  3. 이기종 데이터 배열에서 값 선택이 수행됩니다. 계층화(계층화) 방법은 일반 인구가 사전에 동질적인 그룹으로 분할되어 무작위 또는 기계적 선택이 적용되는 경우입니다.
  4. 특별한 샘플링 방법은 연속물개별 수량을 무작위로 또는 기계적으로 선택하는 것이 아니라 연속적인 관찰이 수행되는 시리즈(몇몇 숫자에서 연속으로 몇 개까지의 순서)를 선택합니다.

표본 관찰의 품질도 샘플링 유형: 반복또는 비반복적.

~에 재선정표본에 빠진 통계 값 또는 그 계열은 사용 후 일반 인구에게 반환되어 새 표본에 들어갈 기회를 갖습니다. 동시에 일반 모집단의 모든 값은 표본에 포함될 확률이 동일합니다.

반복되지 않는 선택표본에 포함된 통계값 또는 그 계열이 사용 후 일반 모집단에 반환되지 않으므로 후자의 나머지 값에 대해 다음 표본에 들어갈 확률이 증가함을 의미합니다.

비반복 샘플링은 더 정확한 결과를 제공하므로 더 자주 사용됩니다. 다만 적용이 안 되는 상황(여객 흐름, 소비자 수요 등 조사) 후 재선정하는 경우도 있다.

관찰 표본의 한계 오차, 표본의 평균 오차, 계산 순서.

위의 표본 모집단 구성 방법과이 경우 발생하는 오류를 자세히 살펴 보겠습니다. 대표성 .
실제로 무작위표본은 일관성 요소 없이 무작위로 일반 모집단에서 단위 선택을 기반으로 합니다. 기술적으로 적절한 무작위 선택은 추첨(예: 복권) 또는 난수 표를 통해 수행됩니다.

실제로 선택적 관찰의 실천에서 "순수한 형태의" 무작위 선택은 거의 사용되지 않지만, 다른 유형의 선택 중에서 초기이며 선택적 관찰의 기본 원칙을 구현합니다. 단순 무작위 표본에 대한 표본 추출 방법의 이론과 오류 공식에 대한 몇 가지 질문을 고려해 보겠습니다.

샘플링 오류- 이것은 일반 모집단의 모수 값과 표본 관찰 결과에서 계산한 값의 차이입니다. 평균 정량적 특성의 경우 샘플링 오류는 다음과 같이 결정됩니다.

지표를 한계 표본 오차라고 합니다.
표본 평균은 표본에 있는 단위에 따라 다른 값을 취할 수 있는 확률 변수입니다. 따라서 샘플링 오류도 확률 변수이며 다른 값을 가질 수 있습니다. 따라서 가능한 오류의 평균을 결정하십시오. 평균 샘플링 오류, 다음에 따라 다릅니다.

표본 크기: 숫자가 클수록 평균 오차는 작아집니다.

연구된 형질의 변화 정도: 형질의 변동이 작을수록 결과적으로 분산이 작을수록 평균 샘플링 오류가 작아집니다.

~에 무작위 재선택평균 오류가 계산됩니다.
.
실제로 일반적인 분산은 정확히 알려져 있지 않지만, 확률 이론그것을 증명했다
.
충분히 큰 n에 대한 값은 1에 가까우므로 다음을 가정할 수 있습니다. 그런 다음 평균 샘플링 오류를 계산할 수 있습니다.
.
그러나 작은 표본의 경우(n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

~에 무작위 샘플링주어진 공식은 값으로 수정됩니다. 그러면 비표본의 평균 오차는 다음과 같습니다.
그리고 .
왜냐하면 가 항상 보다 작으면 계수()는 항상 1보다 작습니다. 이는 비반복 선택의 평균 오차가 항상 반복 선택의 평균 오차보다 작다는 것을 의미합니다.
기계적 샘플링일반 인구가 어떤 식으로든 정렬될 때 사용됩니다(예: 알파벳 순서의 유권자 목록, 전화 번호, 집 번호, 아파트). 단위 선택은 샘플 백분율의 역수와 동일한 특정 간격으로 수행됩니다. 따라서 2% 샘플의 경우 모든 50단위 = 1/0.02가 선택되고 5%의 경우 일반 모집단의 각 1/0.05 = 20단위가 선택됩니다.

원점은 다양한 방식으로 선택됩니다. 즉, 간격 중간에서 원점을 변경하면서 무작위로 선택합니다. 가장 중요한 것은 체계적인 오류를 피하는 것입니다. 예를 들어 5% 샘플의 경우 13번째가 첫 번째 단위로 선택되면 다음 33, 53, 73 등입니다.

정확도 측면에서 기계적 선택은 적절한 무작위 샘플링에 가깝습니다. 따라서 기계적 샘플링의 평균 오차를 결정하기 위해 적절한 무작위 선택 공식이 사용됩니다.

~에 전형적인 선택 조사된 인구는 미리 동질의 단일 유형 그룹으로 나뉩니다. 예를 들어, 기업을 조사할 때 이들은 산업, 하위 부문이 될 수 있으며 인구는 지역, 사회 또는 연령 그룹이 될 수 있습니다. 그런 다음 기계적 또는 적절한 무작위 방식으로 각 그룹에서 독립적인 선택이 이루어집니다.

일반적인 샘플링은 다른 방법보다 더 정확한 결과를 제공합니다. 일반 모집단의 유형화는 표본의 각 유형 그룹의 표현을 보장하므로 평균 표본 오차에 대한 집단 간 분산의 영향을 배제할 수 있습니다. 따라서 분산의 가산법칙()에 따라 대표 표본의 오차를 구할 때 그룹 분산의 평균만을 고려할 필요가 있다. 그러면 평균 샘플링 오류는 다음과 같습니다.
재선정 중
,
반복되지 않는 선택
,
어디 표본에서 그룹 내 분산의 평균입니다.

직렬(또는 중첩) 선택 표본조사를 시작하기 전에 모집단을 계열 또는 그룹으로 나눌 때 사용합니다. 이 시리즈는 완제품, 학생 그룹, 팀의 패키지가 될 수 있습니다. 검사할 시리즈는 기계적으로 또는 무작위로 선택되며 시리즈 내에서 단위에 대한 전체 조사가 수행됩니다. 따라서 평균 샘플링 오류는 다음 공식으로 계산되는 그룹간(계열간) 분산에만 의존합니다.

여기서 r은 선택된 시리즈의 수입니다.
- i번째 시리즈의 평균.

평균 직렬 샘플링 오류는 다음과 같이 계산됩니다.

재선택 시:
,
반복되지 않는 선택:
,
여기서 R은 시리즈의 총 수입니다.

결합선택고려한 선택 방법의 조합입니다.

모든 선택 방법에 대한 평균 샘플링 오류는 주로 샘플의 절대 크기에 따라 달라지며 덜하지만 샘플의 백분율에 따라 달라집니다. 첫 번째 경우에는 4,500개 단위의 모집단에서 225개의 관측이 수행되고 두 번째 경우에는 225,000개 단위의 관측이 수행된다고 가정합니다. 두 경우의 분산은 모두 25입니다. 그런 다음 첫 번째 경우 5% 선택에서 샘플링 오류는 다음과 같습니다.

두 번째 경우 0.1% 선택 시 다음과 같습니다.


이런 식으로, 표본 비율이 50배 감소하면 표본 크기가 변경되지 않았기 때문에 표본 오차가 약간 증가했습니다.
표본 크기가 625개 관측값으로 증가했다고 가정합니다. 이 경우 샘플링 오류는 다음과 같습니다.

일반 모집단과 동일한 크기로 표본이 2.8배 증가하면 표본 오차의 크기는 1.6배 이상 감소합니다.

표본 모집단을 형성하는 방법 및 수단.

통계에서는 연구 목적에 따라 결정되고 연구 대상의 특성에 따라 다양한 표본 집합을 형성하는 방법이 사용됩니다.

표본조사를 실시하기 위한 주된 조건은 모집단의 각 단위 표본에 대한 평등한 기회의 원칙을 위반하여 발생하는 계통오류의 발생을 방지하는 것이다. 체계적인 오류 예방은 표본 모집단 형성을 위한 과학적 기반 방법을 사용한 결과입니다.

일반 인구에서 단위를 선택하는 방법은 다음과 같습니다.

1) 개별 선택 - 샘플에서 개별 단위가 선택됩니다.

2) 그룹 선택 - 연구 중인 질적으로 균질한 그룹 또는 일련의 단위가 샘플에 포함됩니다.

3) 조합선발은 개인선발과 집단선정을 합친 것이다.
선택 방법은 표본 모집단 형성 규칙에 따라 결정됩니다.

샘플은 다음과 같을 수 있습니다.

  • 적절한 무작위표본이 일반 모집단에서 개별 단위를 무작위로(의도하지 않은) 선택한 결과로 형성된다는 사실로 구성됩니다. 이 경우 표본 집합에서 선택한 단위 수는 일반적으로 표본의 허용 비율에 따라 결정됩니다. 표본 점유율은 표본 모집단 n의 단위 수와 일반 모집단 N의 단위 수의 비율입니다.
  • 기계적표본의 단위 선택이 동일한 간격 (그룹)으로 나누어 진 일반 모집단에서 이루어졌다는 사실로 구성됩니다. 이 경우 일반 모집단의 구간 크기는 표본 비율의 역수와 같습니다. 따라서 2% 샘플에서는 50번째 단위마다(1:0.02), 5% 샘플에서는 20번째 단위마다(1:0.05) 등으로 선택됩니다. 따라서 허용되는 선택 비율에 따라 일반 인구는 기계적으로 동일한 그룹으로 나뉩니다. 샘플의 각 그룹에서 하나의 단위만 선택됩니다.
  • 전형적인 -일반 인구가 먼저 동질의 전형적인 그룹으로 나뉩니다. 그런 다음 각 일반 그룹에서 무작위 또는 기계적 샘플에 의해 샘플에 대한 개별 단위 선택이 이루어집니다. 일반적인 샘플의 중요한 특징은 샘플에서 단위를 선택하는 다른 방법에 비해 더 정확한 결과를 제공한다는 것입니다.
  • 연속물- 일반 인구가 동일한 크기의 그룹으로 나뉘는 시리즈. 시리즈는 샘플 세트에서 선택됩니다. 계열 내에서 계열에 속하는 단위에 대한 지속적인 관찰이 수행됩니다.
  • 결합- 샘플링은 2단계일 수 있습니다. 이 경우 일반 인구는 먼저 그룹으로 나뉩니다. 그런 다음 그룹이 선택되고 후자 내에서 개별 단위가 선택됩니다.

통계에서 샘플의 단위를 선택하는 다음과 같은 방법이 구별됩니다.:

  • 단일 단계샘플 - 선택된 각 단위는 주어진 기준에 따라 즉시 연구 대상이 됩니다(실제로는 무작위 및 연속 샘플).
  • 다단계샘플링 - 개별 그룹의 일반 모집단에서 선택하고 그룹에서 개별 단위를 선택합니다(샘플 모집단에서 단위를 선택하는 기계적 방법을 사용하는 일반적인 샘플).

또한 다음이 있습니다.

  • 재선택- 반환 된 공의 계획에 따라. 이 경우 표본에 포함된 각 단위 또는 시리즈는 일반 모집단으로 반환되므로 다시 표본에 포함될 수 있습니다.
  • 비반복 선택- 반환되지 않은 공의 계획에 따라. 동일한 샘플 크기에 대해 더 정확한 결과가 있습니다.

필요한 표본 크기 결정(학생 표 사용).

표본 추출 이론의 과학적 원칙 중 하나는 충분한 수의 단위가 선택되도록 하는 것입니다. 이론적으로이 원칙을 준수해야 할 필요성은 확률 이론의 극한 정리 증명에 나와 있으며, 이를 통해 충분하고 표본의 대표성을 보장하기 위해 일반 모집단에서 얼마나 많은 단위를 선택해야 하는지 설정할 수 있습니다.

표본의 표준 오차가 감소하고 결과적으로 추정치의 정확도가 증가하면 항상 표본 크기가 증가하므로 표본 관찰을 구성하는 단계에서 이미 다음을 결정할 필요가 있습니다 관찰 결과의 요구되는 정확도를 보장하기 위해 표본 크기는 얼마이어야 합니다. 필요한 표본 크기의 계산은 하나 또는 다른 유형 및 선택 방법에 해당하는 한계 표본 오류(A)에 대한 공식에서 파생된 공식을 사용하여 작성됩니다. 따라서 무작위 반복 표본 크기(n)에 대해 다음을 얻습니다.

이 공식의 핵심은 필요한 수를 무작위로 재선택하면 표본 크기가 신뢰 계수의 제곱에 정비례한다는 것입니다. (t2)및 변이 특성의 분산(α2)이고 한계 샘플링 오차(α2)의 제곱에 반비례합니다. 특히, 한계 오차를 두 배로 늘리면 필요한 표본 크기를 4배까지 줄일 수 있습니다. 3개의 매개변수 중 2개(t 및?)는 연구자가 설정합니다.

동시에 연구원은샘플 설문조사의 목적을 위해 질문을 결정해야 합니다. 최적의 변형을 제공하기 위해 이러한 매개변수를 포함하는 것이 더 나은 양적 조합은 무엇입니까? 한 경우에 그는 정확도 측정(?)보다 얻은 결과(t)의 신뢰성에 더 만족할 수 있으며, 반대의 경우도 마찬가지입니다. 표본 관찰을 설계하는 단계에서 연구자가 이 지표를 가지고 있지 않기 때문에 한계 표본 오차의 값에 대한 문제를 해결하는 것이 더 어렵습니다. 따라서 실제로는 한계 표본 오차를 다음과 같이 설정하는 것이 일반적입니다. 규칙, 특성의 예상 평균 수준의 10% 이내. 추정된 평균 수준을 설정하는 것은 유사한 이전 조사의 데이터를 사용하거나 샘플링 프레임의 데이터를 사용하고 작은 파일럿 샘플을 사용하는 등 다양한 방법으로 접근할 수 있습니다.

표본 관찰을 설계할 때 설정하기 가장 어려운 것은 공식 (5.2)의 세 번째 매개변수인 표본 모집단의 분산입니다. 이 경우 이전의 유사 및 예비 조사에서 얻은 조사자가 사용할 수 있는 모든 정보를 사용해야 합니다.

정의의 질문표본조사가 표본추출단위의 여러 특징에 대한 연구를 포함한다면 요구되는 표본크기는 더욱 복잡해진다. 이 경우 일반적으로 각 특성의 평균 수준과 그 변동이 다르므로 목적과 목적만을 고려하여 특성 중 어느 분산을 선호할지 결정할 수 있습니다. 설문 조사.

표본 관찰을 설계할 때 특정 연구의 목적과 관찰 결과에 따른 결론의 확률에 따라 허용 가능한 표본 오차의 미리 결정된 값을 가정합니다.

일반적으로 표본 평균값의 한계 오차 공식을 통해 다음을 결정할 수 있습니다.

표본 모집단의 지표에서 일반 모집단 지표의 가능한 편차의 크기;

가능한 오류의 한계가 특정 지정된 값을 초과하지 않는 필수 정확도를 제공하는 필수 샘플 크기

표본의 오류가 주어진 한계를 가질 확률입니다.

학생 분포확률 이론에서 그것은 절대적으로 연속적인 분포의 1-모수 패밀리입니다.

일련의 역학(간격, 모멘트), 일련의 역학 종료.

역학 시리즈- 이것은 특정 시간 순서로 표시되는 통계 지표의 값입니다.

각 시계열에는 두 가지 구성 요소가 포함됩니다.

1) 기간 표시기(년, 분기, 월, 일 또는 날짜)

2) 시리즈의 수준이라고 하는 기간 또는 해당 날짜에 대해 연구 중인 대상을 특성화하는 지표.

시리즈의 레벨이 표시됩니다.절대값과 평균값 또는 상대값 모두. 지표의 특성에 따라 절대값, 상대값 및 평균값의 동적 계열이 작성됩니다. 상대 및 평균 값의 동적 계열은 절대 값의 미분 계열을 기반으로 구축됩니다. 역학의 간격 및 모멘트 시리즈가 있습니다.

동적 간격 시리즈특정 기간 동안 지표의 값을 포함합니다. 간격 시리즈에서 수준을 요약하여 더 긴 기간 동안의 현상 볼륨 또는 소위 누적 합계를 얻을 수 있습니다.

다이나믹 모멘트 시리즈특정 시점(날짜)의 지표 값을 반영합니다. 모멘트 계열에서 연구자는 특정 날짜 사이의 계열 수준의 변화를 반영하여 현상의 차이에만 관심을 가질 수 있습니다. 여기에서 수준의 합은 실제 내용이 없기 때문입니다. 누적 합계는 여기에서 계산되지 않습니다.

동적 계열의 올바른 구성을 위한 가장 중요한 조건은 다른 기간과 관련된 계열 수준의 비교 가능성입니다. 수준은 균질한 양으로 제시되어야 하며 현상의 다양한 부분에 대한 동일한 완전성이 있어야 합니다.

에게실제 역학의 왜곡을 피하기 위해 시계열의 통계 분석에 앞서 통계 연구(시계열 종료)에서 예비 계산이 수행됩니다. 시계열 폐쇄는 둘 이상의 계열을 하나의 계열로 결합하는 것으로 이해되며, 그 수준은 다른 방법에 따라 계산되거나 영토 경계 등에 해당하지 않습니다. 일련의 역학을 닫는 것은 일련의 역학 수준의 비호환성을 제거하는 공통 기반으로 일련의 역학의 절대 수준을 감소시키는 것을 의미할 수도 있습니다.

시계열, 계수, 성장률 및 성장률의 비교 가능성 개념.

역학 시리즈- 이들은 시간에 따른 자연 및 사회 현상의 발전을 특성화하는 일련의 통계 지표입니다. 러시아 국가 통계 위원회에서 발행한 통계 컬렉션에는 많은 시계열이 표 형식으로 포함되어 있습니다. 일련의 역학을 통해 연구된 현상의 발전 패턴을 드러낼 수 있습니다.

시계열에는 두 가지 유형의 지표가 있습니다. 시간 표시기(년, 분기, 월 등) 또는 시점(연초, 매월 초 등). 행 수준 표시기. 시계열 수준의 지표는 절대값(톤 또는 루블 단위의 제품 생산), 상대값(도시 인구 비율(%)) 및 평균 값(산업 근로자의 평균 임금)으로 표현할 수 있습니다. 년 등). 표 형식에서 시계열에는 두 개의 열 또는 두 개의 행이 있습니다.

시계열을 올바르게 구성하려면 다음과 같은 여러 요구 사항을 충족해야 합니다.

  1. 일련의 역학에 대한 모든 지표는 과학적으로 입증되고 신뢰할 수 있어야 합니다.
  2. 일련의 역학 지표는 시간적으로 비교할 수 있어야 합니다. 동일한 기간 또는 동일한 날짜에 대해 계산되어야 합니다.
  3. 여러 역학의 지표는 영토 전체에서 비교할 수 있어야합니다.
  4. 일련의 역학 지표는 내용면에서 비교할 수 있어야 합니다. 동일한 방식으로 단일 방법론에 따라 계산됩니다.
  5. 일련의 역동성에 대한 지표는 고려되는 농장의 범위에 걸쳐 비교할 수 있어야 합니다. 일련의 역학에 대한 모든 지표는 동일한 측정 단위로 제공되어야 합니다.

통계 지표일정 기간 동안 연구 중인 프로세스의 결과 또는 특정 시점, 즉 특정 시점에서 연구 중인 현상의 상태를 특성화할 수 있습니다. 표시기는 간격(주기적) 및 순간일 수 있습니다. 따라서 처음에 일련의 역학은 간격 또는 모멘트일 수 있습니다. 역학의 모멘트 시리즈는 차례로 동일하거나 동일하지 않은 시간 간격을 가질 수 있습니다.

역학의 초기 시리즈는 일련의 평균값과 일련의 상대값(체인 및 베이스)으로 변환될 수 있습니다. 이러한 시계열을 파생 시계열이라고 합니다.

일련의 역학의 유형에 따라 일련의 역학에서 평균 수준을 계산하는 방법이 다릅니다. 예를 사용하여 시계열의 유형과 평균 수준을 계산하는 공식을 고려하십시오.

절대 이득 (△y) 시리즈의 후속 수준이 이전 수준(3열 - 체인 절대 증분) 또는 초기 수준(4열 - 기본 절대 증분)과 비교하여 변경된 단위 수를 표시합니다. 계산 공식은 다음과 같이 작성할 수 있습니다.

시리즈의 절대 값이 감소하면 각각 "감소", "감소"가 발생합니다.

절대 성장 지표는 예를 들어 1998년에 제품 "A"의 생산량이 1997년에 비해 4,000톤, 1994년에 비해 34,000톤 증가했음을 나타냅니다. 다른 연도는 표를 참조하십시오. 11.5g 3과 4.

성장 인자시리즈의 수준이 이전 수준(5열 - 연쇄 성장 또는 감소 요인) 또는 초기 수준(6열 - 기본 성장 또는 감소 요인)과 비교하여 몇 배나 변경되었는지 보여줍니다. 계산 공식은 다음과 같이 작성할 수 있습니다.

성장률시리즈의 다음 수준이 이전 수준(7열 - 연쇄 성장률) 또는 초기 수준(8열 - 기본 성장률)과 비교하여 몇 퍼센트인지 표시합니다. 계산 공식은 다음과 같이 작성할 수 있습니다.

따라서 예를 들어 1997년에 제품 "A"의 생산량은 1996년에 비해 105.5%(

성장률보고 기간의 수준이 이전 수준(9열 - 사슬 성장률) 또는 초기 수준(10열 - 기본 성장률)과 비교하여 몇 퍼센트 증가했는지 보여줍니다. 계산 공식은 다음과 같이 작성할 수 있습니다.

T pr \u003d T p - 100% 또는 T pr \u003d 절대 증가/이전 기간의 수준 * 100%

따라서 예를 들어 1996년에는 1995년에 비해 제품 "A"가 3.8%(103.8% - 100%) 또는 (8:210) x 100% 더 많이 생산되었고 1994년에 비해 9%( 109% - 100%).

시리즈의 절대 수준이 감소하면 비율은 100% 미만이 되며 따라서 감소 비율(마이너스 부호가 있는 성장률)이 있습니다.

1% 증가의 절대값(11열)은 이전 기간의 수준이 1% 증가하기 위해 주어진 기간에 얼마나 많은 단위를 생산해야 하는지를 나타냅니다. 우리의 예에서는 1995년에 200만 톤, 1998년에 23000톤을 생산해야 했습니다. 훨씬 더 큰.

1% 성장의 절대값의 크기를 결정하는 두 가지 방법이 있습니다.

이전 기간의 수준을 100으로 나눕니다.

절대 사슬 성장률을 해당 사슬 성장률로 나눕니다.

1% 증가의 절대값 =

역학에서는 특히 장기간에 걸쳐 증가 또는 감소하는 각 백분율의 내용과 함께 성장률을 공동으로 분석하는 것이 중요합니다.

시계열 분석을 위해 고려된 방법론은 절대값(t, 천 루블, 직원 수 등)으로 표현되는 시계열과 시계열에 모두 적용 가능합니다. 이는 상대적 지표(스크랩의 %, 석탄의 회분 함량 등) 또는 평균값(c/ha의 평균 수확량, 평균 임금 등)으로 표시됩니다.

이전 또는 초기 수준과 비교하여 각 연도별로 계산된 고려 분석 지표와 함께 시계열을 분석할 때 해당 기간의 평균 분석 지표를 계산할 필요가 있습니다. 시리즈의 평균 수준, 평균 연간 절대 증가 (감소) 및 평균 연간 성장률 및 성장률.

일련의 역학의 평균 수준을 계산하는 방법은 위에서 논의되었습니다. 우리가 고려하고 있는 역학의 간격 시리즈에서 시리즈의 평균 수준은 단순 산술 평균의 공식으로 계산됩니다.

1994-1998년 제품의 평균 연간 생산량. 218.4천 톤에 달했다.

평균 연간 절대 증가는 또한 단순 산술 평균의 공식으로 계산됩니다.

연간 절대 증가량은 4-12,000톤(gr. 3 참조)과 1995-1998년 기간 동안의 평균 연간 생산량 증가에 따라 다양했습니다. 8.5만 톤에 달했다.

평균 성장률과 평균 성장률을 계산하는 방법은 좀 더 세부적인 고려가 필요하다. 표에 제공된 시리즈 수준의 연간 지표의 예를 살펴 보겠습니다.

역학 범위의 중간 수준.

역학 시리즈(또는 시계열)- 이것은 연속적인 순간 또는 기간의 특정 통계 지표의 숫자 값입니다(즉, 시간순으로 정렬됨).

일련의 역학을 구성하는 특정 통계 지표의 숫자 값을 숫자의 수준일반적으로 문자로 표시됩니다. 와이. 시리즈의 첫 번째 멤버 1이니셜 또는 기준선, 그리고 마지막 니 엔 - 결정적인. 레벨이 참조하는 순간 또는 기간은 다음과 같이 표시됩니다. .

동적 계열은 일반적으로 표 또는 그래프의 형태로 표시되며 x축을 따라 시간 척도가 작성됩니다. , 그리고 세로 좌표를 따라 - 시리즈 레벨의 스케일 와이.

일련의 역학의 평균 지표

역학의 각 시리즈는 특정 세트로 간주될 수 있습니다. N평균으로 요약할 수 있는 시변 지표. 이러한 일반화 된 (평균) 지표는 다른 기간, 다른 국가 등에서 하나 또는 다른 지표의 변화를 비교할 때 특히 필요합니다.

일련의 역학의 일반화된 특성은 무엇보다도 다음과 같을 수 있습니다. 평균 행 수준. 평균 수준을 계산하는 방법은 모멘트 계열인지 간격(기간) 계열인지에 따라 다릅니다.

언제 간격계열에서 평균 수준은 계열 수준의 단순 산술 평균 공식에 의해 결정됩니다.

=
가능한 경우 순간행 포함 N수준( y1, y2, …, yn) 날짜(시점) 사이의 간격이 같으면 이러한 계열을 일련의 평균 값으로 쉽게 변환할 수 있습니다. 동시에, 각 기간 시작의 지표(레벨)는 동시에 이전 기간 종료의 지표입니다. 그런 다음 각 기간(날짜 사이의 간격)에 대한 지표의 평균 값은 값의 절반으로 계산할 수 있습니다. ~에기간의 시작과 끝, 즉 어떻게 . 그러한 평균의 수는 . 앞서 언급했듯이 일련의 평균에 대해 평균 수준은 산술 평균에서 계산됩니다.

따라서 다음과 같이 작성할 수 있습니다.
.
분자를 변환하면 다음을 얻습니다.
,

어디 Y1그리고 - 시리즈의 첫 번째 및 마지막 레벨; - 중간 수준.

이 평균은 통계에서 다음과 같이 알려져 있습니다. 평균 연대기순간 시리즈. 그녀는 시간이 지남에 따라 변하는 지표에서 계산되기 때문에 "cronos"(시간, 위도)라는 단어에서이 이름을 받았습니다.

불평등한 경우날짜 사이의 간격에서, 순간 시리즈의 시간순 평균은 날짜 사이의 거리(시간 간격)에 의해 가중치가 부여된 각 순간 쌍에 대한 수준의 평균 값의 산술 평균으로 계산할 수 있습니다. 즉,
.
이 경우날짜 사이의 간격에서 수준이 다른 값을 취한 것으로 가정하고 두 개의 알려진( 그리고 이+1) 평균을 결정한 다음 전체 분석 기간에 대한 전체 평균을 계산합니다.
각각의 값이 다음과 같다고 가정하면 다음까지 변함없이 유지 (i+ 1)- th 순간, 즉. 레벨 변화의 정확한 날짜를 알고 있으면 가중 산술 평균 공식을 사용하여 계산을 수행할 수 있습니다.
,

여기서 레벨이 변경되지 않은 시간입니다.

역학 시리즈의 평균 수준 외에도 시리즈 수준의 평균 변화(기본 및 연쇄 방법), 평균 변화율과 같은 다른 평균 지표도 계산됩니다.

기준선은 절대 변화를 의미합니다.마지막 기본 절대 변경의 몫을 변경 수로 나눈 값입니다. 그건

사슬은 절대 변화를 의미 계열의 수준은 모든 체인 절대 변경의 합계를 변경 수로 나눈 몫입니다.

평균 절대 변화의 부호에 의해 현상의 변화의 성격도 평균적으로 판단됩니다: 성장, 쇠퇴 또는 안정.

기본 및 연쇄 절대 변경을 제어하는 ​​규칙에서 기본 변경과 연쇄 평균 변경은 동일해야 합니다.

평균 절대 변화와 함께 평균 상대도 기본 및 연쇄 방법을 사용하여 계산됩니다.

기준선 평균 상대적 변화다음 공식에 의해 결정됩니다.

사슬 평균 상대적 변화다음 공식에 의해 결정됩니다.

당연히 기본 상대변화와 연쇄평균 상대변화는 같아야 하며, 이를 기준값 1과 비교하여 평균적으로 성장, 쇠퇴 또는 안정 등 현상의 변화의 성격에 대해 결론을 내린다.
기본 또는 사슬 평균 상대 변화에서 1을 빼면 해당 평균 변화율, 이 일련의 역학에 의해 반영되는 연구 중인 현상의 변화의 본질을 판단할 수 있는 기호에 의해.

계절적 변동 및 계절성 지수.

계절적 변동은 안정적인 연간 변동입니다.

최대의 효과를 얻기 위한 경영의 기본 원칙은 소득의 극대화와 비용의 최소화입니다. 계절적 변동을 연구하여 연도별 최대 방정식의 문제를 해결합니다.

계절적 변동을 연구할 때 두 가지 상호 관련된 작업이 해결됩니다.

1. 연내 역학 현상의 발전에 대한 세부 사항 식별;

2. 계절파동모델 구축에 따른 계절변동 측정

계절 칠면조는 일반적으로 계절성을 측정하기 위해 계산됩니다. 일반적으로 비교 기준이 되는 이론 방정식에 대한 일련의 역학의 원래 방정식의 비율에 의해 결정됩니다.

임의의 편차는 계절적 변동에 중첩되기 때문에 계절성 지수를 평균화하여 이를 제거합니다.

이 경우 연간주기의 각 기간에 대해 일반화 된 지표는 평균 계절 지수 형태로 결정됩니다.

계절적 변동의 평균 지수는 주요 발전 추세의 무작위 편차의 영향을 받지 않습니다.

추세의 특성에 따라 평균 계절성 지수 공식은 다음과 같은 형식을 취할 수 있습니다.

1.뚜렷한 주요 개발 추세가 있는 일련의 연내 역학:

2. 상승 또는 하락 추세가 없거나 중요하지 않은 일련의 연내 역학의 경우:

일반 평균은 어디에 있습니까?

주요 경향을 분석하는 방법.

시간이 지남에 따라 현상의 발전은 성격과 영향력의 강도가 다른 요인에 의해 영향을 받습니다. 그들 중 일부는 본질적으로 무작위이고 다른 일부는 거의 일정한 효과를 가지며 일련의 역학에서 특정 개발 추세를 형성합니다.

통계의 중요한 임무는 다양한 무작위 요인의 작용에서 벗어나 일련의 역학에서 추세를 식별하는 것입니다. 이를 위해 구간확대, 이동평균, 분석정렬 등의 방법으로 시계열을 처리한다.

간격 조대화 방법일련의 역학 수준을 포함하는 기간의 확대를 기반으로 합니다. 짧은 기간과 관련된 데이터를 더 큰 기간의 데이터로 교체하는 것입니다. 시리즈의 초기 레벨이 단기간일 때 특히 효과적입니다. 예를 들어, 일일 이벤트와 관련된 일련의 지표는 주간, 월간 등과 관련된 시리즈로 대체됩니다. 이것은 더 명확하게 보여줄 것입니다 "현상의 발전 축". 확대된 구간을 기준으로 계산된 평균은 주요 발전 추세의 방향과 특성(성장 가속 또는 감속)을 식별할 수 있습니다.

이동 평균법이전과 유사하지만, 이 경우 실제 레벨은 커버하는 확장된 간격을 연속적으로 이동(슬라이딩)하기 위해 계산된 평균 레벨로 대체됩니다. 행 수준.

예를 들어수락되면 m=3,그런 다음 먼저 시리즈의 처음 세 수준의 평균을 계산한 다음 동일한 수의 수준에서 연속으로 두 번째부터 시작하여 세 번째부터 시작하는 등의 작업을 수행합니다. 따라서 평균은 말하자면 일련의 역학을 따라 "슬라이드"하여 한 기간 동안 이동합니다. 에서 계산 이동 평균의 구성원은 각 구간의 중간(중앙)을 나타냅니다.

이 방법은 무작위 변동만 제거합니다. 계열에 계절파가 있는 경우 이동 평균 방법으로 평활화한 후 유지됩니다.

분석적 정렬. 무작위 변동을 제거하고 추세를 식별하기 위해 계열의 수준을 분석 공식(또는 분석 정렬)에 따라 정렬합니다. 그 본질은 경험적 (실제) 수준을 이론적 수준으로 대체하는 것입니다. 이론 수준은 시간의 함수로 간주되는 경향의 수학적 모델로 간주되는 특정 방정식에 따라 계산됩니다. . 이 경우 각 실제 수준은 두 구성 요소의 합으로 간주됩니다. 여기서 는 계통 구성 요소로 특정 방정식으로 표현되고 는 추세를 중심으로 변동을 일으키는 확률 변수입니다.

분석 정렬 작업은 다음과 같습니다.

1. 실제 데이터를 기반으로 연구 중인 지표의 개발 추세를 가장 적절하게 반영할 수 있는 가상의 함수 유형을 결정합니다.

2. 실증 데이터에서 지정된 함수(방정식)의 매개변수 찾기

3. 이론적(평준화) 수준의 발견된 방정식에 따라 계산합니다.

특정 기능의 선택은 원칙적으로 경험적 데이터의 그래픽 표현을 기반으로 수행됩니다.

모델은 회귀 방정식으로, 매개변수는 최소 제곱법으로 계산됩니다.

다음은 시계열을 평준화하는 데 가장 일반적으로 사용되는 회귀 방정식으로, 반영하기에 가장 적합한 개발 추세를 나타냅니다.

위 방정식의 매개 변수를 찾기 위해 특수 알고리즘과 컴퓨터 프로그램이 있습니다. 특히, 직선 방정식의 매개변수를 찾기 위해 다음 알고리즘을 사용할 수 있습니다.

시간의 기간 또는 순간에 번호가 매겨져 St = 0이 얻어지면 위의 알고리즘이 크게 단순화되어 다음과 같이 바뀝니다.

차트의 정렬된 수준은 이 동적 계열의 실제 수준에서 가장 가까운 거리를 지나는 하나의 직선에 위치합니다. 제곱 편차의 합은 임의 요인의 영향을 반영합니다.

도움을 받아 방정식의 평균(표준) 오차를 계산합니다.:

여기서 n은 관측값의 수이고 m은 방정식의 매개변수 수입니다(b 1 및 b 0 중 2개 있음).

주요 추세(추세)는 계통적 요인이 일련의 역학 수준에 어떻게 영향을 미치는지 보여주고 추세() 주변 수준의 변동은 잔여 요인의 영향을 측정하는 역할을 합니다.

사용된 시계열 모델의 품질을 평가하기 위해 피셔의 F 테스트. 두 분산의 비율, 즉 회귀로 인한 분산의 비율입니다. 연구된 요인, 무작위 원인, 즉 잔차 분산:

확장된 형식에서 이 기준에 대한 공식은 다음과 같이 나타낼 수 있습니다.

여기서 n은 관측값의 수입니다. 행 수준 수,

m은 방정식의 매개변수 수, y는 계열의 실제 수준,

행의 정렬된 수준 - 행의 평균 수준입니다.

다른 모델보다 더 성공적이지만 모델이 항상 충분히 만족스러운 것은 아닙니다. 기준 F가 특정 임계 한계를 넘는 경우에만 그렇게 인식할 수 있습니다. 이 경계는 F 분포 테이블을 사용하여 설정됩니다.

지수의 본질과 분류.

통계의 지수는 시간, 공간 또는 표준과 비교하여 현상의 크기 변화를 특성화하는 상대적 지표로 이해됩니다.

인덱스 관계의 주요 요소는 인덱스된 값입니다. 색인 값은 통계 모집단의 부호 값으로 이해되며 그 변화가 연구 대상입니다.

인덱스는 세 가지 주요 목적을 수행합니다.

1) 복잡한 현상의 변화 평가

2) 복잡한 현상의 변화에 ​​대한 개별 요인의 영향 결정;

3) 일부 현상의 규모와 과거 기간의 규모, 다른 영역의 규모 및 표준, 계획, 예측과의 비교.

지수는 3가지 기준에 따라 분류됩니다.

2) 인구 요소의 적용 정도;

3) 일반 지수를 계산하는 방법에 의해.

내용별지수는 양적(체적) 지표와 질적 지표의 지표로 나뉜다. 양적 지표의 지표 - 산업 생산의 물리적 볼륨, 판매량의 물리적, 수량 등의 지표 질적 지표의 지표 - 가격, 비용, 노동 생산성, 평균 임금 등의 지표

인구 단위의 적용 범위에 따라 지수는 개인과 일반의 두 가지 클래스로 나뉩니다. 그것들을 특성화하기 위해 인덱스 방법을 적용하는 데 채택된 다음 규칙을 소개합니다.

- 현물 제품의 수량(부피) ; 아르 자형- 생산 단가; - 생산 단가; - 생산량 단위 생산에 소요된 시간(노동 집약도) ; 승- 단위 시간당 가치 측면에서 생산 산출물; V- 단위 시간당 물리적인 출력 - 총 소요 시간 또는 직원 수.

인덱싱된 값이 어느 기간이나 개체에 속하는지 구별하기 위해 오른쪽 하단의 해당 기호 뒤에 첨자를 넣는 것이 일반적입니다. 예를 들어, 역학 지수에서 일반적으로 비교 (현재,보고) 기간에는 첨자 1이 사용되며 비교가 수행되는 기간에는,

개별 지수복잡한 현상의 개별 요소 변화(예: 한 제품 유형의 생산량 변화)를 특성화하는 역할을 합니다. 그들은 역학의 상대적 가치, 의무 이행, 색인 값의 비교를 나타냅니다.

물리적 생산량의 개별 지수가 결정됩니다.

분석적 관점에서, 주어진 개별 역학 지수는 성장률 계수(율)와 유사하고 현재 기간의 지수 값의 변화를 기본 값과 비교하여 특성화합니다. ) 또는 몇 퍼센트 증가(감소)인지. 지수 값은 계수 또는 백분율로 표시됩니다.

일반(복합) 지수복잡한 현상의 모든 요소의 변화를 반영합니다.

집계 색인인덱스의 기본 형식입니다. 분자와 분모가 "집합"의 집합이기 때문에 집계라고합니다.

평균 지수, 그 정의.

집계 지수 외에도 통계에 다른 형태의 가중 평균 지수가 사용됩니다. 사용 가능한 정보가 일반 집계 지수를 계산할 수 없을 때 계산에 의존합니다. 따라서 가격에 대한 데이터는 없지만 현재 기간의 제품 원가에 대한 정보가 있고 각 제품에 대한 개별 가격 지수를 알고 있다면 일반 물가 지수를 종합적으로 결정할 수는 없지만 가능합니다. 개인의 평균으로 계산합니다. 마찬가지로 개별 제품의 생산량을 알 수 없지만 기준 기간의 개별 지수와 생산 비용을 알면 전체 생산량 지수를 가중 평균으로 결정할 수 있습니다.

평균 지수 -이것은개별 지수의 평균으로 계산된 지수. 집계 지수는 일반 지수의 기본 형태이므로 평균 지수는 집계 지수와 같아야 한다. 평균 지수를 계산할 때 산술과 조화의 두 가지 형태의 평균이 사용됩니다.

개별 지수의 가중치가 집계 지수의 분모 항인 경우 산술 평균 지수는 집계 지수와 동일합니다. 이 경우에만 산술 평균 공식에 의해 계산된 지수 값은 집계 지수와 동일합니다.

안녕하세요!

이 기사에서는 STDEV 함수를 사용하여 Excel에서 표준 편차가 작동하는 방식을 고려하기로 결정했습니다. 나는 아주 오랫동안 설명하거나 논평을 하지 않았을 뿐 아니라 단순히 이것이 고등 수학을 공부하는 사람들에게 매우 유용한 기능이기 때문입니다. 그리고 학생들을 돕는 것은 신성합니다. 저는 제 경험을 통해 마스터하는 것이 얼마나 어려운지 압니다. 실제로 표준 편차 함수는 판매된 제품의 안정성을 결정하고, 가격을 생성하고, 구색을 조정하거나 생성하고, 판매에 대한 기타 동등하게 유용한 분석에 사용할 수 있습니다.

Excel은 이 분산 함수의 여러 변형을 사용합니다.


수학 이론

먼저 표준 편차 함수를 Excel에 적용하기 위해, 예를 들어 판매 통계 데이터를 분석하기 위해 수학 언어로 설명할 수 있는 이론에 대해 조금 설명합니다. 나중에 자세히 설명합니다. 나는 즉시 경고합니다. 나는 이해할 수없는 단어를 많이 쓸 것입니다 ...)))) 아래에 텍스트가 있으면 즉시 프로그램의 실제 응용 프로그램을 참조하십시오.

표준편차는 정확히 무엇을 합니까? 분산의 편향되지 않은 추정치를 기반으로 수학적 기대치를 기준으로 확률 변수 X의 표준 편차를 추정합니다. 동의합니다. 혼란스럽게 들릴 수 있지만 학생들은 그것이 실제로 무엇에 관한 것인지 이해할 것입니다!

우선 "표준 편차"를 결정해야 합니다. "표준 편차"를 추가로 계산하려면 공식이 다음과 같이 도움이 됩니다. 공식은 다음과 같이 기술할 수 있다. 확률변수의 측정과 동일한 단위로 측정되며, 표준 산술평균오차를 계산할 때, 신뢰구간을 구성할 때, 통계를 위한 가설을 검증할 때, 분석할 때 사용된다. 독립 변수 간의 선형 관계. 함수는 독립 변수 분산의 제곱근으로 정의됩니다.

이제 우리는 정의하고 표준 편차는 분산의 편향되지 않은 추정치를 기반으로 한 수학적 관점과 비교한 확률 변수 X의 표준 편차 분석입니다. 수식은 다음과 같이 작성됩니다.
두 가지 추정치는 모두 편향되어 제공됩니다. 일반적으로 편향되지 않은 추정치를 구성하는 것은 불가능합니다. 그러나 편향되지 않은 분산 추정치를 기반으로 한 추정치는 일관성이 있습니다.

Excel에서의 실제 구현

자, 이제 지루한 이론에서 벗어나 실제로 STDEV 기능이 어떻게 작동하는지 봅시다. 나는 Excel에서 표준 편차 함수의 모든 변형을 고려하지 않을 것입니다. 하나면 충분하지만 예를 들어보겠습니다. 예를 들어 판매 안정성 통계가 결정되는 방법을 고려하십시오.

먼저 함수의 철자를 보면 알 수 있듯이 매우 간단합니다.

STDEV.G(_number1_;_number2_; ....), 여기서:


이제 예제 파일을 만들고 이를 기반으로 이 함수의 작동을 살펴보겠습니다. 분석 계산의 경우 원칙적으로 모든 통계 분석에서와 같이 최소 3개의 값을 사용해야 하기 때문에 조건부로 3개의 기간을 사용했으며 연, 분기, 월 또는 주가 될 수 있습니다. 제 경우에는 한 달. 최고의 신뢰성을 위해 가능한 한 많은 기간을 사용하는 것이 좋지만 3회 이상은 사용하지 않는 것이 좋습니다. 표의 모든 데이터는 수식의 작업 및 기능을 명확하게 하기 위해 매우 간단합니다.

우선 월별 평균값을 계산해야 합니다. 이를 위해 AVERAGE 함수를 사용하고 공식을 얻습니다. =AVERAGE(C4:E4).
이제 실제로 STDEV.G 함수를 사용하여 표준 편차를 찾을 수 있습니다. 그 값은 각 기간의 상품 판매를 기록해야 하는 값입니다. 결과는 \u003d STDEV.G (C4, D4, E4) 형식의 공식입니다.
자, 작업의 절반이 끝났습니다. 다음 단계에서 "변동"을 형성합니다. 이는 평균값, 표준 편차로 나누고 결과를 백분율로 변환하여 얻습니다. 다음 표를 얻습니다.
글쎄, 주요 계산은 끝났고 판매가 어떻게 안정적으로 진행되고 있는지 알아내는 것이 남아 있습니다. 10%의 편차가 안정적인 것으로 간주되는 조건을 가정해 보겠습니다. 10~25%는 작은 편차이지만 25%를 초과하는 모든 것은 더 이상 안정적이지 않습니다. 조건에 따라 결과를 얻으려면 논리를 사용하고 결과를 얻으려면 다음 공식을 작성합니다.

IF(H4<0,1;"стабильно";ЕСЛИ(H4<0,25;"нормально";"не стабильно"))

모든 범위는 명확성을 위해 조건부로 취해지며 귀하의 작업은 완전히 다른 조건을 가질 수 있습니다.
데이터 시각화를 향상시키려면 테이블에 수천 개의 위치가 있을 때 필요한 특정 조건을 적용하거나 이를 사용하여 색 구성표로 특정 옵션을 강조 표시하면 매우 시각적입니다.

먼저 조건부 서식을 적용할 항목을 선택합니다. "홈" 제어판에서 "조건부 서식"을 선택하고 드롭다운 메뉴에서 "셀 선택 규칙" 항목을 선택한 다음 "텍스트에 ... 포함" 메뉴 항목을 클릭합니다. 조건을 입력하는 대화 상자가 나타납니다.

예를 들어 "안정적"-녹색, "정상"-노란색 및 "안정적이지 않음"-빨간색과 같은 조건을 작성한 후 우선주의해야 할 사항을 볼 수있는 아름답고 이해하기 쉬운 테이블을 얻습니다.

STDEV.H 함수에 VBA 사용

관심 있는 사람들은 매크로를 사용하여 계산을 자동화하고 다음 기능을 사용할 수 있습니다.

함수 MyStDevP(Arr) Dim x, aCnt&, aSum#, aAver#, tmp# For Each x In Arr aSum = aSum + x "배열 요소의 합 계산 aCnt = aCnt + 1 "요소 수 계산 Next x aAver = aSum / aCnt "각 x In Arr의 평균값 tmp = tmp + (x - aAver) ^ 2 "배열의 요소와 평균 간의 차이의 제곱의 합을 계산합니다. Next x MyStDevP = Sqr(tmp / aCnt ) "STDEV.G() 종료 기능 계산

함수 MyStDevP(Arr)

Dim x , aCnt & , aSum #, aAver#, tmp#

Arr의 각 x에 대해

합 = 합 + x "배열 요소의 합 계산