신뢰 구간을 계산하는 방법.  일반 모집단의 수학적 기대치를 위한 신뢰 구간 구축

신뢰 구간을 계산하는 방법. 일반 모집단의 수학적 기대치를 위한 신뢰 구간 구축

통계에는 두 가지 유형의 추정치가 있습니다. 포인트 및 간격. 포인트 추정모집단 모수를 추정하는 데 사용되는 단일 표본 통계입니다. 예를 들어, 표본 평균 는 모집단 평균의 점 추정치이고 표본 분산은 시즌2- 모집단 분산의 점 추정치 σ2. 표본 평균은 모집단 기대치의 편향되지 않은 추정치인 것으로 나타났습니다. 표본 평균은 모든 표본 평균의 평균(표본 크기가 동일하기 때문에 편향되지 않음) N)은 일반 인구의 수학적 기대치와 같습니다.

표본 분산을 위해 시즌2모집단 분산의 편향되지 않은 추정량이 되었습니다. σ2, 표본 분산의 분모는 다음과 같이 설정되어야 합니다. N – 1 , 하지만 N. 즉, 모집단 분산은 가능한 모든 표본 분산의 평균입니다.

모집단 매개변수를 추정할 때 다음과 같은 표본 통계를 염두에 두어야 합니다. , 특정 샘플에 따라 다릅니다. 이 사실을 고려하여 간격 추정일반 모집단의 수학적 기대는 표본 평균의 분포를 분석합니다(자세한 내용은 참조). 구성된 구간은 일반 모집단의 실제 매개변수가 올바르게 추정될 확률인 특정 신뢰 수준을 특징으로 합니다. 유사한 신뢰 구간을 사용하여 기능의 비율을 추정할 수 있습니다. 아르 자형그리고 일반 인구의 주요 분포 질량.

형식의 메모, 형식의 예 다운로드

건물 신뢰 구간알려진 표준 편차가 있는 일반 모집단의 수학적 기대치

일반 모집단의 특성 비율에 대한 신뢰 구간 구축

이 섹션에서는 신뢰 구간의 개념을 범주형 데이터로 확장합니다. 이를 통해 일반 인구에서 특성의 점유율을 추정할 수 있습니다. 아르 자형샘플 공유와 함께 아르 자형에스= X/N. 언급했듯이 값이 N아르 자형그리고 N(1 - p)숫자 5를 초과하면 이항 분포를 정규 분포로 근사할 수 있습니다. 따라서 일반 인구에서 특성의 몫을 추정하려면 아르 자형신뢰 수준이 다음과 같은 구간을 구성할 수 있습니다. (1 - α)x100%.


어디 에스- 기능의 샘플 점유율, 다음과 같습니다. 엑스/N, 즉. 성공 횟수를 표본 크기로 나눈 값, 아르 자형- 일반 인구에서 특성의 몫, 는 표준화된 정규 분포의 임계값이며, N- 표본의 크기.

실시예 3부터라고 가정해 봅시다. 정보 시스템이내에 완료된 인보이스 100개 샘플을 검색했습니다. 지난 달. 이 인보이스 중 10개가 잘못되었다고 가정해 보겠습니다. 이런 식으로, 아르 자형= 10/100 = 0.1. 95% 신뢰 수준은 임계값 Z = 1.96에 해당합니다.

따라서 인보이스의 4.12%에서 15.88% 사이에 오류가 포함될 확률이 95%입니다.

주어진 표본 크기에 대해 모집단의 특성 비율을 포함하는 신뢰 구간은 연속 랜덤 변수. 이는 연속형 확률 변수의 측정값이 범주형 데이터의 측정값보다 더 많은 정보를 포함하기 때문입니다. 즉, 두 개의 값만 취하는 범주형 데이터에는 분포의 모수를 추정하기에는 정보가 충분하지 않습니다.

유한 모집단에서 가져온 추정치 계산

수학적 기대치의 추정.최종 모집단에 대한 보정 계수( fpc)을 줄이기 위해 사용되었습니다. 표준 에러제 시간에. 모집단 모수 추정치에 대한 신뢰 구간을 계산할 때 대체 없이 표본을 추출하는 상황에서 보정 계수가 적용됩니다. 따라서 수학적 기대에 대한 신뢰 구간은 다음과 같은 신뢰 수준을 갖습니다. (1 - α)x100%는 다음 공식으로 계산됩니다.

실시예 4유한 모집단에 대한 수정 계수의 적용을 설명하기 위해 위의 예 3에서 논의한 평균 송장 금액에 대한 신뢰 구간을 계산하는 문제로 돌아가겠습니다. 한 회사가 매월 5,000개의 송장을 발행하고, 엑스=110.27 USD, 에스= $28.95 N = 5000, N = 100, α = 0.05, t99 = 1.9842. 공식 (6)에 따르면 다음을 얻습니다.

기능의 몫 추정.반환 없음을 선택할 때 신뢰 수준이 다음과 같은 특징의 비율에 대한 신뢰 구간 (1 - α)x100%는 다음 공식으로 계산됩니다.

신뢰 구간 및 윤리적 문제

모집단을 샘플링하고 통계적 추론을 공식화할 때 윤리적 문제가 종종 발생합니다. 가장 중요한 것은 표본 통계의 신뢰 구간과 점 추정치가 일치하는 방식입니다. 적절한 신뢰 구간(일반적으로 95% 신뢰 수준에서)과 표본 크기를 지정하지 않은 출판 지점 추정치는 오해의 소지가 있습니다. 이것은 사용자에게 점 추정치가 전체 모집단의 속성을 예측하는 데 필요한 정확한 것이라는 인상을 줄 수 있습니다. 따라서 어떤 연구에서든 포인트가 아니라 구간 추정이 최우선이라는 점을 이해해야 합니다. 게다가, 특별한 주의주어져야 한다 올바른 선택샘플 크기.

대부분의 경우 통계 조작의 대상은 다양한 인구에 대한 사회 학적 조사 결과입니다. 정치적 이슈. 동시에 설문조사 결과는 신문 1면에 실리고 중간 어딘가에는 표본오차와 통계분석 방법론이 실려 있다. 얻은 점 추정치의 유효성을 증명하려면 얻은 기준으로 표본 크기, 신뢰 구간의 경계 및 유의 수준을 표시해야 합니다.

다음 메모

관리자를 위한 Levin et al. Statistics 책의 자료가 사용됩니다. - M.: Williams, 2004. - p. 448–462

중심극한정리충분히 큰 표본 크기가 주어지면 평균의 표본 분포가 정규 분포에 의해 근사화될 수 있음을 나타냅니다. 이 속성은 인구 분포 유형에 의존하지 않습니다.

신뢰 구간(CI, 영어로, 신뢰 구간 - CI) 표본의 연구에서 얻은 모든 환자의 모집단에 대한 결론을 도출하기 위해 연구 결과의 정확도(또는 불확실성) 측정값을 제공합니다( 인구). 95% CI의 올바른 정의는 다음과 같이 공식화할 수 있습니다. 이러한 간격의 95%는 모집단의 실제 값을 포함합니다. 이 해석은 다소 덜 정확합니다. CI는 실제 값이 포함되어 있다고 95% 확신할 수 있는 값 범위입니다. CI를 사용할 때 통계적 유의성을 테스트한 결과 P 값이 아닌 양적 효과를 결정하는 데 중점을 둡니다. P 값은 어떤 양도 평가하지 않고 오히려 "영향 없음"이라는 귀무 가설에 대한 증거의 강도를 측정하는 역할을 합니다. P 값 자체는 차이의 크기나 방향에 대해 아무 것도 알려주지 않습니다. 따라서 P의 독립적인 값은 기사나 초록에서 절대적으로 유용하지 않습니다. 대조적으로 CI는 치료의 유용성과 같은 즉각적인 관심의 효과의 양과 근거의 강도를 나타냅니다. 따라서 DI는 DM의 실행과 직접적인 관련이 있습니다.

에 대한 평가 접근 통계 분석 CI로 설명된 는 관심 효과(진단 검사의 민감도, 예상 발생률, 치료에 따른 상대 위험 감소 등)의 양을 측정하고 이 효과의 불확실성을 측정하는 것을 목표로 합니다. 대부분의 경우 CI는 실제 값이 있을 가능성이 있는 추정치의 양쪽 값 범위이며 95% 확신할 수 있습니다. 95% 확률을 사용하는 규칙은 임의적이며 P 값<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI는 다른 환자 세트에 대해 수행된 동일한 연구가 동일한 결과를 생성하지 않을 것이지만 그 결과는 사실이지만 알려지지 않은 값을 중심으로 분포된다는 아이디어를 기반으로 합니다. 즉, CI는 이를 "표본 종속 변동성"으로 설명합니다. CI는 다른 원인으로 인한 추가 불확실성을 반영하지 않습니다. 특히 추적, 불량한 순응도 또는 부정확한 결과 측정, 맹검 부족 등에 대한 환자의 선택적 손실의 영향은 포함하지 않습니다. 따라서 CI는 항상 불확실성의 총량을 과소평가합니다.

신뢰구간 계산

표 A1.1. 일부 임상 측정에 대한 표준 오차 및 신뢰 구간

일반적으로 CI는 두 비율 간의 차이(d)와 해당 차이 추정치의 표준 오차(SE)와 같은 정량적 측정의 관측된 추정치에서 계산됩니다. 이렇게 얻은 대략적인 95% CI는 d ± 1.96 SE입니다. 공식은 결과 측정의 성격과 CI의 적용 범위에 따라 변경됩니다. 예를 들어, 무세포 백일해 백신에 대한 무작위 위약 대조 시험에서 백일해는 백신을 접종한 영아 1670명 중 72명(4.3%)과 대조군에서 1665명 중 240명(14.4%)에서 발생했습니다. 절대 위험 감소로 알려진 백분율 차이는 10.1%입니다. 이 차이의 SE는 0.99%입니다. 따라서 95% CI는 10.1% + 1.96 x 0.99%입니다. 8.2에서 12.0으로.

다양한 철학적 접근 방식에도 불구하고 통계적 유의성에 대한 CI와 테스트는 수학적으로 밀접하게 관련되어 있습니다.

따라서 P의 값은 "유의한" 것입니다. 아르 자형<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

CI로 표시되는 추정치의 불확실성(부정확성)은 표본 크기의 제곱근과 크게 관련이 있습니다. 작은 샘플은 큰 샘플보다 적은 정보를 제공하며 CI는 작은 샘플에서 그에 따라 더 넓습니다. 예를 들어, 헬리코박터 파일로리 감염을 진단하는 데 사용된 세 가지 검사의 성능을 비교한 기사에서는 요소 호흡 검사 민감도가 95.8%(95% CI 75-100)라고 보고했습니다. 95.8%라는 수치는 인상적으로 보이지만 24명의 성인 H. pylori 환자의 작은 표본 크기는 넓은 CI에서 볼 수 있듯이 이 추정치에 상당한 불확실성이 있음을 의미합니다. 실제로 75%의 하한선은 95.8% 추정치보다 훨씬 낮습니다. 240명의 표본에서 동일한 민감도가 관찰된 경우 95% CI는 92.5-98.0이 되어 테스트가 매우 민감하다는 것을 더 확신할 수 있습니다.

무작위 대조 시험(RCT)에서 중요하지 않은 결과(즉, P > 0.05인 결과)는 특히 잘못 해석되기 쉽습니다. CI는 결과가 임상적으로 유용한 실제 효과와 얼마나 호환되는지를 나타내기 때문에 여기에서 특히 유용합니다. 예를 들어, 결장에서 봉합사와 스테이플 문합을 비교하는 RCT에서 상처 감염은 각각 환자의 10.9% 및 13.5%에서 발생했습니다(P = 0.30). 이 차이에 대한 95% CI는 2.6%(-2 ~ +8)입니다. 652명의 환자가 포함된 이 연구에서도 두 절차로 인한 감염 발생률에 약간의 차이가 있을 가능성이 있습니다. 연구가 작을수록 불확실성이 커집니다. Sung et al. 는 100명의 환자에서 급성 정맥류 출혈에 대해 octreotide 주입과 응급 경화 요법을 비교하는 RCT를 수행했습니다. octreotide 그룹에서 출혈 정지율은 84%였습니다. 경화 요법 그룹에서 - 90%, P = 0.56을 제공합니다. 계속되는 출혈의 비율은 언급된 연구에서 상처 감염의 비율과 유사합니다. 그러나 이 경우 중재의 차이에 대한 95% CI는 6%(-7 ~ +19)입니다. 이 범위는 임상적으로 중요한 5% 차이에 비해 상당히 넓습니다. 이 연구가 효능의 유의한 차이를 배제하지 않는다는 것은 분명합니다. 따라서 저자의 "옥트레오타이드 주입과 경화요법은 정맥류 출혈 치료에 동등하게 효과적"이라는 결론은 확실히 유효하지 않습니다. 이와 같이 절대 위험 감소(ARR)에 대한 95% CI에 0이 포함되는 경우 NNT에 대한 CI(치료에 필요한 수)는 해석하기가 다소 어렵습니다. NLP 및 해당 CI는 ACP의 역수에서 얻습니다(이 값이 백분율로 제공되는 경우 100을 곱함). 여기에서 NPP = 100: 6 = 16.6, 95% CI -14.3~5.3을 얻습니다. 표의 각주 "d"에서 알 수 있듯이. A1.1, 이 CI에는 5.3에서 무한대까지의 NTPP 및 14.3에서 무한대까지의 NTLP 값이 포함됩니다.

CI는 가장 일반적으로 사용되는 통계적 추정 또는 비교를 위해 구성할 수 있습니다. RCT의 경우 평균 비율, 상대 위험, 승산비 및 NRR 간의 차이가 포함됩니다. 유사하게, CI는 진단 테스트 정확도 연구에서 만들어진 모든 주요 추정치(민감도, 특이성, 양성 예측값(모두 단순 비율임) 및 우도비)에 대해 얻을 수 있습니다. 연구. 이러한 DI 사용의 많은 부분을 다루는 개인용 컴퓨터 프로그램은 Statistics with Confidence의 두 번째 버전에서 사용할 수 있습니다. 비율에 대한 CI 계산을 위한 매크로는 http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm에서 Excel과 통계 프로그램 SPSS 및 Minitab에서 무료로 사용할 수 있습니다.

치료 효과에 대한 다중 평가

CI 구성은 연구의 주요 결과에 바람직하지만 모든 결과에 필요한 것은 아닙니다. CI는 임상적으로 중요한 비교와 관련이 있습니다. 예를 들어, 두 그룹을 비교할 때 올바른 CI는 위의 예와 같이 그룹 간의 차이에 대해 작성된 것이며 각 그룹의 추정에 대해 작성할 수 있는 CI가 아닙니다. 각 그룹의 점수에 대해 별도의 CI를 제공하는 것은 쓸모가 없을 뿐만 아니라 이 프레젠테이션은 오해의 소지가 있습니다. 마찬가지로, 서로 다른 하위 그룹에서 치료 효능을 비교할 때 올바른 접근 방식은 두 개(또는 그 이상)의 하위 그룹을 직접 비교하는 것입니다. CI가 효과 없음에 해당하는 값을 제외하고 다른 하위 그룹은 그렇지 않은 경우 치료가 한 하위 그룹에서만 효과적이라고 가정하는 것은 올바르지 않습니다. CI는 여러 하위 그룹의 결과를 비교할 때도 유용합니다. 무화과에. A1.1은 황산마그네슘의 위약 대조 RCT에서 여성의 하위 그룹에서 자간전증이 있는 여성의 자간증의 상대적 위험을 보여줍니다.

쌀. A1.2. Forest Graph는 설사 예방을 위한 소 로타바이러스 백신 대 위약의 11가지 무작위 임상 시험 결과를 보여줍니다. 95% 신뢰 구간은 설사의 상대 위험을 추정하는 데 사용되었습니다. 검은색 사각형의 크기는 정보의 양에 비례합니다. 또한, 치료 효능에 대한 요약 추정치와 95% 신뢰 구간(마름모꼴로 표시됨)이 표시됩니다. 메타 분석은 미리 설정된 일부를 초과하는 무작위 효과 모델을 사용했습니다. 예를 들어, 샘플 크기를 계산하는 데 사용되는 크기일 수 있습니다. 보다 엄격한 기준에서 전체 CI 범위는 미리 결정된 최소값을 초과하는 이점을 보여야 합니다.

우리는 이미 두 가지 치료법이 동등하게 효과적이라는 표시로 통계적 유의성의 부재를 취하는 오류에 대해 논의했습니다. 통계적 유의성을 임상적 유의성과 동일시하지 않는 것도 마찬가지로 중요합니다. 결과가 통계적으로 유의하고 치료 반응의 크기가 클 때 임상적 중요성을 가정할 수 있습니다.

연구는 결과가 통계적으로 유의한지 여부와 임상적으로 중요한 것과 그렇지 않은 것을 보여줄 수 있습니다. 무화과에. A1.2는 전체 CI가<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

분산의 알려진 값의 경우 분포의 평균값을 추정하기 위해 MS EXCEL에서 신뢰 구간을 구축해 보겠습니다.

물론 선택 신뢰 수준당면한 작업에 전적으로 의존합니다. 따라서 항공기의 신뢰성에 대한 항공 승객의 신뢰 정도는 물론 전구의 신뢰성에 대한 구매자의 신뢰 정도보다 높아야합니다.

작업 공식화

부터라고 가정해 봅시다. 인구찍은 견본크기 n. 다음과 같이 가정합니다. 표준 편차이 분포는 알려져 있습니다. 이를 바탕으로 필요한 샘플미지의 평가 분포 평균(μ, ) 해당하는 구성 양측 신뢰 구간.

포인트 추정

에서 알 수 있듯이 통계(부르자 X 참조) 이다 평균의 편향되지 않은 추정이것 인구분포는 N(μ;σ 2 /n)입니다.

메모: 구축해야 하는 경우 신뢰 구간유통의 경우, 아니다 정상?이 경우 충분히 큰 크기로 구출됩니다. 샘플 n 분포에서 정상, 통계의 샘플링 분포 Х av될거야 대응하다 정규 분포매개변수 N(μ;σ 2 /n) 사용.

그래서, 포인트 견적 가운데 분포 값우리는 표본 평균, 즉. X 참조. 이제 바빠지자 신뢰 구간.

신뢰 구간 구축

일반적으로 분포와 그 모수를 알면 확률 변수가 주어진 간격에서 값을 취할 확률을 계산할 수 있습니다. 이제 반대로 해봅시다. 확률 변수가 주어진 확률로 떨어지는 구간을 찾으십시오. 예를 들어 속성에서 정규 분포 95%의 확률로 확률 변수가 정상법, 에서 약 +/- 2 간격 내에 속합니다. 평균값(에 대한 기사 참조). 이 간격은 신뢰 구간.

이제 분포를 알고 있는지 봅시다. , 이 간격을 계산하려면? 질문에 답하려면 분포의 형태와 매개변수를 지정해야 합니다.

우리는 분포의 형태가 정규 분포(우리가 말하는 것을 기억하십시오. 샘플링 분포 통계 X 참조).

매개변수 μ는 우리에게 알려지지 않았습니다(다음을 사용하여 추정하면 됩니다. 신뢰 구간), 그러나 우리는 그 추정치를 가지고 있습니다 X 참조,에 따라 계산 견본,사용할 수 있습니다.

두 번째 매개변수는 표본 평균 표준 편차 알려질 것이다, σ/√n과 같습니다.

왜냐하면 μ를 모르면 간격 +/- 2를 생성합니다. 표준편차출신이 아닌 평균값그러나 알려진 추정치에서 X 참조. 저것들. 계산할 때 신뢰 구간우리는 가정하지 않습니다 X 참조간격 +/- 2에 속합니다. 표준편차 95%의 확률로 μ에서 시작하고 간격이 +/- 2라고 가정합니다. 표준편차~에서 X 참조 95%의 확률로 μ를 덮을 것입니다. - 일반 인구의 평균,어떤에서 견본. 이 두 명령문은 동일하지만 두 번째 명령문을 사용하면 다음을 구성할 수 있습니다. 신뢰 구간.

또한 간격을 세분화합니다. 정상법, 95% 확률로 +/- 1.960 구간에 해당 표준 편차,+/- 2 아님 표준편차. 이것은 공식을 사용하여 계산할 수 있습니다 \u003d NORM.ST.OBR ((1 + 0.95) / 2), 센티미터. 샘플 파일 시트 간격.

이제 우리는 다음을 형성하는 데 도움이 될 확률적 진술을 공식화할 수 있습니다. 신뢰 구간:
"그 확률은 인구 평균에서 위치 표본 평균 1.960" 이내 표본 평균의 표준 편차", 는 95%와 같습니다.

명령문에 언급된 확률 값에는 특별한 이름이 있습니다. , 와 관련이 있습니다.간단한 식에 의한 유의 수준 α(알파) 신뢰 수준 =1 . 우리의 경우 유의 수준 α =1-0,95=0,05 .

이제 이 확률적 진술을 기반으로 다음을 계산하는 표현식을 작성합니다. 신뢰 구간:

여기서 Zα/2 기준 정규 분포(이와 같은 임의의 변수 값 , 무엇 (>=Zα/2 )=α/2).

메모: 상위 α/2-분위수너비를 정의합니다 신뢰 구간안에 표준편차 표본 평균. 상위 α/2-분위수 기준 정규 분포는 항상 0보다 크므로 매우 편리합니다.

우리의 경우 α=0.05에서, 상위 α/2-분위수 1.960과 같습니다. 기타 유의 수준 α의 경우(10%, 1%) 상위 α/2-분위수 Zα/2 공식 \u003d NORM.ST.OBR (1-α / 2)를 사용하여 계산하거나 알려진 경우 신뢰 수준, =NORM.ST.OBR((1+신뢰 수준)/2).

보통 건물을 지을 때 평균 추정을 위한 신뢰 구간만 사용 상위 α/2-분위수그리고 사용하지 마세요 낮은 α/2-분위수. 이것이 가능하기 때문에 기준 정규 분포 x축에 대해 대칭( 분포 밀도에 대해 대칭 평균, 즉 0). 따라서 계산할 필요가 없다. 낮은 α/2-quantile(간단히 α라고 합니다. /2-분위수), 왜냐하면 그것은 동등하다 상위 α/2-분위수빼기 기호로.

x 분포의 모양에 관계없이 해당 확률 변수는 X 참조분산 좋아 N(μ;σ 2 /n) (관련 기사 참조). 따라서 일반적으로 위의 식은 신뢰 구간대략적인 것입니다. x가 분포하는 경우 정상법 N(μ;σ 2 /n), 다음 식 신뢰 구간정확합니다.

MS EXCEL의 신뢰 구간 계산

문제를 해결합시다.
입력 신호에 대한 전자 부품의 응답 시간은 장치의 중요한 특성입니다. 한 엔지니어가 95%의 신뢰 수준에서 평균 응답 시간에 대한 신뢰 구간을 표시하려고 합니다. 엔지니어는 이전 경험에서 응답 시간의 표준 편차가 8ms라는 것을 알고 있습니다. 엔지니어는 응답 시간을 추정하기 위해 25번의 측정을 수행했으며 평균 값은 78ms인 것으로 알려져 있습니다.

해결책: 엔지니어가 전자 장치의 응답 시간을 알고 싶어하지만 응답 시간이 고정되어 있지 않고 자체 분포가 있는 확률 변수라는 것을 이해하고 있습니다. 따라서 그가 기대할 수 있는 최선은 이 분포의 매개변수와 모양을 결정하는 것입니다.

불행히도 문제의 상태에서 응답 시간 분포의 형태를 알지 못합니다(일 필요는 없습니다. 정상). , 이 분포도 알 수 없습니다. 그 사람만이 알려져 있다 표준 편차σ=8. 따라서 확률을 계산하고 구성할 수는 없지만 신뢰 구간.

그러나 분포를 알지 못하더라도 시각 별도 응답, 우리는 에 따라 CPT, 샘플링 분포 평균 응답 시간대략 정상(우리는 조건이 CPT수행되기 때문에 크기 샘플충분히 큰 (n=25)) .

뿐만 아니라, 평균이 분포는 다음과 같습니다. 평균값단위 응답 분포, 즉 μ. 하지만 표준 편차이 분포의 (σ/√n)은 공식 =8/ROOT(25)를 사용하여 계산할 수 있습니다.

엔지니어가 받은 것으로도 알려져 있습니다. 포인트 견적 78ms와 동일한 매개변수 μ(X cf). 따라서 이제 확률을 계산할 수 있습니다. 우리는 분포 형태를 알고 있습니다( 정상) 및 해당 매개변수(Х ср 및 σ/√n).

엔지니어가 알고 싶어 기대값응답 시간 분포의 μ. 위에서 언급했듯이 이 μ는 다음과 같습니다. 평균 응답 시간의 표본 분포에 대한 기대. 우리가 사용하는 경우 정규 분포 N(X cf; σ/√n), 그러면 원하는 μ는 약 95%의 확률로 +/-2*σ/√n 범위에 있을 것입니다.

유의수준 1-0.95=0.05와 같습니다.

마지막으로 왼쪽과 오른쪽 테두리를 찾습니다. 신뢰 구간.
왼쪽 테두리: \u003d 78-NORM.ST.INR (1-0.05 / 2) * 8 / 루트 (25) = 74,864
오른쪽 테두리: \u003d 78 + NORM. ST. OBR (1-0.05 / 2) * 8 / 루트 (25) \u003d 81.136

왼쪽 테두리: =NORM.INV(0.05/2, 78, 8/SQRT(25))
오른쪽 테두리: =NORM.INV(1-0.05/2, 78, 8/SQRT(25))

대답: 신뢰 구간~에 95% 신뢰 수준 및 σ=8밀리초같음 78+/-3.136ms

시트 Sigma의 예제 파일알려진 계산 및 구성을 위한 양식을 만들었습니다. 양측 신뢰 구간임의의 샘플주어진 σ와 유의 수준.

CONFIDENCE.NORM() 함수

값이 샘플범위에 있습니다 B20:B79 , ㅏ 유의 수준 0.05와 동일; 그런 다음 MS Excel 공식:
=AVERAGE(B20:B79)-Confidence(0.05,σ, COUNT(B20:B79))
왼쪽 테두리를 반환합니다 신뢰 구간.

다음 공식을 사용하여 동일한 경계를 계산할 수 있습니다.
=AVERAGE(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

메모: TRUST.NORM() 함수는 MS EXCEL 2010에 등장했습니다. MS EXCEL의 이전 버전에서는 TRUST() 함수를 사용했습니다.

사람은 자신의 능력을 적용하려고 노력해야만 자신의 능력을 인식할 수 있습니다. (세네카)

신뢰 구간

일반 검토

모집단에서 표본을 추출하여 관심 매개변수의 점 추정치를 얻고 추정값의 정확성을 나타내기 위해 표준 오차를 계산합니다.

그러나 대부분의 경우 표준오차는 허용되지 않습니다. 이 정밀도 측정값을 모집단 모수에 대한 구간 추정값과 결합하는 것이 훨씬 더 유용합니다.

이는 모수에 대한 신뢰 구간(CI - 신뢰 구간, CI - 신뢰 구간)을 계산하기 위해 표본 통계(모수)의 이론적 확률 분포에 대한 지식을 사용하여 수행할 수 있습니다.

일반적으로 신뢰 구간은 (주어진 매개변수의) 표준 오차의 배수만큼 양방향으로 추정치를 확장합니다. 간격을 정의하는 두 값(신뢰 한계)은 일반적으로 쉼표로 구분되고 괄호로 묶입니다.

평균에 대한 신뢰 구간

정규 분포 사용

표본평균은 표본크기가 크면 정규분포를 가지므로 표본평균을 고려할 때 정규분포에 대한 지식을 적용할 수 있다.

특히 표본 평균 분포의 95%가 모집단 평균의 1.96 표준 편차(SD) 내에 있습니다.

표본이 하나만 있는 경우 이를 평균의 표준 오차(SEM)라고 하고 평균에 대한 95% 신뢰 구간을 다음과 같이 계산합니다.

이 실험을 여러 번 반복하면 구간에 시간의 95%인 실제 모집단 평균이 포함됩니다.

이것은 일반적으로 실제 모집단 평균(일반 평균)이 95% 신뢰 수준에 있는 값 범위와 같은 신뢰 구간입니다.

이러한 방식으로 신뢰 구간을 해석하는 것이 매우 엄격하지는 않지만(모집단 평균은 고정된 값이므로 이와 관련된 확률을 가질 수 없음) 개념적으로 이해하기가 더 쉽습니다.

용법 티-분포

모집단의 분산 값을 알고 있으면 정규 분포를 사용할 수 있습니다. 또한 표본 크기가 작을 때 모집단의 기초가 되는 데이터가 정규 분포를 따르는 경우 표본 평균은 정규 분포를 따릅니다.

모집단의 기초가 되는 데이터가 정규 분포를 따르지 않거나 일반 분산(인구 분산)을 알 수 없는 경우 표본 평균은 다음을 따릅니다. 스튜던트 t-분포.

다음과 같이 모집단 평균에 대한 95% 신뢰 구간을 계산합니다.

어디서 - 백분율 포인트(백분위수) 티-자유도가 (n-1)인 스튜던트 분포로 0.05의 양측 확률을 제공합니다.

일반적으로 정규 분포를 사용할 때보다 더 넓은 구간을 제공합니다. 이는 모집단 표준 편차 추정 및/또는 작은 표본 크기로 인해 발생하는 추가 불확실성을 고려하기 때문입니다.

표본 크기가 100개 이상인 경우 두 분포의 차이( t-학생및 정상)은 무시할 수 있습니다. 그러나 항상 사용 티-표본 크기가 크더라도 신뢰 구간을 계산할 때 분포.

일반적으로 95% CI가 제공됩니다. 평균에 대한 99% CI와 같은 다른 신뢰 구간을 계산할 수 있습니다.

표준오차와 표 값의 곱 대신 티- 0.05의 양측 확률에 해당하는 분포에 0.01의 양측 확률에 해당하는 값을 곱합니다(표준 오차). 이는 구간에 실제로 모집단 평균이 포함된다는 신뢰도가 높아졌기 때문에 95%의 경우보다 더 넓은 신뢰 구간입니다.

비율에 대한 신뢰 구간

비율의 샘플링 분포에는 이항 분포가 있습니다. 그러나 표본 크기가 N합리적으로 크면 비율 표본 분포가 평균 과 거의 정규화됩니다.

샘플링 비율로 추정 p=r/n(어디 아르 자형- 우리가 관심 있는 특성을 가진 표본의 개인 수) 및 표준 오차는 다음과 같이 추정됩니다.

비율에 대한 95% 신뢰 구간은 다음과 같이 추정됩니다.

표본 크기가 작은 경우(보통 NP또는 n(1-p)더 적은 5 ), 정확한 신뢰 구간을 계산하기 위해 이항 분포를 사용해야 합니다.

경우에 유의하십시오. 백분율로 표시한 다음 (1-p)~로 교체되다 (100p).

신뢰 구간의 해석

신뢰 구간을 해석할 때 다음 질문에 관심이 있습니다.

신뢰구간은 얼마나 넓은가?

넓은 신뢰 구간은 추정치가 정확하지 않음을 나타냅니다. 좁은 것은 정밀한 추정치를 나타냅니다.

신뢰 구간의 너비는 표준 오차의 크기에 따라 달라지며, 이는 차례로 표본 크기에 따라 달라지며 데이터의 변동성에서 숫자 변수를 고려할 때 큰 데이터 세트에 대한 연구보다 더 넓은 신뢰 구간을 제공합니다 소수의 변수.

CI에 특정 관심 값이 포함되어 있습니까?

모집단 모수에 대한 가능한 값이 신뢰 구간 내에 속하는지 여부를 확인할 수 있습니다. 그렇다면 결과는 이 가능한 값과 일치합니다. 그렇지 않은 경우 매개변수에 이 값이 있을 가능성은 거의 없습니다(95% 신뢰 구간의 경우 확률은 거의 5%).

신뢰 구간.

신뢰 구간의 계산은 해당 매개변수의 평균 오차를 기반으로 합니다. 신뢰 구간 확률(1-a)이 있는 한계 내에서 추정된 매개변수의 실제 값이 표시됩니다. 다음은 유의 수준입니다. (1-a)는 신뢰 수준이라고도 합니다.

첫 번째 장에서 우리는 예를 들어 산술 평균의 경우 실제 모집단 평균이 시간의 약 95%에서 평균의 2 평균 오차 내에 있음을 보여주었습니다. 따라서 평균에 대한 95% 신뢰 구간의 경계는 표본 평균에서 평균의 평균 오차의 두 배, 즉 평균의 평균 오차에 신뢰 수준에 따라 달라지는 몇 가지 요인을 곱합니다. 평균과 평균의 차이에 대해서는 스튜던트 계수(스튜던트 기준의 임계값)를, 몫의 몫과 차이에 대해서는 z 기준의 임계값을 취합니다. 계수와 평균 오차의 곱은 이 매개변수의 한계 오차, 즉 평가할 때 얻을 수 있는 최대값.

에 대한 신뢰 구간 산술 평균 : .

다음은 샘플 평균입니다.

산술 평균의 평균 오차;

에스-표본 표준 편차;

N

f = n-1(학생 계수).

에 대한 신뢰 구간 산술 평균의 차이 :

다음은 표본 평균의 차이입니다.

- 산술 평균의 차이의 평균 오차;

초 1 초 2 -표본 표준 편차;

n1,n2

주어진 유의 수준 및 자유도에 대한 학생 기준의 임계값 f=n1 +n2-2(학생 계수).

에 대한 신뢰 구간 주식 :

.

여기서 d는 샘플 점유율입니다.

– 평균 공유 오류;

N– 표본 크기(그룹 크기);

에 대한 신뢰 구간 차이점을 공유하다 :

다음은 샘플 몫의 차이입니다.

산술 평균 간의 차이의 평균 오차입니다.

n1,n2– 표본 크기(그룹 수);

주어진 유의 수준 a( , , )에서 기준 z의 임계값.

지표의 차이에 대한 신뢰 구간을 계산하면 먼저 점 추정치가 아닌 효과의 가능한 값을 직접 볼 수 있습니다. 둘째, 귀무가설의 수용 또는 반박에 대한 결론을 도출할 수 있고, 셋째, 기준의 검정력에 대한 결론을 도출할 수 있습니다.

신뢰 구간을 사용하여 가설을 테스트할 때 다음 규칙을 따라야 합니다.

평균 차이의 100(1-a)% 신뢰 구간에 0이 포함되지 않으면 차이는 유의 수준에서 통계적으로 유의합니다. 반대로 이 구간에 0이 포함되어 있으면 차이가 통계적으로 유의하지 않습니다.

실제로 이 간격에 0이 포함되어 있으면 비교 지표가 다른 그룹에 비해 그룹 중 하나에서 더 많거나 적을 수 있음을 의미합니다. 관찰된 차이는 무작위입니다.

신뢰 구간 내에서 0이 위치하는 곳으로 기준의 힘을 판단할 수 있습니다. 0이 구간의 하한 또는 상한에 가까우면 비교 그룹이 많을수록 차이가 통계적 유의성에 도달할 수 있습니다. 0이 구간의 중간에 가까우면 실험군에서 지표의 증감이 모두 동일할 가능성이 있으며 실제로 차이가 없을 가능성이 있음을 의미합니다.

예:

두 가지 다른 유형의 마취를 사용할 때의 수술 사망률을 비교하려면 첫 번째 유형의 마취를 사용하여 61명이 수술을 받았고 8명이 사망하고 두 번째 마취를 사용하여 67명, 10명이 사망했습니다.

d 1 \u003d 8/61 \u003d 0.131; d 2 \u003d 10/67 \u003d 0.149; d1-d2 = - 0.018.

비교 방법의 치사율 차이는 (-0.018 - 0.122, -0.018 + 0.122) 또는 (-0.14, 0.104) 범위에 있으며 확률은 100(1-a) = 95%입니다. 간격에는 0이 포함됩니다. 두 가지 다른 유형의 마취로 동일한 치사율에 대한 가설은 기각될 수 없습니다.

따라서 사망률은 14%로 감소하고 95%의 확률로 10.4%로 증가할 수 있습니다. 0은 대략 간격의 중간에 있으므로 이 두 가지 방법이 실제로 치사율이 다르지 않다고 주장할 수 있습니다.

앞서 고려한 예에서 평균 두드리는 시간은 시험 점수가 다른 4개 그룹의 학생에서 비교되었습니다. 2번과 5번 시험에 합격한 학생들의 평균 압박 시간의 신뢰 구간과 이 평균 간의 차이에 대한 신뢰 구간을 계산해 보겠습니다.

스튜던트 계수는 스튜던트 분포 표에서 찾을 수 있습니다(부록 참조): 첫 번째 그룹의 경우: = t(0.05;48) = 2.011; 두 번째 그룹의 경우: = t(0.05;61) = 2.000. 따라서 첫 번째 그룹에 대한 신뢰 구간: = (162.19-2.011 * 2.18; 162.19 + 2.011 * 2.18) = (157.8; 166.6) , 두 번째 그룹의 경우 (156.55-2.050*1.88 ; 5+2.80) = (156.55-2.050*1.88 ; 15.6) ; 160.3). 따라서 2번 시험에 합격한 사람의 평균 누르는 시간은 95%의 확률로 157.8ms에서 166.6ms 범위이고 5번 시험에 합격한 사람의 경우 95%의 확률로 152.8ms에서 160.3ms입니다. .

평균의 차이뿐만 아니라 평균에 대한 신뢰 구간을 사용하여 귀무 가설을 테스트할 수도 있습니다. 예를 들어, 우리의 경우와 같이 평균에 대한 신뢰 구간이 겹치면 귀무 가설을 기각할 수 없습니다. 선택한 유의 수준에서 가설을 기각하려면 해당 신뢰 구간이 겹치지 않아야 합니다.

2와 5의 시험에 합격한 그룹의 평균 누르는 시간의 차이에 대한 신뢰 구간을 찾아보겠습니다. 평균의 차이: 162.19 - 156.55 = 5.64. 학생 계수: \u003d t (0.05; 49 + 62-2) \u003d t (0.05; 109) \u003d 1.982. 그룹 표준 편차는 다음과 같습니다. ; . 평균 차이의 평균 오차를 계산합니다. . 신뢰 구간: \u003d (5.64-1.982 * 2.87; 5.64 + 1.982 * 2.87) \u003d (-0.044; 11.33).

따라서 2와 5에서 시험을 통과한 그룹의 평균 누르는 시간의 차이는 -0.044ms에서 11.33ms 사이가 됩니다. 이 간격에는 0이 포함됩니다. 우수한 결과로 시험에 합격한 사람들의 평균 압박 시간은 시험에 불만족스럽게 합격한 사람들에 비해 증가하거나 감소할 수 있습니다. 귀무가설은 기각될 수 없다. 그러나 0은 하한에 매우 가깝고 우수한 패스의 경우 압박 시간이 훨씬 더 줄어들 것입니다. 따라서 우리는 2와 5를 통과한 사람들 사이에 평균 클릭 시간에 여전히 차이가 있다는 결론을 내릴 수 있습니다. 단지 평균 시간, 평균 시간의 확산 및 샘플 크기의 주어진 변화에 대해 이를 감지할 수 없었을 뿐입니다.



검정력은 잘못된 귀무 가설을 기각할 확률입니다. 그들이 실제로 있는 곳에서 차이점을 찾으십시오.

검정력은 유의 수준, 그룹 간 차이의 크기, 그룹 내 값의 분포 및 표본 크기를 기반으로 결정됩니다.

스튜던트 t-검정 및 분산 분석의 경우 민감도 차트를 사용할 수 있습니다.

기준의 힘은 필요한 그룹 수의 예비 결정에 사용할 수 있습니다.

신뢰 구간은 추정된 매개변수의 실제 값이 주어진 확률에 있는 한계 이내를 보여줍니다.

신뢰 구간을 사용하여 통계적 가설을 테스트하고 기준의 민감도에 대한 결론을 도출할 수 있습니다.

문학.

Glantz S. - 6.7장.

레브로바 오유. - p.112-114, p.171-173, p.234-238.

Sidorenko E. V. - pp. 32-33.

학생들의 자기 점검을 위한 질문입니다.

1. 기준의 힘은 무엇입니까?

2. 어떤 경우에 기준의 힘을 평가해야 합니까?

3. 전력 계산 방법.

6. 신뢰 구간을 사용하여 통계적 가설을 테스트하는 방법은 무엇입니까?

7. 신뢰 구간을 계산할 때 기준의 검정력에 대해 무엇을 말할 수 있습니까?

작업.