Como calcular o intervalo de confiança.  Construção de um intervalo de confiança para a expectativa matemática da população geral

Como calcular o intervalo de confiança. Construção de um intervalo de confiança para a expectativa matemática da população geral

Em estatística, existem dois tipos de estimativas: pontuais e intervalares. Estimativa de pontosé uma estatística de amostra única que é usada para estimar um parâmetro populacional. Por exemplo, a média amostral é uma estimativa pontual da média populacional e a variância da amostra S2- estimativa pontual da variância populacional σ2. mostrou-se que a média amostral é uma estimativa imparcial da expectativa da população. A média amostral é chamada de imparcial porque a média de todas as médias amostrais (com o mesmo tamanho de amostra n) é igual à expectativa matemática da população em geral.

Para a variação da amostra S2 tornou-se um estimador imparcial da variância populacional σ2, o denominador da variância da amostra deve ser igual a n – 1 , mas não n. Em outras palavras, a variância da população é a média de todas as variâncias amostrais possíveis.

Ao estimar os parâmetros da população, deve-se ter em mente que as estatísticas da amostra, como , dependem de amostras específicas. Para ter em conta este facto, para obter estimativa de intervalo a expectativa matemática da população geral analisa a distribuição das médias amostrais (para mais detalhes, ver). O intervalo construído é caracterizado por um certo nível de confiança, que é a probabilidade de que o verdadeiro parâmetro da população geral seja estimado corretamente. Intervalos de confiança semelhantes podem ser usados ​​para estimar a proporção de um recurso R e a principal massa distribuída da população em geral.

Baixar nota em ou formato, exemplos em formato

Prédio intervalo de confiança para a expectativa matemática da população geral com um desvio padrão conhecido

Construindo um intervalo de confiança para a proporção de uma característica na população geral

Nesta seção, o conceito de intervalo de confiança é estendido para dados categóricos. Isso permite estimar a participação da característica na população geral R com uma parte da amostra RS= X/n. Como mencionado, se os valores nR e n(1 - p) exceder o número 5, a distribuição binomial pode ser aproximada pela normal. Portanto, para estimar a participação de uma característica na população geral Ré possível construir um intervalo cujo nível de confiança é igual a (1 - α)x100%.


Onde pS- parcela da amostra do recurso, igual a X/n, ou seja o número de sucessos dividido pelo tamanho da amostra, R- a participação da característica na população em geral, Zé o valor crítico da distribuição normal padronizada, n- tamanho da amostra.

Exemplo 3 Vamos supor que a partir sistema de informação recuperou uma amostra de 100 faturas concluídas em mês passado. Digamos que 10 dessas faturas estejam incorretas. Nesse caminho, R= 10/100 = 0,1. O nível de confiança de 95% corresponde ao valor crítico Z = 1,96.

Assim, há 95% de chance de que entre 4,12% e 15,88% das faturas contenham erros.

Para um determinado tamanho de amostra, o intervalo de confiança contendo a proporção da característica na população parece ser mais amplo do que para uma amostra contínua. variável aleatória. Isso ocorre porque as medições de uma variável aleatória contínua contêm mais informações do que as medições de dados categóricos. Em outras palavras, dados categóricos que levam apenas dois valores contêm informações insuficientes para estimar os parâmetros de sua distribuição.

NOcálculo de estimativas extraídas de uma população finita

Estimação da expectativa matemática. Fator de correção para a população final ( fpc) foi usado para reduzir erro padrão em tempo. Ao calcular intervalos de confiança para estimativas de parâmetros populacionais, um fator de correção é aplicado em situações em que as amostras são retiradas sem reposição. Assim, o intervalo de confiança para a expectativa matemática, tendo um nível de confiança igual a (1 - α)x100%, é calculado pela fórmula:

Exemplo 4 Para ilustrar a aplicação de um fator de correção para uma população finita, voltemos ao problema de calcular o intervalo de confiança para a quantidade média de faturas discutidas no Exemplo 3. Suponha que uma empresa emita 5.000 faturas por mês e = 110,27 USD, S= $ 28,95 N = 5000, n = 100, α = 0,05, t99 = 1,9842. Pela fórmula (6) obtemos:

Estimativa da participação do recurso. Ao escolher sem retorno, o intervalo de confiança para a proporção do recurso que tem um nível de confiança igual a (1 - α)x100%, é calculado pela fórmula:

Intervalos de confiança e questões éticas

Ao fazer a amostragem de uma população e formular inferências estatísticas, muitas vezes surgem problemas éticos. A principal é como os intervalos de confiança e as estimativas pontuais das estatísticas amostrais concordam. A publicação de estimativas pontuais sem especificar os intervalos de confiança apropriados (geralmente em níveis de confiança de 95%) e o tamanho da amostra da qual são derivadas pode ser enganosa. Isso pode dar ao usuário a impressão de que uma estimativa pontual é exatamente o que ele precisa para prever as propriedades de toda a população. Assim, é necessário entender que em qualquer pesquisa, não pontuais, mas as estimativas de intervalo devem ser colocadas em primeiro plano. Além do mais, Atenção especial Deveria ser dado escolha certa tamanhos de amostra.

Na maioria das vezes, os objetos de manipulações estatísticas são os resultados de pesquisas sociológicas da população em vários questões políticas. Ao mesmo tempo, os resultados da pesquisa são colocados nas primeiras páginas dos jornais, e o erro de amostragem e a metodologia de análise estatística são impressos em algum lugar no meio. Para comprovar a validade das estimativas pontuais obtidas, é necessário indicar o tamanho da amostra com base na qual foram obtidas, os limites do intervalo de confiança e seu nível de significância.

Próxima nota

São utilizados materiais do livro Levin et al., Estatísticas para gestores. - M.: Williams, 2004. - p. 448–462

Teorema do limite central afirma que, dado um tamanho amostral suficientemente grande, a distribuição amostral das médias pode ser aproximada por uma distribuição normal. Esta propriedade não depende do tipo de distribuição populacional.

Intervalo de confiança(IC; em inglês, intervalo de confiança - IC) obtido no estudo na amostra fornece uma medida da precisão (ou incerteza) dos resultados do estudo, a fim de tirar conclusões sobre a população de todos esses pacientes ( população). A definição correta de IC 95% pode ser formulada da seguinte forma: 95% desses intervalos conterão o valor verdadeiro na população. Essa interpretação é um pouco menos precisa: CI é o intervalo de valores dentro do qual você pode ter 95% de certeza de que contém o valor verdadeiro. Ao usar o IC, a ênfase está na determinação do efeito quantitativo, em oposição ao valor P, que é obtido como resultado do teste de significância estatística. O valor P não avalia qualquer valor, mas serve como uma medida da força da evidência contra a hipótese nula de "sem efeito". O valor de P por si só não nos diz nada sobre a magnitude da diferença, ou mesmo sobre sua direção. Portanto, valores independentes de P são absolutamente não informativos em artigos ou resumos. Em contraste, IC indica tanto a quantidade de efeito de interesse imediato, como a utilidade de um tratamento, quanto a força da evidência. Portanto, a DI está diretamente relacionada à prática do DM.

Abordagem de avaliação para análise estatística, ilustrado pelo IC, visa medir a quantidade do efeito de interesse (sensibilidade do teste diagnóstico, incidência prevista, redução do risco relativo com o tratamento etc.), bem como medir a incerteza desse efeito. Na maioria das vezes, o IC é o intervalo de valores em ambos os lados da estimativa em que o valor verdadeiro provavelmente se encontra, e você pode ter 95% de certeza disso. A convenção para usar a probabilidade de 95% é arbitrária, assim como o valor de P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

O IC baseia-se na ideia de que o mesmo estudo realizado em diferentes conjuntos de pacientes não produziria resultados idênticos, mas que seus resultados seriam distribuídos em torno do valor verdadeiro, mas desconhecido. Em outras palavras, o IC descreve isso como "variabilidade dependente da amostra". O IC não reflete incerteza adicional devido a outras causas; em particular, não inclui os efeitos da perda seletiva de pacientes no rastreamento, baixa adesão ou medição imprecisa do resultado, falta de cegamento, etc. CI, portanto, sempre subestima a quantidade total de incerteza.

Cálculo do intervalo de confiança

Tabela A1.1. Erros padrão e intervalos de confiança para algumas medidas clínicas

Normalmente, o IC é calculado a partir de uma estimativa observada de uma medida quantitativa, como a diferença (d) entre duas proporções e o erro padrão (SE) na estimativa dessa diferença. O IC aproximado de 95% assim obtido é d ± 1,96 SE. A fórmula muda de acordo com a natureza da medida de resultado e a cobertura do IC. Por exemplo, em um estudo randomizado controlado por placebo da vacina acelular contra coqueluche, a coqueluche se desenvolveu em 72 de 1.670 (4,3%) bebês que receberam a vacina e 240 de 1.665 (14,4%) no grupo controle. A diferença percentual, conhecida como redução do risco absoluto, é de 10,1%. O SE dessa diferença é de 0,99%. Assim, o IC de 95% é 10,1% + 1,96 x 0,99%, ou seja de 8,2 a 12,0.

Apesar de diferentes abordagens filosóficas, ICs e testes de significância estatística estão intimamente relacionados matematicamente.

Assim, o valor de P é “significativo”, ou seja, R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

A incerteza (imprecisão) da estimativa, expressa em CI, está amplamente relacionada à raiz quadrada do tamanho da amostra. Amostras pequenas fornecem menos informações do que amostras grandes, e os ICs são correspondentemente mais amplos em amostras menores. Por exemplo, um artigo comparando o desempenho de três testes usados ​​para diagnosticar a infecção por Helicobacter pylori relatou uma sensibilidade do teste respiratório com ureia de 95,8% (IC 95% 75-100). Embora o número de 95,8% pareça impressionante, o pequeno tamanho da amostra de 24 pacientes adultos de H. pylori significa que há uma incerteza significativa nessa estimativa, conforme mostrado pelo IC amplo. De fato, o limite inferior de 75% é muito inferior à estimativa de 95,8%. Se a mesma sensibilidade fosse observada em uma amostra de 240 pessoas, então o IC 95% seria 92,5-98,0, dando mais garantia de que o teste é altamente sensível.

Em ensaios clínicos randomizados (ECRs), resultados não significativos (ou seja, aqueles com P > 0,05) são particularmente suscetíveis a interpretações errôneas. O IC é particularmente útil aqui, pois indica a compatibilidade dos resultados com o efeito verdadeiro clinicamente útil. Por exemplo, em um RCT comparando sutura versus anastomose de grampo no cólon, infecção da ferida desenvolvida em 10,9% e 13,5% dos pacientes, respectivamente (P = 0,30). O IC de 95% para essa diferença é de 2,6% (-2 a +8). Mesmo neste estudo, que incluiu 652 pacientes, ainda é provável que haja uma diferença modesta na incidência de infecções resultantes dos dois procedimentos. Quanto menor o estudo, maior a incerteza. Sung et ai. realizaram um ECR comparando a infusão de octreotida com escleroterapia de emergência para sangramento agudo de varizes em 100 pacientes. No grupo octreotide, a taxa de parada de sangramento foi de 84%; no grupo escleroterapia - 90%, o que dá P = 0,56. Observe que as taxas de sangramento contínuo são semelhantes às de infecção da ferida no estudo mencionado. Neste caso, entretanto, o IC de 95% para diferença nas intervenções é de 6% (-7 a +19). Essa faixa é bastante ampla em comparação com uma diferença de 5% que seria de interesse clínico. É claro que o estudo não descarta uma diferença significativa na eficácia. Portanto, a conclusão dos autores "a infusão de octreotide e a escleroterapia são igualmente eficazes no tratamento de sangramento por varizes" definitivamente não é válida. Em casos como este, onde o IC de 95% para redução de risco absoluto (ARR) inclui zero, como aqui, o IC para NNT (número necessário para tratar) é bastante difícil de interpretar. . O NLP e seu CI são obtidos dos recíprocos do ACP (multiplicando-os por 100 se esses valores forem dados em porcentagem). Aqui temos NPP = 100: 6 = 16,6 com um IC de 95% de -14,3 a 5,3. Como pode ser visto na nota de rodapé "d" na Tabela. A1.1, este CI inclui valores para NTPP de 5,3 a infinito e NTLP de 14,3 a infinito.

Os ICs podem ser construídos para as estimativas ou comparações estatísticas mais comumente usadas. Para RCTs, inclui a diferença entre proporções médias, riscos relativos, odds ratios e NRRs. Da mesma forma, os ICs podem ser obtidos para todas as principais estimativas feitas em estudos de acurácia do teste diagnóstico - sensibilidade, especificidade, valor preditivo positivo (todos os quais são proporções simples) e razões de verossimilhança - estimativas obtidas em meta-análises e comparação com controle estudos. Um programa de computador pessoal que abrange muitos desses usos de DI está disponível com a segunda edição do Statistics with Confidence. Macros para calcular ICs para proporções estão disponíveis gratuitamente para Excel e os programas estatísticos SPSS e Minitab em http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Várias avaliações do efeito do tratamento

Embora a construção de ICs seja desejável para os resultados primários de um estudo, eles não são necessários para todos os resultados. O IC diz respeito a comparações clinicamente importantes. Por exemplo, ao comparar dois grupos, o IC correto é aquele construído para a diferença entre os grupos, conforme mostrado nos exemplos acima, e não o IC que pode ser construído para a estimativa em cada grupo. Não só é inútil fornecer ICs separados para as pontuações em cada grupo, como esta apresentação pode ser enganosa. Da mesma forma, a abordagem correta ao comparar a eficácia do tratamento em diferentes subgrupos é comparar dois (ou mais) subgrupos diretamente. É incorreto supor que o tratamento seja eficaz apenas em um subgrupo se seu IC excluir o valor correspondente a nenhum efeito, enquanto outros não. Os ICs também são úteis ao comparar resultados em vários subgrupos. Na fig. A1.1 mostra o risco relativo de eclâmpsia em mulheres com pré-eclâmpsia em subgrupos de mulheres de um ECR de sulfato de magnésio controlado por placebo.

Arroz. A1.2. O Forest Graph mostra os resultados de 11 ensaios clínicos randomizados da vacina contra o rotavírus bovino para a prevenção da diarreia versus placebo. O intervalo de confiança de 95% foi usado para estimar o risco relativo de diarreia. O tamanho do quadrado preto é proporcional à quantidade de informação. Além disso, uma estimativa resumida da eficácia do tratamento e um intervalo de confiança de 95% (indicado por um diamante) são mostrados. A metanálise utilizou um modelo de efeitos aleatórios que supera alguns pré-estabelecidos; por exemplo, pode ser o tamanho usado no cálculo do tamanho da amostra. Sob um critério mais rigoroso, toda a gama de ICs deve apresentar um benefício que exceda um mínimo predeterminado.

Já discutimos a falácia de tomar a ausência de significância estatística como uma indicação de que dois tratamentos são igualmente eficazes. É igualmente importante não equiparar significância estatística com significância clínica. A importância clínica pode ser assumida quando o resultado é estatisticamente significativo e a magnitude da resposta ao tratamento

Estudos podem mostrar se os resultados são estatisticamente significativos e quais são clinicamente importantes e quais não são. Na fig. A1.2 mostra os resultados de quatro ensaios para os quais todo o IC<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Vamos construir um intervalo de confiança no MS EXCEL para estimar o valor médio da distribuição no caso de um valor conhecido da variância.

Claro que a escolha nível de confiança depende completamente da tarefa em mãos. Assim, o grau de confiança do passageiro aéreo na confiabilidade da aeronave, é claro, deve ser maior do que o grau de confiança do comprador na confiabilidade da lâmpada.

Formulação de Tarefas

Vamos supor que a partir população tendo tomado amostra tamanho n. É assumido que desvio padrão esta distribuição é conhecida. Necessário com base neste amostras avaliar o desconhecido média de distribuição(μ, ) e construir o correspondente bilateral intervalo de confiança.

Estimativa de pontos

Como se sabe de Estatisticas(vamos chamá-lo X cf) é estimativa imparcial da média isto população e tem a distribuição N(μ;σ 2 /n).

Observação: E se você precisar construir intervalo de confiança no caso de distribuição, que não é normal? Neste caso, vem em socorro, que diz que com um tamanho suficientemente grande amostras n da distribuição não- normal, distribuição amostral de estatísticas Х av vai ser aproximadamente corresponder distribuição normal com parâmetros N(μ;σ 2 /n).

Então, ponto estimado meio valores de distribuição nós temos é média da amostra, ou seja X cf. Agora vamos nos ocupar intervalo de confiança.

Construindo um intervalo de confiança

Normalmente, conhecendo a distribuição e seus parâmetros, podemos calcular a probabilidade de uma variável aleatória tomar um valor de um determinado intervalo. Agora vamos fazer o oposto: encontrar o intervalo no qual a variável aleatória cai com uma dada probabilidade. Por exemplo, de propriedades distribuição normal sabe-se que com uma probabilidade de 95%, uma variável aleatória distribuída lei normal, cairá dentro do intervalo de aproximadamente +/- 2 de valor médio(ver artigo sobre). Este intervalo servirá como nosso protótipo para intervalo de confiança.

Agora vamos ver se conhecemos a distribuição , calcular esse intervalo? Para responder à pergunta, devemos especificar a forma de distribuição e seus parâmetros.

Sabemos que a forma de distribuição é distribuição normal(lembre-se que estamos falando de distribuição de amostras Estatisticas X cf).

O parâmetro μ é desconhecido para nós (só precisa ser estimado usando intervalo de confiança), mas temos sua estimativa X cf, calculado com base em amostra, que pode ser usado.

O segundo parâmetro é desvio padrão médio da amostra será conhecido, é igual a σ/√n.

Porque não sabemos μ, então vamos construir o intervalo +/- 2 desvio padrão Não de valor médio, mas a partir de sua estimativa conhecida X cf. Aqueles. ao calcular intervalo de confiança NÃO vamos supor que X cf cairá dentro do intervalo +/- 2 desvio padrão de μ com uma probabilidade de 95%, e vamos supor que o intervalo é +/- 2 desvio padrão a partir de X cf com uma probabilidade de 95% cobrirá μ - a média da população em geral, do qual amostra. Essas duas declarações são equivalentes, mas a segunda declaração nos permite construir intervalo de confiança.

Além disso, refinamos o intervalo: uma variável aleatória distribuída sobre lei normal, com uma probabilidade de 95% cai dentro do intervalo +/- 1,960 desvio padrão, não +/- 2 desvio padrão. Isso pode ser calculado usando a fórmula \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. arquivo de amostra Espaçamento entre folhas.

Agora podemos formular uma afirmação probabilística que nos servirá para formar intervalo de confiança:
"A probabilidade de média populacional localizado de média da amostra dentro de 1.960" desvios padrão da média da amostra", é igual a 95%.

O valor de probabilidade mencionado na declaração tem um nome especial , que está associado a nível de significância α (alfa) por uma expressão simples nível de confiança =1 . No nosso caso nível de significância α =1-0,95=0,05 .

Agora, com base nessa afirmação probabilística, escrevemos uma expressão para calcular intervalo de confiança:

onde Zα/2 padrão distribuição normal(tal valor de uma variável aleatória z, o que P(z>=Zα/2 )=α/2).

Observação: α/2-quantil superior define a largura intervalo de confiança dentro desvio padrão média da amostra. α/2-quantil superior padrão distribuição normalé sempre maior que 0, o que é muito conveniente.

No nosso caso, em α=0,05, α/2-quantil superior é igual a 1,960. Para outros níveis de significância α (10%; 1%) α/2-quantil superior Zα/2 pode ser calculado usando a fórmula \u003d NORM.ST.OBR (1-α / 2) ou, se conhecido nível de confiança, =NORM.ST.OBR((1+nível de confiança)/2).

Geralmente ao construir intervalos de confiança para estimar a média usarem apenas α superior/2-quantil e não use α inferior/2-quantil. Isso é possível porque padrão distribuição normal simétrico em relação ao eixo x ( densidade de sua distribuição simétrico sobre média, ou seja 0). Portanto, não há necessidade de calcular α/2-quantil inferior(é simplesmente chamado de α /2-quantil), Porque é igual α superior/2-quantil com um sinal de menos.

Lembre-se de que, independentemente da forma da distribuição de x, a variável aleatória correspondente X cf distribuído aproximadamente multar N(μ;σ 2 /n) (ver artigo sobre). Portanto, em geral, a expressão acima para intervalo de confiançaé apenas aproximado. Se x é distribuído lei normal N(μ;σ 2 /n), então a expressão para intervalo de confiançaé preciso.

Cálculo do intervalo de confiança no MS EXCEL

Vamos resolver o problema.
O tempo de resposta de um componente eletrônico a um sinal de entrada é uma característica importante de um dispositivo. Um engenheiro deseja traçar um intervalo de confiança para o tempo médio de resposta em um nível de confiança de 95%. Pela experiência anterior, o engenheiro sabe que o desvio padrão do tempo de resposta é de 8 ms. Sabe-se que o engenheiro fez 25 medições para estimar o tempo de resposta, o valor médio foi de 78 ms.

Solução: Um engenheiro quer saber o tempo de resposta de um dispositivo eletrônico, mas entende que o tempo de resposta não é fixo, mas uma variável aleatória que possui distribuição própria. Portanto, o melhor que ele pode esperar é determinar os parâmetros e a forma dessa distribuição.

Infelizmente, da condição do problema, não sabemos a forma de distribuição do tempo de resposta (não precisa ser normal). , essa distribuição também é desconhecida. Só ele é conhecido desvio padrãoσ=8. Portanto, embora não possamos calcular as probabilidades e construir intervalo de confiança.

No entanto, embora não conheçamos a distribuição Tempo resposta separada, sabemos que de acordo com CPT, distribuição de amostras tempo médio de respostaé aproximadamente normal(vamos supor que as condições CPT são realizados, pois o tamanho amostras grande o suficiente (n=25)) .

Além disso, média esta distribuição é igual a valor médio distribuições de resposta unitária, ou seja, µ. MAS desvio padrão desta distribuição (σ/√n) pode ser calculada usando a fórmula =8/ROOT(25) .

Sabe-se também que o engenheiro recebeu ponto estimado parâmetro μ igual a 78 ms (X cf). Portanto, agora podemos calcular as probabilidades, porque conhecemos a forma de distribuição ( normal) e seus parâmetros (Х ср e σ/√n).

Engenheiro quer saber valor esperadoµ da distribuição do tempo de resposta. Como dito acima, este μ é igual a expectativa da distribuição amostral do tempo médio de resposta. Se usarmos distribuição normal N(X cf; σ/√n), então o μ desejado estará na faixa +/-2*σ/√n com uma probabilidade de aproximadamente 95%.

Nível de significânciaé igual a 1-0,95=0,05.

Finalmente, encontre a borda esquerda e direita intervalo de confiança.
Borda esquerda: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / RAIZ (25) = 74,864
Borda direita: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / RAIZ (25) \u003d 81,136

Borda esquerda: =NORM.INV(0,05/2, 78, 8/SQRT(25))
Borda direita: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Responda: intervalo de confiança no nível de confiança de 95% e σ=8msé igual a 78+/-3,136ms

NO arquivo de exemplo na folha Sigma conhecido criou um formulário para cálculo e construção bilateral intervalo de confiança para arbitrário amostras com um dado σ e nível de significância.

Função CONFIANÇA.NORM()

Se os valores amostras estão na faixa B20:B79 , uma nível de significância igual a 0,05; então a fórmula do MS EXCEL:
=MÉDIA(B20:B79)-CONFIANÇA(0,05,σ, CONTAGEM(B20:B79))
retornará a borda esquerda intervalo de confiança.

O mesmo limite pode ser calculado usando a fórmula:
=MÉDIA(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(COUNT(B20:B79))

Observação: A função TRUST.NORM() apareceu no MS EXCEL 2010. Versões anteriores do MS EXCEL usavam a função TRUST().

Uma pessoa pode reconhecer suas habilidades apenas tentando aplicá-las. (Sêneca)

Intervalos de confiança

Revisão geral

Tomando uma amostra da população, obteremos uma estimativa pontual do parâmetro de nosso interesse e calcularemos o erro padrão para indicar a precisão da estimativa.

No entanto, para a maioria dos casos, o erro padrão como tal não é aceitável. É muito mais útil combinar essa medida de precisão com uma estimativa de intervalo para o parâmetro populacional.

Isso pode ser feito utilizando o conhecimento da distribuição de probabilidade teórica da estatística amostral (parâmetro) para calcular um intervalo de confiança (IC - Intervalo de Confiança, IC - Intervalo de Confiança) para o parâmetro.

Em geral, o intervalo de confiança estende as estimativas em ambas as direções por algum múltiplo do erro padrão (de um dado parâmetro); os dois valores (limites de confiança) que definem o intervalo geralmente são separados por uma vírgula e colocados entre parênteses.

Intervalo de confiança para média

Usando a distribuição normal

A média amostral tem uma distribuição normal se o tamanho da amostra for grande, então o conhecimento da distribuição normal pode ser aplicado ao considerar a média amostral.

Em particular, 95% da distribuição das médias amostrais está dentro de 1,96 desvios padrão (DP) da média populacional.

Quando temos apenas uma amostra, chamamos isso de erro padrão da média (SEM) e calculamos o intervalo de confiança de 95% para a média da seguinte forma:

Se esse experimento for repetido várias vezes, o intervalo conterá a média populacional verdadeira em 95% das vezes.

Geralmente é um intervalo de confiança, como o intervalo de valores dentro do qual a verdadeira média da população (média geral) se encontra com um nível de confiança de 95%.

Embora não seja muito rigoroso (a média populacional é um valor fixo e, portanto, não pode ter uma probabilidade relacionada a ele) interpretar o intervalo de confiança dessa forma, é conceitualmente mais fácil de entender.

Uso t- distribuição

Você pode usar a distribuição normal se souber o valor da variância na população. Além disso, quando o tamanho da amostra é pequeno, a média amostral segue uma distribuição normal se os dados subjacentes à população forem normalmente distribuídos.

Se os dados subjacentes à população não são normalmente distribuídos e/ou a variância geral (variância populacional) é desconhecida, a média amostral obedece Distribuição t de Student.

Calcule o intervalo de confiança de 95% para a média populacional da seguinte forma:

Onde - ponto percentual (percentil) t- Distribuição de Student com (n-1) graus de liberdade, que dá uma probabilidade bicaudal de 0,05.

Em geral, fornece um intervalo mais amplo do que quando se usa uma distribuição normal, porque leva em consideração a incerteza adicional que é introduzida pela estimativa do desvio padrão da população e/ou devido ao pequeno tamanho da amostra.

Quando o tamanho da amostra é grande (da ordem de 100 ou mais), a diferença entre as duas distribuições ( t-estudante e normal) é desprezível. No entanto, use sempre t- distribuição ao calcular intervalos de confiança, mesmo que o tamanho da amostra seja grande.

Normalmente, 95% CI é dado. Outros intervalos de confiança podem ser calculados, como IC 99% para a média.

Em vez de produto do erro padrão e valor da tabela t- distribuição que corresponde a uma probabilidade bicaudal de 0,05 multiplique-a (erro padrão) por um valor que corresponde a uma probabilidade bicaudal de 0,01. Este é um intervalo de confiança mais amplo do que o caso de 95% porque reflete o aumento da confiança de que o intervalo realmente inclui a média da população.

Intervalo de confiança para proporção

A distribuição amostral de proporções tem uma distribuição binomial. No entanto, se o tamanho da amostra n razoavelmente grande, então a distribuição da amostra proporcional é aproximadamente normal com média .

Estimativa por razão de amostragem p=r/n(Onde r- o número de indivíduos na amostra com as características que nos interessam), e o erro padrão é estimado:

O intervalo de confiança de 95% para a proporção é estimado:

Se o tamanho da amostra for pequeno (geralmente quando np ou n(1-p) menos 5 ), então a distribuição binomial deve ser usada para calcular os intervalos de confiança exatos.

Observe que se p expressa em porcentagem, então (1-p) substituído por (100p).

Interpretação de intervalos de confiança

Ao interpretar o intervalo de confiança, estamos interessados ​​nas seguintes questões:

Qual a largura do intervalo de confiança?

Um amplo intervalo de confiança indica que a estimativa é imprecisa; estreito indica uma estimativa fina.

A largura do intervalo de confiança depende do tamanho do erro padrão, que, por sua vez, depende do tamanho da amostra e, ao considerar uma variável numérica da variabilidade dos dados, fornece intervalos de confiança mais amplos do que estudos de grande conjunto de dados de poucas variáveis.

O IC inclui algum valor de particular interesse?

Você pode verificar se o valor provável de um parâmetro de população está dentro de um intervalo de confiança. Se sim, então os resultados são consistentes com este valor provável. Caso contrário, é improvável (para um intervalo de confiança de 95%, a chance é de quase 5%) que o parâmetro tenha esse valor.

Intervalos de confiança.

O cálculo do intervalo de confiança é baseado no erro médio do parâmetro correspondente. Intervalo de confiança mostra dentro de quais limites com probabilidade (1-a) é o verdadeiro valor do parâmetro estimado. Aqui a é o nível de significância, (1-a) também é chamado de nível de confiança.

No primeiro capítulo, mostramos que, por exemplo, para a média aritmética, a verdadeira média da população está dentro de 2 erros médios da média em cerca de 95% das vezes. Assim, os limites do intervalo de confiança de 95% para a média serão da média amostral pelo dobro do erro médio da média, ou seja, multiplicamos o erro médio da média por algum fator que depende do nível de confiança. Para a média e a diferença das médias, toma-se o coeficiente de Student (o valor crítico do critério de Student) e para a parcela e diferença das parcelas, o valor crítico do critério z. O produto do coeficiente e o erro médio pode ser chamado de erro marginal deste parâmetro, ou seja, o máximo que podemos obter ao avaliá-lo.

Intervalo de confiança para média aritmética : .

Aqui está a média amostral;

Erro médio da média aritmética;

s- desvio padrão amostral;

n

f = n-1 (coeficiente de estudante).

Intervalo de confiança para diferença de médias aritméticas :

Aqui está a diferença entre as médias amostrais;

- o erro médio da diferença das médias aritméticas;

s 1 , s 2 - desvios padrão da amostra;

n1,n2

Valor crítico do critério de Student para um determinado nível de significância a e o número de graus de liberdade f=n1 +n2-2 (coeficiente de estudante).

Intervalo de confiança para ações :

.

Aqui d é a parcela da amostra;

– erro médio da ação;

n– tamanho da amostra (tamanho do grupo);

Intervalo de confiança para compartilhar diferenças :

Aqui está a diferença entre as ações da amostra;

é o erro médio da diferença entre as médias aritméticas;

n1,n2– tamanhos de amostra (número de grupos);

O valor crítico do critério z em um determinado nível de significância a ( , , ).

Ao calcular os intervalos de confiança para a diferença de indicadores, em primeiro lugar, vemos diretamente os possíveis valores do efeito, e não apenas sua estimativa pontual. Em segundo lugar, podemos tirar uma conclusão sobre a aceitação ou refutação da hipótese nula e, em terceiro lugar, podemos tirar uma conclusão sobre o poder do critério.

Ao testar hipóteses usando intervalos de confiança, a seguinte regra deve ser seguida:

Se o intervalo de confiança de 100(1-a) por cento da diferença média não contém zero, então as diferenças são estatisticamente significativas ao nível de significância a; pelo contrário, se este intervalo contém zero, então as diferenças não são estatisticamente significativas.

De fato, se esse intervalo contém zero, significa que o indicador comparado pode ser mais ou menos em um dos grupos em comparação com o outro, ou seja, as diferenças observadas são aleatórias.

Pelo local onde o zero está localizado dentro do intervalo de confiança, pode-se julgar o poder do critério. Se zero estiver próximo do limite inferior ou superior do intervalo, então talvez com um número maior de grupos comparados, as diferenças atingiriam significância estatística. Se zero estiver próximo do meio do intervalo, significa que tanto o aumento quanto a diminuição do indicador no grupo experimental são igualmente prováveis ​​e, provavelmente, realmente não há diferenças.

Exemplos:

Comparar a mortalidade cirúrgica ao usar dois tipos diferentes de anestesia: 61 pessoas foram operadas com o primeiro tipo de anestesia, 8 morreram, usando o segundo - 67 pessoas, 10 morreram.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; d1-d2 = - 0,018.

A diferença de letalidade dos métodos comparados estará na faixa (-0,018 - 0,122; -0,018 + 0,122) ou (-0,14; 0,104) com probabilidade de 100(1-a) = 95%. O intervalo contém zero, ou seja, a hipótese da mesma letalidade com dois tipos diferentes de anestesia não pode ser rejeitada.

Assim, a mortalidade pode e vai diminuir para 14% e aumentar para 10,4% com uma probabilidade de 95%, ou seja. zero está aproximadamente no meio do intervalo, então pode-se argumentar que, muito provavelmente, esses dois métodos realmente não diferem em letalidade.

No exemplo considerado anteriormente, o tempo médio de toque foi comparado em quatro grupos de alunos que diferem em suas notas nos exames. Vamos calcular os intervalos de confiança do tempo médio de prensagem para os alunos que passaram no exame de 2 e 5 e o intervalo de confiança para a diferença entre essas médias.

Os coeficientes de Student são encontrados nas tabelas de distribuição de Student (ver Apêndice): para o primeiro grupo: = t(0,05;48) = 2,011; para o segundo grupo: = t(0,05;61) = 2,000. Assim, intervalos de confiança para o primeiro grupo: = (162,19-2,011 * 2,18; 162,19 + 2,011 * 2,18) = (157,8; 166,6) , para o segundo grupo (156,55- 2,000*1,88; 156,55+2,000*1,88) = (152,8 ; 160,3). Assim, para quem passou no exame por 2, o tempo médio de prensagem varia de 157,8 ms a 166,6 ms com probabilidade de 95%, para quem passou no exame por 5 - de 152,8 ms a 160,3 ms com probabilidade de 95% .

Você também pode testar a hipótese nula usando intervalos de confiança para as médias, e não apenas para a diferença nas médias. Por exemplo, como no nosso caso, se os intervalos de confiança para as médias se sobrepuserem, a hipótese nula não poderá ser rejeitada. Para rejeitar uma hipótese em um nível de significância escolhido, os intervalos de confiança correspondentes não devem se sobrepor.

Vamos encontrar o intervalo de confiança para a diferença no tempo médio de prensagem nos grupos que passaram no exame para 2 e 5. A diferença nas médias: 162,19 - 156,55 = 5,64. Coeficiente de Student: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Os desvios padrão do grupo serão iguais a: ; . Calculamos o erro médio da diferença entre as médias: . Intervalo de confiança: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Assim, a diferença no tempo médio de prensagem nos grupos que passaram no exame em 2 e em 5 ficará na faixa de -0,044 ms a 11,33 ms. Este intervalo inclui zero, ou seja, o tempo médio de prensagem para quem passou no exame com excelentes resultados pode aumentar e diminuir em comparação com aqueles que passaram no exame de forma insatisfatória, ou seja, a hipótese nula não pode ser rejeitada. Mas o zero está muito próximo do limite inferior, o tempo de pressão é muito mais provável de diminuir para excelentes passadores. Assim, podemos concluir que ainda existem diferenças no tempo médio de cliques entre os que passaram por 2 e por 5, apenas não conseguimos detectá-los para uma determinada mudança no tempo médio, na dispersão do tempo médio e no tamanho da amostra.



O poder do teste é a probabilidade de rejeitar uma hipótese nula incorreta, ou seja, encontrar diferenças onde elas realmente estão.

O poder do teste é determinado com base no nível de significância, na magnitude das diferenças entre os grupos, na dispersão dos valores nos grupos e no tamanho da amostra.

Para o teste t de Student e a análise de variância, você pode usar gráficos de sensibilidade.

O poder do critério pode ser usado na determinação preliminar do número necessário de grupos.

O intervalo de confiança mostra dentro de quais limites o valor verdadeiro do parâmetro estimado está com uma dada probabilidade.

Com a ajuda de intervalos de confiança, você pode testar hipóteses estatísticas e tirar conclusões sobre a sensibilidade dos critérios.

LITERATURA.

Glantz S. - Capítulo 6.7.

Rebrova O.Yu. - p.112-114, p.171-173, p.234-238.

Sidorenko E. V. - pp. 32-33.

Perguntas para auto-exame dos alunos.

1. Qual é o poder do critério?

2. Em que casos é necessário avaliar o poder dos critérios?

3. Métodos de cálculo de potência.

6. Como testar uma hipótese estatística usando um intervalo de confiança?

7. O que se pode dizer sobre o poder do critério ao calcular o intervalo de confiança?

Tarefas.