Intervallo di confidenza.  Cos'è e come può essere utilizzato?  Metodi di analisi quantitativa: stima degli intervalli di confidenza

Intervallo di confidenza. Cos'è e come può essere utilizzato?  Metodi di analisi quantitativa: stima degli intervalli di confidenza

Obbiettivo– insegnare agli studenti algoritmi per il calcolo degli intervalli di confidenza di parametri statistici.

Durante l'elaborazione dei dati statistici, la media aritmetica calcolata, il coefficiente di variazione, il coefficiente di correlazione, i criteri di differenza e altre statistiche puntuali dovrebbero ricevere limiti di confidenza quantitativi, che indicano possibili fluttuazioni dell'indicatore verso l'alto e verso il basso all'interno dell'intervallo di confidenza.

Esempio 3.1 . La distribuzione del calcio nel siero sanguigno delle scimmie, come precedentemente stabilito, è caratterizzata dai seguenti indicatori selettivi: = 11,94 mg%; = 0,127 mg%; n= 100. È necessario determinare l'intervallo di confidenza per la media generale ( ) con probabilità di confidenza P = 0,95.

La media generale è con una certa probabilità nell'intervallo:

, dove – media aritmetica campionaria; t- Criterio dello studente; è l'errore della media aritmetica.

Secondo la tabella "Valori del criterio dello studente" troviamo il valore con un livello di confidenza di 0,95 e il numero di gradi di libertà K\u003d 100-1 \u003d 99. È uguale a 1,982. Insieme ai valori della media aritmetica e dell'errore statistico, lo sostituiamo nella formula:

o 11.69
12,19

Pertanto, con una probabilità del 95%, si può affermare che la media generale di questa distribuzione normale è compresa tra 11,69 e 12,19 mg%.

Esempio 3.2 . Determinare i limiti dell'intervallo di confidenza al 95% per la varianza generale ( ) distribuzione del calcio nel sangue delle scimmie, se è noto che
= 1,60, con n = 100.

Per risolvere il problema, puoi utilizzare la seguente formula:

Dove è l'errore statistico della varianza.

Trova l'errore di varianza del campione utilizzando la formula:
. È pari a 0,11. Significato t- criterio con probabilità di confidenza di 0,95 e numero di gradi di libertà K= 100–1 = 99 è noto dall'esempio precedente.

Usiamo la formula e otteniamo:

o 1.38
1,82

Più accuratamente intervallo di confidenza la varianza generale può essere costruita usando (chi-quadrato) - Test di Pearson. I punti critici per questo criterio sono riportati in una tabella speciale. Quando si utilizza il criterio un livello di significatività bilaterale viene utilizzato per costruire un intervallo di confidenza. Per il limite inferiore, il livello di significatività è calcolato dalla formula
, per la tomaia
. Ad esempio, per un livello di confidenza = 0,99= 0,010,= 0,990. Di conseguenza, secondo la tabella di distribuzione dei valori critici , con i livelli di confidenza calcolati e il numero di gradi di libertà K= 100 – 1= 99, trova i valori
e
. Noi abbiamo
è uguale a 135,80 e
è uguale a 70,06.

Per trovare i limiti di confidenza della varianza generale utilizzando usiamo le formule: per il limite inferiore
, per il limite superiore
. Sostituire i dati dell'attività con i valori trovati in formule:
= 1,17;
= 2,26. Quindi, con un livello di confidenza P= 0,99 o 99% la varianza generale sarà compresa nell'intervallo da 1,17 a 2,26 mg% inclusi.

Esempio 3.3 . Tra i 1000 semi di grano del lotto arrivati ​​all'ascensore, sono stati trovati 120 semi infetti da segale cornuta. È necessario determinare i probabili confini della proporzione totale di semi infetti in un dato lotto di grano.

I limiti di confidenza per la quota generale per tutti i suoi possibili valori dovrebbero essere determinati dalla formula:

,

Dove n è il numero di osservazioni; mè il numero assoluto di uno dei gruppi; tè la deviazione normalizzata.

La frazione campione di semi infetti è pari a
o 12%. Con un livello di confidenza R= deviazione normalizzata del 95% ( t-Criterio dello studente per K =
)t = 1,960.

Sostituiamo i dati disponibili nella formula:

Quindi, i confini dell'intervallo di confidenza sono = 0,122–0,041 = 0,081, o 8,1%; = 0,122 + 0,041 = 0,163, o 16,3%.

Pertanto, con un livello di confidenza del 95%, si può affermare che la percentuale totale di semi infetti è compresa tra l'8,1 e il 16,3%.

Esempio 3.4 . Il coefficiente di variazione, che caratterizza la variazione del calcio (mg%) nel siero sanguigno delle scimmie, è risultato pari al 10,6%. Misura di prova n= 100. È necessario determinare i limiti dell'intervallo di confidenza del 95% per il parametro generale CV.

Limiti di confidenza per il coefficiente di variazione generale CV sono determinate dalle seguenti formule:

e
, dove K valore intermedio calcolato dalla formula
.

Sapendolo con un livello di confidenza R= Deviazione normalizzata del 95% (test t di Student per K =
)t = 1.960, precalcolare il valore A:

.

o 9,3%

o 12,3%

Pertanto, il coefficiente generale di variazione con una probabilità di confidenza del 95% è compreso tra 9,3 e 12,3%. Con campioni ripetuti, il coefficiente di variazione non supererà il 12,3% e non scenderà al di sotto del 9,3% in 95 casi su 100.

Domande per l'autocontrollo:

Compiti per soluzione indipendente.

1. La percentuale media di grasso nel latte per l'allattamento delle mucche di incroci Kholmogory era la seguente: 3,4; 3,6; 3.2; 3.1; 2,9; 3,7; 3.2; 3,6; 4.0; 3.4; 4.1; 3,8; 3.4; 4.0; 3.3; 3,7; 3,5; 3,6; 3.4; 3.8. Impostare gli intervalli di confidenza per la media complessiva a un livello di confidenza del 95% (20 punti).

2. Su 400 piante di segale ibrida, i primi fiori sono apparsi in media 70,5 giorni dopo la semina. La deviazione standard è stata di 6,9 giorni. Determinare l'errore della media e degli intervalli di confidenza per la media e la varianza della popolazione a un livello di significatività W= 0,05 e W= 0,01 (25 punti).

3. Studiando la lunghezza delle foglie di 502 esemplari di fragole da giardino, sono stati ottenuti i seguenti dati: = 7,86cm; σ = 1,32 cm, \u003d ± 0,06 cm Determinare gli intervalli di confidenza per la media aritmetica della popolazione con livelli di significatività di 0,01; 0,02; 0,05. (25 punti).

4. Durante l'esame di 150 uomini adulti, l'altezza media era di 167 cm e σ \u003d 6 cm Quali sono i limiti della media generale e della varianza generale con una probabilità di confidenza di 0,99 e 0,95? (25 punti).

5. La distribuzione del calcio nel siero sanguigno delle scimmie è caratterizzata dai seguenti indicatori selettivi: = 11,94 mg%, σ = 1,27, n = 100. Tracciare un intervallo di confidenza al 95% per la media della popolazione di questa distribuzione. Calcolare il coefficiente di variazione (25 punti).

6. È stato studiato il contenuto totale di azoto nel plasma sanguigno di ratti albini all'età di 37 e 180 giorni. I risultati sono espressi in grammi per 100 cm 3 di plasma. All'età di 37 giorni, 9 ratti avevano: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. All'età di 180 giorni, 8 ratti avevano: 1,20; 1.18; 1,33; 1.21; 1,20; 1.07; 1.13; 1.12. Impostare gli intervalli di confidenza per la differenza con un livello di confidenza di 0,95 (50 punti).

7. Determinare i limiti dell'intervallo di confidenza del 95% per la varianza generale della distribuzione del calcio (mg%) nel siero del sangue delle scimmie, se per questa distribuzione la dimensione del campione n = 100, l'errore statistico della varianza del campione S σ 2 = 1,60 (40 punti).

8. Determinare i limiti dell'intervallo di confidenza al 95% per la varianza generale della distribuzione di 40 spighette di grano lungo la lunghezza (σ 2 = 40,87 mm 2). (25 punti).

9. Il fumo è considerato il principale fattore predisponente alla broncopneumopatia ostruttiva. Il fumo passivo non è considerato un tale fattore. Gli scienziati hanno messo in dubbio la sicurezza del fumo passivo ed esaminato le vie respiratorie nei non fumatori, nei fumatori passivi e attivi. Per caratterizzare lo stato delle vie respiratorie, abbiamo preso uno degli indicatori della funzione della respirazione esterna: la massima velocità volumetrica della metà dell'espirazione. Una diminuzione di questo indicatore è un segno di ridotta pervietà delle vie aeree. I dati del sondaggio sono riportati nella tabella.

Numero di esaminati

Flusso medio espiratorio massimo, l/s

Deviazione standard

Non fumatori

lavorare in una zona non fumatori

lavorare in una stanza piena di fumo

fumatori

fumare un numero limitato di sigarette

numero medio di fumatori di sigarette

fumare un gran numero di sigarette

Dalla tabella, trovare gli intervalli di confidenza al 95% per la media generale e la varianza generale per ciascuno dei gruppi. Quali sono le differenze tra i gruppi? Presentare graficamente i risultati (25 punti).

10. Determinare i limiti degli intervalli di confidenza del 95% e del 99% per la varianza generale del numero di suinetti in 64 parti, se l'errore statistico della varianza del campione S σ 2 = 8,25 (30 punti).

11. È noto che il peso medio dei conigli è di 2,1 kg. Determinare i limiti degli intervalli di confidenza del 95% e del 99% per la media generale e la varianza quando n= 30, σ = 0,56 kg (25 punti).

12. In 100 spighe è stato misurato il contenuto di grano della spiga ( X), lunghezza della punta ( Y) e la massa di grano nella spiga ( z). Trova gli intervalli di confidenza per la media generale e la varianza per P 1 = 0,95, P 2 = 0,99, P 3 = 0,999 se = 19, = 6,766 cm, = 0,554 g; σ x 2 = 29,153, σ y 2 = 2,111, σ z 2 = 0,064 (25 punti).

13. In 100 spighe di grano invernale selezionate a caso, è stato contato il numero di spighette. Il campione è stato caratterizzato dai seguenti indicatori: = 15 spighette e σ = 2,28 pz. Determinare l'accuratezza con cui si ottiene il risultato medio ( ) e tracciare l'intervallo di confidenza per la media complessiva e la varianza ai livelli di significatività del 95% e del 99% (30 punti).

14. Il numero di costole sui gusci di un mollusco fossile Ortamboniti calligramma:

È risaputo che n = 19, σ = 4,25. Determinare i limiti dell'intervallo di confidenza per la media generale e la varianza generale a un livello di significatività W = 0,01 (25 punti).

15. Per determinare la resa del latte in un'azienda lattiero-casearia commerciale, è stata determinata la produttività di 15 vacche al giorno. Secondo i dati dell'anno, ogni vacca ha dato in media la seguente quantità di latte al giorno (l): 22; 19; 25; venti; 27; 17; trenta; 21; diciotto; 24; 26; 23; 25; venti; 24. Tracciare gli intervalli di confidenza per la varianza generale e la media aritmetica. Possiamo aspettarci che la produzione media annua di latte per vacca sia di 10.000 litri? (50 punti).

16. Al fine di determinare la resa media in frumento dell'azienda, lo sfalcio è stato effettuato su parcelle campione di 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 e 2 ha. La resa (c/ha) degli appezzamenti è stata di 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 rispettivamente. Tracciare gli intervalli di confidenza per la varianza generale e la media aritmetica. È possibile prevedere che la resa media per l'impresa agricola sia di 42 c/ha? (50 punti).

Costruiamo un intervallo di confidenza in MS EXCEL per stimare il valore medio della distribuzione nel caso di un valore noto della varianza.

Ovviamente la scelta livello di fiducia dipende completamente dal compito da svolgere. Pertanto, il grado di fiducia del passeggero aereo nell'affidabilità dell'aeromobile, ovviamente, dovrebbe essere superiore al grado di fiducia dell'acquirente nell'affidabilità della lampadina.

Formulazione del compito

Supponiamo che da popolazione aver preso campione taglia nf. Si presume che deviazione standard questa distribuzione è nota. Necessario sulla base di questo campioni valutare l'ignoto media di distribuzione(μ, ) e costruire il corrispondente bilaterale intervallo di confidenza.

Stima puntuale

Come è noto da statistiche(chiamiamolo X cfr) è stima imparziale della media questo popolazione e ha distribuzione N(μ;σ 2 /n).

Nota: E se hai bisogno di costruire intervallo di confidenza nel caso della distribuzione, quale non è normale? In questo caso, viene in soccorso, che dice che con basta grande taglia campioni n dalla distribuzione non- normale, distribuzione campionaria delle statistiche Х av sarà circa corrispondere distribuzione normale con parametri N(μ;σ 2 /n).

Così, stima puntuale mezzo valori di distribuzione abbiamo è campione medio, cioè. X cfr. Ora diamoci da fare intervallo di confidenza.

Costruire un intervallo di confidenza

Di solito, conoscendo la distribuzione ei suoi parametri, possiamo calcolare la probabilità che una variabile casuale assuma un valore da un dato intervallo. Ora facciamo il contrario: troviamo l'intervallo in cui la variabile casuale cade con una data probabilità. Ad esempio, dalle proprietà distribuzione normaleè noto che con una probabilità del 95%, una variabile casuale distribuita su legge normale, rientrerà nell'intervallo di circa +/- 2 da valore medio(vedi articolo su). Questo intervallo servirà come nostro prototipo per intervallo di confidenza.

Ora vediamo se conosciamo la distribuzione , calcolare questo intervallo? Per rispondere alla domanda, dobbiamo specificare la forma di distribuzione ei suoi parametri.

Sappiamo che la forma di distribuzione è distribuzione normale(ricordati che noi stiamo parlando di distribuzione campionaria statistiche X cfr).

Il parametro μ ci è sconosciuto (deve solo essere stimato usando intervallo di confidenza), ma abbiamo la sua stima X cfr, calcolato in base a campione, che può essere utilizzato.

Il secondo parametro è media campionaria deviazione standard sarà noto, è uguale a σ/√n.

Perché non sappiamo μ, allora costruiremo l'intervallo +/- 2 deviazioni standard non da valore medio, ma dalla sua stima nota X cfr. Quelli. durante il calcolo intervallo di confidenza NON lo assumeremo X cfr rientrerà nell'intervallo +/- 2 deviazioni standard da μ con una probabilità del 95% e assumeremo che l'intervallo sia +/- 2 deviazioni standard da X cfr con una probabilità del 95% coprirà μ - la media della popolazione generale, da cui campione. Queste due affermazioni sono equivalenti, ma la seconda affermazione ci permette di costruire intervallo di confidenza.

Inoltre, perfezioniamo l'intervallo: una variabile casuale distribuita su legge normale, con una probabilità del 95% rientra nell'intervallo +/- 1.960 deviazioni standard, non +/- 2 deviazioni standard. Questo può essere calcolato usando la formula \u003d NORM.ST.OBR ((1 + 0,95) / 2), centimetro. file di esempio Spaziatura foglio.

Ora possiamo formulare un'affermazione probabilistica che ci servirà per formare intervallo di confidenza:
"La probabilità che popolazione media situato da media del campione entro 1.960" deviazioni standard della media campionaria", è pari al 95%.

Il valore di probabilità menzionato nell'affermazione ha un nome speciale , a cui è associato livello di significatività α (alfa) mediante una semplice espressione livello di fiducia =1 . Nel nostro caso livello di significatività α =1-0,95=0,05 .

Ora, sulla base di questa affermazione probabilistica, scriviamo un'espressione per il calcolo intervallo di confidenza:

dove Zα/2 standard distribuzione normale(un tale valore di una variabile casuale z.z, che cosa P(z.z>=Zα/2 )=α/2).

Nota: Quantile α/2 superiore definisce la larghezza intervallo di confidenza in deviazioni standard campione medio. Quantile α/2 superiore standard distribuzione normaleè sempre maggiore di 0, il che è molto conveniente.

Nel nostro caso, a α=0.05, α/2-quantile superiore è uguale a 1,960. Per altri livelli di significatività α (10%; 1%) α/2-quantile superiore Zα/2 può essere calcolato utilizzando la formula \u003d NORM.ST.OBR (1-α / 2) o, se noto livello di fiducia, =NORM.ST.OBR((1+livello di confidenza)/2).

Di solito durante la costruzione intervalli di confidenza per la stima della media utilizzare solo α superiore/2-quantile e non utilizzare α inferiore/2-quantile. Questo è possibile perché standard distribuzione normale simmetrico rispetto all'asse x ( densità della sua distribuzione simmetrico circa media, cioè 0). Pertanto, non è necessario calcolare α/2-quantile inferiore(si chiama semplicemente α /2-quantile), perché è uguale α superiore/2-quantile con un segno meno.

Ricordiamo che, indipendentemente dalla forma della distribuzione di x, la corrispondente variabile casuale X cfr distribuito circa bene N(μ;σ 2 /n) (vedi articolo su). Pertanto, dentro caso generale, l'espressione precedente per intervallo di confidenzaè solo approssimativo. Se x è distribuito su legge normale N(μ;σ 2 /n), quindi l'espressione per intervallo di confidenzaè accurato.

Calcolo dell'intervallo di confidenza in MS EXCEL

Risolviamo il problema.
Tempo di risposta componente elettronico sul segnale di ingresso è una caratteristica importante del dispositivo. Un ingegnere desidera tracciare un intervallo di confidenza per il tempo di risposta medio a un livello di confidenza del 95%. Per esperienza precedente, l'ingegnere sa che la deviazione standard del tempo di risposta è di 8 ms. È noto che l'ingegnere ha effettuato 25 misurazioni per stimare il tempo di risposta, il valore medio era di 78 ms.

Soluzione: L'ingegnere vuole conoscere il tempo di risposta dispositivo elettronico, ma capisce che il tempo di risposta non è fisso, ma una variabile casuale che ha una propria distribuzione. Quindi il meglio che può sperare è determinare i parametri e la forma di questa distribuzione.

Sfortunatamente, dalla condizione del problema, non conosciamo la forma della distribuzione del tempo di risposta (non deve essere normale). , anche questa distribuzione è sconosciuta. Solo lui è conosciuto deviazione standardσ=8. Pertanto, mentre non possiamo calcolare le probabilità e costruire intervallo di confidenza.

Tuttavia, anche se non conosciamo la distribuzione volta risposta separata, sappiamo che secondo CPT, distribuzione campionaria tempo medio di rispostaè approssimativamente normale(supponiamo che le condizioni CPT vengono eseguite, perché la dimensione campioni abbastanza grande (n=25)) .

Inoltre, media questa distribuzione è uguale a valore medio distribuzioni di risposta unitaria, cioè μ. MA deviazione standard di questa distribuzione (σ/√n) può essere calcolata utilizzando la formula =8/ROOT(25) .

È anche noto che l'ingegnere ha ricevuto stima puntuale parametro μ pari a 78 ms (X cf). Pertanto, ora possiamo calcolare le probabilità, perché conosciamo la forma di distribuzione ( normale) e i suoi parametri (Х ср e σ/√n).

L'ingegnere vuole sapere valore attesoμ della distribuzione del tempo di risposta. Come detto sopra, questo μ è uguale a aspettativa della distribuzione campionaria del tempo medio di risposta. Se usiamo distribuzione normale N(X cf; σ/√n), allora il μ desiderato sarà compreso nell'intervallo +/-2*σ/√n con una probabilità di circa il 95%.

Livello di significatività equivale a 1-0,95=0,05.

Infine, trova il bordo sinistro e destro intervallo di confidenza.
Bordo sinistro: \u003d 78-NORM.ST.INR (1-0.05 / 2) * 8 / RADICE (25) = 74,864
Bordo destro: \u003d 78 + NORM ST OBR (1-0,05 / 2) * 8 / RADICE (25) \u003d 81,136

Bordo sinistro: =NORM.INV(0.05/2; 78; 8/SQRT(25))
Bordo destro: =INV.NORM.(1-0.05/2; 78; 8/SQRT(25))

Risposta: intervallo di confidenza a Livello di confidenza del 95% e σ=8msecè uguale a 78+/-3.136 ms

A file di esempio su foglio Sigma noto ha creato un modulo per il calcolo e la costruzione bilaterale intervallo di confidenza per arbitrario campioni con un dato σ e livello di significatività.

CONFIDENZA.NORM() funzione

Se i valori campioni sono nella gamma SI20: SI79 , un livello di significatività pari a 0,05; quindi formula MS EXCEL:
=MEDIA(B20:B79)-FIDUCIA(0.05,σ, CONTEGGIO(B20:B79))
restituirà il bordo sinistro intervallo di confidenza.

Lo stesso limite può essere calcolato utilizzando la formula:
=MEDIA(B20:B79)-INV.ST.NORM(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

Nota: La funzione CONFIDENCE.NORM() è apparsa in MS EXCEL 2010. Altro prime versioni MS EXCEL ha utilizzato la funzione TRUST().

E altri Tutti loro sono stime delle loro controparti teoriche, che potrebbero essere ottenute se non ci fosse un campione, ma popolazione. Ma ahimè, la popolazione generale è molto costosa e spesso non disponibile.

Il concetto di stima intervallare

Qualsiasi stima del campione ha una certa dispersione, perché è una variabile casuale che dipende dai valori in un particolare campione. Pertanto, per inferenze statistiche più affidabili, si dovrebbe conoscere non solo la stima puntuale, ma anche l'intervallo, che con un'alta probabilità γ (gamma) copre l'indicatore stimato θ (teta).

Formalmente, questi sono due di questi valori (statistiche) T1(X) e T2(X), che cosa T1< T 2 , per cui a un dato livello di probabilità γ condizione è soddisfatta:

Insomma, è probabile γ o più il vero valore è tra i punti T1(X) e T2(X), che sono chiamati limiti inferiore e superiore intervallo di confidenza.

Una delle condizioni per costruire gli intervalli di confidenza è la sua massima ristrettezza, cioè dovrebbe essere il più breve possibile. Il desiderio è abbastanza naturale, perché. il ricercatore cerca di localizzare più accuratamente la scoperta del parametro desiderato.

Ne consegue che l'intervallo di confidenza dovrebbe coprire le probabilità massime della distribuzione. e la partitura stessa sia al centro.

Cioè, la probabilità di deviazione (dell'indicatore vero dalla stima) verso l'alto è uguale alla probabilità di deviazione verso il basso. Va inoltre notato che per le distribuzioni asimmetriche, l'intervallo a destra non è uguale all'intervallo a sinistra.

La figura sopra mostra chiaramente che maggiore è il livello di confidenza, più ampio è l'intervallo: una relazione diretta.

Questa è stata una piccola introduzione alla teoria della stima dell'intervallo di parametri sconosciuti. Passiamo alla ricerca dei limiti di confidenza per aspettativa matematica.

Intervallo di confidenza per l'aspettativa matematica

Se i dati originali sono distribuiti su , la media sarà un valore normale. Ciò deriva dalla regola secondo cui anche una combinazione lineare di valori normali ha una distribuzione normale. Pertanto, per calcolare le probabilità, potremmo utilizzare l'apparato matematico della legge della distribuzione normale.

Tuttavia, ciò richiederà la conoscenza di due parametri: il valore atteso e la varianza, che di solito non sono noti. Ovviamente puoi usare stime invece di parametri (media aritmetica e ), ma la distribuzione della media non sarà del tutto normale, sarà leggermente appiattita. Il cittadino irlandese William Gosset notò abilmente questo fatto quando pubblicò la sua scoperta nel numero di marzo 1908 di Biometrica. Per motivi di segretezza, Gosset ha firmato con Student. Ecco come è apparsa la distribuzione t di Student.

Tuttavia, la normale distribuzione dei dati, utilizzata da K. Gauss nell'analisi degli errori nelle osservazioni astronomiche, è estremamente rara nella vita terrestre ed è abbastanza difficile stabilirla (sono necessarie circa 2mila osservazioni per un'elevata precisione). Pertanto, è meglio abbandonare l'ipotesi di normalità e utilizzare metodi che non dipendono dalla distribuzione dei dati originali.

La domanda sorge spontanea: qual è la distribuzione della media aritmetica se calcolata dai dati di una distribuzione sconosciuta? La risposta è data dal ben noto nella teoria della probabilità Teorema del limite centrale(CPT). In matematica ne esistono diverse versioni (le formulazioni sono state affinate nel corso degli anni), ma tutte, grosso modo, si riducono all'affermazione che la somma un largo numero indipendente variabili casuali obbedisce alla legge della distribuzione normale.

Quando si calcola la media aritmetica, viene utilizzata la somma delle variabili casuali. Da ciò risulta che la media aritmetica ha una distribuzione normale, in cui il valore atteso è il valore atteso dei dati iniziali e la varianza è .

Persone intelligenti sappiamo come provare il CLT, ma lo verificheremo con l'aiuto di un esperimento condotto in Excel. Simuliamo un campione di 50 variabili casuali uniformemente distribuite (usando Funzioni di Excel CASUALE TRA). Quindi faremo 1000 di questi campioni e calcoleremo la media aritmetica per ciascuno. Diamo un'occhiata alla loro distribuzione.

Si può vedere che la distribuzione della media è vicina alla legge normale. Se il volume dei campioni e il loro numero vengono aumentati ulteriormente, la somiglianza sarà ancora migliore.

Ora che abbiamo visto di persona la validità del CLT, possiamo, usando , calcolare gli intervalli di confidenza per la media aritmetica, che coprono la media vera o l'aspettativa matematica con una data probabilità.

Per stabilire i limiti superiore e inferiore, è necessario conoscere i parametri della distribuzione normale. Di norma, non lo sono, pertanto vengono utilizzate stime: significato aritmetico e varianza di campionamento. Ancora una volta, questo metodo fornisce una buona approssimazione solo per campioni di grandi dimensioni. Quando i campioni sono piccoli, si consiglia spesso di utilizzare la distribuzione di Student. Non credere! La distribuzione di Student per la media si verifica solo quando i dati originali hanno una distribuzione normale, cioè quasi mai. Pertanto, è meglio impostare immediatamente la barra minima per la quantità di dati richiesti e utilizzare metodi asintoticamente corretti. Dicono che 30 osservazioni siano sufficienti. Prendi 50 - non puoi sbagliare.

S 1.2 sono i limiti inferiore e superiore dell'intervallo di confidenza

– media aritmetica campionaria

s0– deviazione standard del campione (imparziale)

n - misura di prova

γ – livello di confidenza (solitamente pari a 0.9, 0.95 o 0.99)

c γ =Φ -1 ((1+γ)/2)è il reciproco della funzione di distribuzione normale standard. In termini semplici, questo è il numero di errori standard dalla media aritmetica al limite inferiore o superiore (le tre probabilità indicate corrispondono ai valori di 1,64, 1,96 e 2,58).

L'essenza della formula è che viene presa la media aritmetica e quindi viene accantonata una certa quantità ( con γ) errori standard ( s 0 /√n). Tutto è noto, prendilo e conta.

Prima dell'uso di massa dei PC, per ottenere i valori della funzione di distribuzione normale e della sua inversa, usavano . Sono ancora utilizzati, ma è più efficiente passare a formule Excel già pronte. Tutti gli elementi della formula sopra ( , e ) possono essere facilmente calcolati in Excel. Ma esiste anche una formula già pronta per calcolare l'intervallo di confidenza: NORMA DI FIDUCIA. La sua sintassi è la seguente.

CONFIDENCE NORM(alpha, standard_dev, dimensione)

alfa– livello di significatività o livello di confidenza, che nella notazione precedente è pari a 1-γ, cioè la probabilità che il matematicol'aspettativa sarà al di fuori dell'intervallo di confidenza. Con un livello di confidenza di 0,95, l'alfa è 0,05 e così via.

standard_offè la deviazione standard dei dati del campione. Non è necessario calcolare l'errore standard, Excel dividerà per la radice di n.

la dimensione– dimensione del campione (n).

Il risultato della funzione CONFIDENZA.NORM è il secondo termine della formula per il calcolo dell'intervallo di confidenza, ad es. mezzo intervallo. Di conseguenza, i punti inferiore e superiore sono la media ± il valore ottenuto.

Pertanto, è possibile costruire un algoritmo universale per il calcolo degli intervalli di confidenza per la media aritmetica, che non dipende dalla distribuzione dei dati iniziali. Il prezzo dell'universalità è la sua natura asintotica, cioè la necessità di utilizzare campioni relativamente grandi. Tuttavia, nel sec moderne tecnologie raccogliere la giusta quantità di dati di solito non è difficile.

Verifica di ipotesi statistiche utilizzando un intervallo di confidenza

(modulo 111)

Uno dei principali problemi risolti in statistica è. In poche parole, la sua essenza è questa. Si assume, ad esempio, che l'aspettativa della popolazione generale sia uguale a un certo valore. Quindi viene costruita la distribuzione delle medie campionarie, che può essere osservata con una data aspettativa. Successivamente, esaminiamo dove si trova la media reale in questa distribuzione condizionale. Se va oltre i limiti consentiti, la comparsa di una tale media è molto improbabile e con una singola ripetizione dell'esperimento è quasi impossibile, il che contraddice l'ipotesi avanzata, che viene respinta con successo. Se la media non va oltre il livello critico, allora l'ipotesi non viene rifiutata (ma nemmeno dimostrata!).

Quindi, con l'aiuto degli intervalli di confidenza, nel nostro caso per l'aspettativa, puoi anche verificare alcune ipotesi. È molto facile da fare. Supponiamo che la media aritmetica per qualche campione sia 100. Si sta verificando l'ipotesi che l'aspettativa sia, diciamo, 90. Cioè, se poniamo la domanda in modo primitivo, suona così: può essere che, con il vero valore del media pari a 90, la media osservata era 100?

Per rispondere a questa domanda, ulteriori informazioni sulla media deviazione standard e dimensione del campione. Diciamo che la deviazione standard è 30 e il numero di osservazioni è 64 (per estrarre facilmente la radice). Quindi l'errore standard della media è 30/8 o 3,75. Per calcolare l'intervallo di confidenza del 95%, sarà necessario rinviare di due a entrambi i lati della media errori standard(più precisamente, entro 1,96). L'intervallo di confidenza sarà di circa 100 ± 7,5, ovvero da 92,5 a 107,5.

Ulteriore ragionamento è il seguente. Se il valore testato rientra nell'intervallo di confidenza, allora non contraddice l'ipotesi, poiché rientra nei limiti delle fluttuazioni casuali (con una probabilità del 95%). Se il punto testato è al di fuori dell'intervallo di confidenza, allora la probabilità di tale evento è molto piccola, comunque al di sotto del livello accettabile. Pertanto, l'ipotesi viene respinta in quanto contraddice i dati osservati. Nel nostro caso, l'ipotesi di aspettativa è al di fuori dell'intervallo di confidenza (il valore testato di 90 non è incluso nell'intervallo di 100±7,5), quindi dovrebbe essere rifiutato. Rispondendo alla domanda primitiva di cui sopra, si dovrebbe dire: no, non può, in ogni caso, ciò accade estremamente raramente. Spesso, ciò indica una probabilità specifica di rifiuto errato dell'ipotesi (p-level), e non un determinato livello, in base al quale è stato costruito l'intervallo di confidenza, ma ne riparleremo un'altra volta.

Come puoi vedere, non è difficile costruire un intervallo di confidenza per la media (o aspettativa matematica). La cosa principale è catturare l'essenza, e poi le cose andranno. In pratica, la maggior parte utilizza l'intervallo di confidenza del 95%, che è largo circa due errori standard su entrambi i lati della media.

È tutto per ora. Ti auguro il meglio!

Intervallo di confidenza(CI; in inglese, intervallo di confidenza - CI) ottenuto nello studio sul campione fornisce una misura dell'accuratezza (o incertezza) dei risultati dello studio, al fine di trarre conclusioni sulla popolazione di tutti questi pazienti (popolazione generale ). La definizione corretta dell'intervallo di confidenza al 95% può essere formulata come segue: il 95% di tali intervalli conterrà il valore reale nella popolazione. Questa interpretazione è in qualche modo meno accurata: CI è l'intervallo di valori entro il quale puoi essere sicuro al 95% che contenga il valore reale. Quando si utilizza CI, l'enfasi è sulla determinazione dell'effetto quantitativo, in contrasto con il valore P, che si ottiene come risultato del test per la significatività statistica. Il valore P non valuta alcun importo, ma serve piuttosto come misura della forza dell'evidenza contro l'ipotesi nulla di "nessun effetto". Il valore di P di per sé non ci dice nulla sull'entità della differenza, e nemmeno sulla sua direzione. Pertanto, i valori indipendenti di P sono assolutamente non informativi in ​​articoli o abstract. Al contrario, CI indica sia la quantità di effetto di interesse immediato, come l'utilità di un trattamento, sia la forza delle prove. Pertanto, DI è direttamente correlato alla pratica del DM.

Approccio valutativo a analisi statistica, illustrata dall'IC, mira a misurare l'entità dell'effetto di interesse (sensibilità del test diagnostico, incidenza prevista, riduzione del rischio relativo con il trattamento, ecc.), nonché a misurare l'incertezza in questo effetto. Molto spesso, l'IC è l'intervallo di valori su entrambi i lati della stima in cui è probabile che si trovi il valore reale e puoi esserne sicuro al 95%. La convenzione per utilizzare la probabilità del 95% è arbitraria, così come il valore di P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

L'IC si basa sull'idea che lo stesso studio eseguito su diversi gruppi di pazienti non produrrebbe risultati identici, ma che i loro risultati sarebbero distribuiti attorno al valore vero ma sconosciuto. In altre parole, l'IC lo descrive come "variabilità dipendente dal campione". L'IC non riflette ulteriore incertezza dovuta ad altre cause; in particolare, non include gli effetti della perdita selettiva dei pazienti sul tracciamento, la scarsa compliance o la misurazione imprecisa degli esiti, la mancanza di accecamento, ecc. CI quindi sottostima sempre la quantità totale di incertezza.

Calcolo dell'intervallo di confidenza

Tabella A1.1. Errori standard e intervalli di confidenza per alcune misurazioni cliniche

Tipicamente, CI viene calcolato da una stima osservata di una misura quantitativa, come la differenza (d) tra due proporzioni, e l'errore standard (SE) nella stima di tale differenza. L'intervallo di confidenza approssimativo al 95% così ottenuto è d ± 1,96 SE. La formula cambia a seconda della natura della misura dell'esito e della copertura dell'IC. Ad esempio, in uno studio randomizzato controllato con placebo sul vaccino contro la pertosse acellulare, la pertosse si è sviluppata in 72 bambini su 1670 (4,3%) che hanno ricevuto il vaccino e in 240 su 1665 (14,4%) nel gruppo di controllo. La differenza percentuale, nota come riduzione del rischio assoluto, è del 10,1%. L'SE di questa differenza è dello 0,99%. Di conseguenza, l'intervallo di confidenza al 95% è 10,1% + 1,96 x 0,99%, ovvero dalle 8.2 alle 12.0.

Nonostante i diversi approcci filosofici, gli IC e i test per la significatività statistica sono strettamente correlati dal punto di vista matematico.

Pertanto, il valore di P è "significativo", cioè R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

L'incertezza (imprecisione) della stima, espressa in CI, è in gran parte correlata alla radice quadrata della dimensione del campione. I campioni piccoli forniscono meno informazioni rispetto ai campioni grandi e gli IC sono corrispondentemente più ampi nei campioni più piccoli. Ad esempio, un articolo che confrontava le prestazioni di tre test utilizzati per diagnosticare l'infezione da Helicobacter pylori riportava una sensibilità del test respiratorio dell'urea del 95,8% (95% CI 75-100). Mentre la cifra del 95,8% sembra impressionante, la piccola dimensione del campione di 24 pazienti adulti con H. pylori significa che c'è una significativa incertezza in questa stima, come mostrato dall'ampio CI. In effetti, il limite inferiore del 75% è molto inferiore alla stima del 95,8%. Se la stessa sensibilità fosse osservata in un campione di 240 persone, allora l'IC 95% sarebbe 92,5-98,0, fornendo maggiori garanzie che il test è altamente sensibile.

Negli studi randomizzati controllati (RCT), i risultati non significativi (cioè quelli con P > 0,05) sono particolarmente suscettibili di interpretazioni errate. L'IC è particolarmente utile in questo caso in quanto indica la compatibilità dei risultati con il vero effetto clinicamente utile. Ad esempio, in un RCT che ha confrontato l'anastomosi con sutura e fiocco nel colon, l'infezione della ferita si è sviluppata rispettivamente nel 10,9% e nel 13,5% dei pazienti (P ​​= 0,30). L'intervallo di confidenza del 95% per questa differenza è del 2,6% (da -2 a +8). Anche in questo studio, che ha incluso 652 pazienti, rimane probabile che ci sia una modesta differenza nell'incidenza delle infezioni derivanti dalle due procedure. Più piccolo è lo studio, maggiore è l'incertezza. Cantato et al. ha eseguito un RCT confrontando l'infusione di octreotide con la scleroterapia di emergenza per il sanguinamento acuto da varici in 100 pazienti. Nel gruppo octreotide, il tasso di arresto emorragico è stato dell'84%; nel gruppo scleroterapia - 90%, che dà P = 0,56. Si noti che i tassi di sanguinamento continuato sono simili a quelli dell'infezione della ferita nello studio citato. In questo caso, tuttavia, l'intervallo di confidenza del 95% per la differenza negli interventi è del 6% (da -7 a +19). Questo intervallo è piuttosto ampio rispetto a una differenza del 5% che sarebbe di interesse clinico. È chiaro che lo studio non esclude una differenza significativa nell'efficacia. Pertanto, la conclusione degli autori "l'infusione di octreotide e la scleroterapia sono ugualmente efficaci nel trattamento del sanguinamento da varici" non è assolutamente valida. In casi come questo in cui l'IC 95% per la riduzione del rischio assoluto (ARR) include zero, come qui, l'IC per NNT (numero necessario da trattare) è piuttosto difficile da interpretare. . La PNL e il suo CI si ottengono dai reciproci dell'ACP (moltiplicandoli per 100 se questi valori sono dati in percentuale). Qui otteniamo NPP = 100: 6 = 16,6 con un IC al 95% da -14,3 a 5,3. Come si evince dalla nota "d" in Tav. A1.1, questo CI include valori per NTPP da 5.3 a infinito e NTLP da 14.3 a infinito.

Gli elementi di configurazione possono essere costruiti per le stime oi confronti statistici più comunemente utilizzati. Per gli RCT, include la differenza tra proporzioni medie, rischi relativi, odds ratio e NRR. Allo stesso modo, gli IC possono essere ottenuti per tutte le principali stime effettuate negli studi sull'accuratezza dei test diagnostici: sensibilità, specificità, valore predittivo positivo (che sono tutte proporzioni semplici) e rapporti di verosimiglianza: stime ottenute in meta-analisi e confronto con il controllo studi. Un programma per personal computer che copre molti di questi usi di DI è disponibile con la seconda edizione di Statistics with Confidence. Le macro per il calcolo degli IC per le proporzioni sono disponibili gratuitamente per Excel e per i programmi statistici SPSS e Minitab all'indirizzo http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Valutazioni multiple dell'effetto del trattamento

Mentre la costruzione di CI è desiderabile per i risultati primari di uno studio, non sono richiesti per tutti i risultati. L'IC riguarda confronti clinicamente importanti. Ad esempio, quando si confrontano due gruppi, l'elemento della configurazione corretto è quello creato per la differenza tra i gruppi, come mostrato negli esempi precedenti, e non l'elemento della configurazione che può essere creato per la stima in ciascun gruppo. Non solo è inutile fornire IC separati per i punteggi di ciascun gruppo, ma questa presentazione può essere fuorviante. Allo stesso modo, l'approccio corretto quando si confronta l'efficacia del trattamento in diversi sottogruppi è quello di confrontare direttamente due (o più) sottogruppi. Non è corretto presumere che il trattamento sia efficace solo in un sottogruppo se il suo IC esclude il valore corrispondente a nessun effetto, mentre altri no. Gli elementi di configurazione sono utili anche quando si confrontano i risultati di più sottogruppi. Sulla fig. A1.1 mostra il rischio relativo di eclampsia nelle donne con preeclampsia in sottogruppi di donne da un RCT controllato con placebo sul solfato di magnesio.

Riso. A1.2. Il Forest Graph mostra i risultati di 11 studi clinici randomizzati sul vaccino contro il rotavirus bovino per la prevenzione della diarrea rispetto al placebo. L'intervallo di confidenza del 95% è stato utilizzato per stimare il rischio relativo di diarrea. La dimensione del quadrato nero è proporzionale alla quantità di informazioni. Inoltre, viene mostrata una stima riassuntiva dell'efficacia del trattamento e un intervallo di confidenza al 95% (indicato da un rombo). La meta-analisi ha utilizzato un modello a effetti casuali che supera alcuni modelli prestabiliti; ad esempio, potrebbe essere la dimensione utilizzata nel calcolo della dimensione del campione. Secondo un criterio più stringente, l'intera gamma di EC deve mostrare un vantaggio che supera un minimo predeterminato.

Abbiamo già discusso l'errore di prendere l'assenza di significatività statistica come un'indicazione che due trattamenti sono ugualmente efficaci. È altrettanto importante non equiparare la significatività statistica alla significatività clinica. L'importanza clinica può essere assunta quando il risultato è statisticamente significativo e l'entità della risposta al trattamento

Gli studi possono mostrare se i risultati sono statisticamente significativi e quali sono clinicamente importanti e quali no. Sulla fig. A1.2 mostra i risultati di quattro prove per le quali l'intero CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Supponiamo di avere un numero elevato di articoli con una distribuzione normale di alcune caratteristiche (ad esempio un magazzino pieno di verdure dello stesso tipo, di dimensioni e peso variabili). Vuoi conoscere le caratteristiche medie dell'intero lotto di merce, ma non hai né il tempo né la voglia di misurare e pesare ogni singolo ortaggio. Capisci che questo non è necessario. Ma quanti pezzi dovresti prendere per un'ispezione casuale?

Prima di dare alcune formule utili per questa situazione, ricordiamo alcune notazioni.

Innanzitutto, se misurassimo l'intero magazzino di verdure (questo insieme di elementi è chiamato popolazione generale), allora sapremmo con tutta la precisione a nostra disposizione il valore medio del peso dell'intero lotto. Chiamiamo questa media X cfr .g it . - media generale. Sappiamo già cosa è completamente determinato se ne conosciamo il valore medio e la deviazione s . È vero, finora non siamo né X media né S non conosciamo la popolazione generale. Possiamo solo prelevare un campione, misurare i valori di cui abbiamo bisogno e calcolare per questo campione sia il valore medio X sr. nel campione che la deviazione standard S sb.

È noto che se il nostro controllo personalizzato contiene un numero elevato di elementi (di solito n è maggiore di 30), e vengono presi davvero casuale, poi s la popolazione generale quasi non differirà da S ..

Inoltre, per il caso di una distribuzione normale, possiamo utilizzare le seguenti formule:

Con una probabilità del 95%


Con una probabilità del 99%



In generale, con probabilità Р (t)


La relazione tra il valore di t e il valore della probabilità P (t), di cui si vuole conoscere l'intervallo di confidenza, può essere ricavata dalla seguente tabella:


Pertanto, abbiamo determinato in quale intervallo si trova il valore medio per la popolazione generale (con una data probabilità).

A meno che non disponiamo di un campione sufficientemente ampio, non possiamo affermare che la popolazione abbia s = S sel. Inoltre, in questo caso, la vicinanza del campione alla distribuzione normale è problematica. In questo caso, usa invece anche S sb s nella formula:




ma il valore di t per una probabilità fissa P(t) dipenderà dal numero di elementi nel campione n. Maggiore è n, più vicino sarà l'intervallo di confidenza risultante al valore dato dalla formula (1). I valori t in questo caso sono presi da un'altra tabella (test t di Student), che forniamo di seguito:

Valori del test t di Student per probabilità 0,95 e 0,99


Esempio 3 30 persone sono state selezionate a caso tra i dipendenti dell'azienda. Secondo il campione, si è scoperto che lo stipendio medio (al mese) è di 30 mila rubli con una deviazione quadrata media di 5 mila rubli. Con una probabilità di 0,99 determinare lo stipendio medio dell'azienda.

Soluzione: Per condizione, abbiamo n = 30, X cfr. =30000, S=5000, P=0,99. Per trovare l'intervallo di confidenza, utilizziamo la formula corrispondente al criterio di Student. Secondo la tabella per n \u003d 30 e P \u003d 0,99 troviamo t \u003d 2,756, quindi,


quelli. fiducia desiderata intervallo 27484< Х ср.ген < 32516.

Quindi, con una probabilità di 0,99, si può sostenere che l'intervallo (27484; 32516) contenga lo stipendio medio dell'azienda.

Ci auguriamo che utilizzerai questo metodo senza necessariamente avere un foglio di calcolo con te ogni volta. I calcoli possono essere eseguiti automaticamente in Excel. Mentre sei in un file Excel, fai clic sul pulsante fx nel menu in alto. Quindi, seleziona tra le funzioni il tipo "statistico", e dall'elenco proposto nella casella - STEUDRASP. Quindi, al prompt, posizionando il cursore nel campo "probabilità", digitare il valore della probabilità reciproca (ovvero, nel nostro caso, invece della probabilità di 0,95, è necessario digitare la probabilità di 0,05). Apparentemente, il foglio di calcolo è progettato in modo tale che il risultato risponda alla domanda su quanto è probabile che possiamo sbagliarci. Allo stesso modo, nel campo "grado di libertà", inserisci il valore (n-1) per il tuo campione.