Metodi di analisi quantitativa: Stima degli intervalli di confidenza.  Intervallo di confidenza.  ABC della statistica medica.  Capitolo III

 Metodi di analisi quantitativa: Stima degli intervalli di confidenza. Intervallo di confidenza. ABC della statistica medica. Capitolo III

Da questo articolo imparerai:

    Che cosa intervallo di confidenza ?

    Qual è il punto 3 regole sigma?

    Come si può mettere in pratica questa conoscenza?

Al giorno d'oggi, a causa di una sovrabbondanza di informazioni associate a un vasto assortimento di prodotti, direzioni di vendita, dipendenti, attività, ecc., è difficile scegliere il principale, che, prima di tutto, vale la pena prestare attenzione e sforzarsi di gestire. Definizione intervallo di confidenza e analisi dell'andare oltre i suoi confini di valori reali - una tecnica che aiutarti a identificare le situazioni, influenzare le tendenze. Sarai in grado di svilupparti fattori positivi e ridurre l'impatto negativo. Questa tecnologia utilizzato in molte note aziende mondiali.

Ci sono i cosiddetti avvisi", quale informare i gestori affermando che il prossimo valore in una certa direzione andato oltre intervallo di confidenza. Cosa significa questo? Questo è un segnale che si è verificato un evento non standard, che potrebbe cambiare la tendenza esistente in questa direzione. Questo è il segnale a tale per risolverlo nella situazione e capire cosa l'ha influenzata.

Ad esempio, considera diverse situazioni. Abbiamo calcolato le previsioni di vendita con limiti di previsione per 100 articoli di materie prime per il 2011 per mesi e vendite effettive a marzo:

  1. Di " olio di semi di girasole» ha superato il limite superiore della previsione e non è rientrato nell'intervallo di confidenza.
  2. Per "lievito secco" è andato oltre il limite inferiore della previsione.
  3. Su "Oatmeal Porridge" ha sfondato il limite superiore.

Per il resto delle merci, le vendite effettive rientravano nei limiti di previsione specificati. Quelli. le loro vendite erano in linea con le aspettative. Quindi, abbiamo identificato 3 prodotti che andavano oltre i confini, e abbiamo iniziato a capire cosa ha influenzato l'andare oltre i confini:

  1. Con "Olio di girasole" siamo entrati in un nuovo rete commerciale, che ci ha dato un volume di vendite aggiuntivo, che ha portato all'uscita del limite superiore. Per questo prodotto vale la pena ricalcolare la previsione fino alla fine dell'anno, tenendo conto della previsione delle vendite a questa catena.
  2. Per Dry Yeast, l'auto è rimasta bloccata alla dogana e si è verificata una carenza entro 5 giorni, che ha influito sul calo delle vendite e sull'uscita dal confine inferiore. Potrebbe valere la pena capire cosa ha causato la causa e cercare di non ripetere questa situazione.
  3. Per Oatmeal è stata lanciata una promozione delle vendite, che ha comportato un aumento significativo delle vendite e ha portato a un superamento delle previsioni.

Abbiamo identificato 3 fattori che hanno influenzato il superamento della previsione. Ce ne possono essere molti di più nella vita Per migliorare l'accuratezza delle previsioni e della pianificazione, i fattori che portano al fatto che le vendite effettive possono andare oltre le previsioni, vale la pena evidenziare e costruire separatamente previsioni e piani per loro. E poi prendi in considerazione il loro impatto sulle principali previsioni di vendita. Puoi anche valutare regolarmente l'impatto di questi fattori e cambiare la situazione in meglio per riducendo l'influenza di fattori negativi e aumentando l'influenza di fattori positivi.

Con un intervallo di confidenza possiamo:

  1. Evidenzia le destinazioni, a cui vale la pena prestare attenzione, perché in queste aree si sono verificati eventi che potrebbero interessare cambiamento di tendenza.
  2. Determina i fattori che effettivamente fanno la differenza.
  3. Accettare decisione ponderata(ad esempio, sugli appalti, durante la pianificazione, ecc.).

Ora diamo un'occhiata a cos'è un intervallo di confidenza e come calcolarlo in Excel usando un esempio.

Cos'è un intervallo di confidenza?

L'intervallo di confidenza è i limiti di previsione (superiore e inferiore), entro i quali con una data probabilità (sigma) ottenere i valori effettivi.

Quelli. calcoliamo la previsione: questo è il nostro punto di riferimento principale, ma comprendiamo che è improbabile che i valori effettivi siano pari al 100% alla nostra previsione. E la domanda sorge spontanea fino a che punto può ottenere valori reali, se la tendenza attuale continua? E questa domanda ci aiuterà a rispondere calcolo dell'intervallo di confidenza, cioè. - limiti superiore e inferiore della previsione.

Cos'è una data probabilità sigma?

Quando si calcola intervallo di confidenza che possiamo impostare la probabilità colpi valori effettivi entro i limiti di previsione indicati. Come farlo? Per fare ciò impostiamo il valore di sigma e, se sigma è uguale a:

    3 sigma- quindi, la probabilità di raggiungere il successivo valore effettivo nell'intervallo di confidenza sarà del 99,7%, ovvero 300 a 1, oppure esiste una probabilità dello 0,3% di superare i limiti.

    2 sigma- quindi, la probabilità di raggiungere il valore successivo all'interno dei limiti è ≈ 95,5%, cioè le probabilità sono di circa 20 a 1, o c'è una probabilità del 4,5% di uscire dai limiti.

    1 sigma- quindi, la probabilità è ≈ 68,3%, cioè le probabilità sono di circa 2 a 1, ovvero c'è una probabilità del 31,7% che il valore successivo cada al di fuori dell'intervallo di confidenza.

Abbiamo formulato Regola 3 Sigma,che lo dice probabilità di successo un altro valore casuale nell'intervallo di confidenza con un dato valore tre sigma è 99,7%.

Il grande matematico russo Chebyshev ha dimostrato un teorema secondo cui esiste una probabilità del 10% di andare oltre i limiti di una previsione con un dato valore di tre sigma. Quelli. la probabilità di rientrare nell'intervallo di confidenza 3 sigma sarà almeno del 90%, mentre un tentativo di calcolare la previsione ei suoi limiti "a occhio" è irto di errori molto più significativi.

Come calcolare in modo indipendente l'intervallo di confidenza in Excel?

Consideriamo il calcolo dell'intervallo di confidenza in Excel (ovvero i limiti superiore e inferiore della previsione) utilizzando un esempio. Abbiamo una serie temporale: vendite per mesi per 5 anni. Guardare il file allegato.

Per calcolare i limiti della previsione, calcoliamo:

  1. Previsioni di vendita().
  2. Sigma - deviazione standard modelli di previsione dai valori effettivi.
  3. Tre sigma.
  4. Intervallo di confidenza.

1. Previsioni di vendita.

=(RC[-14] (dati in serie storica)-RC[-1] (valore del modello))^2(quadrato)


3. Somma per ciascun mese i valori di deviazione dalla fase 8 Sum((Xi-Ximod)^2), ovvero Sommiamo gennaio, febbraio... per ogni anno.

Per fare ciò, usa la formula =SOMMA.SE()

SOMMA.SE(array con numeri di periodi interni al ciclo (per i mesi da 1 a 12); riferimento al numero del periodo nel ciclo; riferimento ad un array con quadrati della differenza tra il dato iniziale e i valori del periodi)


4. Calcolare la deviazione standard per ciascun periodo del ciclo da 1 a 12 (stadio 10 nel file allegato).

Per fare ciò, dal valore calcolato nella fase 9, estraiamo la radice e la dividiamo per il numero di periodi in questo ciclo meno 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

Usiamo le formule in Excel =ROOT(R8 (riferimento a (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (riferimento a un array con numeri di ciclo); O8 (riferimento a un numero di ciclo specifico, che consideriamo nell'array))-1))

Usando la formula di Excel = CONTA.SE contiamo il numero n


Calcolando la deviazione standard dei dati effettivi dal modello di previsione, abbiamo ottenuto il valore sigma per ogni mese - fase 10 nel file allegato.

3. Calcola 3 sigma.

Nella fase 11, impostiamo il numero di sigma - nel nostro esempio, "3" (fase 11 nel file allegato):

Anche valori sigma pratici:

1.64 sigma - 10% di possibilità di superare il limite (1 possibilità su 10);

1.96 sigma - 5% di possibilità di uscire dai limiti (1 possibilità su 20);

2.6 sigma - 1% di possibilità di uscire dai limiti (1 possibilità su 100).

5) Calcoliamo tre sigma, per questo moltiplichiamo i valori "sigma" per ogni mese per "3".

3. Determinare l'intervallo di confidenza.

  1. Limite superiore di previsione- previsioni di vendita tenendo conto della crescita e della stagionalità + (più) 3 sigma;
  2. Limite di previsione inferiore- previsioni di vendita tenendo conto della crescita e della stagionalità - (meno) 3 sigma;

Per comodità di calcolo dell'intervallo di confidenza per un lungo periodo (vedi file allegato), utilizziamo la formula di Excel =Y8+CERCA.VERT(W8;$U$8:$V$19;2;0), dove

Y8- Previsioni di vendita;

W8- il numero del mese per il quale assumeremo il valore di 3 sigma;

Quelli. Limite superiore di previsione= "previsioni di vendita" + "3 sigma" (nell'esempio CERCA.VERT(numero mese; tabella con valori 3 sigma; colonna da cui si estrae il valore sigma pari al numero del mese nella riga corrispondente; 0)).

Limite di previsione inferiore= "previsioni di vendita" meno "3 sigma".

Quindi, abbiamo calcolato l'intervallo di confidenza in Excel.

Ora abbiamo una previsione e un intervallo con limiti entro i quali cadranno i valori effettivi con una data probabilità sigma.

In questo articolo, abbiamo esaminato cosa sono sigma e la regola dei tre sigma, come determinare un intervallo di confidenza e per cosa puoi utilizzare questa tecnica nella pratica.

Previsioni accurate e successo per te!

Come Forecast4AC PRO può aiutartinel calcolo dell'intervallo di confidenza?:

    Forecast4AC PRO calcolerà automaticamente i limiti di previsione superiore o inferiore per più di 1000 serie temporali contemporaneamente;

    La capacità di analizzare i confini della previsione rispetto alla previsione, alla tendenza e alle vendite effettive sul grafico con una sola pressione di un tasto;

Nel programma Forcast4AC PRO è possibile impostare il valore sigma da 1 a 3.

Unisciti a noi!

Scarica applicazioni gratuite per previsioni e analisi di business:


  • Novo Previsione Lite- automatico calcolo delle previsioni in eccellere.
  • 4analisi- Analisi ABC-XYZ e analisi delle emissioni in Eccellere.
  • Qlik Senso Scrivania e Qlik ViewPersonal Edition - Sistemi di BI per l'analisi e la visualizzazione dei dati.

Testa le funzionalità delle soluzioni a pagamento:

  • Novo Previsioni PRO- previsione in Excel per matrici di dati di grandi dimensioni.

Nelle sottosezioni precedenti, abbiamo considerato la questione della stima del parametro sconosciuto un un numero. Tale valutazione è chiamata "punto". In una serie di attività, è necessario non solo trovare il parametro un valore numerico adeguato, ma anche valutarne l'accuratezza e l'affidabilità. È necessario sapere a quali errori può portare la sostituzione dei parametri un la sua stima puntuale un e con quale grado di fiducia possiamo aspettarci che questi errori non vadano oltre i limiti noti?

Problemi di questo tipo sono particolarmente rilevanti per un piccolo numero di osservazioni, quando la stima puntuale e dentroè in gran parte casuale e una sostituzione approssimativa di a con a può portare a gravi errori.

Per dare un'idea dell'accuratezza e dell'attendibilità del preventivo un,

in statistica matematica utilizzare i cosiddetti intervalli di confidenza e probabilità di confidenza.

Lasciamo il parametro un derivato dall'esperienza stima imparziale un. Vogliamo stimare il possibile errore in questo caso. Assegniamo una probabilità p sufficientemente grande (ad esempio, p = 0,9, 0,95 o 0,99) tale che un evento con probabilità p possa essere considerato praticamente certo, e troviamo un valore di s per il quale

Quindi l'intervallo di valori praticamente possibili dell'errore che si verifica durante la sostituzione un sul un, sarà ± s; grandi errori assoluti appariranno solo con una piccola probabilità a = 1 - p. Riscriviamo la (14.3.1) come:

Uguaglianza (14.3.2) significa che con probabilità p il valore sconosciuto del parametro un rientra nell'intervallo

In questo caso, è necessario notare una circostanza. In precedenza, abbiamo ripetutamente considerato la probabilità di colpire variabile casuale entro un dato intervallo non casuale. Qui la situazione è diversa: un intervallo non casuale, ma casuale / r. Casualmente la sua posizione sull'asse x, determinata dal suo centro un; in generale, anche la lunghezza dell'intervallo 2s è casuale, poiché il valore di s è calcolato, di regola, da dati sperimentali. Pertanto, dentro questo caso sarebbe meglio interpretare il valore di p non come la probabilità di "centrare" un punto un nell'intervallo / p, ma come la probabilità che un intervallo casuale / p copra il punto un(figura 14.3.1).

Riso. 14.3.1

Viene chiamata la probabilità p livello di confidenza, e l'intervallo / p - intervallo di confidenza. Limiti di intervallo Se. a x \u003d a- sabbia un 2 = un + e sono chiamati limiti di fiducia.

Diamo un'altra interpretazione al concetto di intervallo di confidenza: può essere considerato come un intervallo di valori di parametri un, compatibili con i dati sperimentali e non contraddittori. Infatti, se accettiamo di considerare praticamente impossibile un evento con probabilità a = 1-p, allora quei valori del parametro a per i quali aa> s deve essere riconosciuto come contraddittorio con i dati sperimentali, e quelli per i quali |a - un a t na 2 .

Lasciamo il parametro un c'è una stima imparziale un. Se conoscessimo la legge di distribuzione della quantità un, il problema di trovare l'intervallo di confidenza sarebbe abbastanza semplice: basterebbe trovare un valore di s per cui

La difficoltà sta nel fatto che la legge di distribuzione della stima un dipende dalla legge di distribuzione della quantità X e, di conseguenza, sui suoi parametri sconosciuti (in particolare, sul parametro stesso un).

Per aggirare questa difficoltà, si può applicare il seguente trucco approssimativamente approssimativo: sostituire i parametri sconosciuti nell'espressione per s con le loro stime puntuali. Con un numero relativamente elevato di esperimenti P(circa 20...30) questa tecnica di solito dà risultati soddisfacenti in termini di accuratezza.

Ad esempio, si consideri il problema dell'intervallo di confidenza per aspettativa matematica.

Lasciate prodotto P X, le cui caratteristiche sono l'aspettativa matematica t e varianza D- sconosciuto. Per questi parametri sono state ottenute le seguenti stime:

È necessario costruire un intervallo di confidenza / ð, corrispondente alla probabilità di confidenza ð, per l'aspettativa matematica t le quantità X.

Per risolvere questo problema, usiamo il fatto che la quantità tè la somma P variabili casuali indipendenti identicamente distribuite X h e secondo il teorema del limite centrale per sufficientemente grande P la sua legge di distribuzione è vicina alla normale. In pratica, anche con un numero relativamente piccolo di termini (dell'ordine di 10...20), la legge di distribuzione della somma può essere considerata approssimativamente normale. Supponiamo che il valore t distribuiti secondo la legge normale. Le caratteristiche di questa legge - l'aspettativa matematica e la varianza - sono uguali, rispettivamente t e

(vedi capitolo 13 sottosezione 13.3). Supponiamo che il valore D ci è noto e troveremo un Ep di tale valore per il quale

Applicando la formula (6.3.5) del capitolo 6, esprimiamo la probabilità a sinistra di (14.3.5) in termini della funzione di distribuzione normale

dove è la deviazione standard della stima t.

Dall'equazione

trova il valore Sp:

dove arg Ф* (x) è la funzione inversa di Ф* (X), quelli. tale valore dell'argomento per il quale la funzione di distribuzione normale è uguale a X.

Dispersione D, attraverso cui si esprime il valore un 1P, non lo sappiamo esattamente; come valore approssimativo, puoi utilizzare la stima D(14.3.4) e poniamo approssimativamente:

Pertanto, il problema di costruire un intervallo di confidenza è approssimativamente risolto, che è uguale a:

dove gp è definito dalla formula (14.3.7).

Per evitare l'interpolazione inversa nelle tabelle della funzione Ф * (l) durante il calcolo di s p, è conveniente compilare una tabella speciale (Tabella 14.3.1), che elenca i valori della quantità

a seconda di r. Il valore (p determina per la legge normale il numero di medie deviazioni standard, che deve essere accantonato a destra ea sinistra del centro di dispersione in modo che la probabilità di colpire l'area risultante sia pari a p.

Attraverso il valore di 7 p, l'intervallo di confidenza è espresso come:

Tabella 14.3.1

Esempio 1. Sono stati eseguiti 20 esperimenti sul valore X; i risultati sono riportati in tabella. 14.3.2.

Tabella 14.3.2

È necessario trovare una stima di per l'aspettativa matematica della quantità X e costruire un intervallo di confidenza corrispondente a un livello di confidenza p = 0.8.

Soluzione. Abbiamo:

Scegliendo per l'origine n: = 10, secondo la terza formula (14.2.14) troviamo la stima imparziale D :

Secondo la tabella 14.3.1 troviamo

Limiti di confidenza:

Intervallo di confidenza:

Valori dei parametri t, trovarsi in questo intervallo è compatibile con i dati sperimentali dati in tabella. 14.3.2.

Analogamente, si può costruire un intervallo di confidenza per la varianza.

Lasciate prodotto P esperimenti indipendenti su una variabile casuale X con parametri sconosciuti da e A, e per la varianza D la stima imparziale si ottiene:

È necessario costruire approssimativamente un intervallo di confidenza per la varianza.

Dalla formula (14.3.11) si può vedere che il valore D rappresenta

Quantità P variabili casuali della forma . Questi valori non lo sono

indipendente, poiché ognuno di essi include la quantità t, dipendente da tutti gli altri. Tuttavia, si può dimostrare che come P anche la legge di distribuzione della loro somma è vicina alla normale. Quasi a P= 20...30 si può già considerare normale.

Supponiamo che sia così, e troviamo le caratteristiche di questa legge: l'aspettativa matematica e la varianza. Dal punteggio D- imparziale, quindi M[D] = D.

Calcolo della varianza D Dè associato a calcoli relativamente complessi, quindi diamo la sua espressione senza derivazione:

dove c 4 - il quarto momento centrale della quantità X.

Per utilizzare questa espressione, è necessario sostituire in essa i valori di 4 e D(almeno approssimativo). Invece di Dè possibile utilizzare la valutazione D. In linea di principio, il quarto momento centrale può anche essere sostituito dalla sua stima, ad esempio, da un valore della forma:

ma una tale sostituzione darà una precisione estremamente bassa, poiché in generale, con un numero limitato di esperimenti, i momenti di ordine elevato sono determinati con grandi errori. Tuttavia, in pratica accade spesso che la forma della legge di distribuzione della quantità X conosciuto in anticipo: solo i suoi parametri sono sconosciuti. Allora possiamo provare ad esprimere u4 in termini di D.

Prendiamo il caso più comune, quando il valore X distribuiti secondo la legge normale. Allora il suo quarto momento centrale è espresso in termini di varianza (vedi Capitolo 6 Sottosezione 6.2);

e la formula (14.3.12) dà o

Sostituire in (14.3.14) l'ignoto D la sua valutazione D, otteniamo: donde

Il momento u 4 può essere espresso in termini di D anche in alcuni altri casi, quando la distribuzione della quantità X non è normale, ma il suo aspetto è noto. Ad esempio, per la legge della densità uniforme (vedi Capitolo 5) abbiamo:

dove (a, P) è l'intervallo su cui è data la legge.

Di conseguenza,

Secondo la formula (14.3.12) si ottiene: da dove troviamo approssimativamente

Nei casi in cui la forma della legge di distribuzione del valore di 26 è sconosciuta, quando si stima il valore di a /) si raccomanda comunque di utilizzare la formula (14.3.16), se non vi sono motivi particolari per ritenere che questo la legge è molto diversa da quella normale (ha una notevole curtosi positiva o negativa).

Se il valore approssimato di a /) viene ottenuto in un modo o nell'altro, allora è possibile costruire un intervallo di confidenza per la varianza nello stesso modo in cui lo abbiamo costruito per l'aspettativa matematica:

dove il valore dipendente dalla data probabilità p si trova in Tabella. 14.3.1.

Esempio 2. Trova un intervallo di confidenza di circa l'80% per la varianza di una variabile casuale X nelle condizioni dell'esempio 1, se è noto che il valore X distribuito secondo una legge prossima alla normalità.

Soluzione. Il valore rimane lo stesso della tabella. 14.3.1:

Secondo la formula (14.3.16)

Secondo la formula (14.3.18) troviamo l'intervallo di confidenza:

Il corrispondente intervallo di valori della deviazione standard: (0,21; 0,29).

14.4. Metodi esatti per la costruzione di intervalli di confidenza per i parametri di una variabile aleatoria distribuita secondo la legge normale

Nella sottosezione precedente, abbiamo considerato metodi approssimativamente approssimativi per la costruzione di intervalli di confidenza per la media e la varianza. Qui diamo un'idea dei metodi esatti per risolvere lo stesso problema. Sottolineiamo che per trovare con precisione gli intervalli di confidenza è assolutamente necessario conoscere in anticipo la forma della legge di distribuzione della quantità X, mentre ciò non è necessario per l'applicazione di metodi approssimativi.

L'idea di metodi esatti per costruire intervalli di confidenza è la seguente. Qualsiasi intervallo di confidenza si trova dalla condizione che esprime la probabilità di avveramento di alcune disuguaglianze, che includono la stima di nostro interesse un. Legge sulla distribuzione dei gradi un in caso generale dipende dai parametri della quantità sconosciuta X. Tuttavia, a volte è possibile passare le disuguaglianze da una variabile casuale un a qualche altra funzione dei valori osservati X p X 2, ..., X pag. la cui legge di distribuzione non dipende da parametri sconosciuti, ma dipende solo dal numero di esperimenti e dalla forma della legge di distribuzione della quantità X. Variabili casuali di questo tipo giocano un ruolo importante nelle statistiche matematiche; sono stati studiati in modo più dettagliato per il caso di una distribuzione normale della quantità X.

Ad esempio, è stato dimostrato che sotto una distribuzione normale della quantità X valore casuale

soggetto al cosiddetto La legge sulla distribuzione degli studenti Insieme a P- 1 gradi di libertà; la densità di questa legge ha la forma

dove G(x) è la nota funzione gamma:

Si dimostra anche che la variabile casuale

ha "distribuzione % 2 " con P- 1 gradi di libertà (vedi capitolo 7), la cui densità è espressa dalla formula

Senza soffermarci sulle derivazioni delle distribuzioni (14.4.2) e (14.4.4), mostreremo come possono essere applicate nella costruzione degli intervalli di confidenza per i parametri Ty D.

Lasciate prodotto P esperimenti indipendenti su una variabile casuale X, distribuito secondo la legge normale con parametri sconosciuti TIO. Per questi parametri, stime

È necessario costruire intervalli di confidenza per entrambi i parametri corrispondenti alla probabilità di confidenza p.

Costruiamo prima un intervallo di confidenza per l'aspettativa matematica. È naturale prendere questo intervallo simmetrico rispetto a t; denotiamo con sp la metà della lunghezza dell'intervallo. Il valore di sp deve essere scelto in modo che la condizione

Proviamo a passare sul lato sinistro dell'uguaglianza (14.4.5) da una variabile casuale t ad una variabile casuale T, distribuita secondo la legge di Student. Per fare ciò, moltiplichiamo entrambe le parti della disuguaglianza |m-w?|

ad un valore positivo: oppure, utilizzando la notazione (14.4.1),

Troviamo un numero / p tale che il valore / p possa essere trovato dalla condizione

Dalla formula (14.4.2) si può vedere che (1) - funzione pari, quindi (14.4.8) dà

L'uguaglianza (14.4.9) determina il valore / p in funzione di p. Se hai a disposizione una tabella di valori integrali

quindi il valore / p può essere trovato per interpolazione inversa nella tabella. Tuttavia, è più conveniente compilare in anticipo una tabella di valori / p. Tale tabella è riportata in Appendice (Tabella 5). Questa tabella mostra i valori in base alla probabilità di confidenza p e al numero di gradi di libertà P- 1. Avendo determinato / p secondo la tabella. 5 e supponendo

troviamo metà dell'ampiezza dell'intervallo di confidenza / pe l'intervallo stesso

Esempio 1. Sono stati eseguiti 5 esperimenti indipendenti su una variabile casuale X, distribuzione normale con parametri sconosciuti t e a proposito di. I risultati degli esperimenti sono riportati in tabella. 14.4.1.

Tabella 14.4.1

Trova un preventivo t per l'aspettativa matematica e costruire un intervallo di confidenza del 90% / p per esso (ovvero l'intervallo corrispondente alla probabilità di confidenza p \u003d 0,9).

Soluzione. Abbiamo:

Secondo la tabella 5 della domanda di P - Troviamo 1 = 4 e p = 0,9 dove

L'intervallo di confidenza sarà

Esempio 2. Per le condizioni dell'esempio 1 del paragrafo 14.3, assumendo il valore X distribuzione normale, trovare l'esatto intervallo di confidenza.

Soluzione. Secondo la tabella 5 dell'applicazione, troviamo a P - 1 = 19ir =

0,8/p = 1,328; da qui

Confrontando con la soluzione dell'esempio 1 della sottosezione 14.3 (e p = 0.072), vediamo che la discrepanza è molto piccola. Se manteniamo la precisione alla seconda cifra decimale, gli intervalli di confidenza trovati con i metodi esatti e approssimati sono gli stessi:

Passiamo alla costruzione di un intervallo di confidenza per la varianza. Considera la stima della varianza imparziale

ed esprimi la variabile casuale D attraverso il valore v(14.4.3) con distribuzione x 2 (14.4.4):

Conoscere la legge di distribuzione della quantità V,è possibile trovare l'intervallo / (1 ) in cui cade con una data probabilità p.

diritto di distribuzione k n _ x (v) il valore di I 7 ha la forma mostrata in fig. 14.4.1.

Riso. 14.4.1

La domanda sorge spontanea: come scegliere l'intervallo / p? Se la legge di distribuzione della quantità v fosse simmetrico (come una legge normale o la distribuzione di Student), sarebbe naturale assumere l'intervallo /p simmetrico rispetto all'aspettativa matematica. In questo caso, la legge k n _ x (v) asimmetrico. Conveniamo di scegliere l'intervallo /p in modo che le probabilità di uscita della quantità v al di fuori dell'intervallo a destra e a sinistra (aree ombreggiate in Fig. 14.4.1) erano uguali e uguali

Per costruire un intervallo / p con questa proprietà, usiamo Table. 4 applicazioni: contiene numeri si) tale che

per la quantità V, con distribuzione x2 con r gradi di libertà. Nel nostro caso r = n- 1. Correggi r = n- 1 e trova nella riga corrispondente della tabella. 4 due valori x 2 - uno corrispondente a una probabilità l'altro - probabilità Indichiamo queste

i valori alle 2 e XL? L'intervallo ha si 2 , con la sua sinistra, e si~ estremità destra.

Ora troviamo l'intervallo di confidenza richiesto /| per la varianza con confini D, e D2, che copre il punto D con probabilità p:

Costruiamo un tale intervallo / (, = (?> b A), che copre il punto D se e solo se il valore v cade nell'intervallo / r. Mostriamo che l'intervallo

soddisfa questa condizione. Anzi, le disuguaglianze sono equivalenti alle disuguaglianze

e queste disuguaglianze valgono con probabilità p. Pertanto, l'intervallo di confidenza per la dispersione viene trovato ed è espresso dalla formula (14.4.13).

Esempio 3. Trova l'intervallo di confidenza per la varianza nelle condizioni dell'esempio 2 della sottosezione 14.3, se è noto che il valore X distribuito normalmente.

Soluzione. abbiamo . Secondo la tabella 4 della domanda

troviamo a r = n- 1 = 19

Secondo la formula (14.4.13) troviamo l'intervallo di confidenza per la dispersione

Intervallo corrispondente per la deviazione standard: (0,21; 0,32). Questo intervallo supera solo di poco l'intervallo (0,21; 0,29) ottenuto nell'Esempio 2 della Sottosezione 14.3 con il metodo approssimato.

  • La Figura 14.3.1 considera un intervallo di confidenza simmetrico rispetto a a. In generale, come vedremo in seguito, ciò non è necessario.

E altri, tutti sono stime delle loro controparti teoriche, che potrebbero essere ottenute se non ci fosse un campione, ma la popolazione generale. Ma ahimè, la popolazione generale è molto costosa e spesso non disponibile.

Il concetto di stima intervallare

Qualsiasi stima del campione ha una certa dispersione, perché è una variabile casuale che dipende dai valori in un particolare campione. Pertanto, per inferenze statistiche più affidabili, si dovrebbe conoscere non solo la stima puntuale, ma anche l'intervallo, che con un'alta probabilità γ (gamma) copre l'indicatore stimato θ (teta).

Formalmente, questi sono due di questi valori (statistiche) T1(X) e T2(X), che cosa T1< T 2 , per cui a un dato livello di probabilità γ condizione è soddisfatta:

Insomma, è probabile γ o più il vero valore è tra i punti T1(X) e T2(X), che sono chiamati limiti inferiore e superiore intervallo di confidenza.

Una delle condizioni per costruire gli intervalli di confidenza è la sua massima ristrettezza, cioè dovrebbe essere il più breve possibile. Il desiderio è abbastanza naturale, perché. il ricercatore cerca di localizzare più accuratamente la scoperta del parametro desiderato.

Ne consegue che l'intervallo di confidenza dovrebbe coprire le probabilità massime della distribuzione. e la partitura stessa sia al centro.

Cioè, la probabilità di deviazione (dell'indicatore vero dalla stima) verso l'alto è uguale alla probabilità di deviazione verso il basso. Va inoltre notato che per le distribuzioni asimmetriche, l'intervallo a destra non è uguale all'intervallo a sinistra.

La figura sopra mostra chiaramente che maggiore è il livello di confidenza, più ampio è l'intervallo: una relazione diretta.

Questa è stata una piccola introduzione alla teoria della stima dell'intervallo di parametri sconosciuti. Passiamo alla ricerca dei limiti di confidenza per l'aspettativa matematica.

Intervallo di confidenza per l'aspettativa matematica

Se i dati originali sono distribuiti su , la media sarà un valore normale. Ciò deriva dalla regola secondo cui anche una combinazione lineare di valori normali ha una distribuzione normale. Pertanto, per calcolare le probabilità, potremmo utilizzare l'apparato matematico della legge della distribuzione normale.

Tuttavia, ciò richiederà la conoscenza di due parametri: il valore atteso e la varianza, che di solito non sono noti. Ovviamente puoi usare stime invece di parametri (media aritmetica e ), ma la distribuzione della media non sarà del tutto normale, sarà leggermente appiattita. Il cittadino irlandese William Gosset notò abilmente questo fatto quando pubblicò la sua scoperta nel numero di marzo 1908 di Biometrica. Per motivi di segretezza, Gosset ha firmato con Student. Ecco come è apparsa la distribuzione t di Student.

Tuttavia, la normale distribuzione dei dati, utilizzata da K. Gauss nell'analisi degli errori nelle osservazioni astronomiche, è estremamente rara nella vita terrestre ed è abbastanza difficile stabilirla (sono necessarie circa 2mila osservazioni per un'elevata precisione). Pertanto, è meglio abbandonare l'ipotesi di normalità e utilizzare metodi che non dipendono dalla distribuzione dei dati originali.

La domanda sorge spontanea: qual è la distribuzione della media aritmetica se calcolata dai dati di una distribuzione sconosciuta? La risposta è data dal ben noto nella teoria della probabilità Teorema del limite centrale(CPT). In matematica ne esistono diverse versioni (le formulazioni sono state affinate nel corso degli anni), ma tutte, grosso modo, si riducono all'affermazione che la somma un largo numero variabili casuali indipendenti obbedisce alla normale legge di distribuzione.

Quando si calcola la media aritmetica, viene utilizzata la somma delle variabili casuali. Da ciò risulta che la media aritmetica ha una distribuzione normale, in cui il valore atteso è il valore atteso dei dati iniziali e la varianza è .

Persone intelligenti sappiamo come provare il CLT, ma lo verificheremo con l'aiuto di un esperimento condotto in Excel. Simuliamo un campione di 50 variabili casuali uniformemente distribuite (usando Funzioni di Excel CASUALE TRA). Quindi faremo 1000 di questi campioni e calcoleremo la media aritmetica per ciascuno. Diamo un'occhiata alla loro distribuzione.

Si può vedere che la distribuzione della media è vicina alla legge normale. Se il volume dei campioni e il loro numero vengono aumentati ulteriormente, la somiglianza sarà ancora migliore.

Ora che abbiamo visto di persona la validità del CLT, possiamo, usando , calcolare gli intervalli di confidenza per la media aritmetica, che coprono la media vera o l'aspettativa matematica con una data probabilità.

Per stabilire i limiti superiore e inferiore, è necessario conoscere i parametri della distribuzione normale. Di norma, non lo sono, pertanto vengono utilizzate stime: significato aritmetico e varianza di campionamento. Ancora una volta, questo metodo fornisce una buona approssimazione solo per campioni di grandi dimensioni. Quando i campioni sono piccoli, si consiglia spesso di utilizzare la distribuzione di Student. Non credere! La distribuzione di Student per la media si verifica solo quando i dati originali hanno una distribuzione normale, cioè quasi mai. Pertanto, è meglio impostare immediatamente la barra minima per la quantità di dati richiesti e utilizzare metodi asintoticamente corretti. Dicono che 30 osservazioni siano sufficienti. Prendi 50 - non puoi sbagliare.

S 1.2 sono i limiti inferiore e superiore dell'intervallo di confidenza

– media aritmetica campionaria

s0– deviazione standard del campione (imparziale)

n - misura di prova

γ – livello di confidenza (solitamente pari a 0.9, 0.95 o 0.99)

c γ =Φ -1 ((1+γ)/2)è il reciproco della funzione di distribuzione normale standard. In termini semplici, questo è il numero di errori standard dalla media aritmetica al limite inferiore o superiore (le tre probabilità indicate corrispondono ai valori di 1,64, 1,96 e 2,58).

L'essenza della formula è che viene presa la media aritmetica e quindi viene accantonata una certa quantità ( con γ) errori standard ( s 0 /√n). Tutto è noto, prendilo e conta.

Prima dell'uso di massa dei PC, per ottenere i valori della funzione di distribuzione normale e della sua inversa, usavano . Sono ancora utilizzati, ma è più efficiente passare a formule Excel già pronte. Tutti gli elementi della formula sopra ( , e ) possono essere facilmente calcolati in Excel. Ma esiste anche una formula già pronta per calcolare l'intervallo di confidenza: NORMA DI FIDUCIA. La sua sintassi è la seguente.

CONFIDENCE NORM(alpha, standard_dev, size)

alfa– livello di significatività o livello di confidenza, che nella notazione precedente è pari a 1-γ, cioè la probabilità che il matematicol'aspettativa sarà al di fuori dell'intervallo di confidenza. Con un livello di confidenza di 0,95, l'alfa è 0,05 e così via.

standard_offè la deviazione standard dei dati del campione. Non è necessario calcolare l'errore standard, Excel dividerà per la radice di n.

la dimensione– dimensione del campione (n).

Il risultato della funzione CONFIDENZA.NORM è il secondo termine della formula per il calcolo dell'intervallo di confidenza, ad es. mezzo intervallo. Di conseguenza, i punti inferiore e superiore sono la media ± il valore ottenuto.

Pertanto, è possibile costruire un algoritmo universale per il calcolo degli intervalli di confidenza per la media aritmetica, che non dipende dalla distribuzione dei dati iniziali. Il prezzo dell'universalità è la sua natura asintotica, cioè la necessità di utilizzare campioni relativamente grandi. Tuttavia, nel sec moderne tecnologie raccogliere la giusta quantità di dati di solito non è difficile.

Verifica di ipotesi statistiche utilizzando un intervallo di confidenza

(modulo 111)

Uno dei principali problemi risolti in statistica è. In poche parole, la sua essenza è questa. Si ipotizza, ad esempio, che l'aspettativa popolazioneè uguale a un certo valore. Quindi viene costruita la distribuzione delle medie campionarie, che può essere osservata con una data aspettativa. Successivamente, esaminiamo dove si trova la media reale in questa distribuzione condizionale. Se va oltre i limiti consentiti, la comparsa di una tale media è molto improbabile e con una singola ripetizione dell'esperimento è quasi impossibile, il che contraddice l'ipotesi avanzata, che viene respinta con successo. Se la media non va oltre il livello critico, allora l'ipotesi non viene rifiutata (ma nemmeno dimostrata!).

Quindi, con l'aiuto degli intervalli di confidenza, nel nostro caso per l'aspettativa, puoi anche verificare alcune ipotesi. È molto facile da fare. Supponiamo che la media aritmetica per qualche campione sia 100. Si sta verificando l'ipotesi che l'aspettativa sia, diciamo, 90. Cioè, se poniamo la domanda in modo primitivo, suona così: può essere che, con il vero valore del media pari a 90, la media osservata era 100?

Per rispondere a questa domanda, saranno necessarie ulteriori informazioni sulla deviazione standard e sulla dimensione del campione. Diciamo deviazione standardè 30 e il numero di osservazioni è 64 (per estrarre facilmente la radice). Quindi l'errore standard della media è 30/8 o 3,75. Per calcolare l'intervallo di confidenza del 95%, sarà necessario rinviare di due a entrambi i lati della media errori standard(più precisamente, entro 1,96). L'intervallo di confidenza sarà di circa 100 ± 7,5, ovvero da 92,5 a 107,5.

Ulteriore ragionamento è il seguente. Se il valore testato rientra nell'intervallo di confidenza, allora non contraddice l'ipotesi, poiché rientra nei limiti delle fluttuazioni casuali (con una probabilità del 95%). Se il punto testato è al di fuori dell'intervallo di confidenza, allora la probabilità di tale evento è molto piccola, comunque al di sotto del livello accettabile. Pertanto, l'ipotesi viene respinta in quanto contraddice i dati osservati. Nel nostro caso, l'ipotesi di aspettativa è al di fuori dell'intervallo di confidenza (il valore testato di 90 non è incluso nell'intervallo di 100±7,5), quindi dovrebbe essere rifiutato. Rispondendo alla domanda primitiva di cui sopra, si dovrebbe dire: no, non può, in ogni caso, ciò accade estremamente raramente. Spesso, ciò indica una probabilità specifica di rifiuto errato dell'ipotesi (p-level), e non un determinato livello, in base al quale è stato costruito l'intervallo di confidenza, ma ne riparleremo un'altra volta.

Come puoi vedere, non è difficile costruire un intervallo di confidenza per la media (o aspettativa matematica). La cosa principale è catturare l'essenza, e poi le cose andranno. In pratica, la maggior parte utilizza l'intervallo di confidenza del 95%, che è largo circa due errori standard su entrambi i lati della media.

È tutto per ora. Ti auguro il meglio!

Uno dei metodi per risolvere problemi statistici è il calcolo dell'intervallo di confidenza. Viene utilizzato come alternativa preferita alla stima puntuale quando la dimensione del campione è piccola. Va notato che il processo di calcolo dell'intervallo di confidenza è piuttosto complicato. Ma gli strumenti del programma Excel ti consentono di semplificarlo in qualche modo. Scopriamo come si fa in pratica.

Questo metodo viene utilizzato nella stima dell'intervallo di varie grandezze statistiche. Il compito principale di questo calcolo è eliminare le incertezze della stima puntuale.

In Excel, ci sono due opzioni principali per eseguire i calcoli utilizzando questo metodo: quando la varianza è nota e quando è sconosciuta. Nel primo caso, la funzione viene utilizzata per i calcoli NORMA DI FIDUCIA, e nel secondo FIDUCIA. STUDENTE.

Metodo 1: funzione CONFIDENCE NORM

Operatore NORMA DI FIDUCIA, che si riferisce al gruppo statistico di funzioni, è apparso per la prima volta in Excel 2010. In more prime versioni questo programma usa il suo analogo FIDUCIA. Il compito di questo operatore è calcolare un intervallo di confidenza con una distribuzione normale per la media della popolazione.

La sua sintassi è la seguente:

CONFIDENCE NORM(alpha, standard_dev, size)

"Alfa"è un argomento che indica il livello di significatività utilizzato per calcolare il livello di confidenza. Il livello di confidenza è uguale alla seguente espressione:

(1-"Alfa")*100

"Deviazione standard"è un argomento, la cui essenza è chiara dal nome. Questa è la deviazione standard del campione proposto.

"La dimensione"è un argomento che determina la dimensione del campione.

Tutti gli argomenti di questo operatore sono obbligatori.

Funzione FIDUCIA ha esattamente gli stessi argomenti e possibilità del precedente. La sua sintassi è:

TRUST(alfa, dev_standard, dimensione)

Come puoi vedere, le differenze sono solo nel nome dell'operatore. Questa funzionalità è stata mantenuta in Excel 2010 e versioni più recenti in una categoria speciale per motivi di compatibilità. "Compatibilità". Nelle versioni di Excel 2007 e precedenti è presente nel gruppo principale di operatori statistici.

Il limite dell'intervallo di confidenza è determinato utilizzando la formula della seguente forma:

X+(-)NORMA DI CONFIDENZA

Dove Xè la media campionaria, che si trova al centro dell'intervallo selezionato.

Ora diamo un'occhiata a come calcolare l'intervallo di confidenza per esempio specifico. Sono stati eseguiti 12 test, che hanno dato risultati diversi, elencati nella tabella. Questa è la nostra totalità. La deviazione standard è 8. Dobbiamo calcolare l'intervallo di confidenza al livello di confidenza del 97%.

  1. Selezionare la cella in cui verrà visualizzato il risultato dell'elaborazione dei dati. Cliccando sul pulsante "Inserisci funzione".
  2. Appare Funzione guidata. Vai alla categoria "Statistico" ed evidenziare il nome "FIDUCIA.NORMA". Successivamente fare clic sul pulsante OK.
  3. Si apre la finestra degli argomenti. I suoi campi corrispondono naturalmente ai nomi degli argomenti.
    Posiziona il cursore sul primo campo - "Alfa". Qui dovremmo specificare il livello di significatività. Come ricordiamo, il nostro livello di fiducia è del 97%. Allo stesso tempo, abbiamo detto che è calcolato in questo modo:

    (livello di attendibilità 1)/100

    Cioè, sostituendo il valore, otteniamo:

    Con semplici calcoli, scopriamo che l'argomento "Alfa"è uguale a 0,03 . accedere dato valore in campo.

    Come sai, la deviazione standard è uguale a 8 . Pertanto, sul campo "Deviazione standard" basta scrivere quel numero.

    In campo "La dimensione"è necessario inserire il numero di elementi dei test eseguiti. Come ricordiamo, loro 12 . Ma per automatizzare la formula e non modificarla ogni volta che viene eseguito un nuovo test, impostiamo questo valore non su un numero ordinario, ma utilizzando l'operatore DAI UN'OCCHIATA. Quindi, impostiamo il cursore nel campo "La dimensione", quindi fare clic sul triangolo, che si trova a sinistra della barra della formula.

    Viene visualizzato un elenco delle funzioni utilizzate di recente. Se l'operatore DAI UN'OCCHIATA usato da te di recente, dovrebbe essere in questo elenco. In questo caso, devi solo fare clic sul suo nome. Altrimenti, se non lo trovi, vai al punto "Altre funzioni...".

  4. Ci appare già familiare Funzione guidata. Tornando al gruppo "Statistico". Selezioniamo il nome lì "DAI UN'OCCHIATA". Fare clic sul pulsante OK.
  5. Viene visualizzata la finestra degli argomenti per l'operatore precedente. Questa funzione è progettata per calcolare il numero di celle nell'intervallo specificato che contengono valori numerici. La sua sintassi è la seguente:

    COUNT(valore1, valore2,…)

    Gruppo di argomenti "I valori"è un riferimento all'intervallo in cui si desidera calcolare il numero di celle riempite con dati numerici. In totale, possono esserci fino a 255 argomenti di questo tipo, ma nel nostro caso ne abbiamo bisogno solo uno.

    Posiziona il cursore nel campo "Valore1" e, tenendo premuto il tasto sinistro del mouse, seleziona l'intervallo sul foglio che contiene la nostra popolazione. Quindi il suo indirizzo verrà visualizzato nel campo. Fare clic sul pulsante OK.

  6. Successivamente, l'applicazione eseguirà il calcolo e visualizzerà il risultato nella cella in cui si trova. Nel nostro caso particolare, la formula si è rivelata così:

    CONFIDENZA NORMA(0.03;8;COUNT(B2:B13))

    Il risultato complessivo dei calcoli è stato 5,011609 .

  7. Ma non è tutto. Come ricordiamo, il limite dell'intervallo di confidenza viene calcolato aggiungendo e sottraendo dal valore medio del campione il risultato del calcolo NORMA DI FIDUCIA. In questo modo vengono calcolati rispettivamente i limiti destro e sinistro dell'intervallo di confidenza. La media campionaria stessa può essere calcolata utilizzando l'operatore MEDIA.

    Questo operatore è progettato per calcolare la media aritmetica dell'intervallo di numeri selezionato. Ha la seguente sintassi piuttosto semplice:

    MEDIA(numero1, numero2,…)

    Discussione "Numero" può essere un singolo valore numerico o un riferimento a celle o anche a interi intervalli che le contengono.

    Quindi, seleziona la cella in cui verrà visualizzato il calcolo del valore medio e fai clic sul pulsante "Inserisci funzione".

  8. si apre Funzione guidata. Torna alla categoria "Statistico" e selezionare un nome dall'elenco "MEDIA". Come sempre, fai clic sul pulsante OK.
  9. Viene avviata la finestra degli argomenti. Posiziona il cursore nel campo "Numero 1" e con il tasto sinistro del mouse premuto selezionare l'intero intervallo di valori. Dopo che le coordinate sono state visualizzate nel campo, fare clic sul pulsante OK.
  10. Successivamente MEDIA invia il risultato del calcolo a un elemento del foglio.
  11. Calcoliamo il limite destro dell'intervallo di confidenza. Per fare ciò, seleziona una cella separata, metti il ​​\u200b\u200bsegno «=» e aggiungi il contenuto degli elementi del foglio in cui si trovano i risultati del calcolo delle funzioni MEDIA e NORMA DI FIDUCIA. Per eseguire il calcolo, premere il pulsante accedere. Nel nostro caso abbiamo ottenuto la seguente formula:

    Risultato del calcolo: 6,953276

  12. Allo stesso modo, calcoliamo il limite sinistro dell'intervallo di confidenza, solo questa volta dal risultato del calcolo MEDIA sottrarre il risultato del calcolo dell'operatore NORMA DI FIDUCIA. Risulta la formula per il nostro esempio del seguente tipo:

    Risultato del calcolo: -3,06994

  13. Abbiamo cercato di descrivere in dettaglio tutti i passaggi per il calcolo dell'intervallo di confidenza, quindi abbiamo descritto in dettaglio ogni formula. Ma puoi combinare tutte le azioni in un'unica formula. Il calcolo del limite destro dell'intervallo di confidenza può essere scritto come segue:

    MEDIA(B2:B13)+FIDUCIA(0.03;8;COUNT(B2:B13))

  14. Un calcolo simile del bordo sinistro sarebbe simile a questo:

    MEDIA(B2:B13)-CONFIDENZA.NORM(0.03;8;COUNT(B2:B13))

Metodo 2: funzione TRUST.STUDENT

Inoltre, esiste un'altra funzione in Excel correlata al calcolo dell'intervallo di confidenza: FIDUCIA. STUDENTE. È apparso solo da Excel 2010. Questo operatore esegue il calcolo dell'intervallo di confidenza della popolazione utilizzando la distribuzione t di Student. È molto conveniente usarlo nel caso in cui la varianza e, di conseguenza, la deviazione standard siano sconosciute. La sintassi dell'operatore è:

TRUST.STUDENT(alfa,dev_standard,dimensione)

Come puoi vedere, i nomi degli operatori in questo caso sono rimasti invariati.

Vediamo come calcolare i limiti dell'intervallo di confidenza con una deviazione standard sconosciuta utilizzando l'esempio della stessa popolazione che abbiamo considerato nel metodo precedente. Il livello di fiducia, come l'ultima volta, prenderemo il 97%.

  1. Selezionare la cella in cui verrà effettuato il calcolo. Fare clic sul pulsante "Inserisci funzione".
  2. In aperto Funzione guidata vai alla categoria "Statistico". Scegli un nome "STUDENTE FIDUCIA". Fare clic sul pulsante OK.
  3. Viene avviata la finestra degli argomenti per l'operatore specificato.

    In campo "Alfa", dato che il livello di confidenza è del 97%, annotiamo il numero 0,03 . Seconda volta sui principi di calcolo dato parametro non ci fermeremo.

    Successivamente, posiziona il cursore nel campo "Deviazione standard". Questa volta, questo indicatore ci è sconosciuto e deve essere calcolato. Questo viene fatto usando una funzione speciale - DEV.ST.B. Per richiamare la finestra di questo operatore, fare clic sul triangolo a sinistra della barra della formula. Se non troviamo il nome desiderato nell'elenco che si apre, vai all'elemento "Altre funzioni...".

  4. sta correndo Funzione guidata. Passaggio alla categoria "Statistico" e segna il nome "STDEV.B". Quindi fare clic sul pulsante OK.
  5. Si apre la finestra degli argomenti. compito dell'operatore DEV.ST.Bè la definizione di deviazione standard nel campionamento. La sua sintassi è simile a questa:

    DEV.ST.V(numero1,numero2,…)

    È facile intuire che l'argomento "Numero"è l'indirizzo dell'elemento di selezione. Se la selezione è posizionata in un singolo array, utilizzando un solo argomento, puoi fornire un collegamento a questo intervallo.

    Posiziona il cursore nel campo "Numero 1" e, come sempre, tenendo premuto il tasto sinistro del mouse, seleziona il set. Dopo che le coordinate sono sul campo, non affrettarti a premere il pulsante OK perché il risultato non sarà corretto. Per prima cosa dobbiamo tornare alla finestra degli argomenti dell'operatore FIDUCIA. STUDENTE per fare l'argomentazione finale. Per fare ciò, fare clic sul nome appropriato nella barra della formula.

  6. La finestra degli argomenti della funzione già familiare si apre di nuovo. Posiziona il cursore nel campo "La dimensione". Ancora una volta, fai clic sul triangolo a noi già familiare per andare alla scelta degli operatori. Come capisci, abbiamo bisogno di un nome "DAI UN'OCCHIATA". Dal momento che abbiamo usato questa funzione nei calcoli nel metodo precedente, è presente in questo elenco, quindi basta fare clic su di esso. Se non lo trovi, segui l'algoritmo descritto nel primo metodo.
  7. Entrare nella finestra degli argomenti DAI UN'OCCHIATA, posizionare il cursore nel campo "Numero 1" e con il pulsante del mouse tenuto premuto, seleziona la raccolta. Quindi fare clic sul pulsante OK.
  8. Successivamente, il programma calcola e visualizza il valore dell'intervallo di confidenza.
  9. Per determinare i limiti, dovremo nuovamente calcolare la media campionaria. Ma, dato che l'algoritmo di calcolo utilizza la formula MEDIA lo stesso del metodo precedente, e anche il risultato non è cambiato, non ci soffermeremo su questo in dettaglio una seconda volta.
  10. Sommando i risultati del calcolo MEDIA e FIDUCIA. STUDENTE, otteniamo il limite destro dell'intervallo di confidenza.
  11. Sottrazione dai risultati del calcolo dell'operatore MEDIA risultato del calcolo FIDUCIA. STUDENTE, abbiamo il limite sinistro dell'intervallo di confidenza.
  12. Se il calcolo è scritto in una formula, il calcolo del bordo destro nel nostro caso sarà simile al seguente:

    MEDIA(B2:B13)+FIDUCIA DELLO STUDENTE(0.03,STDV(B2:B13),COUNT(B2:B13))

  13. Di conseguenza, la formula per calcolare il bordo sinistro sarà simile a questa:

    MEDIA(B2:B13)-FIDUCIA DELLO STUDENTE(0.03,STDV(B2:B13),COUNT(B2:B13))

Come puoi vedere, gli strumenti del programma Excel consentono di facilitare notevolmente il calcolo dell'intervallo di confidenza e dei suoi limiti. A tal fine, vengono utilizzati operatori separati per campioni la cui varianza è nota e sconosciuta.

L'intervallo di confidenza ci è venuto dal campo della statistica. Questo è un intervallo definito che serve per stimare un parametro sconosciuto con un alto grado affidabilità. Il modo più semplice per spiegarlo è con un esempio.

Supponiamo di dover esaminare una variabile casuale, ad esempio la velocità della risposta del server a una richiesta del client. Ogni volta che l'utente digita l'indirizzo di un particolare sito, il server risponde con velocità diversa. Pertanto, il tempo di risposta esaminato ha un carattere casuale. Quindi, l'intervallo di confidenza consente di determinare i limiti di questo parametro, quindi sarà possibile affermare che con una probabilità del 95% il server si troverà nell'intervallo da noi calcolato.

Oppure devi scoprire quante persone ne sono a conoscenza marchio aziende. Quando viene calcolato l'intervallo di confidenza, sarà possibile, ad esempio, affermare che con una probabilità del 95% la quota di consumatori che ne è a conoscenza è compresa tra il 27% e il 34%.

Strettamente correlato a questo termine è un valore come il livello di confidenza. Rappresenta la probabilità che il parametro desiderato sia compreso nell'intervallo di confidenza. Questo valore determina quanto sarà grande il nostro intervallo desiderato. Come maggior valore accetta, più stretto diventa l'intervallo di confidenza e viceversa. Di solito è impostato su 90%, 95% o 99%. Il valore del 95% è il più popolare.

Questo indicatore risente anche della varianza delle osservazioni e la sua definizione si basa sull'assunto che la caratteristica studiata obbedisca, questa affermazione è nota anche come Legge di Gauss. Secondo lui, una tale distribuzione di tutte le probabilità di una variabile casuale continua, che può essere descritta da una densità di probabilità, è chiamata normale. Se l'ipotesi di una distribuzione normale si rivela errata, la stima potrebbe rivelarsi errata.

Per prima cosa, cerchiamo di capire come calcolare l'intervallo di confidenza per Qui, sono possibili due casi. La dispersione (il grado di diffusione di una variabile casuale) può essere nota o meno. Se è noto, il nostro intervallo di confidenza viene calcolato utilizzando la seguente formula:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - segno,

t è un parametro della tavola di distribuzione di Laplace,

σ è la radice quadrata della dispersione.

Se la varianza è sconosciuta, può essere calcolata se conosciamo tutti i valori della funzione desiderata. Per questo, viene utilizzata la seguente formula:

σ2 = х2ср - (хр)2, dove

х2ср - il valore medio dei quadrati del tratto in esame,

(xsr)2 è il quadrato di questo attributo.

La formula con cui viene calcolato l'intervallo di confidenza in questo caso cambia leggermente:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - media campionaria,

α - segno,

t è un parametro che viene trovato utilizzando la tabella di distribuzione di Student t \u003d t (ɣ; n-1),

sqrt(n) è la radice quadrata della dimensione totale del campione,

s è la radice quadrata della varianza.

Considera questo esempio. Si supponga che, sulla base dei risultati di 7 misurazioni, il tratto in studio sia stato determinato pari a 30 e la varianza campionaria pari a 36. È necessario trovare, con una probabilità del 99%, un intervallo di confidenza che contenga il vero valore di il parametro misurato.

Innanzitutto, determiniamo quanto t è uguale a: t \u003d t (0,99; 7-1) \u003d 3,71. Usando la formula precedente, otteniamo:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (quadrato(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

L'intervallo di confidenza per la varianza viene calcolato sia nel caso di una media nota sia quando non ci sono dati sull'aspettativa matematica, ed è noto solo il valore della stima puntuale imparziale della varianza. Non daremo qui le formule per il suo calcolo, poiché sono piuttosto complesse e, volendo, si possono sempre trovare in rete.

Notiamo solo che è conveniente determinare l'intervallo di confidenza utilizzando il programma Excel o un servizio di rete, che si chiama così.