Kvantitatív elemzési módszerek: Konfidenciaintervallumok becslése.  Megbízhatósági intervallum.  Az orvosi statisztika ABC-je.  fejezet III

Kvantitatív elemzési módszerek: Konfidenciaintervallumok becslése. Megbízhatósági intervallum. Az orvosi statisztika ABC-je. fejezet III

Ebből a cikkből megtudhatja:

Napjainkban a termékek széles választékával, értékesítési irányokkal, alkalmazottakkal, tevékenységekkel stb. kapcsolatos információbőség miatt, nehéz kiválasztani a főt, amelyre mindenekelőtt érdemes odafigyelni és erőfeszítéseket tenni annak kezelésére. Meghatározás megbízhatósági intervallumés a tényleges értékek határain túllépés elemzése – egy olyan technika, amely segít azonosítani a helyzeteket, trendek befolyásolása. Képes leszel fejlődni pozitív tényezőkés csökkenti a negatív hatást. Ez a technológia számos jól ismert világcégnél használják.

Vannak ún riasztások", melyik tájékoztassa a vezetőket kimondja, hogy a következő érték egy bizonyos irányba túllépett megbízhatósági intervallum. Mit is jelent ez? Ez azt jelzi, hogy valami nem szabványos esemény történt, ami megváltoztathatja a jelenlegi trendet ebben az irányban. Ez a jel ahhoz rendezni a helyzetben, és megértse, mi befolyásolta azt.

Vegyünk például több helyzetet. Az értékesítési előrejelzést 100 árucikk előrejelzési határaival számoltuk ki 2011-re hónapok bontásban és a márciusi tényleges eladások:

  1. szerző: " napraforgóolaj» áttörte az előrejelzés felső határát, és nem esett a konfidenciaintervallumba.
  2. A "száraz élesztő" túllépte az előrejelzés alsó határát.
  3. A "zabkása" áttörte a felső határt.

A többi áru esetében a tényleges értékesítés a megadott előrejelzési határokon belül volt. Azok. eladásaik a várakozásoknak megfelelően alakultak. Így azonosítottunk 3 olyan terméket, amely túlmutat a határokon, és elkezdtük kitalálni, hogy mi befolyásolta a határon túli utat:

  1. A "napraforgóolaj"-val újat léptünk be kereskedelmi hálózat, ami további értékesítési volument eredményezett, ami a felső határ kibocsátásához vezetett. Ennél a terméknél érdemes az év végéig újraszámolni az előrejelzést, figyelembe véve az ehhez a lánchoz történő értékesítés előrejelzését.
  2. A Dry Yeast esetében az autó elakadt a vámon, és 5 napon belül hiány alakult ki, ami befolyásolta az eladások visszaesését és az alsó határon túllépést. Érdemes lehet kitalálni, hogy mi okozta az okot, és megpróbálni nem ismétlődni.
  3. A Zabpehely esetében értékesítési promóció indult, ami az eladások jelentős növekedését és az előrejelzés túllépését eredményezte.

Három olyan tényezőt azonosítottunk, amelyek befolyásolták az előrejelzés túllépését. Sokkal több is lehet az életben Az előrejelzés és a tervezés pontosságának javítása érdekében azokat a tényezőket, amelyek ahhoz vezetnek, hogy a tényleges eladások túlmutathatnak az előrejelzésen, érdemes külön kiemelni és külön-külön előrejelzéseket, terveket építeni. Ezután vegye figyelembe a fő értékesítési előrejelzésre gyakorolt ​​hatásukat. Rendszeresen értékelheti ezen tényezők hatását, és javíthatja a helyzetet a negatív hatások csökkentésével és a pozitív tényezők hatásának növelésével.

Egy konfidenciaintervallum segítségével a következőket tehetjük:

  1. Jelölje ki az úti célokat, amelyekre érdemes odafigyelni, mert események történtek ezeken a területeken, amelyek hatással lehetnek trend változása.
  2. Határozza meg a tényezőket amelyek valójában különbséget tesznek.
  3. Elfogadni súlyozott döntés(például beszerzésről, tervezéskor stb.).

Most nézzük meg, mi az a konfidenciaintervallum, és hogyan lehet kiszámítani az Excelben egy példa segítségével.

Mi az a konfidenciaintervallum?

A konfidenciaintervallum az előrejelzési határ (felső és alsó), amelyen belül adott valószínűséggel (szigma) megkapja a tényleges értékeket.

Azok. kiszámítjuk az előrejelzést - ez a fő viszonyítási alapunk, de megértjük, hogy a tényleges értékek nem valószínű, hogy 100%-ban megegyeznek az előrejelzésünkkel. És felmerül a kérdés hogy milyen mértékben tényleges értékeket kaphat, ha a jelenlegi tendencia folytatódik? És ez a kérdés segít megválaszolni konfidencia intervallum számítás, azaz - az előrejelzés felső és alsó határa.

Mi az adott valószínűségi szigma?

Számításkor konfidencia intervallumot tudunk beállított valószínűség találatokat tényleges értékeket a megadott előrejelzési határokon belül. Hogyan kell csinálni? Ehhez beállítjuk a szigma értékét, és ha a szigma egyenlő:

    3 szigma- akkor annak valószínűsége, hogy eltalálja a következő tényleges értéket a konfidencia-intervallumban, 99,7%, vagy 300:1, vagy 0,3% a valószínűsége annak, hogy túllépi a határokat.

    2 szigma- akkor a határokon belüli következő érték eltalálásának valószínűsége ≈ 95,5%, azaz. az odds körülbelül 20:1, vagy 4,5% esély van arra, hogy kikerüljön a pályáról.

    1 szigma- akkor a valószínűség ≈ 68,3%, azaz. az esély körülbelül 2 az 1-hez, vagy 31,7% az esély arra, hogy a következő érték a konfidenciaintervallumon kívülre esik.

megfogalmaztuk 3 szigma szabály,ami azt mondja találati valószínűség másik véletlenszerű érték a konfidencia intervallumba adott értékkel a három szigma 99,7%.

A nagy orosz matematikus Csebisev bebizonyította azt a tételt, hogy 10% esély van arra, hogy egy adott három szigma értékű előrejelzés túllépjen. Azok. a 3 szigma konfidenciaintervallumba való esés valószínűsége legalább 90%, míg az előrejelzés és határainak „szemből” való kiszámítása sokkal jelentősebb hibákkal jár.

Hogyan lehet önállóan kiszámítani a konfidencia intervallumot az Excelben?

Tekintsük a konfidenciaintervallum Excelben való kiszámítását (azaz az előrejelzés felső és alsó határát) egy példa segítségével. Van egy idősorunk - eladások hónapok szerint 5 évre. Lásd a csatolt fájlt.

Az előrejelzés határainak kiszámításához a következőket számoljuk:

  1. Eladási előrejelzés().
  2. Sigma - szórás előrejelzési modellek a tényleges értékekből.
  3. Három szigma.
  4. Megbízhatósági intervallum.

1. Értékesítési előrejelzés.

=(RC[-14] (adatok idősorokban)-RC[-1] (modell értéke))^2 (négyzet)


3. Havonta összegezze a 8. szakasztól való eltérési értékeket Sum((Xi-Ximod)^2), azaz Foglaljuk össze minden év januárját, februárját...

Ehhez használja a =SUMIF() képletet

SUMIF(tömb a cikluson belüli periódusok számával (hónapokra 1-től 12-ig); hivatkozás a ciklus periódusának számára; hivatkozás egy tömbre a kiindulási adatok és a ciklus értékei közötti különbség négyzeteivel időszakok)


4. Számítsa ki a szórást a ciklus minden egyes periódusára 1-től 12-ig (10. szakasz a csatolt fájlban).

Ehhez a 9. lépésben kiszámított értékből kivonjuk a gyökért, és elosztjuk a ciklus periódusainak számával mínusz 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

Használjunk képleteket az Excelben =ROOT(R8 (hivatkozás: (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (hivatkozás egy tömbre ciklusszámokkal); O8 (hivatkozás egy adott ciklusszámra, amelyet a tömbben figyelembe veszünk))-1))

Az Excel képlet használatával = COUNTIF megszámoljuk az n számot


Az előrejelzési modelltől való tényleges adatok szórásának kiszámításával minden hónapra megkaptuk a szigma értéket - 10. szakasz a csatolt fájlban.

3. Számíts ki 3 szigmát!

A 11. szakaszban beállítjuk a szigmák számát - példánkban "3" (11. a csatolt fájlban):

Szintén praktikus szigma értékek:

1,64 szigma – 10% esély a határérték túllépésére (1 esély a 10-hez);

1,96 szigma – 5% esély a határon kívülre (1 esély a 20-ból);

2,6 szigma – 1% esély a határon kívülre (1 a 100-hoz).

5) Kiszámolunk három szigmát, ehhez megszorozzuk a „szigma” értékeket minden hónapban „3-mal”.

3. Határozza meg a konfidencia intervallumot!

  1. Előrejelzés felső határa- értékesítési előrejelzés a növekedés és a szezonalitás figyelembevételével + (plusz) 3 szigma;
  2. Alsó előrejelzési határ- értékesítési előrejelzés a növekedés és a szezonalitás figyelembevételével - (mínusz) 3 szigma;

A megbízhatósági intervallum hosszú időszakra történő kiszámításának megkönnyítése érdekében (lásd a csatolt fájlt) az Excel képletet használjuk =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), ahol

Y8- eladási előrejelzés;

W8- annak a hónapnak a száma, amelyre 3 szigmát veszünk;

Azok. Előrejelzés felső határa= "értékesítési előrejelzés" + "3 szigma" (a példában VLOOKUP(hónapszám; táblázat 3 szigma értékkel; oszlop, amelyből kivonjuk a megfelelő sorban lévő hónap számával megegyező szigmaértéket; 0)).

Alsó előrejelzési határ= "értékesítési előrejelzés" mínusz "3 szigma".

Tehát Excelben kiszámítottuk a konfidencia intervallumot.

Most van egy előrejelzésünk és egy olyan tartományunk, amelyen belül a tényleges értékek adott valószínűségi szigmával esnek.

Ebben a cikkben megvizsgáltuk, mi a szigma és a három szigma szabály, hogyan határozható meg a konfidenciaintervallum, és mire használhatja ezt a technikát a gyakorlatban.

Pontos előrejelzések és sok sikert neked!

Hogyan A Forecast4AC PRO segítheta konfidenciaintervallum kiszámításakor?:

    A Forecast4AC PRO egyszerre több mint 1000 idősorra automatikusan kiszámítja a felső vagy alsó előrejelzési határokat;

    Az a képesség, hogy egy gombnyomással elemezze az előrejelzés határait a diagramon szereplő előrejelzéssel, trenddel és tényleges eladásokkal összehasonlítva;

A Forcast4AC PRO programban lehetőség van a szigma értékének 1 és 3 közötti beállítására.

Csatlakozz hozzánk!

Letöltés ingyenes alkalmazások előrejelzéshez és üzleti elemzéshez:


  • Novo Forecast Lite- automatikus előrejelzési számítás ban ben excel.
  • 4analytics- ABC-XYZ elemzésés a kibocsátások elemzése Excel.
  • Qlik Sense Asztali és a Qlik ViewPersonal Edition – BI-rendszerek az adatok elemzéséhez és megjelenítéséhez.

Tesztelje a fizetős megoldások funkcióit:

  • Novo Forecast PRO- előrejelzés Excelben nagy adattömbök esetén.

Az előző alfejezetekben megvizsgáltuk az ismeretlen paraméter becslésének kérdését a egy szám. Az ilyen értékelést "pontnak" nevezik. Számos feladatnál nem csak a paramétert kell megkeresni a megfelelő számértéket, hanem értékelje annak pontosságát és megbízhatóságát is. Szükséges tudni, hogy a paramétercsere milyen hibákhoz vezethet a pontbecslését aés milyen fokú biztonsággal számíthatunk arra, hogy ezek a hibák nem lépik túl az ismert határokat?

Az ilyen jellegű problémák különösen fontosak kis számú megfigyelésnél, amikor a pontbecslést és be nagyrészt véletlenszerű, és az a hozzávetőleges helyettesítése a-val súlyos hibákhoz vezethet.

Képet adni a becslés pontosságáról és megbízhatóságáról a,

ban ben matematikai statisztika használja az úgynevezett konfidenciaintervallumokat és konfidenciavalószínűségeket.

Legyen a paraméter a tapasztalatból származik elfogulatlan becslés a. Ebben az esetben szeretnénk megbecsülni a lehetséges hibát. Adjunk hozzá elég nagy p valószínűséget (például p = 0,9, 0,95 vagy 0,99) ahhoz, hogy egy p valószínűségű esemény gyakorlatilag biztosnak tekinthető, és keressünk egy s értéket, amelyre

Ezután a csere során fellépő hiba gyakorlatilag lehetséges értékeinek tartománya a a a, ± s lesz; nagy abszolút hibák csak kis valószínűséggel jelennek meg a = 1 - p. Írjuk át (14.3.1) így:

Az egyenlőség (14.3.2) azt jelenti, hogy p valószínűséggel a paraméter ismeretlen értéke a intervallumba esik

Ebben az esetben meg kell jegyezni egy körülményt. Korábban többször is figyelembe vettük az ütés valószínűségét valószínűségi változó egy adott nem véletlenszerű intervallumon belül. Itt más a helyzet: a nem véletlenszerű, hanem véletlenszerű intervallum / r. Véletlenszerűen a helyzete az x tengelyen, a középpontja határozza meg a; általában a 2s intervallum hossza is véletlenszerű, mivel az s értékét általában kísérleti adatokból számítjuk. Ezért be ez az eset jobb lenne a p értékét nem a pont "eltalálásának" valószínűségeként értelmezni a a / p intervallumba, hanem annak valószínűségeként, hogy egy / p véletlenszerű intervallum lefedi a pontot a(14.3.1. ábra).

Rizs. 14.3.1

A p valószínűséget nevezzük bizalmi szint, és a / p - intervallum megbízhatósági intervallum. Intervallumhatárok ha. a x \u003d a- s és a 2 = a +és hívják bizalom határai.

Adjunk még egy értelmezést a konfidenciaintervallum fogalmának: tekinthető paraméterértékek intervallumának a, kompatibilis a kísérleti adatokkal, és nem mond ellent azoknak. Valóban, ha egyetértünk abban, hogy egy a = 1-p valószínűségű eseményt gyakorlatilag lehetetlennek tekintünk, akkor az a paraméter azon értékei, amelyekre a - a> s ellentmondónak kell lenni a kísérleti adatoknak, és azokat, amelyeknél |a - a a t na 2 .

Legyen a paraméter a van egy elfogulatlan becslés a. Ha ismernénk a mennyiség eloszlásának törvényét a, a konfidenciaintervallum megtalálásának problémája meglehetősen egyszerű lenne: elég lenne megtalálni egy s értéket, amelyre

A nehézség abban rejlik, hogy a becslés eloszlási törvénye a a mennyiség eloszlásának törvényétől függ xés következésképpen annak ismeretlen paraméterein (különösen magán a paraméteren a)

Ennek a nehézségnek a megkerülésére alkalmazhatjuk a következő durván közelítő trükköt: cseréljük ki az s kifejezésben szereplő ismeretlen paramétereket a pontbecsléseikre. Viszonylag sok kísérlettel P(kb. 20 ... 30) ez a technika általában kielégítő eredményeket ad a pontosság tekintetében.

Példaként tekintsük a megbízhatósági intervallum problémáját matematikai elvárás.

Legyen előállított P x, amelynek jellemzői a matematikai elvárás tés variancia D- ismeretlen. Ezekre a paraméterekre a következő becsléseket kaptuk:

A matematikai elvárásokhoz meg kell építeni egy / р konfidenciaintervallumot, amely megfelel a р konfidenciavalószínűségnek t mennyiségeket x.

A probléma megoldásában azt a tényt használjuk fel, hogy a mennyiség t az összeg P független, azonos eloszlású valószínűségi változók X hés a centrális határértéktétel szerint kellően nagy P eloszlási törvénye közel áll a normálishoz. A gyakorlatban még viszonylag kis számú (10 ... 20 nagyságrendű) tag mellett is megközelítőleg normálisnak tekinthető az összeg eloszlási törvénye. Feltételezzük, hogy az érték t a normál törvény szerint osztják el. Ennek a törvénynek a jellemzői - a matematikai elvárás és a variancia - egyenlőek, ill tés

(lásd a 13. fejezet 13.3. alpontját). Tegyük fel, hogy az érték D ismert számunkra, és találunk olyan Ep értéket, amelyre

A 6. fejezet (6.3.5) képletével a (14.3.5) bal oldalán lévő valószínűséget a normális eloszlás függvényében fejezzük ki.

ahol a becslés szórása t.

Az egyenletből

keresse meg az Sp értéket:

ahol arg Ф* (x) a Ф* inverz függvénye (X), azok. az argumentum olyan értéke, amelyre a normális eloszlásfüggvény egyenlő X.

Diszperzió D, amelyen keresztül az érték kifejeződik a 1P, nem tudjuk pontosan; hozzávetőleges értékeként használhatja a becslést D(14.3.4), és körülbelül:

Így a konfidenciaintervallum felépítésének problémája megközelítőleg megoldott, ami egyenlő:

ahol a gp-t a (14.3.7) képlet határozza meg.

Annak érdekében, hogy elkerüljük a fordított interpolációt az Ф * (l) függvény táblázataiban az s p kiszámításakor, célszerű egy speciális táblázatot összeállítani (14.3.1. táblázat), amely felsorolja a mennyiség értékeit.

attól függően, hogy r. Az érték (p határozza meg a normál törvényhez az átlagok számát szórások, amelyet a diszperziós középponttól jobbra és balra kell félretenni, hogy a kapott terület eltalálásának valószínűsége egyenlő legyen p-vel.

7 p értékén keresztül a konfidencia intervallum a következőképpen fejeződik ki:

14.3.1. táblázat

1. példa Az értékkel 20 kísérletet végeztünk x; az eredmények a táblázatban láthatók. 14.3.2.

14.3.2. táblázat

Meg kell találni a becslést a mennyiség matematikai elvárására xés állítsunk össze egy p = 0,8 konfidenciaszintnek megfelelő konfidenciaintervallumot.

Megoldás. Nekünk van:

Az n origót választva: = 10, a harmadik képlet (14.2.14) szerint megkapjuk a torzítatlan becslést D :

táblázat szerint 14.3.1 találjuk

Bizalmi határok:

Megbízhatósági intervallum:

Paraméterértékek t, Az ebben az intervallumban lévő adatok kompatibilisek a táblázatban megadott kísérleti adatokkal. 14.3.2.

Hasonló módon a variancia konfidenciaintervallumát is meg lehet alkotni.

Legyen előállított P független kísérletek egy valószínűségi változón x ismeretlen paraméterekkel -ból és A-ból, valamint a szóráshoz D az elfogulatlan becslést kapjuk:

A variancia konfidenciaintervallumának közelítő felépítése szükséges.

A (14.3.11) képletből látható, hogy az érték D képviseli

összeg P alak valószínűségi változói . Ezek az értékek nem

független, hiszen bármelyik tartalmazza a mennyiséget t, mindenki mástól függ. Kimutatható azonban, hogy mint Pösszegük eloszlási törvénye is közel áll a normálishoz. Majdnem at P= 20...30 már normálisnak tekinthető.

Tegyük fel, hogy ez így van, és keressük meg ennek a törvénynek a jellemzőit: a matematikai elvárást és szórást. A pontszám óta D- akkor elfogulatlan M[D] = D.

Variancia számítás D D viszonylag bonyolult számításokhoz kapcsolódik, ezért a kifejezését levezetés nélkül adjuk meg:

ahol c 4 - a mennyiség negyedik központi momentuma x.

Ennek a kifejezésnek a használatához helyettesítenie kell benne a 4 és a D(legalábbis hozzávetőlegesen). Ahelyett D használhatja az értékelést D. Elvileg a negyedik központi momentum helyettesíthető a becsült értékével is, például a következő alakzat értékével:

de egy ilyen csere rendkívül alacsony pontosságot ad, mivel általában korlátozott számú kísérlet mellett a nagyfokú nyomatékokat nagy hibákkal határozzák meg. A gyakorlatban azonban gyakran előfordul, hogy a mennyiség eloszlási törvényének formája x előre ismert: csak a paraméterei ismeretlenek. Ezután megpróbálhatjuk az u4-et kifejezésekkel kifejezni D.

Vegyük a leggyakoribb esetet, amikor az érték x a normál törvény szerint osztják el. Ekkor a negyedik központi momentum a szórással fejeződik ki (lásd a 6. fejezet 6.2. alfejezetét);

és a (14.3.12) képlet megadja vagy

A (14.3.14)-ben az ismeretlen helyettesítése Dértékelését D, kapjuk: honnan

Az u 4 pillanata kifejezéssel fejezhető ki D más esetekben is, amikor a mennyiség elosztását x nem normális, de a megjelenése ismert. Például az egyenletes sűrűség törvényéhez (lásd az 5. fejezetet) a következőket kapjuk:

ahol (a, P) az az intervallum, amelyen a törvény adott.

Következésképpen,

A (14.3.12) képlet szerint a következőket kapjuk: ahonnan kb

Azokban az esetekben, amikor a 26 érték eloszlási törvényének alakja ismeretlen, az a /) értékének becslésekor továbbra is a (14.3.16) képlet használata javasolt, ha nincs különösebb ok azt hinni, hogy ez a törvény nagyon eltér a normáltól (észrevehető pozitív vagy negatív kurtózisa van).

Ha a /) hozzávetőleges értékét így vagy úgy megkapjuk, akkor ugyanúgy meg lehet alkotni a variancia konfidenciaintervallumát, mint ahogy azt a matematikai elváráshoz építettük:

táblázatban található az adott p valószínűségtől függő érték. 14.3.1.

2. példa. Keressen egy körülbelül 80%-os megbízhatósági intervallumot egy véletlen változó varianciájához x az 1. példa feltételei szerint, ha ismert, hogy az érték x a normálishoz közeli törvény szerint elosztva.

Megoldás. Az érték ugyanaz marad, mint a táblázatban. 14.3.1:

A (14.3.16) képlet szerint

A (14.3.18) képlet szerint megtaláljuk a konfidencia intervallumot:

A szórás megfelelő értéktartománya: (0,21; 0,29).

14.4. Pontos módszerek megbízhatósági intervallumok felépítésére a normális törvény szerint eloszló valószínűségi változó paramétereihez

Az előző alfejezetben nagyjából közelítő módszereket vettünk figyelembe az átlag és a variancia konfidencia-intervallumának felépítésére. Itt adunk egy ötletet ugyanazon probléma megoldásának pontos módszereiről. Hangsúlyozzuk, hogy a konfidenciaintervallumok pontos megtalálásához feltétlenül szükséges előre ismerni a mennyiség eloszlási törvényének alakját. x, míg ez közelítő módszerek alkalmazásához nem szükséges.

A megbízhatósági intervallumok felépítésének pontos módszereinek ötlete a következő. Bármely konfidenciaintervallum megtalálható néhány egyenlőtlenség teljesülésének valószínűségét kifejező feltételből, amely magában foglalja a számunkra érdekes becslést a. Osztályelosztási törvény a ban ben általános eset az ismeretlen mennyiségi paraméterektől függ x. Néha azonban lehetséges az egyenlőtlenségek átadása egy valószínűségi változóból a a megfigyelt értékek valamilyen más függvényéhez X p X 2, ..., X o. amelynek eloszlási törvénye nem ismeretlen paraméterektől, hanem csak a kísérletek számától és a mennyiség eloszlási törvényének alakjától függ x. Az ilyen véletlenszerű változók nagy szerepet játszanak a matematikai statisztikában; legrészletesebben a mennyiség normális eloszlásának esetére tanulmányozták őket x.

Például bebizonyosodott, hogy a mennyiség normális eloszlása ​​mellett x véletlenszerű érték

figyelemmel az ún Hallgatói elosztási törvény Val vel P- 1 szabadságfok; ennek a törvénynek a sűrűsége a formája

ahol G(x) az ismert gammafüggvény:

Az is bebizonyosodott, hogy a valószínűségi változó

a következővel rendelkezik: "eloszlás % 2". P- 1 szabadságfok (lásd 7. fejezet), melynek sűrűségét a képlet fejezi ki

Anélkül, hogy a (14.4.2) és (14.4.4) eloszlások származtatásain foglalkoznánk, bemutatjuk, hogyan alkalmazhatók ezek a paraméterek konfidenciaintervallumának felépítésekor. Ty D .

Legyen előállított P független kísérletek egy valószínűségi változón x, a normál törvény szerint elosztva ismeretlen paraméterekkel TIO. Ezeknél a paramétereknél becslések

Mindkét paraméterre meg kell alkotni a konfidencia intervallumot, amely megfelel a p konfidenciavalószínűségnek.

Először alkossunk meg egy konfidenciaintervallumot a matematikai elváráshoz. Természetes, hogy ezt az intervallumot szimmetrikusan vesszük a -hoz képest t; jelöljük s p-vel az intervallum hosszának felét. Az sp értékét úgy kell megválasztani, hogy a feltétel

Próbáljuk meg átadni a (14.4.5) egyenlőség bal oldalát egy valószínűségi változóból t egy valószínűségi változóhoz T, a Student törvénye szerint terjesztik. Ehhez megszorozzuk az |m-w?| egyenlőtlenség mindkét részét

pozitív értékre: vagy a (14.4.1) jelöléssel,

Keressünk egy olyan / p számot, hogy a / p értéke megtalálható legyen a feltételből

A (14.4.2) képletből látható, hogy (1) - páros funkció, így (14.4.8) megadja

Az egyenlőség (14.4.9) határozza meg a / p értéket p függvényében. Ha rendelkezésére áll egy integrál értékek táblázata

akkor a / p értéke fordított interpolációval megtalálható a táblázatban. Kényelmesebb azonban előre összeállítani egy értéktáblázatot / p. Egy ilyen táblázatot a Függelék (5. táblázat) tartalmaz. Ez a táblázat a p konfidenciavalószínűségtől és a szabadságfokok számától függő értékeket mutatja P- 1. Miután meghatározta a / p-t a táblázat szerint. 5 és feltételezve

megtaláljuk a / p konfidenciaintervallum szélességének felét és magát az intervallumot

1. példa 5 független kísérletet végeztünk egy valószínűségi változón x, normál eloszlású, ismeretlen paraméterekkel tés róla. A kísérletek eredményeit a táblázat tartalmazza. 14.4.1.

14.4.1. táblázat

Keressen egy becslést t a matematikai várakozáshoz, és állítson össze egy 90%-os / p konfidenciaintervallumot (azaz a p \u003d 0,9 konfidenciavalószínűségnek megfelelő intervallumot).

Megoldás. Nekünk van:

iránti kérelem 5. táblázata szerint P - 1 = 4 és p = 0,9 azt találjuk ahol

A konfidencia intervallum az lesz

2. példa A 14.3. alszakasz 1. példájának feltételeire, az értéket feltételezve x normál eloszlású, keresse meg a pontos konfidenciaintervallumot.

Megoldás. A kérelem 5. táblázata szerint a címen találjuk P - 1 = 19ir =

0,8/p=1,328; innen

A 14.3. alfejezet 1. példájának megoldásával (e p = 0,072) összehasonlítva azt látjuk, hogy az eltérés nagyon kicsi. Ha a pontosságot a második tizedesjegyig tartjuk, akkor a pontos és közelítő módszerrel kapott konfidencia intervallumok megegyeznek:

Folytassuk a variancia konfidenciaintervallumának felépítését. Tekintsük az elfogulatlan varianciabecslést

és fejezzük ki a valószínűségi változót D az értéken keresztül V(14.4.3), amelynek eloszlása ​​x 2 (14.4.4):

A mennyiség eloszlási törvényének ismerete V, meg lehet találni azt a / (1 ) intervallumot, amelybe adott p valószínűséggel esik.

elosztási törvény k n _ x (v) az I 7 értéke az ábrán látható formában van. 14.4.1.

Rizs. 14.4.1

Felmerül a kérdés: hogyan válasszuk ki a / p intervallumot? Ha a mennyiség eloszlási törvénye V szimmetrikus volt (mint egy normál törvény vagy Student-eloszlás), természetes lenne a /p intervallumot szimmetrikusnak venni a matematikai elvárásokhoz képest. Ebben az esetben a törvény k n _ x (v) aszimmetrikus. Állapodjunk meg, hogy a /p intervallumot úgy választjuk meg, hogy a mennyiség kimeneti valószínűsége legyen V az intervallumon kívül jobbra és balra (a 14.4.1. ábrán az árnyékolt területek) azonosak és egyenlőek

Egy / p intervallum létrehozásához ezzel a tulajdonsággal a táblázatot használjuk. 4 alkalmazás: számokat tartalmaz y) oly módon, hogy

a mennyiséghez V, x 2 -eloszlású r szabadságfokkal. A mi esetünkben r = n- 1. Javítás r = n- 1, és keresse meg a táblázat megfelelő sorában. 4 két érték x 2 - az egyik valószínűségnek megfelelő a másik - valószínűségek Jelöljük ezeket

értékeket 2-korés xl? Az intervallum rendelkezik y 2 , a baljával, és y ~ jobb vége.

Most megtaláljuk a szükséges /| konfidenciaintervallumot a D, és határvonalú variancia esetén D2, amely lefedi a lényeget D p valószínűséggel:

Szerkesszünk egy olyan / (, = (?> b A) intervallumot, amely lefedi a pontot D akkor és csak akkor, ha az érték V intervallumba esik / r. Mutassuk meg, hogy az intervallum

megfelel ennek a feltételnek. Valóban, az egyenlőtlenségek egyenértékűek az egyenlőtlenségekkel

és ezek az egyenlőtlenségek p valószínűséggel fennállnak. Így a diszperzió konfidencia intervallumát megtaláljuk, és a (14.4.13) képlettel fejezzük ki.

3. példa Keresse meg a variancia konfidenciaintervallumát a 14.3. alfejezet 2. példájának feltételei mellett, ha ismert, hogy az érték x normálisan elosztva.

Megoldás. Nekünk van . A pályázat 4. táblázata szerint

címen találjuk r = n - 1 = 19

A (14.4.13) képlet alapján megtaláljuk a diszperzió konfidencia intervallumát

A szórásra vonatkozó megfelelő intervallum: (0,21; 0,32). Ez az intervallum csak kis mértékben haladja meg a 14.3 alfejezet 2. példájában kapott intervallumot (0,21; 0,29), közelítő módszerrel.

  • A 14.3.1. ábra olyan konfidenciaintervallumot vesz figyelembe, amely szimmetrikus az a-ra. Általában, mint később látni fogjuk, erre nincs szükség.

És mások. Mindegyik elméleti megfelelőjének becslése, amelyet akkor kaphatnánk meg, ha nem minta lenne, hanem az általános sokaság. De sajnos az általános lakosság nagyon drága és gyakran elérhetetlen.

Az intervallumbecslés fogalma

Minden mintabecslésnek van némi szórása, mert egy valószínűségi változó, amely egy adott mintában lévő értékektől függ. Ezért a megbízhatóbb statisztikai következtetésekhez nem csak a pontbecslést kell ismerni, hanem az intervallumot is, ami nagy valószínűséggel γ (gamma) takarja a becsült mutatót θ (théta).

Formálisan ez két ilyen érték (statisztika) T1(X)és T2(X), mit T1< T 2 , amelyre adott valószínűségi szinten γ feltétel teljesül:

Röviden: valószínű γ vagy több az igazi érték a pontok között van T1(X)és T2(X), amelyeket alsó és felső határnak nevezünk megbízhatósági intervallum.

A konfidenciaintervallumok felépítésének egyik feltétele annak maximális szűksége, pl. a lehető legrövidebbnek kell lennie. A vágy egészen természetes, mert. a kutató igyekszik pontosabban lokalizálni a kívánt paraméter megtalálását.

Ebből következik, hogy a konfidenciaintervallumnak le kell fednie az eloszlás maximális valószínűségét. és maga a kotta legyen a középpontban.

Vagyis a valós mutatónak a becsléstől való felfelé való eltérésének valószínűsége megegyezik a lefelé való eltérés valószínűségével. Azt is meg kell jegyezni, hogy ferde eloszlások esetén a jobb oldali intervallum nem egyenlő a bal oldali intervallummal.

A fenti ábra egyértelműen mutatja, hogy minél nagyobb a megbízhatósági szint, annál szélesebb az intervallum - közvetlen kapcsolat.

Ez egy kis bevezető volt az ismeretlen paraméterek intervallumbecslésének elméletébe. Térjünk át a matematikai elvárás megbízhatósági határainak megtalálására.

Konfidenciaintervallum a matematikai elvárásokhoz

Ha az eredeti adatok el vannak osztva, akkor az átlag normál érték lesz. Ez abból a szabályból következik, hogy a normálértékek lineáris kombinációjának normális eloszlása ​​is van. Ezért a valószínűségek kiszámításához használhatjuk a normál eloszlási törvény matematikai apparátusát.

Ehhez azonban két paraméter ismeretére lesz szükség - a várható értékre és a szórásra, amelyek általában nem ismertek. Természetesen használhatunk paraméterek helyett becsléseket (számtani átlag és ), de akkor az átlag eloszlása ​​nem lesz egészen normális, kissé lelapul. William Gosset ír állampolgár ügyesen megjegyezte ezt a tényt, amikor a Biometrica 1908. márciusi számában közzétette felfedezését. Titoktartási okokból Gosset aláírta a Studentet. Így jelent meg a Student-féle t-eloszlás.

A K. Gauss által a csillagászati ​​megfigyelések hibáinak elemzése során használt adatok normál eloszlása ​​azonban rendkívül ritka a földi életben, és ezt meglehetősen nehéz megállapítani (a nagy pontossághoz körülbelül 2 ezer megfigyelés szükséges). Ezért a legjobb, ha elvetjük a normalitás feltevést, és olyan módszereket alkalmazunk, amelyek nem függnek az eredeti adatok eloszlásától.

Felmerül a kérdés: mi a számtani közép eloszlása, ha ismeretlen eloszlás adataiból számítjuk? A választ a valószínűségszámításban jól ismertek adják Központi határérték tétel(CPT). A matematikában ennek több változata is létezik (a megfogalmazások az évek során finomodtak), de ezek mindegyike durván szólva arra a megállapításra jut, hogy az összeg egy nagy szám független valószínűségi változók engedelmeskednek a normális eloszlás törvényének.

A számtani átlag kiszámításakor a valószínűségi változók összegét használjuk. Ebből kiderül, hogy a számtani középnek normális eloszlása ​​van, amelyben a várható érték a kiindulási adatok várható értéke, a variancia pedig .

Okos emberek tudjuk, hogyan kell bizonyítani a CLT-t, de ezt egy Excelben végzett kísérlet segítségével ellenőrizzük. Szimuláljunk egy 50 egyenletes eloszlású valószínűségi változóból álló mintát (a Excel függvények RANDOMBETWEEN). Ezután készítünk 1000 ilyen mintát, és mindegyikre kiszámítjuk a számtani átlagot. Nézzük a megoszlásukat.

Látható, hogy az átlag eloszlása ​​közel áll a normál törvényhez. Ha a minták mennyiségét és számát még nagyobbra tesszük, akkor a hasonlóság még jobb lesz.

Most, hogy mi magunk is meggyőződtünk a CLT érvényességéről, a segítségével kiszámíthatjuk a számtani átlag konfidenciaintervallumait, amelyek adott valószínűséggel fedik le a valódi átlagot vagy a matematikai várakozást.

A felső és alsó határ megállapításához ismerni kell a normális eloszlás paramétereit. Általában nem használják őket, ezért becsléseket használnak: számtani átlagaés minta variancia. Ez a módszer ismét csak nagy minták esetén ad jó közelítést. Ha a minták kicsik, gyakran javasolt a Student-féle eloszlás használata. Ne hidd! Az átlag Student-féle eloszlása ​​csak akkor fordul elő, ha az eredeti adat normális eloszlású, vagyis szinte soha. Ezért jobb, ha azonnal beállítja a minimális sávot a szükséges adatok mennyiségére, és aszimptotikusan helyes módszereket alkalmaz. Azt mondják, 30 megfigyelés elég. Vegyél 50-et – nem hibázhatsz.

T 1.2 a konfidencia intervallum alsó és felső határa

– minta számtani átlag

s0– minta szórása (elfogulatlan)

n - minta nagysága

γ – megbízhatósági szint (általában 0,9, 0,95 vagy 0,99)

c γ =Φ -1 ((1+γ)/2) a standard normális eloszlási függvény reciproka. Egyszerűen fogalmazva, ez a standard hibák száma az aritmetikai átlagtól az alsó vagy felső határig (a jelzett három valószínűség az 1,64, 1,96 és 2,58 értékeknek felel meg).

A képlet lényege, hogy felvesszük a számtani átlagot, majd abból egy bizonyos összeget félreteszünk ( γ-val) standard hibák ( s 0 /√n). Minden ismert, vedd és számolj.

A PC-k tömeges használata előtt a normál eloszlási függvény és annak inverze értékeinek megszerzéséhez a . Továbbra is használatosak, de hatékonyabb a kész Excel képletek felé fordulni. A fenti képlet összes eleme ( , és ) könnyen kiszámítható Excelben. De van egy kész képlet is a konfidenciaintervallum kiszámítására - BIZALOM NORM. A szintaxisa a következő.

BIZTONSÁGI NORM(alfa, standard_dev, méret)

alfa– szignifikanciaszint vagy konfidenciaszint, amely a fenti jelölésben egyenlő 1-γ-val, azaz. annak a valószínűsége, hogy a matematikaia várakozás a konfidenciaintervallumon kívül lesz. 0,95-ös megbízhatósági szint mellett az alfa 0,05, és így tovább.

standard_off a mintaadatok szórása. A standard hibát nem kell kiszámítani, az Excel osztja az n gyökével.

a méret– mintanagyság (n).

A CONFIDENCE.NORM függvény eredménye a konfidenciaintervallum számítási képletének második tagja, azaz. fél intervallum. Ennek megfelelően az alsó és felső pont az átlag ± a kapott érték.

Így lehetőség nyílik egy univerzális algoritmus felépítésére a számtani átlag konfidenciaintervallumának kiszámítására, amely nem függ a kiindulási adatok eloszlásától. Az univerzalitás ára aszimptotikus volta, azaz. viszonylag nagy minták használatának szükségessége. Azonban a században modern technológiák a megfelelő mennyiségű adat összegyűjtése általában nem nehéz.

Statisztikai hipotézisek tesztelése bizalmi intervallum segítségével

(111. modul)

A statisztika egyik fő megoldandó problémája az. Dióhéjban a lényege ez. Feltételezik például, hogy az elvárás népesség egyenlő valamilyen értékkel. Ezután megszerkesztjük a mintaátlagok eloszlását, amely adott elvárás mellett megfigyelhető. Ezután megnézzük, hogy ebben a feltételes eloszlásban hol található a valós átlag. Ha túllépi a megengedett határokat, akkor egy ilyen átlag megjelenése nagyon valószínűtlen, és a kísérlet egyszeri megismétlésével szinte lehetetlen, ami ellentmond a feltett hipotézisnek, amelyet sikeresen elvetettek. Ha az átlag nem lépi túl a kritikus szintet, akkor a hipotézist nem utasítják el (de nem is igazolják!).

Tehát a konfidenciaintervallumok segítségével, esetünkben az elvárásra vonatkozóan, néhány hipotézist is tesztelhet. Nagyon könnyű megtenni. Tegyük fel, hogy valamelyik minta számtani középértéke 100. Azt a hipotézist teszteljük, hogy a várakozás mondjuk 90. ​​Vagyis, ha primitíven tesszük fel a kérdést, ez így hangzik: lehet-e ez a valódi érték mellett. átlag 90, a megfigyelt átlag 100 volt?

A kérdés megválaszolásához további információkra lesz szükség a szórással és a minta méretével kapcsolatban. Mondjuk szórás 30, a megfigyelések száma pedig 64 (a gyökér egyszerű kivonásához). Ekkor az átlag standard hibája 30/8 vagy 3,75. A 95%-os konfidenciaintervallum kiszámításához kettővel kell elhalasztani az átlag mindkét oldalát standard hibák(pontosabban 1,96-tal). A konfidenciaintervallum körülbelül 100 ± 7,5, vagy 92,5 és 107,5 között lesz.

A további érvelés a következő. Ha a vizsgált érték a konfidencia intervallumon belülre esik, akkor az nem mond ellent a hipotézisnek, mivel beleillik a véletlenszerű ingadozások határai közé (95%-os valószínűséggel). Ha a vizsgált pont a konfidenciaintervallumon kívül esik, akkor egy ilyen esemény valószínűsége nagyon kicsi, minden esetben az elfogadható szint alatt van. Ezért a hipotézist elvetjük, mivel ellentmond a megfigyelt adatoknak. Esetünkben a várakozási hipotézis a konfidenciaintervallumon kívül esik (a 90-es tesztelt érték nem szerepel a 100±7,5-ös intervallumban), ezért el kell vetni. A fenti primitív kérdésre válaszolva azt kell mondani: nem, nem, mindenesetre ez rendkívül ritkán fordul elő. Ez gyakran a hipotézis hibás elutasításának konkrét valószínűségét jelzi (p-szint), és nem egy adott szintet, amely szerint a konfidenciaintervallumot felépítették, hanem erről majd máskor.

Amint látja, nem nehéz felépíteni egy konfidenciaintervallumot az átlaghoz (vagy a matematikai elváráshoz). A lényeg, hogy felfogd a lényeget, aztán mennek a dolgok. A gyakorlatban a legtöbben a 95%-os konfidencia intervallumot használják, ami körülbelül két standard hiba széles az átlag mindkét oldalán.

Ez minden most. Minden jót!

A statisztikai problémák megoldásának egyik módszere a konfidenciaintervallum számítása. A pontbecslés előnyben részesített alternatívájaként használják, ha a minta mérete kicsi. Meg kell jegyezni, hogy a konfidenciaintervallum kiszámításának folyamata meglehetősen bonyolult. De az Excel program eszközei lehetővé teszik némi egyszerűsítést. Nézzük meg, hogyan történik ez a gyakorlatban.

Ezt a módszert különféle statisztikai mennyiségek intervallumbecslésére használják. Ennek a számításnak a fő feladata a pontbecslés bizonytalanságaitól való megszabadulás.

Az Excelben két fő lehetőség van a számítások végrehajtására ez a módszer: amikor ismert a variancia és mikor ismeretlen. Az első esetben a függvényt számításokhoz használjuk BIZALOM NORM, és a másodikban BIZALOM.DIÁK.

1. módszer: CONFIDENCE NORM funkció

Operátor BIZALOM NORM, amely a függvények statisztikai csoportjára utal, először az Excel 2010. In more korai változatai ez a program az analógját használja BIZALOM. Ennek az operátornak az a feladata, hogy kiszámítsa a populáció átlagának normális eloszlású konfidenciaintervallumát.

A szintaxisa a következő:

BIZTONSÁGI NORM(alfa, standard_dev, méret)

"Alfa" a megbízhatósági szint kiszámításához használt szignifikanciaszintet jelző argumentum. A megbízhatósági szint megegyezik a következő kifejezéssel:

(1-"Alfa")*100

"Szabvány eltérés" egy érv, melynek lényege a névből is kiderül. Ez a javasolt minta szórása.

"A méret" egy argumentum, amely meghatározza a minta méretét.

Az operátorhoz tartozó összes argumentum megadása kötelező.

Funkció BIZALOM pontosan ugyanazok az érvek és lehetőségek, mint az előző. A szintaxisa a következő:

TRUST(alfa, standard_dev, méret)

Mint látható, a különbségek csak az operátor nevében vannak. Ezt a funkciót az Excel 2010 és az újabb verziók egy speciális kategóriában megtartották kompatibilitási okokból. "Kompatibilitás". Az Excel 2007 és korábbi verzióiban a statisztikai operátorok fő csoportjában van jelen.

A konfidenciaintervallum határát a következő képlet segítségével határozzuk meg:

X+(-)BIZALMI NORM

Ahol x a minta átlaga, amely a kiválasztott tartomány közepén helyezkedik el.

Most nézzük meg, hogyan kell kiszámítani a konfidenciaintervallumot konkrét példa. 12 tesztet végeztek, amelyek különböző eredményeket adtak, amelyeket a táblázatban sorolunk fel. Ez a mi összességünk. A szórása 8. A konfidencia intervallumot 97%-os konfidenciaszinten kell kiszámítanunk.

  1. Válassza ki azt a cellát, ahol az adatfeldolgozás eredménye megjelenik. A gombra kattintva "Funkció beszúrása".
  2. Megjelenik Funkcióvarázsló. Ugrás a kategóriához "Statisztikai"és jelölje ki a nevet "CONFIDENCE.NORM". Ezt követően kattintson a gombra rendben.
  3. Megnyílik az argumentumok ablaka. Mezői természetesen megfelelnek az argumentumok nevének.
    Állítsa a kurzort az első mezőre - "Alfa". Itt meg kell határoznunk a szignifikancia szintjét. Emlékszünk rá, hogy a bizalom szintje 97%. Ugyanakkor azt mondtuk, hogy a kiszámítása a következő:

    (1-bizalmi szint)/100

    Vagyis az érték helyettesítésével a következőt kapjuk:

    Egyszerű számításokkal megtudjuk, hogy az érv "Alfa" egyenlő 0,03 . Belép adott értéket mezőben.

    Mint tudják, a szórás egyenlő 8 . Ezért a terepen "Szabvány eltérés" csak írja le ezt a számot.

    A terepen "A méret" meg kell adnia az elvégzett vizsgálatok elemeinek számát. Ahogy emlékszünk, ők 12 . De annak érdekében, hogy a képletet automatizáljuk, és ne minden új teszt végrehajtásakor módosítsuk, ezt az értéket ne egy közönséges számra állítsuk, hanem az operátor segítségével JELÖLJE BE. Tehát a kurzort a mezőbe tesszük "A méret", majd kattintson a háromszögre, amely a képletsor bal oldalán található.

    Megjelenik a legutóbb használt funkciók listája. Ha az üzemeltető JELÖLJE BE használta a közelmúltban, szerepelnie kell ezen a listán. Ebben az esetben csak a nevére kell kattintania. Ellenkező esetben, ha nem találja, akkor menjen a lényegre "További funkciók...".

  4. Számunkra már ismerősnek tűnik Funkcióvarázsló. Visszatérve a csoporthoz "Statisztikai". Ott kiválasztjuk a nevet "JELÖLJE BE". Kattintson a gombra rendben.
  5. Megjelenik a fenti operátor argumentum ablaka. Ez a funkció a megadott tartományban a számértékeket tartalmazó cellák számának kiszámítására szolgál. A szintaxisa a következő:

    COUNT(érték1, érték2,…)

    Érvelési csoport "Értékek" egy hivatkozás arra a tartományra, amelyben ki szeretné számítani a numerikus adatokkal töltött cellák számát. Összesen 255 ilyen érv lehet, de esetünkben csak egyre van szükségünk.

    Állítsa a kurzort a mezőbe "Érték1"és a bal egérgombot lenyomva tartva válassza ki a lapon azt a tartományt, amely a populációnkat tartalmazza. Ezután a címe megjelenik a mezőben. Kattintson a gombra rendben.

  6. Ezt követően az alkalmazás elvégzi a számítást, és megjeleníti az eredményt abban a cellában, ahol maga. A mi konkrét esetünkben a képlet így alakult:

    BIZTONSÁGI NORM(0,03;8;SZÁM.(B2:B13))

    A számítások összesített eredménye az volt 5,011609 .

  7. De ez még nem minden. Emlékszünk rá, hogy a konfidencia intervallum határát a számítási eredmény átlagos mintaértékének összeadásával és kivonásával számítjuk ki. BIZALOM NORM. Ily módon a konfidenciaintervallum jobb és bal határa kerül kiszámításra. Maga a mintaátlag kiszámítható az operátor segítségével ÁTLAGOS.

    Ez az operátor a kiválasztott számtartomány számtani középértékének kiszámítására szolgál. A következő meglehetősen egyszerű szintaxissal rendelkezik:

    ÁTLAG(szám1, szám2,…)

    Érv "Szám" lehet egyetlen numerikus érték vagy hivatkozás az ezeket tartalmazó cellákra vagy akár teljes tartományokra.

    Tehát válassza ki azt a cellát, amelyben az átlagérték számítása megjelenik, és kattintson a gombra "Funkció beszúrása".

  8. megnyílik Funkcióvarázsló. Vissza a kategóriához "Statisztikai"és válasszon egy nevet a listából "ÁTLAGOS". Mint mindig, kattintson a gombra rendben.
  9. Elindul az argumentumok ablaka. Állítsa a kurzort a mezőbe "1. szám"és a bal egérgomb lenyomásával válassza ki a teljes értéktartományt. Miután a koordináták megjelennek a mezőben, kattintson a gombra rendben.
  10. Ezután ÁTLAGOS a számítás eredményét egy lapelemre adja ki.
  11. Kiszámoljuk a konfidenciaintervallum jobb határát. Ehhez válasszon ki egy külön cellát, helyezze el a jelet «=» és adja hozzá azoknak a lapelemeknek a tartalmát, amelyekben a függvényszámítás eredményei találhatók ÁTLAGOSés BIZALOM NORM. A számítás elvégzéséhez nyomja meg a gombot Belép. Esetünkben a következő képletet kaptuk:

    A számítás eredménye: 6,953276

  12. Ugyanígy számítjuk ki a konfidenciaintervallum bal határát is, csak ezúttal a számítás eredményéből ÁTLAGOS vonjuk le az operátor számításának eredményét BIZALOM NORM. Kiderül, hogy a következő típusú példánk képlete:

    A számítás eredménye: -3,06994

  13. Megpróbáltuk részletesen leírni a konfidenciaintervallum kiszámításának minden lépését, ezért minden képletet részletesen leírtunk. De az összes műveletet kombinálhatja egy képletben. A konfidenciaintervallum jobb korlátjának kiszámítása a következőképpen írható fel:

    ÁTLAG(B2:B13)+BIZALOM(0.03;8,SZÁM.(B2:B13))

  14. A bal oldali szegély hasonló számítása így nézne ki:

    ÁTLAG(B2:B13)-BIZALMAS.NORM(0.03;8;SZÁM.(B2:B13))

2. módszer: TRUST.STUDENT funkció

Ezenkívül az Excelben van egy másik funkció is, amely a konfidencia intervallum kiszámításához kapcsolódik - BIZALOM.DIÁK. Csak az Excel 2010 óta jelent meg. Ez az operátor a sokaság konfidencia intervallumának kiszámítását a Student-féle t-eloszlás segítségével végzi el. Használata nagyon kényelmes abban az esetben, ha a szórás és ennek megfelelően a szórás ismeretlen. Az operátor szintaxisa a következő:

TRUST.STUDENT(alfa,standard_dev,méret)

Mint látható, az operátorok neve ebben az esetben változatlan maradt.

Nézzük meg, hogyan lehet kiszámítani az ismeretlen szórással rendelkező konfidencia intervallum határait ugyanazon sokaság példáján, amelyet az előző módszerben figyelembe vettünk. A bizalom szintje, mint legutóbb, 97%-ot vesz fel.

  1. Válassza ki azt a cellát, amelyben a számítás készül. Kattintson a gombra "Funkció beszúrása".
  2. A nyitottban Funkcióvarázsló menj a kategóriába "Statisztikai". Válasszon egy nevet "BIZALOM.DIÁK". Kattintson a gombra rendben.
  3. Elindul a megadott operátor argumentum ablaka.

    A terepen "Alfa", tekintettel arra, hogy a megbízhatósági szint 97%, felírjuk a számot 0,03 . Másodszor a számítási elvekről adott paramétert nem állunk meg.

    Ezután állítsa a kurzort a mezőbe "Szabvány eltérés". Ez a mutató ezúttal ismeretlen számunkra, és ki kell számítani. Ez egy speciális funkció segítségével történik - STDEV.V. Az operátor ablakának meghívásához kattintson a képletsor bal oldalán található háromszögre. Ha a megnyíló listában nem találjuk a kívánt nevet, akkor lépjen az elemre "További funkciók...".

  4. fut Funkcióvarázsló. Áthelyezés a kategóriába "Statisztikai"és jelölje be a nevet "STDEV.B". Ezután kattintson a gombra rendben.
  5. Megnyílik az argumentumok ablaka. operátori feladat STDEV.V a mintavételi szórás definíciója. A szintaxisa így néz ki:

    STDEV.V(szám1,szám2,…)

    Könnyű kitalálni, hogy az érv "Szám" a kiválasztási elem címe. Ha a kijelölés egyetlen tömbbe kerül, akkor egyetlen argumentumot használva megadhat egy hivatkozást erre a tartományra.

    Állítsa a kurzort a mezőbe "1. szám"és mint mindig, a bal egérgombot lenyomva tartva válassza ki a készletet. Miután a koordináták a mezőben vannak, ne rohanjon megnyomni a gombot rendben mert az eredmény hibás lesz. Először vissza kell térnünk az operátori argumentumok ablakhoz BIZALOM.DIÁK hogy a végső érvet. Ehhez kattintson a megfelelő névre a képletsorban.

  6. Újra megnyílik a már ismert függvény argumentum ablaka. Állítsa a kurzort a mezőbe "A méret". Ismét kattintson a számunkra már ismerős háromszögre az operátorok kiválasztásához. Amint érti, szükségünk van egy névre "JELÖLJE BE". Mióta használtuk ezt a funkciót az előző módszer számításainál jelen van ebben a listában, ezért csak kattintson rá. Ha nem találja, kövesse az első módszerben leírt algoritmust.
  7. Belépés az érvek ablakába JELÖLJE BE, vigye a kurzort a mezőbe "1. szám"és az egérgombot lenyomva tartva válassza ki a gyűjteményt. Ezután kattintson a gombra rendben.
  8. Ezt követően a program kiszámítja és megjeleníti a konfidencia intervallum értékét.
  9. A határok meghatározásához ismét ki kell számítanunk a minta átlagát. De tekintettel arra, hogy a számítási algoritmus a képlet segítségével ÁTLAGOS ugyanaz, mint az előző módszernél, és még az eredmény sem változott, erre másodszor nem térünk ki részletesen.
  10. A számítás eredményeinek összeadása ÁTLAGOSés BIZALOM.DIÁK, megkapjuk a konfidenciaintervallum megfelelő határát.
  11. Kivonás az operátor számítási eredményeiből ÁTLAGOS számítási eredmény BIZALOM.DIÁK, megvan a konfidenciaintervallum bal oldali korlátja.
  12. Ha a számítást egy képletben írják le, akkor esetünkben a megfelelő határ kiszámítása így fog kinézni:

    ÁTLAG(B2:B13)+DIÁK BIZALMA(0,03,STDV(B2:B13),SZÁM(B2:B13))

  13. Ennek megfelelően a bal oldali szegély kiszámításának képlete így fog kinézni:

    ÁTLAG(B2:B13) – DIÁK BIZALMA(0,03,STDV(B2:B13),SZÁM(B2:B13))

Mint látható, az Excel program eszközei lehetővé teszik a konfidenciaintervallum és határainak kiszámítását jelentősen megkönnyítik. Ebből a célból külön operátorokat használnak az ismert és ismeretlen varianciájú mintákhoz.

A konfidencia intervallum a statisztika területéről érkezett hozzánk. Ez egy meghatározott tartomány, amely egy ismeretlen paraméter becslésére szolgál magas fok megbízhatóság. Ezt a legegyszerűbben egy példával lehet megmagyarázni.

Tegyük fel, hogy meg kell vizsgálnia egy véletlen változót, például azt, hogy a szerver milyen sebességgel válaszol az ügyfél kérésére. Minden alkalommal, amikor a felhasználó beírja egy adott webhely címét, a szerver ezzel válaszol különböző sebességgel. Így a vizsgált válaszidő véletlenszerű. Tehát a konfidenciaintervallum lehetővé teszi ennek a paraméternek a határainak meghatározását, és akkor kijelenthető, hogy 95% valószínűséggel a szerver az általunk számított tartományban lesz.

Vagy meg kell találnia, hogy hányan tudnak róla védjegy cégek. A konfidenciaintervallum kiszámításakor például azt lehet mondani, hogy 95%-os valószínűséggel 27% és 34% közötti tartományba esik az erről tudó fogyasztók aránya.

Ehhez a kifejezéshez szorosan kapcsolódik egy olyan érték, mint a megbízhatósági szint. Azt a valószínűséget jelenti, hogy a kívánt paraméter szerepel a konfidenciaintervallumban. Ez az érték határozza meg, hogy mekkora lesz a kívánt tartományunk. Hogyan nagyobb érték elfogadja, annál szűkebb lesz a konfidenciaintervallum, és fordítva. Általában 90%-ra, 95%-ra vagy 99%-ra van állítva. A 95%-os érték a legnépszerűbb.

Ezt a mutatót a megfigyelések szórása is befolyásolja, és meghatározása azon a feltételezésen alapul, hogy a vizsgált tulajdonság engedelmeskedik Ezt az állítást Gauss-törvénynek is nevezik. Szerinte egy folytonos valószínűségi változó összes valószínűségének ilyen, valószínűségi sűrűséggel leírható eloszlását normálisnak nevezzük. Ha a normális eloszlás feltételezése hibásnak bizonyult, akkor a becslés hibásnak bizonyulhat.

Először is nézzük meg, hogyan kell kiszámítani a konfidencia intervallumot itt, két eset lehetséges. A diszperzió (egy valószínűségi változó terjedésének mértéke) ismert vagy nem. Ha ismert, akkor a konfidencia intervallumot a következő képlettel számítjuk ki:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - jel,

t egy paraméter a Laplace eloszlástáblából,

σ a diszperzió négyzetgyöke.

Ha a variancia ismeretlen, akkor kiszámítható, ha ismerjük a kívánt jellemző összes értékét. Ehhez a következő képletet használják:

σ2 = х2ср - (хр)2, ahol

х2ср - a vizsgált tulajdonság négyzeteinek átlagos értéke,

(xsr)2 ennek az attribútumnak a négyzete.

A képlet, amellyel a konfidenciaintervallumot ebben az esetben számítják, kissé megváltozik:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - minta átlag,

α - jel,

t egy paraméter, amely a Student eloszlástáblázata segítségével található t \u003d t (ɣ; n-1),

sqrt(n) a teljes mintaméret négyzetgyöke,

s a variancia négyzetgyöke.

Tekintsük ezt a példát. Tételezzük fel, hogy 7 mérés eredménye alapján a vizsgált tulajdonságot 30-nak, a minta varianciáját pedig 36-nak határoztuk meg. 99%-os valószínűséggel meg kell találni egy olyan konfidencia intervallumot, amely tartalmazza a mért paraméter.

Először határozzuk meg, mi t egyenlő: t \u003d t (0,99; 7-1) \u003d 3,71. A fenti képlet segítségével a következőt kapjuk:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

A variancia konfidenciaintervallumát mind ismert átlag esetén, mind akkor számítjuk, ha a matematikai várakozásra nincs adat, és csak a variancia torzítatlan pontbecslésének értéke ismert. A számítási képleteket itt nem adjuk meg, mivel ezek meglehetősen összetettek, és ha szükséges, mindig megtalálhatók a neten.

Csak azt jegyezzük meg, hogy kényelmes a megbízhatósági intervallum meghatározása Excel programmal vagy hálózati szolgáltatással, amelyet így hívnak.