Az intervallum eloszlás sorozat felépítésének sorrendje.  Folyamatos kvantitatív adatok intervallumvariációs sorozatának felépítése

Az intervallum eloszlás sorozat felépítésének sorrendje. Folyamatos kvantitatív adatok intervallumvariációs sorozatának felépítése

2. Az elosztási sorozat fogalma. Diszkrét és intervallum eloszlási sorozatok

elosztási sorok csoportosításokat nevezzük különleges fajta, amelynél az egyes attribútumokhoz, attribútumcsoportokhoz vagy attribútumosztályokhoz ismert a csoport egységeinek száma, vagy fajsúly ez a szám összesen. Azok. terjesztési sorozat– attribútumértékek rendezett halmaza növekvő vagy csökkenő sorrendben a megfelelő súlyokkal együtt. A disztribúciós sorozatok mennyiségi vagy attribútum alapján is felépíthetők.

A mennyiségi alapon felépített eloszlási sorozatokat variációs sorozatoknak nevezzük. Ők diszkrét és intervallum. Egy eloszlási sorozat épülhet folyamatosan változó jellemzőre (amikor egy adott intervallumon belül tetszőleges értéket vehet fel) és diszkréten változó jellemzőre (szigorúan meghatározott egész értékeket vesz fel).

diszkrét a variációs eloszlás sorozat változatok tartományok halmaza a hozzájuk tartozó gyakoriságokkal vagy részletekkel. Egy diszkrét sorozat változatai egy előjel diszkréten, szakaszosan változó értékei, általában ez egy számlálás eredménye.

Diszkrét

variációs sorozatokat általában akkor építenek, ha a vizsgált tulajdonság értékei legalább valamilyen véges értékkel eltérhetnek egymástól. A diszkrét sorozatokban egy jellemző pontértékei vannak megadva. Példa : Az üzletek által havonta eladott férfi öltönyök méret szerinti megoszlása.

intervallum

a variációs sorozat egy valószínűségi változó értékeinek változási intervallumainak rendezett halmaza, amelyek mindegyikébe esnek a megfelelő frekvenciák vagy gyakoriságok értékei. Az intervallumsorok egy folyamatosan változó jellemző eloszlásának elemzésére szolgálnak, amelynek értékét leggyakrabban méréssel vagy súlyozással rögzítik. Egy ilyen sor változatai egy csoportosítás.

Példa : Az élelmiszerboltban történő vásárlások megoszlása ​​összeg szerint.

Ha diszkrét variációs sorozatokban a frekvenciamenet közvetlenül a sorozat variánsára vonatkozik, akkor az intervallumokban a változatok csoportjára.

A disztribúciós sorozatokat célszerű grafikus ábrázolásukkal elemezni, ami lehetővé teszi mind az eloszlás formájának, mind a mintáknak a megítélését. Egy diszkrét sorozat szaggatott vonalként jelenik meg a diagramon - elosztási terület. Beépíteni téglalap alakú rendszer koordináták az abszcissza tengely mentén, a változó jellemző rangsorolt ​​(rendezett) értékei ugyanazon a skálán, a frekvenciák kifejezésére szolgáló skála pedig az ordináta tengely mentén kerül ábrázolásra.

Az intervallum sorozatok a következőképpen jelennek meg eloszlási hisztogramok(azaz oszlopdiagramok).

A hisztogram készítésekor az intervallumok értékeit az abszcissza tengelyen ábrázoljuk, a frekvenciákat pedig a megfelelő intervallumokra épített téglalapok ábrázolják. Az oszlopok magassága egyenlő időközök esetén legyen arányos a gyakorisággal.

Bármely hisztogram átalakítható eloszlások sokszögévé, ehhez téglalapjainak csúcsait egyenes szegmensekkel kell összekötni.

2. Index módszer az átlagos kibocsátás és az átlagos létszám kibocsátás változására gyakorolt ​​hatásának elemzésére

Index módszer Az általános mutatók dinamikájának elemzésére és összehasonlítására, valamint ezen mutatók szintjének változását befolyásoló tényezőkre szolgál. Az indexek segítségével feltárható, hogy az átlagos kibocsátás és az átlagos létszám milyen hatással van a termelés volumenének alakulására. Ezt a problémát analitikus indexek rendszerének felépítésével oldjuk meg.

A termelési volumen indexe az átlagos foglalkoztatotti létszám indexével és az átlagos kibocsátás indexével ugyanúgy összefügg, mint a termelés volumene (Q) a kibocsátással ( w)és szám ( r) .

Megállapíthatjuk, hogy a termelés volumene megegyezik az átlagos termelés és az átlagos létszám szorzatával:

Q = w r, ahol Q a termelés mennyisége,

w - átlagos teljesítmény,

r az átlagos létszám.

Mint látható, beszélgetünk a statikai jelenségek kapcsolatáról: két tényező szorzata adja a létrejövő jelenség össztérfogatát. Az is nyilvánvaló, hogy ez a kapcsolat funkcionális, ezért ennek a kapcsolatnak a dinamikáját indexek segítségével vizsgáljuk. A megadott példában ez a következő rendszer:

J w × J r = J wr .

Például a Jwr termelési volumen indexe, mint egy eredő jelenség indexe, két indextényezőre bontható: az átlagos kibocsátás indexére (Jw) és az átlagos létszám indexére (Jr):

Index Index Index

az átlag térfogata

termelés kimeneti erőssége

ahol J w- a Laspeyres-képlettel számított munkatermelékenységi index;

J r- az alkalmazottak számának mutatója, a Paasche-képlet szerint számítva.

Az indexrendszerek arra szolgálnak, hogy meghatározzák az egyes tényezők hatását az effektív mutató szintjének kialakulására, lehetővé teszik az ismeretlen értékének 2 ismert indexértékkel történő meghatározását.

A fenti indexrendszer alapján a termelés volumenének abszolút növekedése is megtalálható, tényezők hatására lebontva.

1. Teljes termelési volumennövekedés:

∆wr = ∑w 1 r 1 - ∑w 0 r 0.

2. Növekedés az átlagos kibocsátási mutató hatására:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Növekedés az átlagos létszám mutatójának hatására:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Példa. A következő információk ismertek

Meg tudjuk határozni, hogy a termelés volumene relatív és abszolút értékben hogyan és hogyan változott egyéni tényezők befolyásolta ezt a változást.

A termelés mennyisége a következő volt:

a bázisidőszakban

w 0 * r 0 = 2000 * 90 \u003d 180000,

és a jelentésben

w 1 * r 1 = 2100 * 100 \u003d 210 000.

Ennek következtében a termelés volumene 30 ezerrel, 1,16%-kal nőtt.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

vagy (210000:180000)*100%=1,16%.

A termelés volumenében bekövetkezett változás a következők miatt következett be:

1) az átlagos létszám 10 fővel vagy 111,1%-kal nő

r 1 / r 0 \u003d 100 / 90 \u003d 1,11 vagy 111,1%.

Abszolút értékben ennek a tényezőnek köszönhetően a termelés volumene 20 000-rel nőtt:

w 0 r 1 - w 0 r 0 \u003d w 0 (r 1 -r 0) \u003d 2000 (100-90) \u003d 20000.

2) az átlagos teljesítmény növekedése 105%-kal vagy 10 000-rel:

w 1 r 1 / w 0 r 1 = 2100 * 100 / 2000 * 100 \u003d 1,05 vagy 105%.

Abszolút értékben a növekedés:

w 1 r 1 - w 0 r 1 \u003d (w 1 - w 0) r 1 \u003d (2100-2000) * 100 \u003d 10000.

Tehát a tényezők együttes hatása a következő volt:

1. Abszolút értékben

10000 + 20000 = 30000

2. Relatív értelemben

1,11 * 1,05 = 1,16 (116%)

A növekedés tehát 1,16%-os. Mindkét eredmény született már korábban.

Az "index" szó fordításban mutatót, indikátort jelent. A statisztikában az indexet relatív mutatóként értelmezik, amely egy jelenség időben, térben vagy a tervhez viszonyított változását jellemzi. Mivel az index relatív érték, az indexek nevei összhangban vannak a relatív értékek nevével.

Azokban az esetekben, amikor egy összehasonlított termék időbeli változását elemezzük, feltehetjük a kérdést, hogy hogyan különféle feltételek(különböző területeken) változnak az index összetevői (bizonyos terméktípusok ára, fizikai mennyiség, termelési vagy értékesítési szerkezet). Ebben a tekintetben állandó összetételű, változó összetételű és szerkezeti eltolódású indexek épülnek fel.

Állandó (rögzített) összetételi index - ez egy olyan index, amely az átlagérték dinamikáját jellemzi a sokaság azonos fix szerkezetével.

Az állandó összetételű index felépítésének elve az, hogy kiküszöböljük a súlyok szerkezetében bekövetkezett változások hatását az indexált értékre, az indexált mutató súlyozott átlagának azonos súlyokkal történő kiszámításával.

Az állandó összetétel indexe formailag megegyezik az aggregált indexszel. Az összesített forma a leggyakoribb.

A konstans összetételi indexet bármely időszak egyik szintjén rögzített súlyokkal számítják ki, és csak az indexált érték változását mutatja. Az állandó összetételi index kiküszöböli a súlyok szerkezetében bekövetkezett változások hatását az indexált értékre azáltal, hogy az indexált mutató súlyozott átlagos szintjét azonos súlyokkal számítja ki. Az állandó összetételű indexekben a jelenségek állandó szerkezete alapján számított mutatókat hasonlítják össze.

A társadalmi-gazdasági jelenségek és folyamatok vizsgálatának legfontosabb állomása a primer adatok rendszerezése, és ennek alapján a teljes objektumra jellemző összesítő jellemző megszerzése általánosító mutatók segítségével, amely a primer statisztikai anyagok összegzésével és csoportosításával érhető el.

Statisztikai összefoglaló - ez szekvenciális műveletek komplexuma, amelyek egy halmazt alkotó egyedi tények általánosítására, a vizsgált jelenség egészében rejlő tipikus jellemzők és minták azonosítására szolgálnak. A statisztikai összesítés elkészítése a következő lépéseket tartalmazza :

  • a csoportosítási jellemző kiválasztása;
  • a csoportok kialakításának sorrendjének meghatározása;
  • rendszerfejlesztés statisztikai mutatók csoportok és a tárgy egészének jellemzésére;
  • statisztikai táblázatok elrendezésének kidolgozása az összesített eredmények bemutatásához.

Statisztikai csoportosítás a vizsgált sokaság egységeinek homogén csoportokra való felosztását nevezzük bizonyos, számukra lényeges jellemzők szerint. A csoportosítás a statisztikai adatok összesítésének legfontosabb statisztikai módszere, a statisztikai mutatók helyes számításának alapja.

A következő típusú csoportosítások léteznek: tipológiai, szerkezeti, elemző. Mindezeket a csoportosításokat az egyesíti, hogy az objektum egységeit valamilyen attribútum szerint csoportokra osztják.

csoportosító jel az a jel, amellyel a sokaság egységeit külön csoportokra osztják. Tól től jó választás csoportosítási jellemzője a statisztikai vizsgálat következtetéseitől függ. A csoportosítás alapjaként szignifikáns, elméletileg alátámasztott (mennyiségi vagy minőségi) jellemzők alkalmazása szükséges.

A csoportosulás mennyiségi jelei számszerű kifejezéssel kell rendelkeznie (kereskedési volumen, személy életkora, családi jövedelme stb.), és a csoportosítás minőségi jellemzői tükrözi a népességi egység állapotát (nem, családi állapot, a vállalkozás iparági hovatartozása, tulajdonosi formája stb.).

A csoportosítás alapjainak meghatározása után el kell dönteni, hogy a vizsgált populációt hány csoportra kell felosztani. A csoportok száma függ a vizsgálat céljaitól és a csoportosítás alapjául szolgáló indikátor típusától, a populáció mennyiségétől, a tulajdonság variációs fokától.

Például a vállalkozások tulajdonosi formák szerinti csoportosítása figyelembe veszi az önkormányzati, szövetségi és a szövetség alanyai vagyonát. Ha a csoportosítás mennyiségi alapon történik, akkor invertálni kell Speciális figyelem a vizsgált objektum egységeinek számáról és a csoportosítási attribútum fluktuációjának mértékéről.

A csoportok számának meghatározásakor meg kell határozni a csoportosítási intervallumokat. Intervallum - ezek egy változó jellemző értékei, amelyek bizonyos határokon belül vannak. Minden intervallumnak megvan a maga értéke, felső és alsó határa, vagy legalább az egyik.

Az intervallum alsó határa az attribútum legkisebb értékének nevezzük az intervallumban, és felső határ - az attribútum legnagyobb értéke az intervallumban. Az intervallum értéke a felső és alsó határ közötti különbség.

A csoportosítási intervallumok méretüktől függően a következők: egyenlő és egyenlőtlen. Ha a tulajdonság variációja viszonylag szűk határokban nyilvánul meg, és az eloszlás egyenletes, akkor egyenlő intervallumokkal csoportosítást építünk. Az egyenlő intervallum értékét a következő képlet határozza meg :

ahol Xmax, Xmin - az attribútum maximális és minimális értéke az aggregátumban; n a csoportok száma.

A legegyszerűbb csoportosítás, amelyben minden kiválasztott csoportot egy mutató jellemez, egy eloszlási sorozat.

Statisztikai eloszlási sorozat - ez a népességi egységek rendezett elosztása csoportokba egy bizonyos tulajdonság szerint. Attól függően, hogy az eloszlási sorozatok kialakulásának hátterében milyen tulajdonság áll, megkülönböztetünk attribúciós és variációs eloszlási sorozatokat.

jelző minőségi jellemzők szerint felépített eloszlási sorozatoknak nevezik, vagyis olyan jeleknek, amelyeknek nincs számszerű kifejezésük (munkatípus, nem, szakma szerinti megoszlás stb.). Az attribútum-eloszlási sorozatok a sokaság összetételét jellemzik egyik vagy másik lényeges jellemző szerint. Ezek az adatok több időszakot átvéve lehetővé teszik a szerkezet változásának tanulmányozását.

Változatos sorok mennyiségi alapon felépített disztribúciós sorozatnak nevezzük. Bármely variációs sorozat két elemből áll: változatokból és frekvenciákból. Lehetőségek az attribútum egyedi értékeit, amelyeket a variációs sorozatban vesz fel, nevezzük, vagyis a változó attribútumának konkrét értékét.

Frekvenciák az egyes változatok vagy az egyes csoportok számának nevezzük variációs sorozat, vagyis ezek olyan számok, amelyek azt mutatják meg, hogy bizonyos opciók milyen gyakran fordulnak elő a terjesztési sorozatban. Az összes gyakoriság összege határozza meg a teljes populáció méretét, mennyiségét. Frekvenciák frekvenciákat hívnak, egy egység töredékében vagy az összérték százalékában kifejezve. Ennek megfelelően a frekvenciák összege 1 vagy 100%.

A tulajdonság variációjának természetétől függően a variációs sorozat három formáját különböztetjük meg: rangsorolt ​​sorozat, diszkrét sorozatés intervallum sorozat.

Rangsorolt ​​variációs sorozat - ez a populáció egyes egységeinek megoszlása ​​a vizsgált tulajdonság növekvő vagy csökkenő sorrendjében. A rangsorolás megkönnyíti a mennyiségi adatok csoportokra bontását, azonnali észlelését a legkisebb ill legnagyobb érték funkció, jelölje ki a leggyakrabban ismétlődő értékeket.

Diszkrét variációs sorozat a populációs egységek eloszlását egy diszkrét attribútum szerint jellemzi, amely csak egész értékeket vesz fel. Például a tarifakategória, a családban lévő gyermekek száma, a vállalkozásban foglalkoztatottak száma stb.

Ha egy tábla folyamatos változást mutat, amely bizonyos határokon belül bármilyen értéket felvehet ("-tól -ig"), akkor ehhez a táblához meg kell építeni intervallum variációs sorozat . Például a jövedelem összege, a munkatapasztalat, a vállalkozás tárgyi eszközeinek költsége stb.

Példák a "Statisztikai összefoglalás és csoportosítás" témakörben a problémák megoldására

1. feladat . A hallgatók által előfizetéssel beérkezett könyvek számáról van információ az elmúlt tanévben.

Hozzon létre egy tartományos és diszkrét variációs eloszlás sorozatot, amely a sorozat elemeit jelöli.

Megoldás

Ez a készlet a tanulók által megkapott könyvek számának beállítására szolgál. Számoljuk meg az ilyen változatok számát, és rendezzük őket variációs rangsorolt ​​és variációs diszkrét eloszlási sorozatokba.

2. feladat . 50 vállalkozás tárgyi eszközeinek értékéről van adat, ezer rubel.

Készítsen elosztási sorozatot, kiemelve 5 vállalkozáscsoportot (egyenlő időközönként).

Megoldás

A megoldáshoz a vállalkozások tárgyi eszközeinek költségének legnagyobb és legkisebb értékét választjuk. Ezek 30,0 és 10,2 ezer rubel.

Keresse meg az intervallum méretét: h \u003d (30,0-10,2): 5 \u003d 3,96 ezer rubel.

Ezután az első csoportba a vállalkozások tartoznak, amelyek befektetett eszközeinek összege 10,2 ezer rubel. legfeljebb 10,2 + 3,96 = 14,16 ezer rubel. 9 ilyen vállalkozás lesz. A második csoportba azok a vállalkozások tartoznak, amelyek befektetett eszközeinek összege 14,16 ezer rubeltől lesz. legfeljebb 14,16 + 3,96 = 18,12 ezer rubel. 16 ilyen vállalkozás lesz, hasonlóan a harmadik, negyedik és ötödik csoportba tartozó vállalkozások számát.

A kapott eloszlási sorozat a táblázatba kerül.

3. feladat . Számos könnyűipari vállalkozás esetében a következő adatokat kaptuk:

Készítse el a vállalkozások csoportosítását a dolgozók száma szerint, egyenlő időközönként 6 csoportot alkotva! Számolj minden csoporthoz:

1. vállalkozások száma
2. dolgozók száma
3. a gyártott termékek mennyisége évente
4. átlagos tényleges kibocsátás munkavállalónként
5. befektetett eszközök összege
6. az átlagos méret egy vállalkozás befektetett eszközei
7. átlagos érték egy vállalkozás által gyártott termékek

A számítások eredményét rögzítse táblázatokba! Vonja le saját következtetéseit.

Megoldás

A megoldáshoz a vállalkozás átlagos dolgozóinak legnagyobb és legkisebb értékét választjuk. Ez a 43 és a 256.

Határozza meg az intervallum méretét: h = (256-43): 6 = 35,5

Ekkor az első csoportba azok a vállalkozások tartoznak, amelyek átlagos létszáma 43-43 + 35,5 = 78,5 fő. 5 ilyen vállalkozás lesz, a második csoportba azok a vállalkozások tartoznak, amelyekben az átlagos dolgozói létszám 78,5-78,5 + 35,5 = 114 fő lesz. 12 ilyen vállalkozás lesz, hasonlóan a harmadik, negyedik, ötödik és hatodik csoportba tartozó vállalkozások számát.

Az így kapott eloszlási sorozatokat táblázatba foglaljuk, és minden csoporthoz kiszámítjuk a szükséges mutatókat:

Következtetés : A táblázatból látható, hogy a vállalkozások második csoportja a legtöbb. 12 vállalkozást foglal magában. A legkisebb az ötödik és hatodik csoport (két-két vállalkozás). Ezek a legnagyobb vállalkozások (a dolgozók számát tekintve).

Mivel a második csoport a legtöbb, az ebbe a csoportba tartozó vállalkozások éves kibocsátásának volumene és a tárgyi eszközök volumene jóval magasabb, mint másoké. Ugyanakkor az egy dolgozó átlagos tényleges kibocsátása e csoport vállalkozásainál nem a legmagasabb. Itt a negyedik csoport vállalkozásai állnak az élen. Ez a csoport is meglehetősen nagy mennyiségű befektetett eszközt tesz ki.

Összegzésképpen megjegyezzük, hogy egy vállalkozás befektetett eszközeinek átlagos mérete és kibocsátásának átlagos értéke egyenesen arányos a vállalkozás méretével (a dolgozók számát tekintve).

Építéskor intervallum sorozat Az elosztás három kérdéssel foglalkozik:

  • 1. Hány intervallumot vegyek?
  • 2. Milyen hosszúak az intervallumok?
  • 3. Mi az eljárás a népességegységek beszámítására az intervallumok határai közé?
  • 1. Az intervallumok száma alapján határozható meg Sturgess formula:

2. Intervallum hossza vagy intervallum lépése, általában a képlet határozza meg

ahol R- variációs tartomány.

3. A népességegységek beszámításának sorrendje az intervallum határaiba

eltérő lehet, de egy intervallumsor felépítésénél az eloszlás szükségszerűen szigorúan meghatározott.

Például ez: [), amelyben a sokaság egységei szerepelnek az alsó korlátokban, és nem szerepelnek a felső korlátokban, hanem átkerülnek a következő intervallumba. Ez alól a szabály alól kivétel az utolsó intervallum , amelynek felső határa a rangsorolt ​​sorozat utolsó számát tartalmazza.

Az intervallumok határai a következők:

  • zárt - az attribútum két szélső értékével;
  • open - az attribútum egy szélső értékével (előtt valamilyen szám ill felett ilyen szám).

Az elméleti anyag befogadása érdekében bemutatjuk háttér-információ megoldásokért feladatokon keresztül.

Feltételes adatok állnak rendelkezésre az értékesítési vezetők átlagos számáról, az általuk értékesített egyedi minőségű áruk számáról, a termék egyedi piaci áráról, valamint 30 cég értékesítési volumenéről az Orosz Föderáció egyik régiójában. a tárgyév első negyedévében (2.1. táblázat).

2.1. táblázat

Kezdeti információk egy átfogó feladathoz

népesség

vezetők

Ár, ezer rubel

Eladási mennyiség, millió rubel

népesség

vezetők

Eladott áruk mennyisége, db.

Ár, ezer rubel

Eladási mennyiség, millió rubel

A kezdeti információk, valamint a további információk alapján egyedi feladatokat állítunk fel. Ezután bemutatjuk ezek megoldásának módszertanát és magukat a megoldásokat.

Átfogó feladat. Feladat 2.1

Az eredeti adattábla használata. 2.1 szükségesépítsünk fel egy diszkrét sorozatot a cégek megoszlására az eladott áruk száma alapján (2.2. táblázat).

Megoldás:

2.2. táblázat

A cégek megoszlásának diszkrét sorozata az Orosz Föderáció egyik régiójában eladott áruk száma szerint a jelentési év első negyedévében

Átfogó feladat. Feladat 2.2

kívánt 30 cégből álló rangsorolt ​​sorozatot készítsen a vezetők átlagos száma alapján.

Megoldás:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

Átfogó feladat. Feladat 2.3

Az eredeti adattábla használata. 2.1, kívánt:

  • 1. Készítsen intervallumsort a cégek vezetők száma szerinti megoszlására!
  • 2. Számítsa ki a cégek eloszlási sorozatának gyakoriságát!
  • 3. vonjon le következtetéseket.

Megoldás:

Számítsa ki a Sturgess-formulával (2.5) intervallumok száma:

Így 6 intervallumot (csoportot) veszünk.

Intervallum hossza, vagy intervallum lépés, számítsa ki a képlet alapján

Jegyzet. A sokaság egységeinek beszámítási sorrendje az intervallum határaiba a következő: I), amelyben a sokaság egységei az alsó határokba kerülnek, a felső határokba nem, hanem átkerülnek a következőbe. intervallum. Ez alól a szabály alól kivétel az utolsó I ] intervallum, amelynek felső határa tartalmazza a rangsorolt ​​sorozat utolsó számát.

Intervallumsort készítünk (2.3. táblázat).

A cégek megoszlásának intervallumsorozata, de az Orosz Föderáció egyik régiójában a vezetők átlagos száma a jelentési év első negyedévében

Következtetés. A legnépesebb cégcsoport az átlagosan 25-30 fős vezetői létszámú csoport, amelybe 8 cég tartozik (27%); a legkisebb, átlagosan 40-45 fős vezetői létszámú csoportba csak egy cég tartozik (3%).

Az eredeti adattábla használata. 2.1, valamint a cégek vezetői létszám szerinti megoszlásának intervallumsorát (2.3. táblázat), kívánt elemző csoportosítást készít a vezetők száma és a cégek értékesítési volumene közötti kapcsolatról, és ennek alapján von le következtetést a jelzett jelek közötti kapcsolat meglétéről (vagy hiányáról).

Megoldás:

Az elemző csoportosítás faktor alapon épül fel. Feladatunkban a faktorjel (x) a vezetők száma, az eredő jel (y) pedig az értékesítési volumen (2.4. táblázat).

Most építkezzünk elemző csoportosítás(2.5. táblázat).

Következtetés. A felépített elemző csoportosítás adatai alapján elmondható, hogy az értékesítési menedzserek számának növekedésével a csoportba tartozó vállalat átlagos értékesítési volumene is növekszik, ami e tulajdonságok közötti közvetlen kapcsolat meglétét jelzi.

2.4. táblázat

Segédtábla analitikai csoportosítás felépítéséhez

Vezetők, személyek száma,

Céges szám

Értékesítési mennyiség, millió rubel, y

» = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U4 = 7 = 10,61

nál nél = ’ =10,31 30

2.5. táblázat

Az értékesítési volumenek függősége a cégvezetők számától az Orosz Föderáció egyik régiójában a jelentési év első negyedévében

TESZTKÉRDÉSEK
  • 1. Mi a statisztikai megfigyelés lényege?
  • 2. Nevezze meg a statisztikai megfigyelés szakaszait!
  • 3. Melyek a statisztikai megfigyelés szervezeti formái?
  • 4. Nevezze meg a statisztikai megfigyelés típusait!
  • 5. Mi az a statisztikai összesítés?
  • 6. Nevezze meg a statisztikai jelentések típusait!
  • 7. Mi az a statisztikai csoportosítás?
  • 8. Nevezze meg a statisztikai csoportosítások típusait!
  • 9. Mi az elosztási sorozat?
  • 10. Nevezze meg az eloszlássorozat szerkezeti elemeit!
  • 11. Mi az eljárás az eloszlássorozat felépítéséhez?

Példa egy teszt megoldására a matematikai statisztikában

1. feladat

Kezdeti adatok : egy bizonyos 30 fős csoport diákjai sikeresen vizsgáztak az „Informatika” kurzusból. A tanulók által kapott osztályzatok a következő számsorokat alkotják:

I. Készítsen variációs sorozatot

m x

w x

m x nak

w x nak

Teljes:

II. Statisztikai információk grafikus ábrázolása.

III. A minta numerikus jellemzői.

1. Számtani közép

2. Geometriai átlag

3. Divat

4. Medián

222222333333333 | 3 34444444445555

5. Minta szórása

7. Variációs együttható

8. Aszimmetria

9. Aszimmetria együttható

10. Kurtosis

11. Kurtosis együttható

2. feladat

Kezdeti adatok : egy bizonyos csoport tanulói zárótesztet írtak. A csoport 30 főből áll. A tanulók által elért pontszámok a következő számsort alkotják

Megoldás

I. Mivel az előjel sok különböző értéket vesz fel, ezért intervallum variációs sorozatot készítünk neki. Ehhez először beállítjuk az intervallum értékét h. Használjuk a Sturger-képletet

Készítsünk intervallumskálát. Ebben az esetben az első intervallum felső határához a képlet által meghatározott értéket vesszük:

A következő intervallumok felső határait a következő rekurzív képlet határozza meg:

, akkor

Befejezzük az intervallumskálát, mivel a következő intervallum felső határa nagyobb vagy egyenlő lett, mint a minta maximális értéke
.

II. Az intervallumvariáció-sorozat grafikus megjelenítése

III. A minta numerikus jellemzői

A minta numerikus jellemzőinek meghatározásához egy segédtáblázatot készítünk

Összeg:

1. Számtani közép

2. Geometriai átlag

3. Divat

4. Medián

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Minta szórása

6. Minta szórása

7. Variációs együttható

8. Aszimmetria

9. Aszimmetria együttható

10. Kurtosis

11. Kurtosis együttható

3. feladat

Állapot : az ampermérő skála osztásának értéke 0,1 A. A mért értékeket a legközelebbi egész osztásra kerekítjük. Határozza meg annak valószínűségét, hogy a leolvasás során 0,02 A-nél nagyobb hiba történik.

Megoldás.

A kerekítési hiba valószínűségi változónak tekinthető x, amely egyenletesen oszlik el két szomszédos egész osztás közötti intervallumban. Az egyenletes eloszlás sűrűsége

ahol
- a lehetséges értékeket tartalmazó intervallum hossza x; ezen az intervallumon kívül
Ebben a feladatban a lehetséges értékeket tartalmazó intervallum hossza x, egyenlő 0,1-gyel, tehát

Az olvasási hiba meghaladja a 0,02-t, ha az intervallumban (0,02; 0,08) szerepel. Akkor

Válasz: R=0,6

4. feladat

Kiinduló adatok: egy normál eloszlású jellemző matematikai elvárása és szórása x 10, illetve 2. Határozzuk meg annak valószínűségét, hogy a teszt eredményeként x a (12, 14) intervallumban lévő értéket veszi fel.

Megoldás.

Használjuk a képletet

És az elméleti frekvenciák

Megoldás

x neki várható érték M(X) és D(X) variancia. Megoldás. Keresse meg egy valószínűségi változó F(x) eloszlásfüggvényét... mintavételi hiba). Komponáljunk variációs sor Intervallum szélessége lesz: Minden értékhez sor Számítsuk ki, hány...

  • Megoldás: elválasztható egyenlet

    Megoldás

    Privát keresése űrlapon megoldásokat inhomogén egyenlet összeállít rendszer Oldjuk meg a kapott rendszert... ; +47; +61; +10; -nyolc. Építési intervallum variációs sor. Adjon statisztikai becsléseket az átlagról...

  • Megoldás: Számítsunk lánc- és alap abszolút növekedési rátákat, növekedési ütemeket, növekedési ütemeket. A kapott értékeket az 1. táblázat foglalja össze

    Megoldás

    A termelés mennyisége. Megoldás: intervallum számtani átlaga variációs sor a következőképpen számolva: per... Marginális mintavételi hiba 0,954 valószínűséggel (t=2) lesz: Δ w = t*μ = 2*0,0146 = 0,02927 Határozzuk meg a határokat...

  • Megoldás. jel

    Megoldás

    Kinek a munkatapasztalatáról és elérte minta. Az átlagos szolgálati idő a minta ... ezen alkalmazottak munkanapjából és elérte minta. A minta átlagos időtartama... 1,16, szignifikancia szint α = 0,05. Megoldás. variációs sor ennek a mintának az alakja: 0,71 ...

  • Biológia munkatanterv 10-11. osztályosoknak Összeállította: Polikarpova S. V.

    dolgozó tréning program

    A legegyszerűbb keresztezési sémák» 5 L.r. " Megoldás elemi genetikai problémák” 6 L.r. " Megoldás elemi genetikai problémák” 7 L.r. "..., 110, 115, 112, 110. Smink variációs sor, húz variációs görbe, keresse meg a jellemző átlagos értékét ...

  • Matematikai statisztika- a matematika egyik ága matematikai módszerek statisztikai adatok feldolgozása, rendszerezése és felhasználása tudományos és gyakorlati következtetésekhez.

    3.1. A MATEMATIKAI STATISZTIKA ALAPVETŐ FOGALMAI

    Orvosbiológiai problémáknál gyakran szükséges egy-egy tulajdonság megoszlását nagyon nagy számú egyed esetében vizsgálni. Különböző egyéneknél ez a funkció megvan eltérő jelentése, tehát ez egy valószínűségi változó. Például bármely terápiás gyógyszer eltérő hatást fejt ki, ha különböző betegeknél alkalmazzák. Ahhoz azonban, hogy képet kapjunk ennek a gyógyszernek a hatékonyságáról, nem szükséges alkalmazni mindenki beteg. Viszonylag kis betegcsoportra lehet nyomon követni a gyógyszer alkalmazásának eredményeit, és a kapott adatok alapján azonosítani a kezelési folyamat lényeges jellemzőit (hatékonyság, ellenjavallatok).

    Népesség- a vizsgálandó homogén elemek halmaza, amelyet valamilyen tulajdonság jellemez. Ez a jel az folyamatos valószínűségi változó eloszlássűrűséggel f(x).

    Például, ha arra vagyunk kíváncsiak, hogy egy adott régióban milyen elterjedt egy betegség, akkor az általános népesség a régió teljes lakossága. Ha külön-külön akarjuk kideríteni a férfiak és nők e betegségre való hajlamát, akkor két általános populációt kell figyelembe venni.

    A tulajdonságok tanulmányozására népesség válasszon néhány elemet.

    Minta- az általános populáció vizsgálatra (kezelésre) kiválasztott része.

    Ha ez nem okoz zavart, akkor a mintát ún tárgyak gyűjteménye vizsgálatra kiválasztott, és totalitás

    értékeket a vizsgált tulajdonságról, amelyet a vizsgálat során szereztek meg. Ezeket az értékeket többféleképpen ábrázolhatjuk.

    Egyszerű statisztikai sorozat - a vizsgált tulajdonság értékei, rögzítésük sorrendjében.

    A táblázatban látható egy példa egy egyszerű statisztikai sorozatra, amelyet 20 beteg homlokbőrének felületi hullámsebességének (m/s) mérésével kaptunk. 3.1.

    3.1. táblázat.Egyszerű statisztikai sorozat

    Az egyszerű statisztikai sorozat a felmérési eredmények rögzítésének fő és legteljesebb módja. Több száz elemet tartalmazhat. Nagyon nehéz egy ilyen aggregátumot egy pillantással megnézni. Ezért a nagy mintákat általában csoportokra osztják. Ehhez az attribútum változási területét több részre osztják (N) időközönként egyenlő szélességű, és számítsa ki az ezekbe az intervallumokba eső jellemző relatív gyakoriságát (n/n). Az egyes intervallumok szélessége:

    Az intervallumok határainak jelentése a következő:

    Ha a minta bármely eleme a határ két szomszédos intervallum között, akkor erre úgy hivatkozunk, mint bal intervallum. Az így csoportosított adatokat ún intervallum statisztikai sorozat.

    - ez egy táblázat, amely a tulajdonság értékeinek intervallumait és az ezekbe az intervallumokba eső tulajdonságok relatív gyakoriságait mutatja.

    Esetünkben kialakíthatunk például egy ilyen intervallum statisztikai sorozatot (N = 5, d= 4), tab. 3.2.

    3.2. táblázat.Intervallum statisztikai sorozatok

    Itt két 28-cal egyenlő érték van hozzárendelve a 28-32 intervallumhoz (3.1 táblázat), a 32, 33, 34 és 35 pedig a 32-36 intervallumhoz.

    Egy intervallum statisztikai sorozat grafikusan ábrázolható. Ehhez a jellemző értékek intervallumait az abszcissza tengely mentén ábrázolják, és mindegyikre, mint az alapra, egy téglalapot építenek, amelynek magassága megegyezik a relatív gyakorisággal. Az így kapott oszlopdiagramot ún hisztogram.

    Rizs. 3.1. oszlopdiagram

    A hisztogramon elég jól láthatóak a jellemző eloszlásának statisztikai mintái.

    Nagy mintamérettel (több ezer) és kis oszlopszélességgel a hisztogram alakja közel áll a grafikon alakjához eloszlási sűrűség jel.

    A hisztogram oszlopainak száma a következő képlettel választható ki:

    A hisztogram kézi elkészítése hosszú folyamat. Ezért kifejlesztett számítógépes programok automatikus felépítésükhöz.

    3.2. A STATISZTIKAI SOROK SZÁMÚ JELLEMZŐI

    Számos statisztikai eljárás mintabecsléseket használ a sokaság átlagára és szórására (vagy szórására).

    minta átlag(X) egy egyszerű statisztikai sorozat összes elemének számtani átlaga:

    A mi példánkra x= 37,05 (m/s).

    A minta átlagaa legjobbaz általános átlag becsléseM.

    Minta variancia s 2 egyenlő az elemek mintaátlagtól való eltérésének négyzetes összegével osztva n- 1:

    Példánkban s 2 \u003d 25,2 (m / s) 2.

    Felhívjuk figyelmét, hogy a minta szórásának számításakor a képlet nevezője nem az n mintanagyság, hanem az n-1. Ennek oka az a tény, hogy a (3.3) képletben az eltérések kiszámításakor az ismeretlen matematikai elvárás helyett annak becslését használják - minta átlag.

    A minta szórása az a legjobb az általános variancia becslése (σ 2).

    Minta szórása(s) van Négyzetgyök a minta eltéréséből:

    A mi példánkra s= 5,02 (m/s).

    szelektív rms eltérés az általános RMSE (σ) legjobb becslése.

    A minta méretének korlátlan növekedésével minden mintajellemző az általános sokaság megfelelő jellemzőihez igazodik.

    A minta jellemzőinek kiszámításához számítógépes képleteket használnak. Az Excelben ezek a számítások az AVERAGE, VARR statisztikai függvényeket hajtják végre. STDEV.

    3.3. INTERVALLUM BECSLÉS

    A minta összes jellemzője véletlenszerű értékek. Ez azt jelenti, hogy egy másik, azonos méretű mintánál a minta jellemzőinek értékei eltérőek lesznek. Így szelektív

    jellemzők csak becslések a lakosság releváns jellemzői.

    Kompenzálja a szelektív értékelés hiányosságait intervallum becslés, képviselő szám intervallum, amelyen belül adott valószínűséggel R d megtaláljuk a becsült paraméter valódi értékét.

    Hadd U r - az általános sokaság valamely paramétere (általános átlag, általános variancia stb.).

    intervallum becslés Az U r paramétert intervallumnak nevezzük (U 1, U 2), megfelel a feltételnek:

    P(U < Ur < U2) = Рд. (3.5)

    Valószínűség R d hívott megbízhatósági valószínűség.

    Bizalmi valószínűség Рd - annak a valószínűsége, hogy a becsült mennyiség valódi értéke belül a megadott intervallum.

    Ugyanakkor az intervallum (U 1, U 2) hívott megbízhatósági intervallum a becsült paraméterhez.

    Gyakran a konfidenciavalószínűség helyett a hozzá tartozó α = 1 - R d érték, amelyet ún. szignifikancia szintje.

    Jelentősségi szint annak a valószínűsége, hogy a becsült paraméter valódi értéke kívülmegbízhatósági intervallum.

    Néha az α-t és az Rd-t százalékban fejezik ki, például 0,05 helyett 5%, 0,95 helyett 95%.

    Az intervallumbecslésnél először válassza ki a megfelelőt bizalmi szint(általában 0,95 vagy 0,99), majd keresse meg a becsült paraméter értékeinek megfelelő intervallumát.

    Néhányat megjegyezünk általános tulajdonságok intervallumbecslések.

    1. Minél alacsonyabb a szignifikancia szint (annál több R d), minél szélesebb az intervallumbecslés. Tehát, ha 0,05 szignifikancia szinten az általános átlag intervallumbecslése 34,7< M< 39,4, то для уровня 0,01 она будет гораздо шире: 33,85 < M< 40,25.

    2. Minél nagyobb a minta mérete n, annál szűkebb az intervallumbecslés a kiválasztott szignifikanciaszint mellett. Legyen például 5 a 20 elemből álló mintából kapott általános átlag (β=0,05) százalékos becslése, majd 34,7< M< 39,4.

    A minta méretét 80-ra növelve pontosabb becslést kapunk ugyanazon a szignifikancia szinten: 35,5< M< 38,6.

    NÁL NÉL általános eset megbízható megbízhatósági becslések felépítéséhez szükség van annak a törvénynek a ismeretére, amely szerint a becsült véletlenszerű jellemző megoszlik az általános sokaságban. Fontolja meg, hogyan épül fel az intervallumbecslés Általános átlag vonás, amely a szerint oszlik meg az általános populációban Normál törvény.

    3.4. AZ ÁLTALÁNOS KÖZÉP BECSLÉSE A NORMÁL FORGALMAZÁSI TÖRVÉNY SZÁMÁRA

    Az általános M általános átlag intervallumbecslésének megalkotása egy általános sokaságra normál eloszlási törvény mellett a következő tulajdonságon alapul. Térfogatmintavételhez n hozzáállás

    engedelmeskedik a ν = szabadságfokszámú Student-eloszlásnak n- 1.

    Itt x a minta átlaga, és s- szelektív szórás.

    A Student-féle eloszlási táblák vagy számítógépes analógja segítségével olyan határértéket találhatunk, amely adott valószínűséggel teljesül a következő egyenlőtlenség:

    Ez az egyenlőtlenség megfelel az M egyenlőtlenségének:

    ahol ε a konfidencia intervallum fele.

    Így az M konfidenciaintervallumának felépítése a következő sorrendben történik.

    1. Válassza ki a P d konfidenciavalószínűséget (általában 0,95 vagy 0,99), és ehhez a Student-féle eloszlási táblázat szerint megtalálja a t paramétert.

    2. Számítsa ki az ε konfidenciaintervallum félszélességét:

    3. Megkapjuk az általános átlag intervallumbecslését a kiválasztott megbízhatósági valószínűséggel:

    Röviden így van leírva:

    Számítógépes eljárásokat fejlesztettek ki az intervallumbecslések megtalálására.

    Elmagyarázzuk, hogyan kell használni a Student-féle eloszlási táblát. Ennek a táblázatnak két "bejárata" van: a bal oldali oszlop, amelyet a szabadságfokok száma ν = n- 1, a legfelső sor pedig az α szignifikanciaszint. A megfelelő sor és oszlop metszéspontjában található a Student-féle együttható t.

    Alkalmazzuk ezt a módszert a mintánkra. Az alábbiakban a Student eloszlási táblázatának egy részlete látható.

    3.3. táblázat. A Student eloszlási táblázatának töredéke

    Egy egyszerű statisztikai sorozat 20 fős mintára (n= 20, ν =19) a táblázatban látható. 3.1. Ennél a sorozatnál a (3.1-3.3) képletekkel végzett számítások a következőket adják: x= 37,05; s= 5,02.

    Válasszunk α=0,05 (Pd=0,95). A "19" sor és a "0.05" oszlop metszéspontjában találjuk t= 2,09.

    Számítsuk ki a becslési pontosságot a (3.6) képlettel: ε = 2,09?5,02/λ /20 = 2,34.

    Építsünk intervallumbecslést: 95%-os valószínűséggel az ismeretlen általános átlag kielégíti az egyenlőtlenséget:

    37,05 - 2,34 < M< 37,05 + 2,34, или M= 37,05 ± 2,34 (m/s), Р d = 0,95.

    3.5. A STATISZTIKAI HIPOTÉZISEK ELLENŐRZÉSÉNEK MÓDSZEREI

    Statisztikai hipotézisek

    Mielőtt megfogalmazná, mi a statisztikai hipotézis, nézze meg a következő példát.

    Egy bizonyos betegség kezelésének két módszerének összehasonlítására két, egyenként 20 fős betegcsoportot választottak ki, amelyek kezelését ezen módszerek szerint végezték. Minden betegnél a az eljárások száma pozitív hatás követi. Ezen adatok szerint minden csoportnál mintaátlagokat (X), mintavarianciákat találtunk (s 2)és minta RMS (s).

    Az eredményeket táblázatban mutatjuk be. 3.4.

    3.4. táblázat

    A pozitív hatás eléréséhez szükséges eljárások száma egy valószínűségi változó, amelyről minden információ be van kapcsolva Ebben a pillanatban a mintában található.

    Táblázatból. A 3.4 azt mutatja, hogy a minta átlaga az első csoportban kisebb, mint a másodikban. Ez azt jelenti, hogy ugyanaz az arány érvényes az általános átlagokra: M 1< М 2 ? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает hipotézisek statisztikai tesztelése.

    Statisztikai hipotézis- ez egy feltételezés a populációk tulajdonságairól.

    Megfontoljuk a tulajdonságokkal kapcsolatos hipotéziseket kétáltalános populációk.

    Ha a populációk rendelkeznek ismert, ugyanaz a becsült érték eloszlása, és a feltételezések a mennyiségekre vonatkoznak valamilyen paramétert ezt az eloszlást, akkor a hipotéziseket ún parametrikus. Például a mintákat olyan populációkból veszik, amelyek normális törvény eloszlás és egyenlő szórás. Ennek kiderítése kötelező ugyanazok ezen populációk általános átlagai.

    Ha semmit sem tudunk az általános populációk eloszlásának törvényeiről, akkor a tulajdonságaikra vonatkozó hipotéziseket nevezzük nem paraméteres. Például, ugyanazok azon populációk eloszlási törvényei, amelyekből a mintákat veszik.

    Null és alternatív hipotézisek.

    A hipotézisek tesztelésének feladata. Jelentősségi szint

    Ismerkedjünk meg a hipotézisvizsgálat során használt terminológiával.

    H 0 - nullhipotézis (szkeptikus hipotézis) - ez egy hipotézis körülbelül semmi különbségösszehasonlított minták között. A szkeptikus úgy véli, hogy a kutatás eredményeiből nyert mintabecslések közötti eltérések véletlenszerűek;

    H 1- az alternatív hipotézis (az optimista hipotézis) az összehasonlított minták közötti különbségek meglétére vonatkozó hipotézis. Az optimista úgy véli, hogy a mintabecslések közötti különbségeket objektív okok okozzák, és megfelelnek az általános sokaságban tapasztalható különbségeknek.

    A statisztikai hipotézisek tesztelése csak akkor valósítható meg, ha az összehasonlított minták elemei felhasználhatók valamilyen érték(kritérium), melynek elosztási törvénye méltányosság esetén H 0 ismert. Ezután ennél a mennyiségnél meg lehet adni megbízhatósági intervallum, amelybe adott valószínűséggel R d megkapja az értékét. Ezt az intervallumot ún kritikus terület. Ha a kritériumérték a kritikus tartományba esik, akkor a hipotézist elfogadjuk H 0 . Ellenkező esetben a H 1 hipotézist elfogadjuk.

    Az orvosi kutatásban P d = 0,95 vagy P d = 0,99 használják. Ezek az értékek megfelelnek szignifikancia szintekα = 0,05 vagy α = 0,01.

    Statisztikai hipotézisek tesztelésekorszignifikancia szintje(α) a nullhipotézis elutasításának valószínűsége, ha igaz.

    Vegye figyelembe, hogy a hipotézisvizsgálati eljárás lényegében arra irányul különbség észlelése, hogy ne erősítsék meg távollétüket. Amikor a kritériumérték túllép a kritikus területen, akkor tiszta szívből mondhatjuk, hogy „szkeptikus” - nos, mit akarsz még?! Ha nem lennének eltérések, akkor 95%-os (vagy 99%-os) valószínűséggel a számított érték a megadott határokon belül lenne. Szóval nem!..

    Nos, ha a kritérium értéke a kritikus tartományba esik, akkor nincs okunk azt hinni, hogy a H 0 hipotézis helyes. Ez valószínűleg a két lehetséges ok egyikére utal.

    1. A minták mérete nem elég nagy a különbségek kimutatásához. Valószínű, hogy a folyamatos kísérletezés sikerrel jár.

    2. Vannak különbségek. De olyan kicsik, hogy nincs gyakorlati jelentősége. Ebben az esetben a kísérletek folytatásának nincs értelme.

    Térjünk át néhány, az orvosi kutatásban használt statisztikai hipotézisre.

    3.6. HIPOTÉZISEK VIZSGÁLATA SZÓRÁSEGYENLŐSÉGRE, FISHER F-KRITÉRIUMRA

    Egyes klinikai vizsgálatokban a pozitív hatást nem annyira az igazolja nagyságrendű vizsgált paraméter, mennyi stabilizáció, ingadozásainak csökkentése. Ebben az esetben felmerül a kérdés, hogy egy mintavételes felmérés eredményei alapján két általános varianciát kell összehasonlítani. Ezt a feladatot a segítségével lehet megoldani Fisher-kritérium.

    A probléma megfogalmazása

    normális törvény terjesztés. Mintaméretek -

    n 1és n2, a minta eltérések egyenlő s 1 és s 2 2 általános eltérések.

    Ellenőrzött hipotézisek:

    H 0- általános eltérések ugyanazok;

    H 1- általános eltérések különböző.

    Akkor jelenik meg, ha a minták a következővel rendelkező populációkból származnak normális törvény eloszlást, akkor ha a hipotézis igaz H 0 a mintavarianciák aránya megfelel a Fisher-eloszlásnak. Ezért az érvényesség tesztelésének kritériumaként H 0értéket veszik F, képlettel számolva:

    ahol s 1 és s 2 - minta szórások.

    Ez az arány megfelel a Fisher-eloszlásnak a számláló szabadságfokainak számával ν 1 = n 1- 1 és a nevező szabadságfokainak száma ν 2 = n 2 - 1. A kritikus tartomány határait a Fisher-eloszlás táblázatai alapján vagy a BRASPOBR számítógépes függvény segítségével találjuk meg.

    táblázatban bemutatott példához. 3.4, kapjuk: ν 1 \u003d ν 2 \u003d 20 - 1 \u003d 19; F= 2,16/4,05 = 0,53. α = 0,05-nél a kritikus tartomány határai rendre egyenlőek: = 0,40, = 2,53.

    A kritériumérték a kritikus tartományba esett, így a hipotézist elfogadjuk H 0:általános mintavarianciák ugyanazok.

    3.7. AZ ÁTLAGOK EGYENLŐSÉGÉRE VONATKOZÓ HIPOTÉZISVIZSGÁLAT, DIÁK t-próba

    Összehasonlítási probléma közepes két populáció fordul elő, amikor gyakorlati érték pontosan rendelkezik nagyságrendű a vizsgált tulajdonság. Például, ha összehasonlítjuk a kezelés időtartamát két különböző módszerrel vagy az alkalmazásukból adódó szövődmények számát. Ebben az esetben a Student-féle t-próba használható.

    A probléma megfogalmazása

    Két mintát (X 1 ) és (X 2 ) vettünk a -val rendelkező populációkból normális törvény elosztása és ugyanaz a diszperzió. Mintaméretek - n 1 és n 2 , minta azt jelenti egyenlő X 1 és X 2, és minta eltérések- s 1 2 és s 2 2 illetőleg. Összehasonlítani kell általános átlagok.

    Ellenőrzött hipotézisek:

    H 0- általános átlagok ugyanazok;

    H 1- általános átlagok különböző.

    Megmutatjuk, hogy ha a hipotézis igaz H 0 t értéke a következő képlettel számítva:

    a Student-törvény szerint ν = ν 1 + + ν2 - 2 szabadságfokszámmal elosztva.

    Itt ahol ν 1 = n 1 - 1 - az első minta szabadságfokainak száma; v2 = n 2 - 1 - a második minta szabadságfokainak száma.

    A kritikus tartomány határait a t-eloszlás táblázataiból vagy a STUDRASP számítógépes függvény segítségével találjuk meg. A Student eloszlása ​​nullára szimmetrikus, így a kritikus tartomány bal és jobb oldali határa abszolút értékben megegyezik, előjelben pedig ellentétes: -és

    táblázatban bemutatott példához. 3.4, kapjuk:

    v 1 = v 2 \u003d 20 - 1 \u003d 19; v = 38, t= -2,51. α = 0,05 = 2,02 értékkel.

    A kritériumérték túlmutat a kritikus tartomány bal határán, ezért elfogadjuk a hipotézist H 1:általános átlagok különböző. Ugyanakkor a teljes népesség átlaga első minta KEVÉSBÉ.

    A Student-féle t-próba alkalmazhatósága

    A Student-féle t-próba csak az innen származó mintákra vonatkozik Normál aggregátumokkal ugyanazok az általános eltérések. Ha a feltételek közül legalább egy megsértődik, akkor a kritérium alkalmazhatósága kétséges. Az általános populáció normalitás követelményét általában figyelmen kívül hagyják, hivatkozva központi határérték tétel. Valójában a (3.10) számlálóban lévő mintaátlag különbsége normális eloszlásúnak tekinthető ν > 30 esetén. De a varianciaegyenlőség kérdése nem igazolható, és utalás arra, hogy a Fisher vizsgálat nem mutatott ki eltéréseket, nem vehető figyelembe. Mindazonáltal a t-próbát széles körben használják a populáció átlagában mutatkozó különbségek kimutatására, bár elegendő bizonyíték nélkül.

    Az alábbiakban figyelembe vesszük nem paraméteres kritérium, amelyet sikeresen alkalmaznak ugyanazokra a célokra, és amely nem igényel semmilyen normalitás, se szórások egyenlősége.

    3.8. KÉT MINTA NEM PARAMÉTRIAI ÖSSZEHASONLÍTÁSA: A MANN-WHITNEY TESZT

    A nem-paraméteres kritériumok célja két általános sokaság eloszlási törvényei közötti különbségek kimutatása. Az általános különbségekre érzékeny kritériumok közepes, kritériumoknak nevezzük váltás. Az általános különbségekre érzékeny kritériumok diszperzió, kritériumoknak nevezzük skála. A Mann-Whitney teszt a kritériumokra hivatkozik nyírásés két populáció átlagában mutatkozó különbségek kimutatására szolgál, amelyekből származó mintákat mutatunk be rangsor skála. A mért előjelek ezen a skálán növekvő sorrendben helyezkednek el, majd 1, 2 egész számokkal vannak számozva... Ezeket a számokat ún. rangok. Az egyenlő értékekhez ugyanazok a rangok tartoznak. Nem magának az attribútumnak az értéke számít, hanem csak rendes hely, amelyet egyéb értékek mellett foglal el.

    táblázatban. 3.5. a 3.4 táblázat első csoportja kibontott formában (1. sor), rangsorolással (2. sor) kerül bemutatásra, majd az azonos értékek rangsorait számtani átlagértékekkel helyettesítjük. Például az első sor 4-es és 4-es elemei 2-es és 3-as rangot kaptak, amelyeket ezután ugyanazokkal a 2,5-ös értékekkel helyettesítettek.

    3.5. táblázat

    A probléma megfogalmazása

    Független minták (X 1)és (X 2) ismeretlen eloszlási törvényű populációkból nyerték ki. Mintaméretek n 1és n 2 illetőleg. A minták elemeinek értékeit a rangsor skála. Meg kell vizsgálni, hogy ezek az általános populációk különböznek-e egymástól?

    Ellenőrzött hipotézisek:

    H 0- a minták ugyanahhoz az általános sokasághoz tartoznak; H 1- a minták különböző általános sokaságokhoz tartoznak.

    Az ilyen hipotézisek tesztelésére a (/-Mann-Whitney tesztet használjuk.

    Először két mintából egy kombinált mintát (X) készítünk, melynek elemeit rangsoroljuk. Ezután megkeressük az első minta elemeinek megfelelő rangok összegét. Ez az összeg a hipotézisek tesztelésének kritériuma.

    U= Az első minta rangsorainak összege. (3.11)

    20-nál nagyobb független minták esetén az érték U normális eloszlásnak engedelmeskedik, amelynek matematikai elvárása és szórása egyenlő:

    Ezért a kritikus tartomány határait a normál eloszlási táblázatok szerint találjuk meg.

    táblázatban bemutatott példához. 3.4, kapjuk: ν 1 \u003d ν 2 \u003d 20 - 1 \u003d 19, U= 339, μ = 410, σ = 37. α = 0,05 esetén a következőt kapjuk: bal = 338 és jobb = 482.

    A kritérium értéke túlmutat a kritikus régió bal határán, így elfogadjuk a H 1 hipotézist: az általános sokaságok eltérő eloszlási törvényekkel rendelkeznek. Ugyanakkor a teljes népesség átlaga első minta KEVÉSBÉ.