Készítsen intervallumot és diszkrét variációs sorozatot.  Elosztási sorozat felépítése

Készítsen intervallumot és diszkrét variációs sorozatot. Elosztási sorozat felépítése

Laboratóriumi munka №1. Elsődleges feldolgozás statisztikai adat

Elosztó sorozat felépítése

A populációs egységek csoportokba rendezett eloszlását bármely attribútum szerint nevezzük elosztás közelében . Ebben az esetben az előjel egyaránt lehet mennyiségi, akkor a sorozatot hívjuk variációs , és minőségi, akkor a sorozat ún jelző . Például egy város lakossága aszerint osztható el korcsoportok ban ben variációs sorozat, vagy attribútumsorozatban szakmai hovatartozás szerint (természetesen sokkal több minőségi és mennyiségi előjel kínálható az eloszlási sorozatok felépítéséhez, a jelválasztást a statisztikai kutatás feladata határozza meg).

Bármely disztribúciós sorozatot két elem jellemez:

- választási lehetőség(x i) az egységek jellemzőinek egyedi értékei mintavételi keret. Változatos sorozatok esetén a változat számértékeket vesz fel, attribúciós sorozatoknál minőségi értékeket (például x = "köztisztviselő");

- frekvencia(n én) egy szám, amely megmutatja, hogy ez vagy az a jellemző érték hányszor fordul elő. Ha a gyakoriságot relatív számként fejezzük ki (vagyis a populációs elemek arányát, amelyek megfelelnek adott értéket opciók, a lakosság teljes mennyiségében), akkor az ún relatív gyakoriság vagy frekvencia.

A variációs sorozatok lehetnek:

- diszkrét amikor a vizsgált tulajdonságot egy bizonyos szám (általában egész szám) jellemzi.

- intervallum amikor a "tól" és "ig" határok egy folyamatosan változó jellemzőhöz vannak meghatározva. Intervallumsorozat akkor is épül, ha egy diszkréten változó jellemző értékkészlete nagy.

Intervallumsorozat szerkeszthető egyenlő hosszúságú intervallumokkal (egyenlő intervallumsorokkal) és nem egyenlő intervallumokkal is, ha ezt a statisztikai vizsgálat feltételei megszabják. Például a népesség jövedelemeloszlásának sorozatát tekinthetjük a következő intervallumokkal:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



ahol k az intervallumok száma, n a minta mérete. (Természetesen a képlet általában törtszámot ad, és az intervallumok számának a kapott számhoz legközelebb eső egész számot választjuk.) Az intervallum hosszát ebben az esetben a képlet határozza meg.

.

Grafikusan a variációs sorozatok ábrázolhatók hisztogramok(Ebben az intervallumban a frekvenciának megfelelő magasságú "oszlopot" építenek az intervallumsorozat minden intervalluma fölé), elosztási terület(pontokat összekötő szaggatott vonal ( x i;n i) vagy halmozódik fel(a felhalmozott gyakoriságok szerint szerkesztve, azaz az attribútum minden értékéhez az adottnál kisebb attribútumértékkel rendelkező objektumok halmazában való előfordulási gyakoriságot veszik).

Amikor Excelben dolgozik, a következő függvények használhatók variációs sorozatok készítésére:

JELÖLJE BE( adattömb) – a mintanagyság meghatározásához. Az argumentum a mintaadatokat tartalmazó cellatartomány.

COUNTIF( hatótávolság; kritérium) - attribútum vagy variációs sorozat felépítésére használható. Az argumentumok az attribútum mintaértékeinek tömbjének tartománya és a kritérium - az attribútum numerikus vagy szöveges értéke vagy annak a cellának a száma, amelyben az található. Az eredmény az adott érték előfordulási gyakorisága a mintában.

FREKVENCIA( adattömb; intervallum tömb) – variációs sorozat felépítése. Az argumentumok a mintaadattömb tartománya és az intervallumok oszlopa. Ha diszkrét sorozatot kell építeni, akkor itt az opciók értékei vannak feltüntetve, ha intervallum, akkor az intervallumok felső határai (ezeket "zsebeknek" is nevezik). Mivel az eredmény egy gyakorisági oszlop, ezért a függvény bevezetését a CTRL+SHIFT+ENTER billentyűkombináció lenyomásával kell befejezni. Vegye figyelembe, hogy egy intervallum tömbjének beállításakor egy függvény bevezetésekor az utolsó érték elhagyható - minden olyan érték, amely nem esett az előző "zsebekbe", a megfelelő "zsebbe" kerül. Ez néha segít elkerülni azt a hibát, hogy a legnagyobb mintaérték nem kerül automatikusan az utolsó „zsebbe”.

Ezenkívül összetett csoportosításokhoz (több kritérium szerint) a „pivot tables” eszközt használják. Attribútum- és variációs sorozatok készítésére is használhatók, de ez szükségtelenül bonyolítja a feladatot. Változatsorozatok és hisztogramok készítéséhez létezik egy „hisztogram” eljárás az „Analysis Package” bővítményből (a bővítmények Excelben való használatához először le kell töltenie őket, alapértelmezés szerint nincsenek telepítve)

Az elsődleges adatfeldolgozás folyamatát az alábbi példákkal szemléltetjük.

Példa 1.1. 60 család mennyiségi összetételére vonatkozóan vannak adatok.

Készítsen variációs sorozatot és eloszlási sokszöget

Megoldás.

Nyissuk meg az Excel táblázatokat. Adjunk meg egy adattömböt az A1:L5 tartományban. Ha egy dokumentumot elektronikus formában (például Word formátumban) tanulmányoz, mindössze annyit kell tennie, hogy kiválaszt egy táblázatot az adatokkal és a vágólapra másolja, majd válassza ki az A1 cellát, és illessze be az adatokat - ezek automatikusan elfoglalják a megfelelő tartomány. Számítsuk ki az n mintaméretet - a mintaadatok számát, ehhez a B7 cellába írjuk be a = COUNT képletet (A1: L5). Ne feledje, hogy a kívánt tartomány képletbe való beírásához nem szükséges megadni a jelölését a billentyűzetről, elegendő kiválasztani. Határozzuk meg a mintában a minimális és maximális értéket úgy, hogy a =MIN(A1:L5) képletet beírjuk a B8 cellába, és a B9 cellába: =MAX(A1:L5).

1.1. ábra 1. példa Statisztikai adatok elsődleges feldolgozása Excel táblákban

Ezután készítsünk egy táblázatot egy variációs sorozat felépítéséhez az intervallumoszlop (változatértékek) és a gyakorisági oszlop nevének megadásával. Az intervallumok oszlopába írja be az attribútum értékeit a minimumtól (1) a maximumig (6), a B12:B17 tartományban. Válassza ki a gyakoriság oszlopot, írja be a =FREQUENCY(A1:L5;B12:B17) képletet, és nyomja meg a CTRL+SHIFT+ENTER billentyűkombinációt

1.2. ábra Példa 1. Variációs sorozat felépítése

A vezérléshez a frekvenciák összegét a SUM függvénnyel számítjuk ki (S függvény ikon a Kezdőlap Szerkesztés csoportjában), a számított összegnek meg kell egyeznie a B7 cellában korábban számított mintamérettel.

Most építsünk egy sokszöget: miután kiválasztotta a kapott frekvenciatartományt, válassza ki a "Graph" parancsot a "Beszúrás" fülön. Alapértelmezés szerint a vízszintes tengelyen lévő értékek sorszámok lesznek - esetünkben 1-től 6-ig, ami egybeesik az opciók értékeivel (tarifakategóriák száma).

A „Series 1” diagram sorozatának neve a „Tervező” lapon ugyanazzal az „adatok kiválasztása” opcióval módosítható, vagy egyszerűen törölhető.

1.3. ábra. 1. példa Frekvenciapoligon felépítése

Példa 1.2. 50 forrásból származó szennyezőanyag-kibocsátásról állnak rendelkezésre adatok:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Állítson össze egy egyenlő intervallumú sorozatot, készítsen hisztogramot

Megoldás

Adjunk hozzá egy adattömböt egy Excel munkalaphoz, ez az A1:J5 tartományt foglalja el Az előző feladathoz hasonlóan itt is meghatározzuk az n mintaméretet, a minta minimális és maximális értékeit. Mivel most nem diszkrét, hanem intervallumsorozatra van szükségünk, és a feladatban az intervallumok száma nincs megadva, a k intervallumok számát a Sturgess-képlet segítségével számítjuk ki. Ehhez írja be a B10 cellába az =1+3.322*LOG10(B7) képletet.

1.4. 2. példa Egyenlő intervallum sorozat felépítése

A kapott érték nem egész szám, hanem körülbelül 6,64. Mivel k=7 esetén az intervallumok hosszát egész számként fejezzük ki (ellentétben k=6 esetével), ezért a C10-es cellába ezt az értéket beírva k=7-et választunk. A B11 cellában lévő d intervallum hosszát a = (B9-B8) / C10 képlet beírásával számítjuk ki.

Határozzuk meg az intervallumok tömbjét, megadva a felső korlátot mind a 7 intervallumhoz. Ehhez az E8 cellában számítsa ki az első intervallum felső határát a =B8+B11 képlet beírásával; az E9 cellában a második intervallum felső határát az =E8+B11 képlet beírásával. Az intervallumok felső határának fennmaradó értékeinek kiszámításához rögzítjük a megadott képlet B11 cellájának számát a $ jellel úgy, hogy az E9 cellában lévő képlet =E8+B$11 legyen, és másoljuk a Az E9 sejt az E10-E14 sejtekhez. Az utolsó kapott érték megegyezik a mintában korábban a B9 cellában számított maximális értékkel.

1.5. 2. példa Egyenlő intervallum sorozat felépítése


Most töltsük ki a „zsebek” tömbjét a FREQUENCY függvénnyel, ahogy az 1. példában történt.

1.6. 2. példa Egyenlő intervallum sorozat felépítése

A kapott variációs sorozatok alapján készítünk egy hisztogramot: válassza ki a gyakoriság oszlopot, és válassza a "Hisztogram" lehetőséget a "Beszúrás" fülön. A hisztogram kézhezvétele után a vízszintes tengely címkéit az intervallumok tartományában lévő értékekre változtatjuk, ehhez a „Tervező” fül „Adatok kiválasztása” opcióját választjuk. A megjelenő ablakban válassza ki a "Módosítás" parancsot a "Vízszintes tengely címkéi" szakaszban, és adja meg a változatok értéktartományát az "egérrel".

1.7. ábra. 2. példa Hisztogram felépítése

1.8. ábra. 2. példa Hisztogram felépítése

A matematikai statisztika tárgya. Általános és minta sokaság.

— Matematikai statisztika- a matematika ága, amely a statisztikai adatok kiválasztásának, csoportosításának, rendszerezésének és elemzésének módszereit tanulmányozza tudományosan megalapozott következtetések levonása érdekében.

— Statisztikai adat- a vizsgált objektumok figyelembe vett jellemzőjének számértékei, amelyeket véletlenszerű kísérlet eredményeként kaptak.

A matematikai statisztika szorosan kapcsolódik a valószínűségszámításhoz, de a valószínűségszámítástól eltérően a kísérlet matematikai modellje ismeretlen. A matematikai statisztikában a statisztikai adatok szerint szükség van egy ismeretlen valószínűségi eloszlás megállapítására vagy az eloszlási paraméterek objektív értékelésére.

A matematikai statisztika módszerei lehetővé teszik a tömeges, visszatérő jelenségek optimális matematikai modelljének felépítését. A valószínűségelmélet és a matematikai statisztika közötti összekötő kapocs a valószínűségelmélet határtételei.

Jelenleg a nemzetgazdaság szinte minden ágazatában alkalmazzák a statisztikai módszereket.

— Népesség– az összes vizsgált objektum statisztikai adatai (esetenként maguk az objektumok). A lakosságot gyakran RV X-nek tekintik.

— Minta(mintapopuláció) - az általános sokaságból véletlenszerűen kiválasztott objektumok statisztikai adatai.

— Minta nagysága n(az általános népesség mennyisége N) - az általános sokaságból vizsgálatra kiválasztott objektumok száma (objektumok száma az általános sokaságban).

Példák.

a) Statisztikai adat lehet: a tanulók növekedése; az igék (vagy más szórészek) száma egy bizonyos hosszúságú szövegrészben; a bizonyítvány átlagos pontszáma; intelligencia szint; a diszpécser által elkövetett hibák száma stb.

b) Általános népesség talán: az összes ember magassága, az összes gyári munkás rangja, egy bizonyos beszédrész használatának gyakorisága a szerző összes vizsgált művében, az összes végzett bizonyítvány átlagpontszáma stb.



ban ben) minta esetleg: - 20 diák magassága, igekötők száma véletlenszerűen kiválasztott 50 homogén, 500 szóhasználat hosszúságú szövegrészben, a város iskoláiból véletlenszerűen kiválasztott 100 végzős bizonyítványának átlagpontszáma stb.

A mintát ún reprezentatív, ha helyesen tükrözi az általános lakosság tulajdonát. A minta reprezentativitása véletlenszerű szelekcióval érhető el, amikor az általános sokaság minden objektuma azonos valószínűséggel kiválasztódik.

Annak érdekében, hogy a minta reprezentatív legyen, különféle módszereket alkalmaznak a vizsgálati tárgyak kiválasztására.

Kiválasztás típusai: egyszerű, mechanikus, soros, tipikus.

Egyszerű. Az elemek véletlenszerűen kerülnek kiválasztásra a teljes sokaságból.

Mechanikai kiválasztás. Válasszon ki minden 10 (25, 30 stb.) objektumot az általános sokaságból.

Sorozatszám. Minden sorozatban egy tanulmányt készítenek (például 500 szóhasználatból 10 szakaszt választanak ki a szövegből - 10 sorozat).

Tipikus. Az általános populációt egy bizonyos tulajdonság szerint tipikus csoportokra osztják. Az egyes ilyen csoportokból kivont sorozatok számát ennek a csoportnak az általános sokaságon belüli aránya határozza meg.

A minta statisztikai eloszlása ​​és grafikus ábrázolása.

Tanulmányozzuk az SV X-et (általános populációt) valamilyen jellemző tekintetében. Számos független tesztet végeznek. A kísérletek eredményeként az SV X bizonyos értékeket vesz fel. A kapott értékek halmaza minta, maguk az értékek pedig statisztikai adatok.

Kezdetben a minta rangsorolása - a minta statisztikai adatainak elrendezése nem csökkenő sorrendben. Kapunk egy variációs sorozatot.

Variációs sorozat- rangsorolt ​​minta.

Diszkrét statisztikai sorozatok

Ha a sokaság egy diszkrét önéletrajz, akkor egy diszkrét statisztikai sorozatot (statisztikai eloszlást) állítunk össze.

Az érték jelenjen meg a mintaidőben,

Idő, …, - idő.

I-thaya választási lehetőség minták; - frekvencia i-th option A gyakoriság azt mutatja, hogy ez az opció hányszor jelent meg a mintában.

- relatív gyakoriság i-edik lehetőség

(megmutatja, hogy a minta melyik része ).

A statisztikai eloszlás a mintaopciók és azok gyakorisága vagy relatív gyakorisága közötti megfelelés.

A DSV esetében a statisztikai eloszlás táblázat formájában is bemutatható - a gyakoriságok statisztikai sorozata vagy a relatív gyakoriságok statisztikai sorozata.

Statisztikai gyakorisági sorozatok Statisztikai sorozatok

relatív gyakoriságok

........
........
........
........

A minta statisztikai eloszlásának egyértelmű ábrázolása érdekében a statisztikai eloszlás „grafikonjait” készítjük: egy poligont és egy hisztogramot.

Frekvencia sokszög(relatív gyakoriságok) - egy diszkrét statisztikai sorozat grafikus ábrázolása - egy szaggatott vonal, amely a pontokat sorba köti [ a relatív gyakoriságok sokszögéhez].

Példa. A kutatót a jelentkezők matematikai ismeretei érdeklik. 10 jelentkezőt választanak ki és rögzítik iskolai osztályzatukat ebből a tantárgyból. A következő minta érkezett: 5;4;4;3;2;5;4;3;4;5.

a) Mutassa be a mintát variációs sorozatként;

b) készítsen statisztikai sorozatot a gyakoriságokból és a relatív gyakoriságokból;

c) rajzolja meg a kapott sorozathoz egy relatív gyakoriságú sokszöget.

a) Rangsoroljuk a mintát, i.e. Rendezd a minta tagjait nem csökkenő sorrendbe! Variációs sorozatot kapunk: 2; 3; 3; négy; négy; négy; négy; 5; 5;5.

b) Összeállítunk egy statisztikai sorozatot a gyakoriságokból (a mintalehetőségek és azok gyakorisága közötti megfelelés) és egy statisztikai sorozatot a relatív gyakoriságokról (a mintalehetőségek és relatív gyakoriságaik közötti megfelelés)

0,1 0,2 0,4 0,3

Gyakoriságok statisztikai sorozatai statisztikai sorozatok rel. frekvenciák

1+2+4+3=10=n 0,1+0,2+0,4+0,3=1.

Relatív frekvenciák sokszöge.


Hogy mi a statisztikai adatok csoportosítása, és hogyan kapcsolódik az eloszlási sorozatokhoz, arról volt szó ebben az előadásban, ahol megtudhatja, mi is az a diszkrét és variációs eloszlássorozat.

A disztribúciós sorozat az egyik fajtája statisztikai sorozat(rajtuk kívül a statisztika dinamikus sorozatokat használ), a közélet jelenségeire vonatkozó adatok elemzésére szolgálnak. A variációs sorozatok felépítése mindenki számára megvalósítható feladat. Vannak azonban szabályok, amelyeket emlékezni kell.

Hogyan készítsünk diszkrét variációs eloszlás sorozatot

1. példa 20 megkérdezett család gyermekszámáról állnak rendelkezésre adatok. Készítsen diszkrét variációs sorozatot a családok elosztása gyerekek száma szerint.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Megoldás:

  1. Kezdjük a táblázat elrendezésével, amibe majd beírjuk az adatokat. Mivel a terjesztési sorok két elemből állnak, a táblázat két oszlopból áll. Az első oszlop mindig egy változat - amit tanulmányozunk - a nevét a feladatból vettük (a mondat vége a feladattal a feltételekben) - gyerekek száma szerint- tehát a mi verziónk a gyerekek száma.

A második oszlop a gyakoriság - milyen gyakran fordul elő változatunk a vizsgált jelenségben - az oszlop nevét is átvesszük a feladatból - a családok elosztása - tehát gyakoriságunk a megfelelő gyermekszámmal rendelkező családok száma.

  1. Most a kezdeti adatokból kiválasztjuk azokat az értékeket, amelyek legalább egyszer előfordulnak. A mi esetünkben ez

És rendezzük ezeket az adatokat a táblázatunk első oszlopában logikai sorrendbe, jelen esetben 0-ról 4-re növelve.

Végezetül pedig számoljuk ki, hogy az opciók egyes értékei hányszor fordulnak elő.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Ennek eredményeként teljes táblázatot vagy a családok gyermekszám szerinti megoszlásának szükséges sorozatát kapjuk.

Gyakorlat . A vállalkozás 30 dolgozójának tarifakategóriáiról van adat. Készítsen diszkrét variációs sorozatot a dolgozók bérkategóriák szerinti megoszlására. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Hogyan készítsünk eloszlási intervallumvariációs sorozatot

Építsünk intervallum eloszlás sorozatot, és nézzük meg, miben tér el a felépítése egy diszkrét sorozattól.

2. példa Vannak adatok a 16 vállalkozás által kapott nyereség összegéről, millió rubel. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Készítsen intervallumvariációs sorozatot a vállalkozások nyereségvolumen szerinti megoszlására, 3 csoport egyenlő időközönkénti kiválasztásával.

A sorozat felépítésének általános elve természetesen megmarad, ugyanaz a két oszlop, ugyanazok a változatok és gyakoriság, de ebben az esetben a változatok az intervallumban helyezkednek el, és a frekvenciákat másképp számolják.

Megoldás:

  1. Kezdjük az előző feladathoz hasonlóan egy táblázat elrendezés felépítésével, amelybe ezután adatokat viszünk be. Mivel a terjesztési sorok két elemből állnak, a táblázat két oszlopból áll. Az első oszlop mindig egy variáns - amit tanulmányozunk - a nevét a feladatból vesszük (a mondat vége a feladattal a feltételekben) - a haszon összegével - ami azt jelenti, hogy a mi változatunk a profit összege kapott.

A második oszlop a gyakoriság - milyen gyakran fordul elő változatunk a vizsgált jelenségben - a hozzárendelésből vettük az oszlop nevét is - a vállalkozások megoszlása ​​- ez azt jelenti, hogy gyakoriságunk a megfelelő nyereséggel rendelkező vállalkozások száma, in ez az eset az intervallumba esik.

Ennek eredményeként a táblázatunk elrendezése így fog kinézni:

ahol i az intervallum értéke vagy hossza,

Xmax és Xmin - a jellemző maximális és minimális értéke,

n a feladat feltételének megfelelő csoportok szükséges száma.

Számítsuk ki a példánk intervallumértékét. Ehhez a kezdeti adatok között megtaláljuk a legnagyobbat és a legkisebbet

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - a maximális érték 118 millió rubel, a minimum pedig 9 millió rubel. Számítsuk ki a képletet.

A számításnál a periódusban 36-os számot kaptunk, (3) hármat, ilyen helyzetekben az intervallum értékét felfelé kell kerekíteni, hogy a számítások után a maximális adat ne vesszen el, éppen ezért a intervallum a számításban 36,4 millió rubel.

  1. Most építsük fel az intervallumokat – lehetőségeinket ebben a feladatban. Az első intervallumot a minimális értékről indítjuk, hozzáadjuk az intervallum értékét és megkapjuk az első intervallum felső határát. Ekkor az első intervallum felső határa a második intervallum alsó határává válik, hozzáadjuk az intervallum értékét és megkapjuk a második intervallumot. És így tovább, ahányszor szükséges az intervallumok felépítéséhez a feltételnek megfelelően.

Figyelem, ha az intervallum értékét nem kerekítenénk 36,4-re, hanem 36,3-on hagynánk, akkor az utolsó érték 117,9 lenne. Az adatvesztés elkerülése érdekében szükséges az intervallum értékét nagyobb értékre kerekíteni.

  1. Számoljuk meg az egyes intervallumokba tartozó vállalkozások számát. Az adatok feldolgozásakor emlékezni kell arra, hogy az intervallum felső értékét ebben az intervallumban nem veszik figyelembe (nem szerepel ebben az intervallumban), hanem a következő intervallumban veszik figyelembe (az intervallum alsó határa benne van). ebben az intervallumban, és a felső nem szerepel), kivéve az utolsó intervallumot.

Az adatfeldolgozás során célszerű a kiválasztott adatokat hagyományos ikonokkal vagy színekkel jelezni a feldolgozás egyszerűsítése érdekében.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Az első intervallumot sárgával jelöljük - és meghatározzuk, hogy mennyi adat esik a 9-től 45,4-ig terjedő intervallumba, míg ezt a 45,4-et a második intervallumban vesszük figyelembe (feltéve, hogy benne van az adatokban) - ennek eredményeként kap 7 vállalkozást az első intervallumban. És így tovább minden intervallumban.

  1. (kiegészítő művelet) Számítsuk ki a vállalkozások által kapott teljes nyereség összegét minden intervallumra és általában! Ehhez adja hozzá a különböző színekkel jelölt adatokat, és kapja meg a profit összértékét.

Az első intervallumra 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 millió rubel

A második intervallum - 48 + 57 + 48 + 56 + 63 = 272 millió rubel.

A harmadik intervallumhoz - 118 + 87 + 98 + 88 = 391 millió rubel.

Gyakorlat . Vannak adatok a betét nagyságáról a 30 betétes bankjában, ezer rubel. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Épít intervallum variációs sorozat a betétesek megoszlása ​​a hozzájárulás nagysága szerint, 4 csoportot egyenlő időközönként kiemelve. Minden csoportra számítsa ki a hozzájárulások teljes összegét.

csoportosítás- ez a populáció felosztása valamilyen szempontból homogének csoportokra.

Szolgálati megbízás. Az online számológéppel a következőket teheti:

  • variációs sorozatot készíteni, építs fel egy hisztogramot és egy sokszöget;
  • variációs mutatók keresése (átlag, módusz (a grafikus is), medián, variációs tartomány, kvartilisek, decilisek, kvartilis differenciációs együttható, variációs együttható és egyéb mutatók);

Utasítás. Egy sorozat csoportosításához ki kell választani az eredményül kapott variációs sorozat típusát (diszkrét vagy intervallum), és meg kell adni az adatmennyiséget (sorok számát). Az így kapott megoldást a rendszer Word fájlba menti (lásd a statisztikai adatok csoportosításának példáját).

A bemeneti adatok száma
",0);">

Ha a csoportosítás már megtörtént és a diszkrét variációs sorozat vagy intervallum sorozat, akkor az online számológépet kell használnia Változásmutatók. Az eloszlás típusára vonatkozó hipotézis tesztelése szolgáltatás felhasználásával készült Elosztási forma tanulmányozása.

A statisztikai csoportosítások típusai

Variációs sorozat. Megfigyelések esetén egy diszkrét valószínűségi változó ugyanaz az érték többször is megtalálható. Az x i valószínűségi változó ilyen értékeit rögzítjük, jelezve, hogy n i hányszor jelenik meg n megfigyelésben, ez az érték gyakorisága.
Folyamatos valószínűségi változó esetén a gyakorlatban a csoportosítást alkalmazzák.
  1. Tipológiai csoportosítás- ez a vizsgált minőségileg heterogén sokaság osztályokra, társadalmi-gazdasági típusokra, homogén egységcsoportokra való felosztása. A csoportosítás létrehozásához használja a Diszkrét variációs sorozat paramétert.
  2. A szerkezeti csoportosítást ún, amelyben egy homogén populációt csoportokra osztanak, amelyek valamilyen változó sajátosság szerint jellemzik a szerkezetét. A csoportosítás létrehozásához használja az Intervallum sorozat paramétert.
  3. A vizsgált jelenségek és jellemzőik kapcsolatát feltáró csoportosítást ún elemző csoport(lásd a sorozatok analitikai csoportosítását).

A statisztikai csoportosítások felépítésének elvei

A növekvő sorrendben rendezett megfigyelések sorozatát variációs sorozatnak nevezzük. csoportosító jel az a jel, amellyel a lakosságot külön csoportokra osztják. Ezt hívják a csoport bázisának. A csoportosítás történhet mennyiségi és minőségi jellemzők alapján is.
A csoportosítás alapjainak meghatározása után el kell dönteni, hogy a vizsgált populációt hány csoportra kell felosztani.

Használata személyi számítógépek a statisztikai adatok feldolgozásához egy objektum egységeinek csoportosítása szabványos eljárásokkal történik.
Az egyik ilyen eljárás a Sturgess-képlet felhasználásán alapul a csoportok optimális számának meghatározására:

k = 1+3,322*lg(N)

Ahol k a csoportok száma, N a népességegységek száma.

A részintervallumok hossza h=(x max -x min)/k

Ezután számolja meg a megfigyelések találatait ezekben az intervallumokban, amelyeket n i gyakoriságnak veszünk. Kevés olyan frekvencia, amelynek értéke kisebb, mint 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Az x i =(c i-1 +c i)/2 intervallumok felezőpontjait vesszük új értéknek.

Egy változó attribútum változásainak leírása eloszlási sorozatok segítségével történik.

Statisztikai eloszlási sorozat- ez a statisztikai sokaság egységeinek rendezett elosztása külön csoportokba egy bizonyos változó tulajdonság szerint.

A kvalitatív alapon felépített statisztikai sorozatokat ún jelző. Ha az eloszlási sorozat kvantitatív attribútumon alapul, akkor a sorozat az variációs.

A variációs sorozatokat viszont diszkrétre és intervallumra osztják. A magban diszkrét a terjesztési sorozat diszkrét (megszakadt) jellemzője, amely meghatározott számértékeket vesz fel (bűncselekmények száma, állampolgárok jogsegélykérelmeinek száma). intervallum az elosztási sorozat egy folyamatos jellemzőre épül, amely egy adott tartományból tetszőleges értéket felvehet (az elítélt életkora, szabadságvesztés időtartama stb.)

Bármely statisztikai eloszlási sorozat két kötelező elemet tartalmaz - sorozat- és gyakorisági változatokat. Lehetőségek (x i) a jellemző egyedi értékei, amelyeket a terjesztési sorozatban vesz fel. Frekvenciák (fi) olyan számértékek, amelyek azt mutatják, hogy bizonyos opciók hányszor fordulnak elő az eloszlási sorozatban. Az összes gyakoriság összegét a sokaság térfogatának nevezzük.

A relatív egységekben (törtekben vagy százalékokban) kifejezett gyakoriságokat gyakoriságoknak ( w i). A gyakoriságok összege eggyel egyenlő, ha a gyakoriságokat egy töredékében fejezzük ki, vagy 100-at, ha százalékban fejezzük ki. A gyakoriságok használata lehetővé teszi a különböző populációméretekkel rendelkező variációs sorozatok összehasonlítását. A gyakoriságokat a következő képlet határozza meg:

Egy diszkrét sorozat létrehozásához a sorozatban előforduló összes eseményt rangsoroljuk egyéni értékek funkciót, majd kiszámítja az egyes értékek ismétlődési gyakoriságát. Egy eloszlási sorozat egy két sorból és oszlopból álló táblázat ötletében készül, amelyek közül az egyik a sorozat változatainak értékeit tartalmazza. x i, a másodikban - a frekvenciák értékei fi.

Tekintsünk egy példát egy diszkrét variációs sorozat felépítésére.

Példa 3.1 . Szerint a Belügyminisztérium regisztrált bűncselekményeket követtek el a városban N kiskorú éves.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Készítsen diszkrét eloszlássorozatot.

Megoldás .

Először is rangsorolni kell a kiskorúak életkorára vonatkozó adatokat, pl. írd le őket növekvő sorrendben.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



3.1. táblázat

Így a gyakoriságok az adott életkor létszámát tükrözik, például 5 fő 13 éves, 8 fő 14 éves stb.

Épület intervallum Az elosztási sorokat a mennyiségi attribútum szerinti egyenlő intervallumú csoportosítás megvalósításához hasonlóan hajtjuk végre, azaz először meghatározzuk a csoportok optimális számát, amelyekre a halmaz fel lesz osztva, meghatározzuk az intervallumok csoportonkénti határait és a frekvenciákat kiszámítják.

Szemléltessük egy intervallum eloszlás sorozat felépítését a következő példával.

Példa 3.2 .

Készítsen intervallumsort a következő statisztikai sokasághoz - egy ügyvéd fizetése az irodában, ezer rubel:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Megoldás.

Vegyük az egyenlő intervallumú csoportok optimális számát egy adott statisztikai sokasághoz, ami egyenlő 4-gyel (16 lehetőségünk van). Ezért az egyes csoportok mérete egyenlő:

és az egyes intervallumok értéke egyenlő lesz:

Az intervallumok határait a következő képletek határozzák meg:

,

hol van az i-edik intervallum alsó és felső határa.

Az intervallumok határainak közbülső számítását mellőzve ezek értékét (opciók) és az egyes intervallumokon belül fizetéssel rendelkező ügyvédek számát (gyakoriságait) beírjuk a 3.2 táblázatba, amely az így kapott intervallumsorokat mutatja be.

3.2. táblázat

A statisztikai eloszlássorok elemzése grafikus módszerrel is elvégezhető. Az eloszlási sorozatok grafikus ábrázolása lehetővé teszi a vizsgált sokaság eloszlási mintáinak vizuális szemléltetését sokszög, hisztogram és kumulátumok formájában. Vessünk egy pillantást ezekre a grafikonokra.

Poligon egy vonallánc, melynek szakaszai pontokat kapcsolnak össze koordinátákkal ( x i;fi). Általában sokszöget használnak egy képhez diszkrét sorozat terjesztés. Felépítéséhez a jellemző rangsorolt ​​egyedi értékeit az x tengelyen ábrázoljuk x i, az y tengelyen az ezeknek az értékeknek megfelelő frekvenciák vannak. Ennek eredményeként az abszcissza és az ordináta tengelyek mentén jelölt adatoknak megfelelő pontok szegmenseinek összekapcsolásával egy vonalláncot kapunk, amelyet sokszögnek nevezünk. Nézzünk egy példát egy frekvenciapoligon felépítésére.

Egy sokszög felépítésének szemléltetésére vegyük a 3.1. példa megoldásának eredményét egy diszkrét sorozat felépítéséhez - 1. ábra. Az abszcisszán az elítéltek életkorát, az ordináta pedig azon fiatalkorú elítéltek számát mutatja, akik adott életkor. Ezt a sokszöget elemezve azt mondhatjuk a legnagyobb számban elítéltek - 14 fő, 15 évesek.

3.1. ábra - Egy diszkrét sorozat frekvenciatartománya.

Intervallumsorozathoz sokszög is építhető, ilyenkor az intervallumok felezőpontjait az abszcissza tengely mentén, a megfelelő frekvenciákat pedig az ordináta tengelye mentén ábrázoljuk.

oszlopdiagram– téglalapokból álló lépcsőzetes figura, melynek alapjai a jellemző értékének intervallumai, magasságai pedig megegyeznek a megfelelő frekvenciákkal. A hisztogram csak az intervallum eloszlási sorozatok megjelenítésére szolgál. Ha az intervallumok egyenlőtlenek, akkor az y tengelyen lévő hisztogram felépítéséhez nem a frekvenciákat kell ábrázolni, hanem a gyakoriság és a megfelelő intervallum szélességének arányát. Egy hisztogram akkor alakítható eloszlási sokszöggé, ha oszlopainak közepét szegmensek kötik össze.

A hisztogram felépítésének szemléltetésére vegyük a 3.2. példa - 3.2. ábra - intervallumsorozat összeállításának eredményeit.

3.2. ábra – Eloszlási hisztogram bérekügyvédek.

A variációs sorozatok grafikus ábrázolásához kumulátum is használatos. Összesített egy görbe, amely halmozott frekvenciák sorozatát ábrázolja, és koordinátákkal összekötő pontokat ( x i;f i nak). A kumulatív gyakoriságok kiszámítása az eloszlási sorozat összes gyakoriságának egymás utáni összegzésével történik, és megmutatja azon populációs egységek számát, amelyeknek a jellemzőértéke nem nagyobb, mint a megadott. Szemléltessük a 3.2. példában – 3.3. táblázatban bemutatott variációs intervallum sorozatok halmozott gyakoriságának kiszámítását.

3.3. táblázat

Egy diszkrét eloszlási sorozat kumulátumának felépítéséhez a tulajdonság rangsorolt ​​egyedi értékeit az abszcissza tengely mentén, a hozzájuk tartozó halmozott frekvenciákat pedig az ordináta tengely mentén ábrázoljuk. Egy intervallumsorozat kumulatív görbéjének megalkotásakor az első pont abszcissza az első intervallum alsó határával, az ordinátája pedig 0 lesz. Minden további pontnak meg kell felelnie az intervallumok felső határának. Készítsünk kumulátumot a 3.3. táblázat - 3.3. ábra adataiból.

3.3. ábra – Az ügyvédi fizetések kumulatív eloszlási görbéje.

tesztkérdések

1. A statisztikai eloszlássorozat fogalma, főbb elemei.

2. A statisztikai eloszlássorok típusai. Rövid leírásuk.

3. Diszkrét és intervallum eloszlási sorozatok.

4. Diszkrét eloszlási sorozatok felépítésének technikája.

5. Intervallumeloszlási sorozatok felépítésének technikája.

6. Diszkrét eloszlási sorozatok grafikus ábrázolása.

7. Intervallumeloszlási sorozatok grafikus ábrázolása.

Feladatok

1. feladat. A csoport 25 tanulójának TGP-ben való előmeneteléről foglalkozásonként a következő adatok állnak rendelkezésre: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5 , 5, 2, 3 , 3, 5, 4, 2, 3, 3. Készítse el a tanulók diszkrét variációs sorozatát a foglalkozáson kapott értékelések pontszámai alapján! Az eredményül kapott sorozathoz számítsa ki a Frekvenciák, kumulatív gyakoriságok, a kumulatív gyakoriságok értékeit. Vonja le saját következtetéseit.

2. feladat. A telepen 1000 elítélt él, életkori megoszlásukat a táblázat tartalmazza:

kép ezt a sorozatot grafikusan. Vonja le saját következtetéseit.

3. feladat. A fogvatartottak szabadságvesztésének idejéről az alábbi adatok állnak rendelkezésre:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Készítsen intervallumsort a foglyok börtönbüntetés szerinti megoszlásáról! Vonja le saját következtetéseit.

4. feladat. A vizsgált időszakban az elítéltek korcsoportonkénti megoszlására vonatkozóan a következő adatok állnak rendelkezésre:

Rajzolja le ezt a sorozatot grafikusan, vonjon le következtetéseket.