Ha a populációt a vizsgált tulajdonság szerint csoportokra osztjuk, akkor erre a sokaságra a következő típusú szórások számíthatók: teljes, csoport (csoporton belüli), csoportátlag (csoporton belüli átlag), csoportközi.
Kezdetben a determinációs együtthatót számolja ki, amely megmutatja, hogy a vizsgált tulajdonság teljes variációjának mekkora része a csoportok közötti variáció, azaz. csoportosítás miatt:
Az empirikus korrelációs arány a csoportosító (faktoriális) és az effektív jelek közötti kapcsolat szorosságát jellemzi.
Az empirikus korrelációs arány 0 és 1 közötti értékeket vehet fel.
A kapcsolat szorosságának az empirikus korrelációs arány alapján történő értékeléséhez használhatja a Chaddock-relációkat:
4. példa A tervező és felmérő szervezetek által végzett munkavégzésről a következő adatok állnak rendelkezésre különböző formák ingatlan:
Határozza meg:
1) teljes variancia;
2) csoportos diszperziók;
3) a csoportos diszperziók átlaga;
4) csoportok közötti diszperzió;
5) teljes variancia az eltérések összeadásának szabálya alapján;
6) determinációs együttható és empirikus korreláció.
Vonja le saját következtetéseit.
Megoldás:
1. Határozzuk meg a két tulajdonformájú vállalkozások által végzett átlagos munkamennyiséget:
Számítsa ki a teljes szórást:
2. Határozza meg a csoportátlagokat:
millió rubel;
millió dörzsölje.
Csoport eltérések:
;
3. Számítsa ki a csoportvarianciák átlagát:
4. Határozza meg a csoportok közötti varianciát:
5. Számítsa ki a teljes szórást az eltérések összeadási szabálya alapján:
6. Határozza meg a determinációs együtthatót:
.
Így a tervező és felmérő szervezetek által végzett munka mennyisége 22%-ban függ a vállalkozások tulajdonformájától.
Az empirikus korrelációs hányadost a képlet számítja ki
.
A számított mutató értéke azt jelzi, hogy a munka mennyiségének a vállalkozás tulajdoni formától való függősége kicsi.
5. példa A termelési telephelyek technológiai fegyelmének felmérése eredményeként a következő adatokat kaptuk:
Határozza meg a determinációs együtthatót!
A statisztikai eltérések fő általánosító mutatói a szórás és a szórás.
Diszperzió azt számtani átlaga az egyes jellemzőértékek négyzetes eltérései a teljes átlagtól. A szórást általában az eltérések középnégyzetének nevezik, és 2 -vel jelöljük. A kiindulási adatoktól függően a variancia kiszámítható a számtani átlagból, egyszerű vagy súlyozott:
súlyozatlan (egyszerű) diszperzió;
súlyozott variancia.
Szórás abszolút dimenziók általánosító jellemzője variációk tulajdonság összességében. Ugyanazokban a mértékegységekben van kifejezve, mint az előjel (méterben, tonnában, százalékban, hektárban stb.).
A szórás a variancia négyzetgyöke, és -val jelöljük:
súlyozatlan szórás;
súlyozott szórás.
A szórás az átlag megbízhatóságának mértéke. Minél kisebb a szórás, annál jobban tükrözi a számtani átlag a teljes reprezentált sokaságot.
A szórás számítását megelőzi a szórás számítása.
A súlyozott variancia kiszámításának eljárása a következő:
1) határozza meg a számtani súlyozott átlagot:
2) számítsa ki az opciók átlagtól való eltérését:
3) négyzetre emelje az egyes opciók átlagtól való eltérését:
4) szorozzuk meg az eltérések négyzetét a súlyokkal (gyakoriságokkal):
5) foglalja össze a beérkezett munkákat:
6) a kapott összeget elosztjuk a súlyok összegével:
2.1. példa
Számítsa ki a számtani súlyozott átlagot:
Az átlagtól való eltérések értékeit és azok négyzeteit a táblázat tartalmazza. Határozzuk meg az eltérést:
A szórása egyenlő lesz:
Ha a forrásadatokat intervallumként jelenítjük meg terjesztési sorozat , akkor először meg kell határoznia a jellemző diszkrét értékét, majd alkalmaznia kell a leírt módszert.
Mutassuk meg a szórás számítását a kolhoz vetésterületének búzatermés szerinti megoszlására vonatkozó adatok intervallumsoraihoz.
A számtani átlag a következő:
Számítsuk ki a szórást:
Számítástechnika diszperzió bonyolult, és nagy értékek az opciók és a frekvenciák nehézkesek lehetnek. A számítások leegyszerűsíthetők a diszperziós tulajdonságok segítségével.
A diszperzió a következő tulajdonságokkal rendelkezik.
1. Egy változó jellemző súlyának (frekvenciájának) bizonyos számú csökkenése vagy növekedése nem változtatja meg a diszperziót.
2. Minden jellemző értékének csökkentése vagy növelése azonos állandó értékkel DE a diszperzió nem változik.
3. Minden jellemző értékének csökkentése vagy növelése bizonyos számú alkalommal k rendre csökkenti vagy növeli a szórást k 2 alkalommal szórás be k egyszer.
4. Egy jellemző tetszőleges értékhez viszonyított szórása mindig nagyobb, mint a számtani középhez viszonyított szórása az átlagos és tetszőleges értékek különbségének négyzetével:
Ha egy DE 0, akkor a következő egyenlőséghez jutunk:
azaz egy jellemző szórása egyenlő a jellemző értékeinek átlagnégyzete és az átlag négyzete közötti különbséggel.
Mindegyik tulajdonság használható önmagában vagy másokkal kombinálva a variancia kiszámításakor.
A variancia kiszámításának folyamata egyszerű:
1) határozza meg számtani átlaga :
2) négyzetre emelje a számtani átlagot:
3) négyzetre emelje a sorozat egyes változatainak eltérését:
x én 2 .
4) keresse meg az opciók négyzetösszegét:
5) osszuk el az opciók négyzetösszegét a számukkal, azaz határozzuk meg az átlagos négyzetet:
6) határozza meg a különbséget a jellemző négyzete és az átlag négyzete között:
Példa 3.1 A dolgozók termelékenységéről a következő adatok állnak rendelkezésünkre:
Végezzük el a következő számításokat:
A statisztikában gyakran egy jelenség vagy folyamat elemzésekor nemcsak a vizsgált mutatók átlagos szintjeire vonatkozó információkat kell figyelembe venni, hanem az egyes egységek értékeinek szórása vagy változása , ami a vizsgált populáció fontos jellemzője.
Részvényárak, kereslet és kínálat volumene, kamatlábak különböző időszakok időben és különböző helyeken.
A változást jellemző főbb mutatók , a tartomány, a szórás, a szórás és a variációs együttható.
Terjeszkedési variáció az attribútum maximális és minimális értéke közötti különbség: R = Xmax – Xmin. Ennek a mutatónak az a hátránya, hogy csak a tulajdonságvariáció határait értékeli, és nem tükrözi ezeken a határokon belüli ingadozását.
Diszperzió mentes ettől a hiányosságtól. Kiszámítása az attribútumértékek átlagos értékétől való eltéréseinek átlagos négyzete:
A variancia kiszámításának egyszerűsített módja a következő (egyszerű és súlyozott) képletekkel hajtják végre:
Ezen képletek alkalmazására az 1. és 2. feladatban mutatunk be példákat.
A gyakorlatban széles körben használt mutató az szórás :
A szórást a variancia négyzetgyökeként határozzuk meg, és a dimenziója megegyezik a vizsgált tulajdonságéval.
A figyelembe vett mutatók lehetővé teszik a szórás abszolút értékének megszerzését, pl. értékelje a vizsgált tulajdonság mértékegységeiben. Velük ellentétben a variációs együttható a fluktuációt relatív értékben méri - az átlagos szinthez viszonyítva, ami sok esetben előnyösebb.
Képlet a variációs együttható kiszámításához.
1. feladat . A kerület bankjaiban a reklámozás hatását a havi átlagos betét nagyságára vizsgálva 2 bankot vizsgáltunk. A következő eredményeket kapjuk:
Határozza meg:
1) bankonként: a) az átlagos méret havi betét; b) a hozzájárulás megoszlása;
2) az átlagos havi betét két bank esetében együtt;
3) A kaució felosztása 2 bankra, reklámtól függően;
4) A letét felosztása 2 bankra, minden tényezőtől függően, kivéve a reklámot;
5) Teljes variancia az összeadási szabály használatával;
6) Determinációs együttható;
7) Korrelációs reláció.
Megoldás
1) Készítsünk számítási táblázatot egy bank számára reklámozással . Az átlagos havi betét meghatározásához megtaláljuk az intervallumok felezőpontját. Ebben az esetben a nyitott intervallum (az első) értékét feltételesen egyenlővé tesszük a vele szomszédos intervallum értékével (a második).
A hozzájárulás átlagos nagyságát a súlyozott aritmetikai átlag képlettel találjuk meg:
29 000/50 = 580 rubel
A hozzájárulás szóródását a következő képlet határozza meg:
23 400/50 = 468
Hasonló műveleteket fogunk végrehajtani egy banknak hirdetések nélkül :
2) Keresse meg két bank átlagos betéti értékét együtt! Xav \u003d (580 × 50 + 542,8 × 50) / 100 \u003d 561,4 rubel.
3) A betét szórását, két bank esetében, reklámtól függően, a következő képlettel találjuk meg: σ 2 =pq (egy alternatív előjel varianciájának képlete). Itt p=0,5 a reklámtól függő tényezők aránya; q=1-0,5, majd σ 2 =0,5*0,5=0,25.
4) Mivel az egyéb tényezők aránya 0,5, ezért két bank esetében a betét szórása, amely a reklámon kívül minden tényezőtől függ, szintén 0,25.
5) Határozza meg a teljes szórást az összeadási szabály segítségével!
= (468*50+636,16*50)/100=552,08
= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96
σ 2 = σ 2 tény + σ 2 pihenő \u003d 552,08 + 345,96 \u003d 898,04
6) Meghatározási együttható η 2 = σ 2 tény / σ 2 = 345,96/898,04 = 0,39 = 39% - a hozzájárulás mértéke 39%-ban függ a reklámtól.
7) Empirikus korrelációs arány η = √η 2 = √0,39 = 0,62 - az összefüggés meglehetősen szoros.
2. feladat . A vállalkozásokat a piacképes termékek értéke szerint csoportosítják:
Határozza meg: 1) a piacképes termékek értékének szórását; 2) szórás; 3) variációs együttható.
Megoldás
1) Feltétel szerint bemutatva intervallum sorozat terjesztés. Diszkréten kell kifejezni, azaz meg kell keresni az intervallum közepét (x "). A zárt intervallumok csoportjaiban a középsőt egyszerű számtani átlaggal találjuk meg. A felső határral rendelkező csoportokban e felső határ különbségeként és az azt követő intervallum fele (200-(400 -200):2=100).
Alsó határértékkel rendelkező csoportokban - ennek az alsó határnak az összege és az előző intervallum fele (800+(800-600):2=900).
A piacképes termékek átlagos értékének kiszámítása a következő képlet szerint történik:
Хср = k×((Σ((x"-a):k)×f):Σf)+a. Itt a=500 a variáns mérete a legmagasabb frekvencián, k=600-400=200 a a legnagyobb gyakoriságú intervallum mérete Tegyük táblázatba az eredményt:
Így, átlagos érték piacképes termékek a vizsgált időszak egészére Xav = (-5:37) × 200 + 500 = 472,97 ezer rubel.
2) A diszperziót a következő képlettel találjuk meg:
σ 2 \u003d (33/37) * 2002-(472,97-500) 2 = 35 675,67-730,62 \u003d 34 945,05
3) szórás: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 ezer rubel.
4) Variációs együttható: V \u003d (σ / Xav) * 100 \u003d (186,94 / 472,97) * 100 \u003d 39,52%
A statisztikában használt számos mutató közül ki kell emelni a varianciaszámítást. Meg kell jegyezni, hogy ennek a számításnak a manuális végrehajtása meglehetősen fárasztó feladat. Szerencsére az Excelben vannak olyan függvények, amelyek lehetővé teszik a számítási eljárás automatizálását. Nézzük meg az ezekkel az eszközökkel való munka algoritmusát.
A variancia a szórás mértéke, amely az ettől való eltérések átlagos négyzete matematikai elvárás. Így a számok átlag körüli terjedését fejezi ki. A variancia kiszámítása a következőképpen végezhető el népesség, valamint szelektíven.
Ennek a mutatónak az Excelben az általános sokaságra történő kiszámításához a függvényt használják DISP.G. Ennek a kifejezésnek a szintaxisa a következő:
DISP.G(Szám1;Szám2;…)
Összesen 1-255 argumentum alkalmazható. Az argumentumok lehetnek számértékek és hivatkozások is azokra a cellákra, amelyekben szerepelnek.
Nézzük meg, hogyan számítható ki ez az érték egy numerikus adattartományra.
Ellentétben az általános sokaságra vonatkozó érték számításával, a minta számításánál a nevező nem az összes szám, hanem eggyel kevesebb. Ez a hiba kijavítása érdekében történik. Az Excel figyelembe veszi ezt az árnyalatot egy speciális funkcióban, amelyet az ilyen típusú számításokhoz terveztek - DISP.V. Szintaxisát a következő képlet képviseli:
VAR.B(Szám1;Szám2;…)
Az argumentumok száma az előző függvényhez hasonlóan szintén 1 és 255 között változhat.
Mint látható, az Excel program nagyban képes megkönnyíteni a variancia számítását. Ezt a statisztikát az alkalmazás a sokaságra és a mintára egyaránt kiszámíthatja. Ebben az esetben az összes felhasználói művelet valójában csak a feldolgozott számok és a fő számok tartományának meghatározására redukálódik Excel munka maga csinálja. Ez természetesen jelentős időt takarít meg a felhasználóknak.
Variációs tartomány (vagy variációs tartomány) - a jellemző maximális és minimális értéke közötti különbség:
Példánkban a dolgozók műszakteljesítményének változási tartománya: az első brigádban R=105-95=10 gyermek, a második brigádban R=125-75=50 gyermek. (5-ször több). Ez arra utal, hogy az 1. dandár teljesítménye „stabilabb”, de a második brigádnak több tartaléka van a kibocsátás növekedésére, mert. ha minden munkás eléri a maximális teljesítményt ennél a brigádnál, akkor 3 * 125 = 375 alkatrészt tud előállítani, az 1. brigádban pedig csak 105 * 3 = 315 alkatrészt.
Ha az attribútum szélső értékei nem jellemzőek a sokaságra, akkor kvartilis vagy decilis tartományokat használnak. Az RQ= Q3-Q1 kvartilis tartomány a populáció 50%-át fedi le, az első decilis tartomány RD1 = D9-D1 az adatok 80%-át, a második decilis tartomány RD2= D8-D2 60%-át fedi le.
A variációs tartomány mutató hátránya, hogy értéke nem tükrözi a tulajdonság összes ingadozását.
A legegyszerűbb általánosító mutató, amely egy tulajdonság összes ingadozását tükrözi átlagos lineáris eltérés, amely az egyes opciók átlagos értékétől való abszolút eltérésének számtani átlaga:
,
csoportosított adatokhoz
,
ahol хi a jellemző értéke diszkrét sorozat vagy intervallum közepe egy intervallumeloszlásban.
A fenti képletekben a számláló különbségeit modulo vesszük, ellenkező esetben a számtani átlag tulajdonsága szerint a számláló mindig nulla lesz. Ezért az átlagos lineáris eltérést ritkán alkalmazzák a statisztikai gyakorlatban, csak azokban az esetekben, amikor a mutatók összegzése az előjel figyelembevétele nélkül közgazdaságilag értelmes. Segítségével elemzik például a foglalkoztatottak összetételét, a termelés jövedelmezőségét, a külkereskedelmi forgalmat.
Feature variancia a változat átlagos értékétől való eltéréseinek átlagos négyzete:
egyszerű szórás
,
súlyozott variancia
.
A variancia kiszámításának képlete leegyszerűsíthető:
Így a szórás egyenlő a változat négyzeteinek átlaga és a sokaság változatának átlagának négyzete közötti különbséggel:
.
Az eltérések négyzetes összegzése miatt azonban a variancia torz képet ad az eltérésekről, így ebből számítják ki az átlagot. szórás, amely megmutatja, hogy az attribútum adott változatai átlagosan mennyivel térnek el átlagos értéküktől. Kivonattal számítva négyzetgyök diszperzióból:
csoportosítatlan adatokhoz
,
számára variációs sorozat
Minél kisebb a variancia és a szórás értéke, minél homogénebb a sokaság, annál megbízhatóbb (tipikusabb) lesz az átlagérték.
Lineáris átlag és átlag szórás- megnevezett számok, azaz az attribútum mértékegységében vannak kifejezve, tartalmukban azonosak és jelentésükben közel állnak egymáshoz.
számol abszolút mutatók táblázatok segítségével variációk javasoltak.
3. táblázat - A variációs jellemzők számítása (a munkacsoportok műszakteljesítményére vonatkozó adatok periódusának példáján)
Dolgozók száma |
Az intervallum közepe |
Becsült értékek |
|||||
Teljes: |
A dolgozók átlagos műszakteljesítménye:
Átlagos lineáris eltérés:
Kimeneti diszperzió:
Az egyes dolgozók kibocsátásának szórása az átlagos termeléstől:
.
Az eltérések számítása körülményes számításokkal jár (főleg, ha az átlagot nagy számként fejezzük ki, több tizedesjegygel). A számítások leegyszerűsíthetők egy egyszerűsített képlet és diszperziós tulajdonságok használatával.
A diszperzió a következő tulajdonságokkal rendelkezik:
,
, akkor vagy
A variancia tulajdonságait felhasználva, először a sokaság összes változatát csökkentve A értékkel, majd elosztva a h intervallum értékével, egy képletet kapunk az egyenlő intervallumú variációs sorozatok variancia kiszámítására. pillanatok módja:
,
ahol a nyomatékok módszerével számított diszperzió;
h a variációs sorozat intervallumának értéke;
– új (transzformált) változatértékek;
A egy állandó érték, amely a legnagyobb gyakoriságú intervallum közepeként használatos; vagy a legmagasabb frekvenciájú változat;
az első sorrend pillanatának négyzete;
a másodrendű pillanat.
Számítsuk ki a szórást momentumok módszerével a munkacsoport műszakteljesítményének adatai alapján.
4. táblázat - A diszperzió számítása nyomatékos módszerrel
Termelő munkások csoportjai, db. |
Dolgozók száma |
Az intervallum közepe |
Becsült értékek |
||
Számítási eljárás:
A statisztikák által vizsgált jelek között vannak olyanok, amelyeknek csak két, egymást kizáró jelentése van. Ezek alternatív jelek. Két mennyiségi értéket kapnak: az 1. és a 0. opciót. Az 1. opció gyakorisága, amelyet p-vel jelölünk, azon egységek aránya, amelyek rendelkeznek ezzel a tulajdonsággal. Az 1-p=q különbség a 0 opciók gyakorisága.
xi |
|
Alternatív jellemző számtani átlaga
, mivel p+q=1.
Feature variancia
, mert 1-p=q
Így egy alternatív attribútum szórása megegyezik az ezzel az attribútummal rendelkező egységek arányának és az ezzel az attribútummal nem rendelkező egységek arányának a szorzatával.
Ha az 1 és 0 értékek egyformán gyakoriak, azaz p=q, akkor a szórás eléri a maximumot, pq=0,25.
A varianciaváltozót mintavételes felmérésekben használják, például a termékminőséget illetően.
A diszperzió a változás egyéb jellemzőitől eltérően additív mennyiség. Vagyis a faktorkritérium szerint csoportokra bontott összesítésben x , eredő szórás y az egyes csoportokon belüli (csoporton belüli) és a csoportok közötti (csoportok közötti) varianciakra bontható. Ezután a tulajdonság variációinak vizsgálatával a populáció egészében, lehetővé válik az egyes csoportokban, valamint ezen csoportok közötti eltérések tanulmányozása.
Teljes variancia egy tulajdonság változását méri nál nél a teljes populációra az összes olyan tényező hatására, amely ezt a változást (eltéréseket) okozta. Ez egyenlő a jellemző egyedi értékeinek eltéréseinek négyzetes átlagával nál nél a teljes átlagból, és kiszámítható egyszerű vagy súlyozott varianciaként.
Csoportközi variancia az effektív tulajdonság variációját jellemzi nál nél, amelyet a jel-tényező hatása okoz x a csoportosítás mögött. Ez jellemzi a csoportátlagok változását, és egyenlő a csoportátlagok összátlagtól való eltéréseinek négyzetes átlagával:
,
ahol az i-edik csoport számtani átlaga;
– az i-edik csoportba tartozó egységek száma (az i-edik csoport gyakorisága);
a népesség összátlaga.
Csoporton belüli variancia véletlenszerű variációt tükröz, vagyis a változásnak azt a részét, amelyet nem figyelembe vett tényezők hatása okoz, és nem függ a csoportosítás alapjául szolgáló attribútum-tényezőtől. Ez jellemzi a variációt egyéni értékek a csoportátlagokhoz viszonyítva, egyenlő az attribútum egyedi értékeinek eltéréseinek négyzetes átlagával nál nél egy csoporton belül ennek a csoportnak a számtani átlagából (csoportátlag), és egyszerű vagy súlyozott varianciaként számítják ki minden csoportra:
vagy ,
ahol a csoportban lévő egységek száma.
Az egyes csoportok csoporton belüli eltérései alapján meg lehet határozni a csoporton belüli eltérések általános átlaga:
.
A három variancia közötti kapcsolatot ún szórásösszeadás szabályai, amely szerint a teljes variancia egyenlő a csoportközi variancia és a csoporton belüli eltérések átlagának összegével:
Példa. A munkavállalók tarifakategóriájának (képzettségének) a munkájuk termelékenységére gyakorolt hatását vizsgálva a következő adatokat kaptuk.
5. táblázat - A dolgozók megoszlása átlagos órateljesítmény szerint.
№ p/n |
A 4. kategória dolgozói |
Az 5. kategória dolgozói |
|||||
Edzés |
Edzés |
||||||
1 |
7 |
7-10=-3 |
9 |
1 |
14 |
14-15=-1 |
1 |
NÁL NÉL ezt a példát a munkavállalókat két csoportra osztják egy tényezőkritérium szerint x- képesítések, amelyeket a rangjuk jellemez. Az effektív tulajdonság - a termelés - mind a hatása alatt (csoportközi variáció), mind más véletlenszerű tényezők hatására (csoporton belüli variáció) változik. A kihívás az, hogy ezeket az eltéréseket három varianciával mérjük: teljes, csoportok közötti és csoporton belüli eltérésekkel. Az empirikus determinációs együttható az eredményül kapott jellemző változásának arányát mutatja nál nél tényezőjel hatására x. A teljes variáció többi része nál nél más tényezők változásai okozzák.
A példában az empirikus determinációs együttható a következő:
vagy 66,7%
Ez azt jelenti, hogy a dolgozók munkatermelékenységének ingadozásának 66,7%-a a képzettségbeli különbségekből, 33,3%-a pedig egyéb tényezők hatásából adódik.
Empirikus korrelációs reláció a csoportosítás és a hatásos jellemzők közötti kapcsolat szorosságát mutatja. Kiszámítása az empirikus determinációs együttható négyzetgyöke:
Az empirikus korrelációs hányados, valamint a 0 és 1 közötti értékeket vehet fel.
Ha nincs kapcsolat, akkor =0. Ebben az esetben =0, vagyis a csoportátlagok egyenlőek egymással, és nincs csoportok közötti eltérés. Ez azt jelenti, hogy a csoportosító jel - a tényező nem befolyásolja az általános eltérés kialakulását.
Ha a kapcsolat funkcionális, akkor =1. Ebben az esetben a csoportátlagok szórása megegyezik a teljes variancia () értékével, azaz nincs csoporton belüli eltérés. Ez azt jelenti, hogy a csoportosítási jellemző teljes mértékben meghatározza a vizsgált jellemző variációját.
Minél közelebb áll a korrelációs reláció értéke egyhez, annál szorosabb, közelebb áll a funkcionális függéshez a tulajdonságok közötti kapcsolat.
A jelek közötti kapcsolat szorosságának kvalitatív értékelésére a Chaddock relációkat használjuk.
A példában , ami szoros kapcsolatot jelez a dolgozók termelékenysége és képzettsége között.