Jellemző variancia képlete.  Abszolút változási arányok

Jellemző variancia képlete. Abszolút változási arányok

A statisztikában gyakran egy jelenség vagy folyamat elemzésekor nemcsak a vizsgált mutatók átlagos szintjeire vonatkozó információkat kell figyelembe venni, hanem az egyes egységek értékeinek szórása vagy változása , ami a vizsgált populáció fontos jellemzője.

Részvényárak, kereslet és kínálat volumene, kamatlábak különböző időszakok időben és különböző helyeken.

A változást jellemző főbb mutatók , a tartomány, a szórás, a szórás és a variációs együttható.

Terjeszkedési variáció az attribútum maximális és minimális értéke közötti különbség: R = Xmax – Xmin. Ennek a mutatónak az a hátránya, hogy csak a tulajdonságvariáció határait értékeli, és nem tükrözi ezeken a határokon belüli ingadozását.

Diszperzió mentes ettől a hiányosságtól. Kiszámítása az attribútumértékek átlagos értékétől való eltéréseinek átlagos négyzete:

A variancia kiszámításának egyszerűsített módja a következő (egyszerű és súlyozott) képletekkel hajtják végre:

Ezen képletek alkalmazására az 1. és 2. feladatban mutatunk be példákat.

A gyakorlatban széles körben használt mutató az szórás :

A szórást a következőképpen határozzuk meg Négyzetgyök a varianciától, és a vizsgált tulajdonság dimenziójával azonos.

A figyelembe vett mutatók lehetővé teszik a szórás abszolút értékének megszerzését, pl. értékelje a vizsgált tulajdonság mértékegységeiben. Velük ellentétben a variációs együttható a fluktuációt relatív értékben méri - az átlagos szinthez viszonyítva, ami sok esetben előnyösebb.

Képlet a variációs együttható kiszámításához.

Példák a problémák megoldására a "Statisztikák változási mutatói" témában

1. feladat . A régió bankjaiban a reklámozás hatását a havi átlagos betét nagyságára vizsgálva 2 bankot vizsgáltunk. A következő eredményeket kapjuk:

Határozza meg:
1) bankonként: a) az átlagos méret havi betét; b) a hozzájárulás megoszlása;
2) az átlagos havi betét két bank esetében együtt;
3) A kaució felosztása 2 bankra, reklámtól függően;
4) A letét felosztása 2 bankra, minden tényezőtől függően, kivéve a reklámot;
5) Teljes variancia az összeadási szabály használatával;
6) Determinációs együttható;
7) Korrelációs reláció.

Megoldás

1) Készítsünk számítási táblázatot egy bank számára reklámozással . Az átlagos havi betét meghatározásához megtaláljuk az intervallumok felezőpontját. Ebben az esetben a nyitott intervallum (az első) értékét feltételesen egyenlővé tesszük a vele szomszédos intervallum értékével (a második).

A hozzájárulás átlagos nagyságát a súlyozott aritmetikai átlag képlettel találjuk meg:

29 000/50 = 580 rubel

A hozzájárulás szóródását a következő képlet határozza meg:

23 400/50 = 468

Hasonló műveleteket fogunk végrehajtani egy banknak hirdetések nélkül :

2) Keresse meg két bank átlagos betéti értékét együtt! Xav \u003d (580 × 50 + 542,8 × 50) / 100 \u003d 561,4 rubel.

3) A betét szórását két bank esetében a reklámtól függően a következő képlettel találjuk meg: σ 2 =pq (egy alternatív jellemző varianciájának képlete). Itt p=0,5 a reklámtól függő tényezők aránya; q=1-0,5, majd σ 2 =0,5*0,5=0,25.

4) Mivel az egyéb tényezők aránya 0,5, ezért két bank esetében a betét szórása, amely a reklámon kívül minden tényezőtől függ, szintén 0,25.

5) Határozza meg a teljes szórást az összeadási szabály segítségével!

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 tény + σ 2 pihenő \u003d 552,08 + 345,96 \u003d 898,04

6) Meghatározási együttható η 2 = σ 2 tény / σ 2 = 345,96/898,04 = 0,39 = 39% - a hozzájárulás mértéke 39%-ban függ a reklámtól.

7) Empirikus korrelációs arány η = √η 2 = √0,39 = 0,62 - az összefüggés meglehetősen szoros.

2. feladat . A vállalkozásokat a piacképes termékek értéke szerint csoportosítják:

Határozza meg: 1) a piacképes termékek értékének szórását; 2) szórás; 3) variációs együttható.

Megoldás

1) Feltétel szerint bemutatva intervallum sorozat terjesztés. Diszkréten kell kifejezni, azaz meg kell keresni az intervallum közepét (x "). A zárt intervallumok csoportjaiban a középsőt egyszerű számtani átlaggal találjuk meg. A felső határral rendelkező csoportokban e felső határ különbségeként és az azt követő intervallum fele (200-(400 -200):2=100).

Alsó határértékkel rendelkező csoportokban - ennek az alsó határnak az összege és az előző intervallum fele (800+(800-600):2=900).

A piacképes termékek átlagos értékének kiszámítása a következő képlet szerint történik:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Itt a=500 a variáns mérete a legmagasabb frekvencián, k=600-400=200 a a legnagyobb gyakoriságú intervallum mérete Tegyük táblázatba az eredményt:

Így, átlagos érték piacképes termékek a vizsgált időszak egészére Xav = (-5:37) × 200 + 500 = 472,97 ezer rubel.

2) A diszperziót a következő képlettel találjuk meg:

σ 2 \u003d (33/37) * 2002-(472,97-500) 2 = 35 675,67-730,62 \u003d 34 945,05

3) szórás: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 ezer rubel.

4) Variációs együttható: V \u003d (σ / Xav) * 100 \u003d (186,94 / 472,97) * 100 \u003d 39,52%

Változási tartomány (vagy variációs tartomány) - a jellemző maximális és minimális értéke közötti különbség:

Példánkban a dolgozók műszakteljesítményének változási tartománya: az első brigádban R=105-95=10 gyermek, a második brigádban R=125-75=50 gyermek. (5-ször több). Ez arra utal, hogy az 1. dandár teljesítménye „stabilabb”, de a második brigádnak több tartaléka van a kibocsátás növekedésére, mert. ha minden munkás eléri a maximális teljesítményt ennél a brigádnál, akkor 3 * 125 = 375 alkatrészt tud előállítani, az 1. brigádban pedig csak 105 * 3 = 315 alkatrészt.
Ha az attribútum szélső értékei nem jellemzőek a sokaságra, akkor kvartilis vagy decilis tartományokat használnak. Az RQ= Q3-Q1 kvartilis tartomány a populáció 50%-át fedi le, az első decilis tartomány RD1 = D9-D1 az adatok 80%-át, a második decilis tartomány RD2= D8-D2 60%-át fedi le.
A variációs tartomány mutató hátránya, hogy értéke nem tükrözi a tulajdonság összes ingadozását.
A legegyszerűbb általánosító mutató, amely egy tulajdonság összes ingadozását tükrözi átlagos lineáris eltérés, amely az egyes opciók átlagos értékétől való abszolút eltérésének számtani átlaga:

,
csoportosított adatokhoz
,
ahol хi a jellemző értéke diszkrét sorozat vagy intervallum közepe egy intervallumeloszlásban.
A fenti képletekben a számláló különbségeit modulo vesszük, ellenkező esetben a számtani átlag tulajdonsága szerint a számláló mindig nulla lesz. Ezért az átlagos lineáris eltérést ritkán alkalmazzák a statisztikai gyakorlatban, csak azokban az esetekben, amikor a mutatók összegzése az előjel figyelembevétele nélkül közgazdaságilag értelmes. Segítségével elemzik például a foglalkoztatottak összetételét, a termelés jövedelmezőségét, a külkereskedelmi forgalmat.
Feature variancia a változat átlagos értékétől való eltéréseinek átlagos négyzete:
egyszerű szórás
,
súlyozott variancia
.
A variancia kiszámításának képlete leegyszerűsíthető:

Így a szórás egyenlő a változat négyzeteinek átlaga és a sokaság változatának átlagának négyzete közötti különbséggel:
.
Az eltérések négyzetes összegzése miatt azonban a variancia torz képet ad az eltérésekről, így ebből számítják ki az átlagot. szórás, amely megmutatja, hogy az attribútum adott változatai átlagosan mennyivel térnek el átlagos értéküktől. A variancia négyzetgyökéből számítva:
csoportosítatlan adatokhoz
,
számára variációs sorozat

Minél kisebb a variancia és a szórás értéke, minél homogénebb a sokaság, annál megbízhatóbb (tipikusabb) lesz az átlagérték.
Lineáris átlag és átlag szórás- megnevezett számok, azaz az attribútum mértékegységében vannak kifejezve, tartalmukban azonosak és jelentésükben közel állnak egymáshoz.
A szórás abszolút mutatóit táblázatok segítségével javasoljuk kiszámítani.
3. táblázat - A variációs jellemzők számítása (a munkacsoportok műszakteljesítményére vonatkozó adatok periódusának példáján)


Dolgozók száma

Az intervallum közepe

Becsült értékek

Teljes:

A dolgozók átlagos műszakteljesítménye:

Átlagos lineáris eltérés:

Kimeneti diszperzió:

Az egyes dolgozók kibocsátásának szórása az átlagos termeléstől:
.

1. Diszperziószámítás nyomatékos módszerrel

Az eltérések számítása nehézkes számításokkal jár (különösen, ha az átlagértéket fejezzük ki egy nagy szám több tizedesjegygel). A számítások leegyszerűsíthetők egy egyszerűsített képlet és diszperziós tulajdonságok használatával.
A diszperzió a következő tulajdonságokkal rendelkezik:

  1. ha az attribútum összes értékét csökkentjük vagy növeljük ugyanazzal az A értékkel, akkor a szórás ettől nem csökken:

,

, akkor vagy
A variancia tulajdonságait felhasználva, először a sokaság összes változatát csökkentve A értékkel, majd elosztva a h intervallum értékével, egy képletet kapunk az egyenlő intervallumú variációs sorozatok variancia kiszámítására. pillanatok módja:
,
ahol a nyomatékok módszerével számított diszperzió;
h a variációs sorozat intervallumának értéke;
– új (transzformált) változatértékek;
A egy állandó érték, amely a legnagyobb gyakoriságú intervallum közepeként használatos; vagy a legmagasabb frekvenciájú változat;
az első sorrend pillanatának négyzete;
a másodrendű pillanat.
Számítsuk ki a szórást momentumok módszerével a munkacsoport műszakteljesítményének adatai alapján.
4. táblázat - A diszperzió számítása nyomatékos módszerrel


Termelő munkások csoportjai, db.

Dolgozók száma

Az intervallum közepe

Becsült értékek

Számítási eljárás:


  1. számítsuk ki a szórást:

2 Alternatív jellemző varianciájának kiszámítása

A statisztikák által vizsgált jelek között vannak olyanok, amelyeknek csak két, egymást kizáró jelentése van. Ezek alternatív jelek. Két mennyiségi értéket kapnak: az 1. és a 0. opciót. Az 1. opció gyakorisága, amelyet p-vel jelölünk, azon egységek aránya, amelyek rendelkeznek ezzel a tulajdonsággal. Az 1-p=q különbség a 0 opciók gyakorisága.


xi

Alternatív jellemző számtani átlaga
, mivel p+q=1.

Feature variancia
, mert 1-p=q
Így egy alternatív attribútum szórása megegyezik az ezzel az attribútummal rendelkező egységek arányának és az ezzel az attribútummal nem rendelkező egységek arányának a szorzatával.
Ha az 1 és 0 értékek egyformán gyakoriak, azaz p=q, akkor a szórás eléri a maximumot, pq=0,25.
A varianciaváltozót mintavételes felmérésekben használják, például a termékminőséget illetően.

3 Csoportközi diszperzió. Varianciaösszeadás szabály

A diszperzió a változás egyéb jellemzőitől eltérően additív mennyiség. Vagyis a faktorkritérium szerint csoportokra bontott összesítésben x , eredő szórás y az egyes csoportokon belüli (csoporton belüli) és a csoportok közötti (csoportok közötti) varianciakra bontható. Ezután a tulajdonság variációinak vizsgálatával a populáció egészében, lehetővé válik az egyes csoportokban, valamint ezen csoportok közötti eltérések tanulmányozása.

Teljes variancia egy tulajdonság változását méri nál nél a teljes populációra az összes olyan tényező hatására, amely ezt a változást (eltéréseket) okozta. Ez egyenlő a jellemző egyedi értékeinek eltéréseinek négyzetes átlagával nál nél a teljes átlagból, és kiszámítható egyszerű vagy súlyozott varianciaként.
Csoportközi variancia az effektív tulajdonság variációját jellemzi nál nél, amelyet a jel-tényező hatása okoz x a csoportosítás mögött. Ez jellemzi a csoportátlagok változását, és egyenlő a csoportátlagok összátlagtól való eltéréseinek négyzetes átlagával:
,
ahol az i-edik csoport számtani átlaga;
– az i-edik csoportba tartozó egységek száma (az i-edik csoport gyakorisága);
a népesség összátlaga.
Csoporton belüli variancia véletlenszerű variációt tükröz, vagyis a változásnak azt a részét, amelyet nem figyelembe vett tényezők hatása okoz, és nem függ a csoportosítás alapjául szolgáló attribútum-tényezőtől. Ez jellemzi a variációt egyéni értékek a csoportátlagokhoz viszonyítva, egyenlő az attribútum egyedi értékeinek eltéréseinek négyzetes átlagával nál nél egy csoporton belül ennek a csoportnak a számtani átlagából (csoportátlag), és egyszerű vagy súlyozott varianciaként számítják ki minden csoportra:
vagy ,
ahol a csoportban lévő egységek száma.
Az egyes csoportok csoporton belüli eltérései alapján meg lehet határozni a csoporton belüli eltérések általános átlaga:
.
A három variancia közötti kapcsolatot ún szórásösszeadás szabályai, amely szerint a teljes variancia egyenlő a csoportközi variancia és a csoporton belüli eltérések átlagának összegével:

Példa. A munkavállalók tarifakategóriájának (képzettségének) a munkájuk termelékenységére gyakorolt ​​​​hatását vizsgálva a következő adatokat kaptuk.
5. táblázat - A dolgozók megoszlása ​​átlagos órateljesítmény szerint.



p/p

A 4. kategória dolgozói

Az 5. kategória dolgozói

Edzés
munkás, db,

Edzés
munkás, db,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

NÁL NÉL ezt a példát a munkavállalókat két csoportra osztják egy tényezőkritérium szerint x- képesítések, amelyeket a rangjuk jellemez. Az effektív tulajdonság - a termelés - mind a hatása alatt (csoportközi variáció), mind más véletlenszerű tényezők hatására (csoporton belüli variáció) változik. A kihívás az, hogy ezeket az eltéréseket három varianciával mérjük: teljes, csoportok közötti és csoporton belüli eltérésekkel. Az empirikus determinációs együttható az eredményül kapott jellemző változásának arányát mutatja nál nél tényezőjel hatására x. A teljes variáció többi része nál nél más tényezők változásai okozzák.
A példában az empirikus determinációs együttható a következő:
vagy 66,7%
Ez azt jelenti, hogy a dolgozók munkatermelékenységének ingadozásának 66,7%-a a képzettségbeli különbségekből, 33,3%-a pedig egyéb tényezők hatásából adódik.
Empirikus korrelációs reláció a csoportosítás és a hatásos jellemzők közötti kapcsolat szorosságát mutatja. Kiszámítása az empirikus determinációs együttható négyzetgyöke:

Az empirikus korrelációs hányados, valamint a 0 és 1 közötti értékeket vehet fel.
Ha nincs kapcsolat, akkor =0. Ebben az esetben =0, vagyis a csoportátlagok egyenlőek egymással, és nincs csoportok közötti eltérés. Ez azt jelenti, hogy a csoportosító jel - a tényező nem befolyásolja az általános eltérés kialakulását.
Ha a kapcsolat funkcionális, akkor =1. Ebben az esetben a csoportátlagok szórása megegyezik a teljes variancia () értékével, azaz nincs csoporton belüli eltérés. Ez azt jelenti, hogy a csoportosítási jellemző teljes mértékben meghatározza a vizsgált jellemző variációját.
Minél közelebb áll a korrelációs reláció értéke egyhez, annál szorosabb, közelebb áll a funkcionális függéshez a tulajdonságok közötti kapcsolat.
A jelek közötti kapcsolat szorosságának kvalitatív értékelésére a Chaddock relációkat használjuk.

A példában , ami szoros kapcsolatot jelez a dolgozók termelékenysége és képzettsége között.

Csoportosított adatokhoz maradék diszperzió- a csoporton belüli diszperziók átlaga:

Ahol σ 2 j a j -edik csoport csoporton belüli varianciája.

Csoportosítatlan adatokhoz maradék diszperzió a közelítési pontosság mértéke, azaz. a regressziós egyenes közelítése az eredeti adatokhoz:
ahol y(t) a trendegyenlet szerinti előrejelzés; y t – a dinamika kezdeti sorozata; n a pontok száma; p a regressziós egyenlet együtthatóinak száma (a magyarázó változók száma).
Ebben a példában az ún elfogulatlan varianciabecslés.

1. példa. Egy társulás három vállalkozásának dolgozóinak tarifakategóriák szerinti megoszlását a következő adatok jellemzik:

Munkásbér kategóriaA vállalkozásnál dolgozók száma
vállalkozás 1vállalkozás 2vállalkozás 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Határozza meg:
1. diszperzió az egyes vállalkozásokra (csoporton belüli diszperzió);
2. a csoporton belüli diszperziók átlaga;
3. csoportközi diszperzió;
4. teljes variancia.

Megoldás.
Mielőtt folytatná a probléma megoldását, meg kell találnia, hogy melyik funkció hatékony és melyik tényező. A vizsgált példában az érvényes jellemző a "tarifakategória", a tényezőjellemző pedig a "Vállalkozás száma (név)".
Ekkor van három olyan csoportunk (vállalkozásunk), amelyekhez ki kell számítani a csoportátlagot és a csoporton belüli eltéréseket:


Vállalatcsoport átlag,csoporton belüli variancia,
1 4 1,8

A csoporton belüli eltérések átlaga ( maradék diszperzió) a következő képlettel számítva:


ahol lehet számolni:
vagy:


akkor:
A teljes diszperzió egyenlő lesz: s 2 \u003d 1,6 + 0 \u003d 1,6.
A teljes variancia a következő két képlet valamelyikével is kiszámítható:

Gyakorlati problémák megoldása során gyakran olyan jellel kell számolni, amely csak két alternatív értéket vesz fel. Ebben az esetben nem egy jellemző értékének súlyáról beszélnek, hanem az aggregátumban való részesedéséről. Ha a vizsgált tulajdonsággal rendelkező populációs egységek arányát a " R", és nem birtoklás - keresztül" q”, akkor a diszperzió a következő képlettel számítható ki:
s2 = p×q

2. példa. A brigád hat dolgozójának fejlettségi adatai alapján határozza meg a csoportközi szórást, és értékelje a műszak hatását a munkatermelékenységükre, ha a teljes variancia 12,2.

A dolgozó brigád szMűködési teljesítmény, db.
az első műszakban2. műszakban
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Megoldás. Kezdeti adatok

xf1f2f 3f4f5f6Teljes
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Teljes 31 33 37 37 40 38

Ekkor van 6 csoportunk, amelyekre ki kell számítani a csoportátlagot és a csoporton belüli varianciákat.
1. Keresse meg az egyes csoportok átlagértékeit!.







2. Határozza meg az egyes csoportok átlagos négyzetét!.







A számítás eredményeit táblázatban foglaljuk össze:
CsoportszámCsoportátlagCsoporton belüli variancia
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Csoporton belüli variancia jellemzi a vizsgált (eredményes) tulajdonság csoporton belüli változását (variációját) minden tényező hatására, kivéve a csoportosítás alapjául szolgáló tényezőt:
A csoporton belüli diszperziók átlagát a következő képlettel számítjuk ki:


4. Csoportközi variancia a vizsgált (eredményes) tulajdonság változását (variációját) jellemzi a csoportosítás alapjául szolgáló tényező (faktoriális vonás) hatására.
A csoportok közötti diszperziót a következőképpen határozzuk meg:

ahol


Akkor

Teljes variancia jellemzi a vizsgált (eredményes) tulajdonság változását (variációját) kivétel nélkül minden tényező (faktoriális tulajdonság) hatására. A feladat feltétele szerint egyenlő 12,2-vel.
Empirikus korrelációs reláció azt méri, hogy az eredményül kapott attribútum teljes fluktuációjának mekkora részét okozza a vizsgált tényező. Ez a faktorvariancia és a teljes variancia aránya:

Meghatározzuk az empirikus korrelációs kapcsolatot:

A jellemzők közötti kapcsolatok lehetnek gyengeek vagy erősek (szorosak). Kritériumaik értékelése a Chaddock-skálán történik:
0,1 0,3 0,5 0,7 0,9 Példánkban az Y jellemző X tényezője közötti kapcsolat gyenge
Meghatározási együttható.

Határozzuk meg a determinációs együtthatót:

Így az eltérés 0,67%-a a tulajdonságok közötti különbségekből, 99,37%-a pedig egyéb tényezőkből adódik.
Következtetés: ban ben ez az eset a dolgozók fejlődése nem függ az adott műszakban végzett munkától, azaz. a műszak befolyása a munkatermelékenységükre nem jelentős, és más tényezőkre vezethető vissza.

3. példa. Átlag alapján bérekés az értékétől való négyzetes eltérések két dolgozócsoport esetében, keresse meg a teljes szórást az eltérések összeadására vonatkozó szabály alkalmazásával:

Megoldás:
A csoporton belüli eltérések átlaga

A csoportok közötti diszperziót a következőképpen határozzuk meg:


A teljes szórás: 480 + 13824 = 14304

Diszperzió valószínűségi változó - egy adott szóródásának mértéke valószínűségi változó, vagyis őt eltérések tól től matematikai elvárás. A statisztikában a jelölést (szigma négyzet) gyakran használják a variancia jelölésére. A variancia négyzetgyökét ún szórás vagy standard spread. A szórást ugyanabban az egységben mérjük, mint magát a valószínűségi változót, és a szórást az egység négyzetében mérjük.

Bár nagyon kényelmes csak egy érték (például átlag vagy módusz és medián) használata a teljes minta becsléséhez, ez a megközelítés könnyen helytelen következtetésekhez vezethet. Ennek a helyzetnek az oka nem magában az értékben rejlik, hanem abban, hogy egy érték semmilyen módon nem tükrözi az adatértékek terjedését.

Például a mintában:

az átlag 5.

Magában a mintában azonban nincs 5-ös értékű elem. Lehetséges, hogy tudnia kell, hogy a minta egyes elemei milyen közel állnak az átlagos értékükhöz. Más szóval, ismernie kell az értékek szórását. Ismerve, hogy az adatok milyen mértékben változtak, jobban értelmezhető átlagos, középsőés divat. A mintaértékek változásának mértékét a szórása és a szórása kiszámításával határozzuk meg.



A variancia és a variancia négyzetgyöke, az úgynevezett szórás, jellemzi a minta átlagától való átlagos eltérést. E két mennyiség között legmagasabb érték Megvan szórás. Ezt az értéket úgy ábrázolhatjuk, mint az az átlagos távolság, amelyen az elemek a minta középső elemétől vannak.

A diszperziót nehéz értelmesen értelmezni. Ennek az értéknek a négyzetgyöke azonban a szórás, és jól értelmezhető.

A szórást úgy számítjuk ki, hogy először meghatározzuk a szórást, majd kiszámítjuk a szórás négyzetgyökét.

Például az ábrán látható adattömb esetében a következő értékeket kapjuk:

1. kép

Itt a különbségek négyzetes átlaga 717,43. A szóráshoz csak ennek a számnak a négyzetgyökét kell venni.

Az eredmény körülbelül 26,78 lesz.

Emlékeztetni kell arra, hogy a szórást az az átlagos távolság, amelyen az elemek a minta átlagától vannak.

A szórás megmutatja, hogy az átlag mennyire írja le jól a teljes mintát.

Tegyük fel, hogy Ön a PC összeszerelésével foglalkozó gyártási osztály vezetője. A negyedéves jelentés szerint az utolsó negyedévben 2500 PC-t gyártottak. Rossz vagy jó? Ön azt kérte (vagy már van ez az oszlop a jelentésben), hogy jelenítse meg a jelentésben az adatok szórását. A szórásszám például 2000. Ön, mint osztályvezető számára világossá válik, hogy a gyártósornak jobb vezérlésre van szüksége (túl nagy eltérések vannak az összeszerelt PC-k számában).

Emlékezzünk vissza, hogy ha a szórás nagy, az adatok széles körben szóródnak az átlag körül, és ha a szórás kicsi, akkor az átlaghoz közel klasztereznek.

Négy statisztikai függvény VARP(), VARP(), STDEV() és STDEV() arra szolgál, hogy kiszámítsa a számok szórását és szórását egy cellatartományban. Egy adathalmaz szórásának és szórásának kiszámítása előtt meg kell határozni, hogy az adatok az általános sokaságot vagy egy mintát képviselnek-e. népesség. Az általános sokaságból vett minta esetén a VARP() és STDEV() függvényeket, az általános sokaságnál pedig a VARP() és STDEV() függvényeket kell használni:

Népesség Funkció

VARP()

STDLONG()
Minta

VARI()

STDEV()

A variancia (valamint a szórás), mint már említettük, azt jelzi, hogy az adatkészletben szereplő értékek milyen mértékben szóródnak a számtani átlag körül.

A szórás vagy szórás kis értéke azt jelzi, hogy minden adat a számtani átlag köré összpontosul, és nagyon fontos ezek az értékek – hogy az adatok az értékek széles tartományában vannak szétszórva.

Az eltérést meglehetősen nehéz értelmesen értelmezni (mit jelent a kis érték, a nagy érték?). Teljesítmény Feladatok 3 lehetővé teszi, hogy vizuálisan, grafikonon mutassa meg az adathalmaz eltérésének jelentését.

Feladatok

· 1. Feladat.

· 2.1. Adja meg a fogalmakat: variancia és szórás; szimbolikus jelölésüket a statisztikai adatfeldolgozásban.

· 2.2. Készítsen munkalapot az 1. ábra szerint, és végezze el a szükséges számításokat!

· 2.3. Adja meg a számításokhoz használt alapképleteket!

· 2.4. Magyarázza meg az összes jelölést ( , , )

· 2.5. megmagyarázni gyakorlati érték a variancia és a szórás fogalma.

2. feladat.

1.1. Adja meg a fogalmakat: általános sokaság és minta; szimbolikus jelölésük matematikai elvárása és számtani átlaga a statisztikai adatfeldolgozásban.

1.2. A 2. ábra szerint készítsen munkalapot és végezzen számításokat.

1.3. Adja meg a számításokhoz használt alapképleteket (az általános sokaságra és a mintára).

2. ábra

1.4. Magyarázza el, miért lehetséges olyan számtani átlagértékeket kapni a mintákban, mint a 46,43 és a 48,78 (lásd a mellékletet). Következtetni.

3. feladat.

Két minta eltérő adatkészlettel rendelkezik, de ezek átlaga ugyanaz lesz:

3. ábra

3.1. Készítsen munkalapot a 3. ábra szerint, és végezze el a szükséges számításokat!

3.2. Adja meg az alapvető számítási képleteket!

3.3. Készítsen grafikonokat a 4., 5. ábra szerint.

3.4. Magyarázza meg a keletkező függőségeket!

3.5. Végezzen hasonló számításokat erre a két mintára.

Kiindulási minta 11119999

Válassza ki a második minta értékeit úgy, hogy a második minta számtani átlaga azonos legyen, például:

Válassza ki saját maga a második minta értékeit. Rendezd el a számításokat és az ábrázolást a 3., 4., 5. ábra szerint. Mutasd be a számításoknál használt fő képleteket!

Vonja le a megfelelő következtetéseket.

Minden feladatot jelentés formájában kell bemutatni az összes szükséges ábrával, grafikonnal, képletekkel és rövid magyarázatokkal.

Megjegyzés: a grafikonok felépítését ábrákkal és rövid magyarázatokkal kell magyarázni.

Ez a jellemző azonban önmagában még nem elegendő egy valószínűségi változó vizsgálatához. Képzelj el két lövöldözőt, akik célba lőnek. Az egyik pontosan lő és közelről üt, a másik pedig ... csak szórakozik és nem is céloz. De az a vicces átlagos az eredmény pontosan ugyanaz lesz, mint az első lövésznél! Ezt a helyzetet feltételesen illusztrálják a következő valószínűségi változók:

A "mesterlövész" matematikai elvárás azonban egyenlő az "érdekes személy" -vel: - ez is nulla!

Ezért számszerűsíteni kell, hogy meddig elszórt golyók (egy valószínűségi változó értékei) a cél középpontjához képest (elvárás). jól és szétszóródás latinból csak mint diszperzió .

Nézzük meg, hogyan határozható meg ez a numerikus jellemző a lecke 1. részének egyik példájában:

Ott találtunk egy kiábrándító matematikai elvárást ezzel a játékkal szemben, és most ki kell számolnunk a szórását, ami jelöljük keresztül.

Nézzük meg, hogy a győzelmek/veszteségek mennyire "szóródnak" az átlagértékhez képest. Nyilván ehhez számolnunk kell különbségek között egy valószínűségi változó értékeiés ő matematikai elvárás:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Most úgy tűnik, hogy összegezni kell az eredményeket, de ez nem jó, mert a bal oldali oszcillációk kioltják egymást a jobb oldali oszcillációkkal. Tehát például az "amatőr" lövöldözős (példa fent) a különbségek lesznek , és hozzáadva nullát adnak, így nem kapunk becslést a lövésének szóródásáról.

A bosszúság elkerülése érdekében fontolja meg modulok különbségek, de technikai okokból a megközelítés gyökeret vert, ha négyzetre emeljük. Kényelmesebb a megoldást táblázatba rendezni:

És itt számolni kell súlyozott átlag a négyzetes eltérések értéke. Mi az? Az övék várható érték, ami a szórás mértéke:

meghatározás diszperzió. A definícióból azonnal kiderül, hogy szórás nem lehet negatív- gyakorlathoz vedd figyelembe!

Emlékezzünk arra, hogyan találjuk meg az elvárást. Szorozzuk meg a különbségek négyzetét a megfelelő valószínűséggel (A táblázat folytatása):
- átvitt értelemben ez a "vonóerő",
és foglalja össze az eredményeket:

Nem gondolja, hogy a nyeremények hátterében az eredmény túl nagynak bizonyult? Így van – négyzetbe húztunk, és ahhoz, hogy visszatérjünk játékunk dimenziójához, négyzetgyököt kell venni. Ezt az értéket hívják szórás és a görög "szigma" betűvel jelöljük:

Néha ezt a jelentést nevezik szórás .

mi a jelentése? Ha a matematikai elvárástól a szórással balra és jobbra térünk el:

– akkor a valószínűségi változó legvalószínűbb értékei „koncentrálódnak” erre az intervallumra. Amit valójában látunk:

Történt azonban, hogy a szóródás elemzése során szinte mindig a szóródás fogalmával dolgozzunk. Lássuk, mit jelent ez a játékokkal kapcsolatban. Ha a lövészeknél a célpont középpontjához viszonyított találatok "pontosságáról" beszélünk, akkor itt a szóródás két dolgot jellemez:

Először is nyilvánvaló, hogy az arányok növekedésével a szórás is nő. Tehát ha például 10-szeresére növeljük, akkor a matematikai elvárás 10-szeresére, a szórás pedig 100-szorosára nő. (amint ez egy másodfokú érték). De vedd figyelembe, hogy a játékszabályok nem változtak! Csak az árfolyamok változtak, nagyjából 10 rubelt fogadtunk, most 100-at.

A második, érdekesebb pont, hogy a szóródás jellemzi a játékstílust. Mentálisan rögzítse a játék arányát valamilyen bizonyos szinten, és nézd meg, mi van itt:

Az alacsony varianciájú játék óvatos játék. A játékos hajlamos a legmegbízhatóbb sémákat választani, ahol nem veszít/nyer túl sokat egyszerre. Például a piros/fekete rendszer a rulettben (lásd a cikk 4. példáját Véletlen változók) .

Magas varianciájú játék. Gyakran hívják diszperzió játszma, meccs. Ez egy kalandos vagy agresszív játékstílus, ahol a játékos „adrenalin” sémákat választ. Legalább emlékezzünk "Martingale", amelyben a tét összegek nagyságrendekkel nagyobbak, mint az előző bekezdés „csendes” játéka.

A póker helyzete jelzésértékű: vannak ún szoros olyan játékosok, akik hajlamosak óvatosak lenni, és "rázzák" játékpénzeiket (bankroll). Nem meglepő, hogy bankrolljuk nem nagyon ingadozik (alacsony szórás). Ezzel szemben, ha egy játékosnak nagy a varianciája, akkor ő az agresszor. Gyakran kockáztat, nagy téteket köt, és képes egy hatalmas bankot feltörni és darabokra hullani.

Ugyanez történik a Forexben és így tovább – sok példa van rá.

Sőt, minden esetben nem mindegy, hogy a játék egy fillérért vagy több ezer dollárért szól. Minden szintnek megvannak a maga alacsony és nagy varianciájú játékosai. Nos, az átlagos győzelemért, mint emlékszünk, "felelős" várható érték.

Valószínűleg észrevette, hogy az eltérés megtalálása hosszú és fáradságos folyamat. De a matematika nagyvonalú:

Képlet a szórás meghatározásához

Ez a képlet közvetlenül a variancia definíciójából származik, és azonnal forgalomba hozzuk. Felülről lemásolom a táblát a játékunkkal:

és a megtalált elvárás .

A szórást a második módon számítjuk ki. Először keressük meg a matematikai elvárást - a valószínűségi változó négyzetét. Által a matematikai elvárás meghatározása:

Ebben az esetben:

Tehát a képlet szerint:

Ahogy mondják, érezd a különbséget. A gyakorlatban pedig természetesen jobb a képlet alkalmazása (hacsak a feltétel másként nem kívánja).

Elsajátítjuk a megoldás és a tervezés technikáját:

6. példa

Keresse meg annak matematikai elvárását, szórását és szórását.

Ez a feladat mindenhol megtalálható, és általában nincs értelme.
Elképzelhetsz több számmal ellátott izzót, amelyek bizonyos valószínűséggel kigyulladnak egy őrültek házában :)

Megoldás: A főbb számításokat célszerű táblázatban összefoglalni. Először a felső két sorba írjuk a kezdő adatokat. Ezután kiszámoljuk a termékeket, majd végül az összegeket a jobb oldali oszlopban:

Valójában szinte minden készen áll. A harmadik sorban egy kész matematikai elvárás rajzolódott ki: .

A diszperziót a következő képlettel számítjuk ki:

És végül a szórás:
- személy szerint én 2 tizedesjegyig szoktam kerekíteni.

Minden számítás elvégezhető számológépen, és még jobb - Excelben:

Itt nehéz tévedni :)

Válasz:

Azok, akik szeretnék, még jobban leegyszerűsíthetik az életüket, és kihasználhatják az enyémet számológép (demó), amely nem csak azonnal megoldja ezt a problémát, hanem épít is tematikus grafika (hamarosan). A program képes letöltés a könyvtárban– ha legalább egyet letöltött oktatási anyag vagy kapni Egy másik módja. Köszönjük a projekt támogatását!

Néhány feladat az önálló megoldáshoz:

7. példa

Számítsa ki az előző példa valószínűségi változójának varianciáját definíció szerint!

És egy hasonló példa:

8. példa

Egy diszkrét valószínűségi változót a saját eloszlási törvénye ad meg:

Igen, a valószínűségi változó értékei elég nagyok lehetnek (példa innen igazi munka) , és itt, ha lehetséges, használja az Excelt. Ahogy egyébként a 7. példában - gyorsabb, megbízhatóbb és kellemesebb.

Megoldások és válaszok az oldal alján.

A lecke 2. részének végén még egyet elemzünk tipikus feladat, akár azt is mondhatnánk, egy kis rébusz:

9. példa

Egy diszkrét valószínűségi változó csak két értéket vehet fel: és , és . A valószínűség, a matematikai elvárás és a szórás ismert.

Megoldás: Kezdjük egy ismeretlen valószínűséggel. Mivel egy valószínűségi változó csak két értéket vehet fel, akkor a megfelelő események valószínűségeinek összege:

és azóta .

Már csak meg kell találni..., könnyű mondani :) De na jó, elkezdődött. A matematikai elvárás definíciója szerint:
- helyettesítse az ismert értékeket:

- és ebből az egyenletből semmi mást nem lehet kipréselni, csak azt, hogy átírhatod a szokásos irányba:

vagy:

A további akciókról szerintem lehet találgatni. Készítsük el és oldjuk meg a rendszert:

Tizedesjegyek- ez persze teljes szégyen; szorozd meg mindkét egyenletet 10-zel:

és oszd el 2-vel:

Ez sokkal jobb. Az 1. egyenletből a következőket fejezzük ki:
(ez a könnyebb út)- helyettesítse a 2. egyenletben:


Mi építkezünk négyzet alakúés egyszerűsítsünk:

Megszorozzuk:

Ennek eredményeként másodfokú egyenlet, keresse meg a megkülönböztetőjét:
- tökéletes!

és két megoldást kapunk:

1) ha , akkor ;

2) ha , akkor .

Az első értékpár teljesíti a feltételt. Nagy valószínűséggel minden helyes, de ennek ellenére felírjuk az elosztási törvényt:

és végezzen ellenőrzést, nevezetesen keresse meg az elvárást: