Regresszió és korrelációs elemzés– statisztikai kutatási módszerek. Ezek a leggyakoribb módok egy paraméter egy vagy több független változótól való függésének kimutatására.
Lent konkrétan gyakorlati példák Tekintsük ezt a két, a közgazdászok körében igen népszerű elemzést. Példát adunk az eredmények elérésére is, ha ezeket kombináljuk.
Megmutatja néhány érték (független, független) hatását a függő változóra. Például, hogyan függ a gazdaságilag aktív népesség száma a vállalkozások számától, a bérektől és egyéb paraméterektől. Vagy: hogyan befolyásolják a GDP szintjét a külföldi befektetések, az energiaárak stb.
Az elemzés eredménye lehetővé teszi a rangsorolást. A főbb tényezők alapján pedig előre jelezni, megtervezni a fejlesztést kiemelt területek vezetői döntések meghozatalára.
Regresszió történik:
Tekintsük a regressziós modell Excelben való felépítésének és az eredmények értelmezésének példáját. Vegyünk egy lineáris típusú regressziót.
Egy feladat. 6 vállalkozásnál a havi átlag bérés a nyugdíjas alkalmazottak száma. Meg kell határozni a nyugdíjba vonult alkalmazottak számának az átlagkeresettől való függését.
Modell lineáris regresszió a következő formája van:
Y \u003d a 0 + a 1 x 1 + ... + a k x k.
Ahol a a regressziós együtthatók, x a befolyásoló változók, és k a tényezők száma.
Példánkban Y a kilépő dolgozók mutatója. A befolyásoló tényező a bérek (x).
Az Excel beépített függvényekkel rendelkezik, amelyek segítségével kiszámítható a lineáris regressziós modell paraméterei. De az Analysis ToolPak bővítmény gyorsabban megteszi.
Aktiváljon egy hatékony elemző eszközt:
Az aktiválás után a kiegészítő elérhető lesz az Adatok lapon.
Most közvetlenül a regressziós elemzéssel fogunk foglalkozni.
Mindenekelőtt az R-négyzetre és az együtthatókra figyelünk.
Az R-négyzet a determinációs együttható. Példánkban ez 0,755, azaz 75,5%. Ez azt jelenti, hogy a modell számított paraméterei 75,5%-ban magyarázzák a vizsgált paraméterek közötti kapcsolatot. Minél nagyobb a determinációs együttható, annál jobb a modell. Jó - 0,8 felett. Gyenge - kevesebb, mint 0,5 (egy ilyen elemzés aligha tekinthető ésszerűnek). Példánkban - "nem rossz".
A 64,1428 együttható azt mutatja meg, hogy mi lesz Y, ha a vizsgált modellben minden változó 0-val egyenlő. Vagyis a modellben nem leírt egyéb tényezők is befolyásolják az elemzett paraméter értékét.
A -0,16285 együttható az X változó súlyát mutatja az Y-n. Vagyis az átlagos havi fizetés ebben a modellben -0,16285 súllyal befolyásolja a kilépők számát (ez kis mértékű befolyást jelent). A „-” jel negatív hatást jelez: minél magasabb a fizetés, annál kevesebb a kilépés. Ami tisztességes.
A korrelációs elemzés segít megállapítani, hogy egy vagy két mintában van-e kapcsolat a mutatók között. Például a gép üzemideje és a javítási költség között, a felszerelések ára és a működés időtartama, a gyerekek magassága és súlya stb.
Ha van kapcsolat, akkor az egyik paraméter növekedése a másikban növekedést (pozitív korrelációt) vagy csökkenést (negatív) eredményez-e. A korrelációs elemzés segít az elemzőnek eldönteni, hogy az egyik mutató értéke előre jelezheti-e egy másik mutató lehetséges értékét.
A korrelációs együtthatót r-vel jelöljük. +1 és -1 között változik. Összefüggések osztályozása a különböző területeken más lesz. Ha az együttható értéke 0, nincs lineáris kapcsolat a minták között.
Fontolja meg, hogyan használja az Excelt a korrelációs együttható meghatározásához.
A CORREL függvény a párosított együtthatók megkeresésére szolgál.
Feladat: Állapítsa meg, van-e összefüggés a munkaidő között! esztergapadés karbantartásának költségét.
Helyezze a kurzort bármelyik cellába, és nyomja meg az fx gombot.
A kapcsolat típusának meghatározásához meg kell nézni az együttható abszolút számát (minden tevékenységi területnek saját skálája van).
Számos paraméter (több mint 2) korrelációs elemzéséhez kényelmesebb az "Adatelemzés" ("Analysis Package" kiegészítő) használata. A listában ki kell választania egy korrelációt, és ki kell jelölnie egy tömböt. Összes.
Az eredményül kapott együtthatók a korrelációs mátrixban jelennek meg. Mint ez:
A gyakorlatban ezt a két technikát gyakran együtt alkalmazzák.
Példa:
Most már láthatóak a regressziós elemzés adatai.
A „korreláció” latinul „korrelációt”, „kapcsolatot” jelent. A kapcsolat mennyiségi jellemzőjét a korrelációs együttható kiszámításával kaphatjuk meg. Ez népszerű itt statisztikai elemzések az együttható megmutatja, hogy vannak-e összefüggések valamely paraméterrel (például magasság és súly; intelligenciaszint és tanulmányi teljesítmény; sérülések száma és munkaórák).
A korrelációszámítást különösen széles körben alkalmazzák a közgazdaságtanban, a szociológiai kutatásokban, az orvostudományban és a biometriában – mindenhol, ahol két olyan adathalmazt kaphatunk, amelyek között összefüggés található.
A korrelációt manuálisan is kiszámíthatja egyszerű aritmetikai műveletek végrehajtásával. A számítási folyamat azonban nagyon időigényes, ha az adatkészlet nagy. A módszer sajátossága, hogy gyűjtést igényel egy nagy szám forrásadatokat, hogy a legpontosabban jelenítse meg, hogy van-e kapcsolat a funkciók között. Ezért a korrelációelemzés komoly alkalmazása lehetetlen számítástechnika nélkül. Az egyik legnépszerűbb és legolcsóbb program ennek a problémának a megoldására.
A korreláció meghatározásának legidőigényesebb lépése az adathalmaz. Az összehasonlítandó adatok általában két oszlopba vagy sorban vannak elrendezve. A táblázatot úgy kell elkészíteni, hogy a cellákban hézagok ne legyenek. Modern változatok Az Excel (2007-től és fiatalabbaktól) nem igényel további beállításokat a statisztikai számításokhoz; A szükséges manipulációk elvégezhetők:
A korreláció lehet közvetlen (ha az együttható nagyobb, mint nulla) és inverz (-1-től 0-ig).
Az első azt jelenti, hogy az egyik paraméter növekedésével a másik is növekszik. Az inverz (negatív) korreláció azt a tényt tükrözi, hogy az egyik változó növekedésével a másik csökken.
A korreláció közel nullához lehet. Ez általában azt jelzi, hogy a vizsgált paraméterek nem kapcsolódnak egymáshoz. De néha nulla korreláció lép fel, ha olyan sikertelen mintát készítünk, amely nem tükrözi a kapcsolatot, vagy a kapcsolat összetett, nemlineáris jellegű.
Ha az együttható közepes vagy erős összefüggést mutat (±0,5 és ±0,99 között), akkor ne feledjük, hogy ez csak egy statisztikai összefüggés, amely egyáltalán nem garantálja az egyik paraméter hatását a másikra. Az sem zárható ki, hogy mindkét paraméter független egymástól, de valamilyen harmadik nem figyelembe vett tényező befolyásolja őket. Az Excel segít a korrelációs együttható azonnali kiszámításában, de általában csak kvantitatív módszerek nem elegendő az ok-okozati összefüggések megállapításához összehasonlítható mintákban.
A korrelációs együtthatót (vagy lineáris korrelációs együtthatót) "r"-ként jelöljük (in ritka esetek mint "ρ"), és két vagy több változó lineáris korrelációját (vagyis valamilyen érték és irány által adott összefüggést) jellemzi. Az együttható értéke -1 és +1 között van, azaz a korreláció lehet pozitív és negatív is. Ha a korrelációs együttható -1, akkor tökéletes negatív korreláció van; ha a korrelációs együttható +1, akkor tökéletes pozitív korreláció van. Más esetekben a két változó között pozitív vagy negatív korreláció van, vagy nincs korreláció. A korrelációs együttható kiszámítható manuálisan, ingyenes online számológépekkel vagy egy jó grafikus számológéppel.
Adatgyűjtés. Mielőtt elkezdené a korrelációs együttható számítását, vizsgálja meg az adott számpárt. Jobb, ha egy függőlegesen vagy vízszintesen elhelyezhető táblázatba írjuk le őket. Minden sort vagy oszlopot "x" és "y" betűvel jelöljön meg.
Számítsd ki az "x" számtani átlagot! Ehhez adja össze az „x” összes értékét, majd ossza el az eredményt az értékek számával.
Keresse meg az "y" számtani átlagát. Ehhez kövesse ugyanazokat a lépéseket, azaz adja össze az „y” összes értékét, majd ossza el az összeget az értékek számával.
Számítsa ki az "x" szórását. Miután kiszámolta x és y átlagát, keresse meg ezeknek a változóknak a szórását. A szórást a következő képlet segítségével számítjuk ki:
Számítsa ki az "y" szórást. Kövesse az előző lépés lépéseit. Használja ugyanazt a képletet, de helyettesítse be az "y" értékeket.
Írja fel a korrelációs együttható kiszámításának alapképletét! Ez a képlet tartalmazza az átlagokat, a szórásokat és mindkét változó számpárjainak számát (n). A korrelációs együtthatót "r"-ként jelöljük (ritka esetekben "ρ"-ként). Ez a cikk a képletet használja a Pearson-korrelációs együttható kiszámításához.
Kiszámolta mindkét változó átlagát és szórását, így a képlet segítségével kiszámíthatja a korrelációs együtthatót. Emlékezzünk vissza, hogy "n" mindkét változó értékpárjainak száma. Az egyéb mennyiségek értékét korábban kiszámoltuk.
Elemezze az eredményt. Példánkban a korrelációs együttható 0,988. Ez az érték valamilyen módon jellemzi a számpárok adott halmazát. Ügyeljen az érték előjelére és nagyságára.
Keressen egy számológépet az interneten a korrelációs együttható kiszámításához. Ezt az együtthatót gyakran számítják ki a statisztikákban. Ha sok számpár van, akkor gyakorlatilag lehetetlen manuálisan kiszámítani a korrelációs együtthatót. Ezért vannak online számológépek a korrelációs együttható kiszámításához. A keresőbe írja be a "korrelációs együttható kalkulátor" kifejezést (idézőjelek nélkül).
Adja meg az adatokat. Az adatok (számpárok) helyes beviteléhez olvassa el az oldalon található utasításokat. Rendkívül fontos a megfelelő számpárok megadása; különben rossz eredményt kap. Ne feledje, hogy a különböző webhelyek eltérő adatbeviteli formátumokkal rendelkeznek.
Számítsa ki a korrelációs együtthatót! Az adatok megadása után egyszerűen kattintson a "Számítás", "Kiszámítás" vagy hasonló gombra az eredmény eléréséhez.
Adja meg az adatokat. Fogjon egy grafikus számológépet, váltson statisztikai számítási módba, és válassza a Szerkesztés parancsot.
Törölje a korábbi mentett adatokat. A legtöbb számológép megőrzi a beírt statisztikákat, amíg nem törli azokat. A régi adatok új adatokkal való összekeverésének elkerülése érdekében először törölje a tárolt információkat.
Adja meg a kezdeti adatokat. A nyílbillentyűkkel vigye a kurzort az "xStat" fejléc alatti első cellára. Írja be az első értéket, és nyomja meg az Enter billentyűt. A képernyő alján az "xStat (1) = __" jelenik meg, szóköz helyett a beírt értékkel. Az Enter megnyomása után a beírt érték megjelenik a táblázatban, és a kurzor a következő sorra ugrik; ekkor a képernyő alján megjelenik az "xStat(2) = __".
Számítsa ki a korrelációs együtthatót! Azt jellemzi, hogy az adat milyen közel van valamilyen egyeneshez. A grafikus számológép gyorsan meghatározza a megfelelő egyenest és kiszámítja a korrelációs együtthatót.
Elemezze az eredményeket. Az Enter megnyomásával a következő információk jelennek meg a képernyőn:
Sok vállalatnál és vállalkozásnál széles körben használt segédprogram. A valóság az, hogy szinte minden dolgozónak ismernie kell bizonyos mértékig az Excelt, mivel ez a program nagyon sokféle feladat megoldására szolgál. A táblázatokkal való munka során gyakran meg kell határozni, hogy bizonyos változók kapcsolódnak-e egymáshoz. Ehhez az úgynevezett korrelációt használják. Ebben a cikkben részletesen megvizsgáljuk, hogyan lehet kiszámítani a korrelációs együtthatót az Excelben. Találjuk ki. Megy!
Kezdjük azzal, hogy mi a korrelációs együttható általában. Két elem közötti kapcsolat mértékét jelzi, és mindig -1-től (erős inverz kapcsolat) 1-ig (erős előremutató kapcsolat) terjed. Ha az együttható 0, ez azt jelzi, hogy nincs kapcsolat az értékek között.
Most, miután foglalkoztunk az elmélettel, térjünk át a gyakorlatra. A változók és az y közötti kapcsolat megkereséséhez használja a Microsoft Excel beépített „CORREL” funkcióját. Ehhez kattintson a függvényvarázsló gombra (a képletmező mellett található). A megnyíló ablakban válassza ki a „CORREL” elemet a függvények listájából. Ezután állítsa be a tartományt a "Tömb1" és a "Tömb2" mezőben. Például a „Tömb1”-nél válassza ki az y értékeket, a „Tömb2”-nél pedig az x értékeket. Ennek eredményeként megkapja a program által kiszámított korrelációs együtthatót.
A következő módszer olyan tanulók számára lesz releváns, akiknek egy adott képlet alapján kell függőséget találniuk. Először is ismernie kell az x és y változók átlagos értékét. Ehhez válassza ki a változó értékeit, és használja az "ÁTLAG" funkciót. Ezután ki kell számítania az egyes x és x avg, valamint az y avg közötti különbséget. A kijelölt cellákba írja be x-x képletek, y-. Ne felejtse el rögzíteni a cellákat átlagos értékekkel. Ezután húzza le a képletet, hogy a többi számra vonatkozzon.
Most, hogy minden szükséges adatunk megvan, kiszámolhatjuk a korrelációt. A kapott különbségeket így szorozzuk meg: (x-x avg) * (y-y avg). Miután megkapta az egyes változók eredményét, összegezze a kapott számokat az autosum függvény segítségével. Így kerül kiszámításra a számláló.
Most térjünk át a nevezőre. A számított különbségeket négyzetre kell emelni. Ehhez egy külön oszlopba írja be a képleteket: (x-x avg) 2 és (y-y avg) 2 . Ezután nyújtsa ki a képleteket a teljes tartományra. Ezután az "AutoSum" gombbal keresse meg az összes oszlop összegét (x és y esetén). Marad a talált összegek szorzása és kivonása belőlük Négyzetgyök. Az utolsó lépés a számláló elosztása a nevezővel. A kapott eredmény a kívánt korrelációs együttható lesz.
Amint láthatja, a Microsoft Excel függvényekkel való helyes munka ismeretében jelentősen leegyszerűsítheti az összetett matematikai kifejezések kiszámításának feladatát. A programban megvalósított eszközöknek köszönhetően egyszerűen pár perc alatt készíthet korrelációelemzést Excelben, ezzel időt és energiát takarít meg. Írja meg a megjegyzésekben, hogy a cikk segített-e megérteni a problémát, kérdezzen mindenről, ami érdekelte a megvitatott témában.
Értesítés! Az Ön konkrét problémájának megoldása hasonlóan fog kinézni ezt a példát, beleértve az alábbi táblázatokat és magyarázó szövegeket, de figyelembe véve az Ön kezdeti adatait ...Egy feladat:
Van egy kapcsolódó minta 26 értékpárból (x k , y k ):
k | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
x k | 25.20000 | 26.40000 | 26.00000 | 25.80000 | 24.90000 | 25.70000 | 25.70000 | 25.70000 | 26.10000 | 25.80000 |
y k | 30.80000 | 29.40000 | 30.20000 | 30.50000 | 31.40000 | 30.30000 | 30.40000 | 30.50000 | 29.90000 | 30.40000 |
k | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
x k | 25.90000 | 26.20000 | 25.60000 | 25.40000 | 26.60000 | 26.20000 | 26.00000 | 22.10000 | 25.90000 | 25.80000 |
y k | 30.30000 | 30.50000 | 30.60000 | 31.00000 | 29.60000 | 30.40000 | 30.70000 | 31.60000 | 30.50000 | 30.60000 |
k | 21 | 22 | 23 | 24 | 25 | 26 |
x k | 25.90000 | 26.30000 | 26.10000 | 26.00000 | 26.40000 | 25.80000 |
y k | 30.70000 | 30.10000 | 30.60000 | 30.50000 | 30.70000 | 30.80000 |
Ki kell számolni/megépíteni:
- korrelációs együttható;
- tesztelje az X és Y valószínűségi változók függésének hipotézisét α = 0,05 szignifikancia szinten;
- a lineáris regressziós egyenlet együtthatói;
- szórásdiagram (korrelációs mező) és regressziós egyenes grafikon;
MEGOLDÁS:
A korrelációs együttható két valószínűségi változó kölcsönös valószínűségi hatásának mutatója. Korrelációs együttható Rértékeket vehet át -1 előtt +1 . Ha az abszolút érték közelebb van a 1 , akkor ez bizonyíték erős kapcsolatértékek között, és ha közelebb van 0 - akkor gyenge kapcsolatot vagy annak hiányát jelzi. Ha az abszolút érték R egyenlő eggyel, akkor a mennyiségek közötti funkcionális kapcsolatról beszélhetünk, vagyis egy mennyiség matematikai függvény segítségével kifejezhető egy másikkal.
n |
Σ |
k = 1 |
M x | = |
|
| x k , | Az én | = | vagy a képlet szerint
A gyakorlatban az (1.4) képletet gyakrabban használják a korrelációs együttható kiszámításához, mivel kevesebb számítást igényel. Ha azonban a kovariancia korábban számított cov(X,Y), akkor előnyösebb az (1.1) képlet alkalmazása, mert a kovariancia valós értéke mellett felhasználhatja a közbenső számítások eredményeit is. 1.1 Számítsa ki a korrelációs együtthatót az (1.4) képlet segítségével!, ehhez kiszámítjuk az x k 2, y k 2 és x k y k értékeket és beírjuk az 1. táblázatba. Asztal 1
1.2. Kiszámítjuk M x-et az (1.5) képlettel. 1.2.1. x k x 1 + x 2 + ... + x 26 = 25,20000 + 26,40000 + ... + 25,80000 = 669,500000 1.2.2. 669.50000 / 26 = 25.75000 M x = 25,750000 1.3. Hasonlóképpen számítjuk ki M y-t. 1.3.1. Adjuk hozzá az összes elemet egymás után y k y 1 + y 2 + … + y 26 = 30,80000 + 29,40000 + ... + 30,80000 = 793,000000 1.3.2. A kapott összeget elosztjuk a mintaelemek számával 793.00000 / 26 = 30.50000 M y = 30,500000 1.4. Hasonlóképpen számítjuk ki az M xy-t. 1.4.1. Sorban hozzáadjuk az 1. táblázat 6. oszlopának összes elemét 776.16000 + 776.16000 + ... + 794.64000 = 20412.830000 1.4.2. A kapott összeget osszuk el az elemek számával 20412.83000 / 26 = 785.10885 M xy = 785,108846 1.5. Számítsa ki S x 2 értékét az (1.6.) képlet segítségével!. 1.5.1. Sorban hozzáadjuk az 1. táblázat 4. oszlopának összes elemét 635.04000 + 696.96000 + ... + 665.64000 = 17256.910000 1.5.2. A kapott összeget osszuk el az elemek számával 17256.91000 / 26 = 663.72731 1.5.3. Az utolsó számból kivonjuk az M x érték négyzetét, és megkapjuk az S x 2 értékét S x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481 1.6. Számítsa ki S y 2 értékét az (1.6.) képlettel!. 1.6.1. Sorban hozzáadjuk az 1. táblázat 5. oszlopának összes elemét 948.64000 + 864.36000 + ... + 948.64000 = 24191.840000 1.6.2. A kapott összeget osszuk el az elemek számával 24191.84000 / 26 = 930.45538 1.6.3. Az utolsó számból kivonva M y négyzetét, megkapjuk S y 2 értékét S y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538 1.7. Számítsuk ki S x 2 és S y 2 szorzatát. S x 2 S y 2 = 0,66481 0,20538 = 0,136541 1.8. Kivonjuk az utolsó szám négyzetgyökét, megkapjuk az S x S y értéket. S x Sy = 0,36951 1.9. Számítsa ki a korrelációs együttható értékét az (1.4.) képlet alapján!. R = (785,10885 - 25,75000 30,50000) / 0,36951 = (785,10885 - 785,37500) / 0,36951 = -0,72028 VÁLASZ: Rx,y = -0,720279 2. Ellenőrizzük a korrelációs együttható szignifikanciáját (ellenőrizzük a függőségi hipotézist).Mivel a korrelációs együttható becslése véges mintán történik, és ezért eltérhet az általános értékétől, szükséges a korrelációs együttható szignifikanciájának ellenőrzése. Az ellenőrzés a t-kritérium segítségével történik:
Véletlenszerű érték t követi a Student-féle t-eloszlást és a t-eloszlás táblázata szerint meg kell találni a kritérium kritikus értékét (t cr.α) adott α szignifikanciaszinten. Ha a (2.1) képlettel számított modulo t kisebbnek bizonyul, mint t cr.α , akkor a közötti függőségek Véletlen változók X és Y nem. Egyébként a kísérleti adatok nem mondanak ellent a valószínűségi változók függésére vonatkozó hipotézisnek. 2.1. Számítsuk ki a t-kritérium értékét a (2.1) képlet alapján, kapjuk:
2.2. Határozzuk meg a t cr.α paraméter kritikus értékét a t-eloszlás táblázatából A kívánt t kr.α érték a szabadságfokok számának megfelelő sor és az adott α szignifikanciaszintnek megfelelő oszlop metszéspontjában található. 2. táblázat t-eloszlás
2.2. Hasonlítsuk össze a t-kritérium és a t cr abszolút értékét.α A t-kritérium abszolút értéke nem kisebb, mint a kritikus t = 5,08680, tcr.α = 2,064, ezért kísérleti adatok, 0,95 valószínűséggel(1 - α ), ne mondjon ellent a hipotézisnek X és Y valószínűségi változók függéséről. 3. Kiszámoljuk a lineáris regressziós egyenlet együtthatóit.A lineáris regressziós egyenlet egy egyenes egyenlete, amely közelíti (körülbelül leírja) az X és Y valószínűségi változók közötti kapcsolatot. Ha feltételezzük, hogy X szabad és Y függ X-től, akkor a regressziós egyenlet a következőképpen lesz felírva. Y = a + b X (3.1), ahol:
A (3.2) képlettel számított együttható b lineáris regressziós együtthatónak nevezzük. Egyes forrásokban a hívott állandó együttható regresszió és b a változók szerint. Egy adott X értékre vonatkozó Y előrejelzési hibákat a következő képletekkel számítjuk ki: A σ y/x értéket (3.4 képlet) is nevezzük maradék szórása, ez jellemzi Y eltérését a (3.1) egyenlettel leírt regressziós egyenestől X fix (adott) értékénél. | . |
3.3 Számítsa ki a b együtthatót a (3.2) képlet szerint
b = -0.72028 0.55582 = -0.40035
3.4 Számítsa ki az a együtthatót a (3.3) képlet szerint
a = 30.50000 - (-0.40035 25.75000) = 40.80894
3.5 Becsülje meg a regressziós egyenlet hibáit!.
3.5.1 Kivonjuk a négyzetgyököt S y 2-ből, és megkapjuk:
δy/x = (0,31437 / 30,50000)100% = 1,03073%
4.1. Az X minta minimális és maximális eleme a 18. és 15. elem, x min = 22,10000 és x max = 26,60000.
4.2. Az Y minta minimális és maximális eleme a 2. és a 18. elem, y min = 29,40000 és y max = 31,60000.
4.3. Az abszcissza tengelyen az x 18 = 22,10000 ponttól közvetlenül balra választjuk ki a kezdőpontot, és olyan léptékben, hogy az x 15 = 26,60000 pont illeszkedjen a tengelyre, és a többi pont jól elkülöníthető legyen.
4.4. Az y tengelyen az y 2 = 29,40000 ponttól közvetlenül balra választjuk ki a kezdőpontot, és olyan léptékben, hogy az y 18 = 31,60000 pont illeszkedjen a tengelyre, és a többi pont jól elkülöníthető legyen.
4.5. Az abszcissza tengelyen az x k értékeket, az ordináta tengelyen pedig az y k értékeket helyezzük el.
4.6. Az (x 1, y 1), (x 2, y 2), ..., (x 26, y 26) pontokat a koordinátasíkra helyezzük. Kapunk egy szórást (korrelációs mezőt), amelyet az alábbi ábra mutat.
4.7. Rajzoljunk regressziós egyenest.
Ehhez keresünk két különböző pontot (x r1 , y r1) és (x r2 , y r2) koordinátákkal, amelyek kielégítik a (3.6) egyenletet, tegyük a koordinátasíkra, és húzzunk rajtuk egy vonalat. Vegyük x min = 22,10000 az első pont abszcisszáját. Behelyettesítjük x min értékét a (3.6) egyenletben, megkapjuk az első pont ordinátáját. Így van egy pontunk koordinátákkal (22.10000, 31.96127). Hasonlóképpen megkapjuk a második pont koordinátáit, az x max = 26,60000 értéket állítva abszcisszaként. A második pont a következő lesz: (26.60000, 30.15970).
A regressziós egyenes az alábbi ábrán piros színnel látható
Felhívjuk figyelmét, hogy a regressziós egyenes mindig átmegy X és Y átlagértékeinek pontján, azaz. koordinátákkal (M x , M y).