Regressione e analisi di correlazione– metodi di ricerca statistica. Questi sono i modi più comuni per mostrare la dipendenza di un parametro da una o più variabili indipendenti.
Di seguito su specifico esempi pratici Consideriamo queste due analisi molto popolari tra gli economisti. Daremo anche un esempio di come ottenere risultati quando vengono combinati.
Mostra l'influenza di alcuni valori (indipendente, indipendente) sulla variabile dipendente. Ad esempio, come il numero di popolazione economicamente attiva dipende dal numero di imprese, salari e altri parametri. Oppure: in che modo gli investimenti esteri, i prezzi dell'energia, ecc. influiscono sul livello del PIL.
Il risultato dell'analisi consente di stabilire le priorità. E sulla base dei principali fattori, per prevedere, pianificare lo sviluppo aree prioritarie prendere decisioni manageriali.
La regressione avviene:
Si consideri l'esempio della creazione di un modello di regressione in Excel e dell'interpretazione dei risultati. Prendiamo un tipo lineare di regressione.
Un compito. A 6 imprese, la media mensile salario e il numero di dipendenti in pensione. È necessario determinare la dipendenza del numero di dipendenti in pensione dallo stipendio medio.
Modello regressione lineare ha la seguente forma:
Y \u003d a 0 + a 1 x 1 + ... + a k x k.
Dove a sono i coefficienti di regressione, x sono le variabili di influenza e k è il numero di fattori.
Nel nostro esempio, Y è l'indicatore dei lavoratori licenziati. Il fattore che influenza è il salario (x).
Excel dispone di funzioni incorporate che possono essere utilizzate per calcolare i parametri di un modello di regressione lineare. Ma il componente aggiuntivo Analysis ToolPak lo farà più velocemente.
Attiva un potente strumento analitico:
Una volta attivato, il componente aggiuntivo sarà disponibile nella scheda Dati.
Ora ci occuperemo direttamente dell'analisi di regressione.
Prima di tutto, prestiamo attenzione all'R-quadro e ai coefficienti.
R-quadrato è il coefficiente di determinazione. Nel nostro esempio, è 0,755 o 75,5%. Ciò significa che i parametri calcolati del modello spiegano la relazione tra i parametri studiati del 75,5%. Più alto è il coefficiente di determinazione, migliore è il modello. Buono - superiore a 0,8. Scarso - meno di 0,5 (un'analisi del genere difficilmente può essere considerata ragionevole). Nel nostro esempio - "non male".
Il coefficiente 64.1428 mostra quale sarà Y se tutte le variabili nel modello in esame sono uguali a 0. Cioè, anche altri fattori che non sono descritti nel modello influenzano il valore del parametro analizzato.
Il coefficiente -0,16285 mostra il peso della variabile X su Y. Cioè, lo stipendio mensile medio all'interno di questo modello influisce sul numero di rinunciatari con un peso di -0,16285 (questo è un piccolo grado di influenza). Il segno “-” indica un impatto negativo: più alto è lo stipendio, meno rinuncia. Il che è giusto.
L'analisi di correlazione aiuta a stabilire se esiste una relazione tra gli indicatori in uno o due campioni. Ad esempio, tra il tempo di funzionamento della macchina e il costo delle riparazioni, il prezzo dell'attrezzatura e la durata dell'operazione, l'altezza e il peso dei bambini, ecc.
Se esiste una relazione, allora se un aumento di un parametro porta ad un aumento (correlazione positiva) o una diminuzione (negativa) nell'altro. L'analisi di correlazione aiuta l'analista a determinare se il valore di un indicatore può prevedere il possibile valore di un altro.
Il coefficiente di correlazione è indicato con r. Varia da +1 a -1. Classificazione delle correlazioni per diverse aree sarà diverso. Quando il valore del coefficiente è 0, non esiste alcuna relazione lineare tra i campioni.
Considera come utilizzare Excel per trovare il coefficiente di correlazione.
La funzione CORREL viene utilizzata per trovare i coefficienti accoppiati.
Compito: determinare se esiste una relazione tra l'orario di lavoro tornio e il costo della sua manutenzione.
Posiziona il cursore in qualsiasi cella e premi il pulsante fx.
Per determinare il tipo di connessione, è necessario esaminare il numero assoluto del coefficiente (ogni campo di attività ha la propria scala).
Per l'analisi di correlazione di più parametri (più di 2), è più conveniente utilizzare "Data Analysis" (componente aggiuntivo "Analysis Package"). Nell'elenco è necessario selezionare una correlazione e designare un array. Tutto.
I coefficienti risultanti verranno visualizzati nella matrice di correlazione. Come questo:
In pratica, queste due tecniche sono spesso utilizzate insieme.
Esempio:
Ora i dati dell'analisi di regressione sono visibili.
"Correlazione" in latino significa "correlazione", "relazione". Una caratteristica quantitativa della relazione può essere ottenuta calcolando il coefficiente di correlazione. Questo popolare in analisi statistiche il coefficiente mostra se alcuni parametri sono correlati tra loro (ad esempio, altezza e peso; livello di intelligenza e rendimento scolastico; numero di infortuni e ore di lavoro).
Il calcolo della correlazione è ampiamente utilizzato in economia, ricerca sociologica, medicina e biometria, ovunque sia possibile ottenere due set di dati tra i quali è possibile trovare una relazione.
È possibile calcolare manualmente la correlazione eseguendo semplici operazioni aritmetiche. Tuttavia, il processo di calcolo richiede molto tempo se il set di dati è grande. La particolarità del metodo è che richiede la raccolta un largo numero dati di origine per visualizzare in modo più accurato se esiste una relazione tra le funzioni. Pertanto, l'uso serio dell'analisi di correlazione è impossibile senza l'uso della tecnologia informatica. Uno dei programmi più popolari e convenienti per risolvere questo problema è.
Il passaggio che richiede più tempo per determinare la correlazione è il set di dati. I dati da confrontare sono solitamente disposti in due colonne o righe. La tabella dovrebbe essere fatta senza spazi vuoti nelle celle. Versioni moderne Excel (dal 2007 in poi) non richiede impostazioni aggiuntive per i calcoli statistici; le manipolazioni necessarie possono essere fatte:
La correlazione può essere diretta (se il coefficiente è maggiore di zero) e inversa (da -1 a 0).
Il primo significa che all'aumentare di un parametro, aumenta anche l'altro. Una correlazione inversa (negativa) riflette il fatto che all'aumentare di una variabile, l'altra diminuisce.
La correlazione può essere vicina allo zero. Questo di solito indica che i parametri studiati non sono correlati tra loro. Ma a volte si verifica una correlazione zero se viene creato un campione non riuscito che non riflette la relazione o se la relazione ha una natura complessa non lineare.
Se il coefficiente mostra una relazione media o forte (da ±0,5 a ±0,99), va ricordato che si tratta solo di una relazione statistica, che non garantisce affatto l'influenza di un parametro su un altro. È anche impossibile escludere la situazione in cui entrambi i parametri sono indipendenti l'uno dall'altro, ma sono influenzati da un terzo fattore non contabilizzato. Excel ti aiuta a calcolare istantaneamente il coefficiente di correlazione, ma di solito solo metodi quantitativi insufficiente per stabilire relazioni causali in campioni comparabili.
Il coefficiente di correlazione (o coefficiente di correlazione lineare) è indicato come "r" (in casi rari come "ρ") e caratterizza una correlazione lineare (ovvero una relazione data da qualche valore e direzione) di due o più variabili. Il valore del coefficiente è compreso tra -1 e +1, ovvero la correlazione può essere sia positiva che negativa. Se il coefficiente di correlazione è -1, c'è una perfetta correlazione negativa; se il coefficiente di correlazione è +1, c'è una perfetta correlazione positiva. In altri casi, c'è una correlazione positiva, una correlazione negativa o nessuna correlazione tra le due variabili. Il coefficiente di correlazione può essere calcolato manualmente, con calcolatori online gratuiti o con un buon calcolatore grafico.
Raccogliere dati. Prima di iniziare a calcolare il coefficiente di correlazione, esamina la coppia di numeri data. È meglio scriverli in una tabella che può essere disposta verticalmente o orizzontalmente. Etichetta ogni riga o colonna come una "x" e una "y".
Calcola la media aritmetica "x". Per fare ciò, somma tutti i valori di "x", quindi dividi il risultato per il numero di valori.
Trova la media aritmetica "y". Per fare ciò, segui gli stessi passaggi, ovvero somma tutti i valori di "y", quindi dividi la somma per il numero di valori.
Calcola la deviazione standard di "x". Una volta calcolate le medie di x e y, trova le deviazioni standard di queste variabili. La deviazione standard viene calcolata utilizzando la seguente formula:
Calcola la deviazione standard "y". Segui i passaggi nel passaggio precedente. Usa la stessa formula, ma sostituisci i valori "y" in essa.
Annota la formula di base per il calcolo del coefficiente di correlazione. Questa formula include medie, deviazioni standard e il numero (n) di coppie di numeri di entrambe le variabili. Il coefficiente di correlazione è indicato come "r" (in rari casi, come "ρ"). Questo articolo utilizza la formula per calcolare il coefficiente di correlazione di Pearson.
Hai calcolato le medie e le deviazioni standard di entrambe le variabili, quindi puoi utilizzare la formula per calcolare il coefficiente di correlazione. Ricordiamo che "n" è il numero di coppie di valori di entrambe le variabili. Il valore di altre grandezze è stato calcolato in precedenza.
Analizza il risultato. Nel nostro esempio, il coefficiente di correlazione è 0,988. Questo valore in qualche modo caratterizza un dato insieme di coppie di numeri. Prestare attenzione al segno e alla grandezza del valore.
Trova una calcolatrice su Internet per calcolare il coefficiente di correlazione. Questo coefficiente è spesso calcolato nelle statistiche. Se ci sono molte coppie di numeri, è praticamente impossibile calcolare manualmente il coefficiente di correlazione. Pertanto, ci sono calcolatori online per il calcolo del coefficiente di correlazione. Nel motore di ricerca, inserisci "calcolatore del coefficiente di correlazione" (senza virgolette).
Inserisci i dati. Leggi le istruzioni sul sito per inserire correttamente i dati (coppie di numeri). È estremamente importante inserire le coppie di numeri appropriate; altrimenti otterrai un risultato sbagliato. Tieni presente che diversi siti Web hanno diversi formati di immissione dei dati.
Calcolare il coefficiente di correlazione. Dopo aver inserito i dati, è sufficiente fare clic sul pulsante "Calcola", "Calcola" o simili per ottenere il risultato.
Inserisci i dati. Prendi una calcolatrice grafica, passa alla modalità di calcolo statistico e seleziona il comando Modifica.
Elimina i dati salvati in precedenza. La maggior parte dei calcolatori conserva le statistiche inserite fino a quando non le cancelli. Per evitare di confondere i vecchi dati con i nuovi dati, eliminare prima tutte le informazioni memorizzate.
Inserisci i dati iniziali. Utilizzare i tasti freccia per spostare il cursore sulla prima cella sotto l'intestazione "xStat". Immettere il primo valore e premere Invio. Nella parte inferiore dello schermo verrà visualizzato "xStat (1) = __", con il valore immesso al posto di uno spazio. Dopo aver premuto Invio, il valore immesso apparirà nella tabella e il cursore si sposterà sulla riga successiva; questo visualizzerà "xStat(2) = __" nella parte inferiore dello schermo.
Calcolare il coefficiente di correlazione. Caratterizza la vicinanza dei dati a una linea retta. Il calcolatore grafico può determinare rapidamente la retta appropriata e calcolare il coefficiente di correlazione.
Analizzare i risultati. Premendo Invio, sullo schermo verranno visualizzate le seguenti informazioni:
Un'utilità ampiamente utilizzata in molte aziende e imprese. La realtà è che quasi tutti i dipendenti devono essere esperti in Excel in una certa misura, poiché questo programma viene utilizzato per risolvere una gamma molto ampia di attività. Quando si lavora con le tabelle, è spesso necessario determinare se determinate variabili sono correlate tra loro. Per questo, viene utilizzata la cosiddetta correlazione. In questo articolo, daremo uno sguardo dettagliato a come calcolare il coefficiente di correlazione in Excel. Scopriamolo. Andare!
Cominciamo con qual è il coefficiente di correlazione in generale. Indica il grado di relazione tra due elementi e va sempre da -1 (forte relazione inversa) a 1 (forte relazione in avanti). Se il coefficiente è 0, ciò indica che non esiste alcuna relazione tra i valori.
Ora, dopo aver affrontato la teoria, passiamo alla pratica. Per trovare la relazione tra le variabili e y, utilizzare la funzione integrata di Microsoft Excel "CORREL". Per fare ciò, fare clic sul pulsante della procedura guidata della funzione (si trova accanto al campo della formula). Nella finestra che si apre, seleziona "CORREL" dall'elenco delle funzioni. Successivamente, imposta l'intervallo nei campi "Array1" e "Array2". Ad esempio, per "Array1" selezionare i valori y e per "Array2" selezionare i valori x. Di conseguenza, otterrai il coefficiente di correlazione calcolato dal programma.
Il seguente metodo sarà rilevante per gli studenti che devono trovare una dipendenza utilizzando una data formula. Prima di tutto, devi conoscere i valori medi delle variabili x e y. Per fare ciò, seleziona i valori della variabile e utilizza la funzione "MEDIA". Successivamente, è necessario calcolare la differenza tra ogni x e x avg e y avg. Nelle celle selezionate scrivi formule x-x, y-. Non dimenticare di appuntare le celle con valori medi. Quindi trascina la formula verso il basso in modo che si applichi al resto dei numeri.
Ora che abbiamo tutti i dati necessari, possiamo calcolare la correlazione. Moltiplica le differenze risultanti in questo modo: (x-x avg) * (y-y avg). Dopo aver ottenuto il risultato per ciascuna delle variabili, somma i numeri risultanti utilizzando la funzione di somma automatica. Ecco come viene calcolato il numeratore.
Ora passiamo al denominatore. Le differenze calcolate devono essere elevate al quadrato. Per fare ciò, in una colonna separata, inserisci le formule: (x-x avg) 2 e (y-y avg) 2 . Quindi allunga le formule all'intera gamma. Quindi, utilizzando il pulsante "Somma automatica", trova la somma per tutte le colonne (per x e per y). Resta da moltiplicare le somme trovate ed estrarne Radice quadrata. L'ultimo passo è dividere il numeratore per il denominatore. Il risultato ottenuto sarà il coefficiente di correlazione desiderato.
Come puoi vedere, sapendo come lavorare correttamente con le funzioni di Microsoft Excel, puoi semplificare notevolmente il compito di calcolare espressioni matematiche complesse. Grazie agli strumenti implementati nel programma, puoi facilmente eseguire un'analisi di correlazione in Excel in un paio di minuti, risparmiando tempo e fatica. Scrivi nei commenti se l'articolo ti ha aiutato a capire il problema, chiedi tutto ciò che ti interessava sull'argomento discusso.
Avviso! La soluzione al tuo problema specifico sarà simile questo esempio, comprese tutte le tabelle e i testi esplicativi di seguito, ma tenendo conto dei tuoi dati iniziali ...Un compito:
Esiste un campione correlato di 26 coppie di valori (x k ,y k ):
K | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
x K | 25.20000 | 26.40000 | 26.00000 | 25.80000 | 24.90000 | 25.70000 | 25.70000 | 25.70000 | 26.10000 | 25.80000 |
e k | 30.80000 | 29.40000 | 30.20000 | 30.50000 | 31.40000 | 30.30000 | 30.40000 | 30.50000 | 29.90000 | 30.40000 |
K | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
x K | 25.90000 | 26.20000 | 25.60000 | 25.40000 | 26.60000 | 26.20000 | 26.00000 | 22.10000 | 25.90000 | 25.80000 |
e k | 30.30000 | 30.50000 | 30.60000 | 31.00000 | 29.60000 | 30.40000 | 30.70000 | 31.60000 | 30.50000 | 30.60000 |
K | 21 | 22 | 23 | 24 | 25 | 26 |
x K | 25.90000 | 26.30000 | 26.10000 | 26.00000 | 26.40000 | 25.80000 |
e k | 30.70000 | 30.10000 | 30.60000 | 30.50000 | 30.70000 | 30.80000 |
È necessario calcolare/costruire:
- coefficiente di correlazione;
- verificare l'ipotesi della dipendenza delle variabili aleatorie X e Y, ad un livello di significatività α = 0.05;
- coefficienti dell'equazione di regressione lineare;
- diagramma a dispersione (campo di correlazione) e grafico a linee di regressione;
SOLUZIONE:
Il coefficiente di correlazione è un indicatore dell'influenza probabilistica reciproca di due variabili casuali. Coefficiente di correlazione R può prendere valori da -1 prima +1 . Se il valore assoluto è più vicino a 1 , allora questa è una prova forte connessione tra i valori e se più vicino a 0 - quindi, questo indica una connessione debole o la sua assenza. Se il valore assoluto R uguale a uno, allora possiamo parlare di una relazione funzionale tra quantità, cioè una quantità può essere espressa in termini di un'altra usando una funzione matematica.
n |
Σ |
K = 1 |
Mx | = |
|
| xK, | Mio | = | o secondo la formula
In pratica, la formula (1.4) è più spesso utilizzata per calcolare il coefficiente di correlazione, poiché richiede meno calcoli. Tuttavia, se la covarianza è stata calcolata in precedenza cov(X,Y), allora è più vantaggioso usare la formula (1.1), perché oltre al valore effettivo della covarianza, è possibile utilizzare anche i risultati dei calcoli intermedi. 1.1 Calcolare il coefficiente di correlazione utilizzando la formula (1.4), per questo calcoliamo i valori x k 2 , y k 2 e x k y k e li inseriamo nella tabella 1. Tabella 1
1.2. Calcoliamo M x con la formula (1.5). 1.2.1. x K x 1 + x 2 + ... + x 26 = 25,20000 + 26,40000 + ... + 25,80000 = 669,500000 1.2.2. 669.50000 / 26 = 25.75000 M x = 25,750000 1.3. Allo stesso modo, calcoliamo M y. 1.3.1. Aggiungiamo tutti gli elementi in sequenza e k y 1 + y 2 + … + y 26 = 30,80000 + 29,40000 + ... + 30,80000 = 793,000000 1.3.2. Dividi la somma risultante per il numero di elementi del campione 793.00000 / 26 = 30.50000 M y = 30,500000 1.4. Allo stesso modo, calcoliamo M xy. 1.4.1. Aggiungiamo in sequenza tutti gli elementi della sesta colonna della tabella 1 776.16000 + 776.16000 + ... + 794.64000 = 20412.830000 1.4.2. Dividi la somma risultante per il numero di elementi 20412.83000 / 26 = 785.10885 M xy = 785,108846 1.5. Calcolare il valore di S x 2 usando la formula (1.6.). 1.5.1. Aggiungiamo in sequenza tutti gli elementi della 4a colonna della tabella 1 635.04000 + 696.96000 + ... + 665.64000 = 17256.910000 1.5.2. Dividi la somma risultante per il numero di elementi 17256.91000 / 26 = 663.72731 1.5.3. Sottrai dall'ultimo numero il quadrato del valore M x otteniamo il valore per S x 2 Sx2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481 1.6. Calcolare il valore di S y 2 con la formula (1.6.). 1.6.1. Aggiungiamo in sequenza tutti gli elementi della quinta colonna della tabella 1 948.64000 + 864.36000 + ... + 948.64000 = 24191.840000 1.6.2. Dividi la somma risultante per il numero di elementi 24191.84000 / 26 = 930.45538 1.6.3. Sottrai dall'ultimo numero il quadrato di M y , otteniamo il valore di S y 2 S e 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538 1.7. Calcoliamo il prodotto di S x 2 e S y 2. S x 2 S y 2 = 0,66481 0,20538 = 0,136541 1.8. Estraiamo la radice quadrata dell'ultimo numero, otteniamo il valore S x S y. S x S y = 0,36951 1.9. Calcolare il valore del coefficiente di correlazione secondo la formula (1.4.). R = (785,10885 - 25,75000 30,50000) / 0,36951 = (785,10885 - 785,37500) / 0,36951 = -0,72028 RISPOSTA: Rx,y = -0.720279 2. Controlliamo la significatività del coefficiente di correlazione (controlliamo l'ipotesi di dipendenza).Poiché la stima del coefficiente di correlazione è calcolata su un campione finito, e quindi può discostarsi dal suo valore generale, è necessario verificare la significatività del coefficiente di correlazione. Il controllo viene effettuato utilizzando il criterio t:
Valore casuale t segue la distribuzione t di Student e secondo la tabella della distribuzione t è necessario trovare il valore critico del criterio (t cr.α) ad un dato livello di significatività α . Se il modulo t calcolato dalla formula (2.1) risulta essere minore di t cr.α , allora le dipendenze tra variabili casuali X e Y non lo sono. Altrimenti, i dati sperimentali non contraddicono l'ipotesi sulla dipendenza delle variabili casuali. 2.1. Calcola il valore del criterio t secondo la formula (2.1) otteniamo:
2.2. Determiniamo il valore critico del parametro t cr.α dalla tabella della distribuzione t Il valore desiderato t kr.α si trova all'intersezione della riga corrispondente al numero di gradi di libertà e della colonna corrispondente a un determinato livello di significatività α . Tavolo 2 distribuzione t
2.2. Confrontiamo il valore assoluto del criterio t e t cr.α Il valore assoluto del criterio t non è minore di quello critico t = 5.08680, tcr.α = 2.064, quindi dati sperimentali, con una probabilità di 0,95(1 - α ), non contraddire l'ipotesi sulla dipendenza delle variabili casuali X e Y. 3. Calcoliamo i coefficienti dell'equazione di regressione lineare.L'equazione di regressione lineare è un'equazione di una linea retta che approssima (descrive approssimativamente) la relazione tra le variabili casuali X e Y. Se assumiamo che X sia libera e Y dipenda da X, allora l'equazione di regressione sarà scritta come segue Y = a + b X (3.1), dove:
Il coefficiente calcolato dalla formula (3.2) bè chiamato coefficiente di regressione lineare. In alcune fonti un chiamato coefficiente costante regressione e b secondo le variabili. Gli errori di previsione Y per un dato valore X sono calcolati dalle formule: Viene anche chiamato il valore σ y/x (formula 3.4). deviazione standard residua, caratterizza l'allontanamento di Y dalla retta di regressione descritta dall'equazione (3.1) a un valore (dato) fisso di X. | . |
3.3 Calcolare il coefficiente b per formula (3.2)
b = -0.72028 0.55582 = -0.40035
3.4 Calcolare il coefficiente a per formula (3.3)
un = 30.50000 - (-0.40035 25.75000) = 40.80894
3.5 Stimare gli errori dell'equazione di regressione.
3.5.1 Estraiamo la radice quadrata da S y 2 e otteniamo:
δy/x = (0,31437 / 30,50000)100% = 1,03073%
4.1. Troviamo che l'elemento minimo e massimo del campione X è rispettivamente il 18° e il 15° elemento, x min = 22,10000 e x max = 26,60000.
4.2. Troviamo che l'elemento minimo e massimo del campione Y è rispettivamente il 2° e il 18° elemento, y min = 29,40000 e y max = 31,60000.
4.3. Sull'asse delle ascisse, selezioniamo il punto iniziale appena a sinistra del punto x 18 = 22.10000, e una scala tale che il punto x 15 = 26.60000 si adatti all'asse e gli altri punti siano chiaramente distinti.
4.4. Sull'asse y, selezioniamo il punto iniziale appena a sinistra del punto y 2 = 29.40000, e una scala tale che il punto y 18 = 31.60000 si adatti all'asse e gli altri punti siano chiaramente distinti.
4.5. Sull'asse delle ascisse posizioniamo i valori x k , e sull'asse delle ordinate posizioniamo i valori y k .
4.6. Mettiamo i punti (x 1, y 1), (x 2, y 2), ..., (x 26, y 26) sul piano delle coordinate. Otteniamo un grafico a dispersione (campo di correlazione), mostrato nella figura seguente.
4.7. Tracciamo una linea di regressione.
Per fare ciò, troviamo due diversi punti con coordinate (x r1 , y r1) e (x r2 , y r2) che soddisfano l'equazione (3.6), li posizioniamo sul piano delle coordinate e tracciamo una linea attraverso di essi. Prendiamo x min = 22.10000 come ascissa del primo punto. Sostituiamo il valore di x min nell'equazione (3.6), otteniamo l'ordinata del primo punto. Quindi, abbiamo un punto con coordinate (22.10000, 31.96127). Analogamente si ottengono le coordinate del secondo punto, ponendo come ascissa il valore x max = 26,60000. Il secondo punto sarà: (26.60000, 30.15970).
La linea di regressione è mostrata nella figura sottostante in rosso
Si noti che la retta di regressione passa sempre per il punto dei valori medi di X e Y, ovvero con coordinate (M x , M y).