Dove si applica il metodo dei minimi quadrati?

Dove si applica il metodo dei minimi quadrati?

Che trova la più ampia applicazione in vari campi della scienza e della pratica. Può essere fisica, chimica, biologia, economia, sociologia, psicologia e chi più ne ha più ne metta. Per volontà del destino, ho spesso a che fare con l'economia, e quindi oggi organizzerò per te un biglietto per un paese fantastico chiamato Econometria=) … Come fai a non volerlo?! È molto bello lì - devi solo decidere! ... Ma quello che probabilmente vuoi sicuramente è imparare a risolvere i problemi metodo minimi quadrati . E soprattutto i lettori diligenti impareranno a risolverli non solo in modo accurato, ma anche MOLTO VELOCE ;-) Ma prima formulazione generale del problema+ esempio correlato:

Lascia che gli indicatori siano studiati in alcune aree tematiche che hanno un'espressione quantitativa. Allo stesso tempo, ci sono tutte le ragioni per credere che l'indicatore dipenda dall'indicatore. Questa ipotesi può essere sia un'ipotesi scientifica che basata su un elementare buon senso. Lasciamo da parte la scienza, tuttavia, ed esploriamo aree più appetitose, vale a dire i negozi di alimentari. Denota con:

– superficie commerciale di un negozio di alimentari, mq,
- fatturato annuo di un negozio di alimentari, milioni di rubli.

È abbastanza chiaro che maggiore è l'area del negozio, maggiore è il suo fatturato nella maggior parte dei casi.

Supponiamo che dopo aver condotto osservazioni / esperimenti / calcoli / ballando con un tamburello, abbiamo a nostra disposizione dati numerici:

Con i negozi di alimentari, penso che sia tutto chiaro: - questa è l'area del 1° negozio, - il suo fatturato annuo, - l'area del 2° negozio, - il suo fatturato annuo, ecc. A proposito, non è affatto necessario avere accesso a materiali classificati: è possibile ottenere una valutazione abbastanza accurata del fatturato utilizzando statistica matematica. Tuttavia, non lasciarti distrarre, il corso di spionaggio commerciale è già pagato =)

I dati tabulari possono anche essere scritti sotto forma di punti e rappresentati nel solito modo per noi. Sistema cartesiano .

Rispondiamo a una domanda importante: quanti punti sono necessari per uno studio qualitativo?

Piu 'grande e', meglio 'e. Il set minimo ammissibile è composto da 5-6 punti. Inoltre, con una piccola quantità di dati, i risultati "anormali" non dovrebbero essere inclusi nel campione. Quindi, ad esempio, un piccolo negozio d'élite può aiutare ordini di grandezza più dei "loro colleghi", distorcendo così lo schema generale che deve essere trovato!

Se è abbastanza semplice, dobbiamo scegliere una funzione , orario che passa il più vicino possibile ai punti . Tale funzione è chiamata approssimazione (approssimazione - approssimazione) o funzione teorica . In generale, qui appare immediatamente l'ovvio "candidato": il polinomio alto grado, il cui grafico passa per TUTTI i punti. Ma questa opzione è complicata e spesso semplicemente errata. (perché il grafico si "avvolgerà" continuamente e rifletterà male la tendenza principale).

Pertanto, la funzione desiderata deve essere sufficientemente semplice e allo stesso tempo riflettere adeguatamente la dipendenza. Come puoi immaginare, viene chiamato uno dei metodi per trovare tali funzioni minimi quadrati. Innanzitutto, analizziamo la sua essenza in vista generale. Lascia che qualche funzione approssimi i dati sperimentali:


Come valutare l'accuratezza di questa approssimazione? Calcoliamo anche le differenze (deviazioni) tra i valori sperimentali e funzionali (studiamo il disegno). Il primo pensiero che viene in mente è stimare quanto è grande la somma, ma il problema è che le differenze possono essere negative. (Per esempio, ) e le deviazioni risultanti da tale somma si annulleranno a vicenda. Pertanto, come stima dell'accuratezza dell'approssimazione, si suggerisce di prendere la somma moduli deviazioni:

o in forma piegata: (all'improvviso, chi non lo sa: è l'icona della somma, ed è una variabile ausiliaria-"contatore", che assume valori da 1 a ).

Avvicinamento a punti sperimentali varie funzioni, riceveremo significati diversi, e ovviamente, dove questa somma è minore, quella funzione è più accurata.

Tale metodo esiste e viene chiamato metodo del modulo minimo. Tuttavia, in pratica è diventato molto più diffuso. metodo dei minimi quadrati, in cui eventuali valori negativi vengono eliminati non dal modulo, ma elevando al quadrato gli scostamenti:

, dopo di che gli sforzi sono diretti alla selezione di una tale funzione che la somma delle deviazioni al quadrato era il più piccolo possibile. In realtà, da qui il nome del metodo.

E ora torniamo a un altro punto importante: come notato sopra, la funzione selezionata dovrebbe essere abbastanza semplice, ma ci sono anche molte di queste funzioni: lineare , iperbolico, esponenziale, logaritmico, quadratico eccetera. E, naturalmente, qui vorrei subito "ridurre il campo di attività". Quale classe di funzioni scegliere per la ricerca? Tecnica primitiva ma efficace:

- Il modo più semplice per disegnare punti sul disegno e analizzarne la posizione. Se tendono ad essere in linea retta, dovresti cercare equazione della retta con valori ottimali e . In altre parole, il compito è trovare TALI coefficienti, in modo che la somma delle deviazioni al quadrato sia la più piccola.

Se i punti si trovano, ad esempio, lungo iperbole, allora è chiaro che la funzione lineare darà una scarsa approssimazione. In questo caso, stiamo cercando i coefficienti più "favorevoli" per l'equazione dell'iperbole - quelli che danno la minima somma dei quadrati .

Ora nota che in entrambi i casi stiamo parlando funzioni di due variabili, i cui argomenti sono opzioni di dipendenza cercate:

E in sostanza, dobbiamo risolvere un problema standard: trovare minimo di una funzione di due variabili.

Ricordiamo il nostro esempio: supponiamo che i punti "shop" tendano ad essere posizionati in linea retta e ci siano tutte le ragioni per ritenere la presenza dipendenza lineare fatturato dall'area commerciale. Troviamo TALI coefficienti "a" e "be" in modo che la somma delle deviazioni al quadrato era il più piccolo. Tutto come al solito - prima derivate parziali del 1° ordine. Secondo regola di linearità puoi differenziare proprio sotto l'icona della somma:

Se desideri utilizzare queste informazioni per un saggio o una tesina, ti sarò molto grato per il collegamento nell'elenco delle fonti, non troverai calcoli così dettagliati da nessuna parte:

Facciamo un sistema standard:

Riduciamo ogni equazione di un "due" e, inoltre, "spezziamo" le somme:

Nota : analizza in modo indipendente perché "a" e "be" possono essere tolti dall'icona della somma. A proposito, formalmente questo può essere fatto con la somma

Riscriviamo il sistema in forma "applicata":

dopodiché inizia a disegnare l'algoritmo per risolvere il nostro problema:

Conosciamo le coordinate dei punti? Sappiamo. Somme possiamo trovare? Facilmente. Componiamo il più semplice sistema di due equazioni lineari in due incognite("a" e "beh"). Risolviamo il sistema, ad esempio, Il metodo di Cramer, risultando in un punto stazionario . Controllo condizione sufficiente per un estremo, possiamo verificare che a questo punto la funzione raggiunge con precisione minimo. La verifica è associata a calcoli aggiuntivi e quindi la lasceremo dietro le quinte. (se necessario, è possibile visualizzare il frame mancante). Traiamo la conclusione finale:

Funzione il modo migliore (almeno rispetto a qualsiasi altra funzione lineare) avvicina i punti sperimentali . In parole povere, il suo grafico passa il più vicino possibile a questi punti. Nella tradizione econometria viene chiamata anche la funzione di approssimazione risultante equazione di regressione lineare accoppiata .

Il problema in esame ha un grande valore pratico. Nella situazione con il nostro esempio, l'equazione consente di prevedere che tipo di fatturato ("yig") sarà nel negozio con l'uno o l'altro valore dell'area di vendita (uno o l'altro significato di "x"). Sì, la previsione risultante sarà solo una previsione, ma in molti casi risulterà essere abbastanza precisa.

Analizzerò solo un problema con i numeri "reali", poiché non ci sono difficoltà: tutti i calcoli sono a livello curriculum scolastico 7-8 grado. Nel 95 percento dei casi ti verrà chiesto di trovare solo una funzione lineare, ma alla fine dell'articolo mostrerò che non è più difficile trovare le equazioni per l'iperbole ottimale, l'esponente e alcune altre funzioni.

In effetti, resta da distribuire le chicche promesse, in modo da imparare a risolvere tali esempi non solo in modo accurato, ma anche rapido. Studiamo attentamente lo standard:

Un compito

Come risultato dello studio della relazione tra due indicatori, sono state ottenute le seguenti coppie di numeri:

Usando il metodo dei minimi quadrati, trova la funzione lineare che meglio approssima quella empirica (esperto) dati. Fai un disegno in cui in cartesiano sistema rettangolare coordinate per costruire punti sperimentali e un grafico della funzione di approssimazione . Trova la somma dei quadrati delle deviazioni tra i valori empirici e teorici. Scopri se la funzione è migliore (in termini di metodo dei minimi quadrati) punti sperimentali approssimati.

Nota che i valori "x" sono valori naturali, e questo ha un significato significativo caratteristico, di cui parlerò poco dopo; ma, ovviamente, possono essere frazionari. Inoltre, a seconda del contenuto di una particolare attività, entrambi i valori "X" e "G" possono essere completamente o parzialmente negativi. Bene, ci è stato assegnato un compito "senza volto" e lo iniziamo soluzione:

Troviamo i coefficienti della funzione ottima come soluzione del sistema:

Per una notazione più compatta, la variabile “contatore” può essere omessa, poiché è già chiaro che la sommatoria si effettua da 1 a .

È più conveniente calcolare gli importi richiesti in forma tabellare:


I calcoli possono essere eseguiti su un microcalcolatore, ma è molto meglio usare Excel, sia più veloce che senza errori; guarda un breve video:

Quindi, otteniamo quanto segue sistema:

Qui puoi moltiplicare la seconda equazione per 3 e sottrarre la seconda dalla prima equazione termine per termine. Ma questa è fortuna: in pratica, i sistemi spesso non sono dotati e in questi casi salva Il metodo di Cramer:
, quindi il sistema ha una soluzione unica.

Facciamo un controllo. Capisco che non voglio, ma perché saltare gli errori dove non puoi assolutamente perderli? Sostituisci la soluzione trovata nella parte sinistra di ciascuna equazione del sistema:

Si ottengono le parti giuste delle equazioni corrispondenti, il che significa che il sistema è risolto correttamente.

Pertanto, la funzione di approssimazione desiderata: – da tutte le funzioni lineari i dati sperimentali sono meglio approssimati da esso.

A differenza di dritto dipendenza del fatturato del negozio dalla sua area, la dipendenza trovata è inversione (principio "più - meno"), e questo fatto è immediatamente rivelato dal negativo coefficiente angolare. Funzione ci informa che con un aumento di un determinato indicatore di 1 unità, il valore dell'indicatore dipendente diminuisce media di 0,65 unità. Come si suol dire, più alto è il prezzo del grano saraceno, meno venduto.

Per tracciare la funzione di approssimazione, troviamo due dei suoi valori:

ed eseguire il disegno:


La linea costruita è chiamata linea di tendenza (vale a dire, una linea di tendenza lineare, cioè in caso generale la tendenza non è necessariamente una linea retta). Tutti conoscono l'espressione "essere di tendenza" e penso che questo termine non abbia bisogno di ulteriori commenti.

Calcola la somma dei quadrati delle deviazioni tra valori empirici e teorici. Geometricamente, questa è la somma dei quadrati delle lunghezze dei segmenti "cremisi". (due dei quali sono così piccoli che non puoi nemmeno vederli).

Riassumiamo i calcoli in una tabella:


Possono essere nuovamente eseguiti manualmente, nel caso in cui fornirò un esempio per il 1 ° punto:

ma è molto più efficiente fare il modo già noto:

Ripetiamo: qual è il significato del risultato? Da tutte le funzioni lineari funzione l'esponente è il più piccolo, cioè è la migliore approssimazione nella sua famiglia. E qui, a proposito, l'ultima domanda del problema non è casuale: e se la funzione esponenziale proposta sarà meglio approssimare i punti sperimentali?

Troviamo la somma corrispondente delle deviazioni al quadrato: per distinguerle, le designerò con la lettera "epsilon". La tecnica è esattamente la stessa:


E ancora per ogni calcolo del fuoco per il 1° punto:

In Excel, usiamo la funzione standard SCAD (La sintassi può essere trovata nella Guida di Excel).

Conclusione: , quindi la funzione esponenziale approssima i punti sperimentali peggio della retta .

Ma va notato qui che "peggio" è non significa ancora, che c'è. Ora ho costruito un grafico di questa funzione esponenziale - e passa anche vicino ai punti - tanto che senza uno studio analitico è difficile dire quale funzione sia più precisa.

Questo completa la soluzione e torno alla questione dei valori naturali dell'argomento. A vari studi, di regola, economico o sociologico, numeri "X" naturali mesi, anni o altri intervalli di tempo uguali. Considera, ad esempio, un problema del genere.

Dopo l'allineamento, otteniamo una funzione della seguente forma: g (x) = x + 1 3 + 1 .

Possiamo approssimare questi dati con una relazione lineare y = a x + b calcolando i parametri appropriati. Per fare ciò, dovremo applicare il cosiddetto metodo dei minimi quadrati. Dovrai anche fare un disegno per verificare quale linea allineerà meglio i dati sperimentali.

Yandex.RTB RA-339285-1

Cos'è esattamente l'OLS (metodo dei minimi quadrati)

La cosa principale che dobbiamo fare è trovare tali coefficienti di dipendenza lineare in cui il valore della funzione di due variabili F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 sarà il più piccolo. In altre parole, per determinati valori di a e b, la somma dei quadrati delle deviazioni dei dati presentati dalla retta risultante avrà un valore minimo. Questo è il significato del metodo dei minimi quadrati. Tutto quello che dobbiamo fare per risolvere l'esempio è trovare l'estremo della funzione di due variabili.

Come derivare le formule per il calcolo dei coefficienti

Per ricavare le formule per il calcolo dei coefficienti è necessario comporre e risolvere un sistema di equazioni a due variabili. Per fare ciò, calcoliamo le derivate parziali dell'espressione F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 rispetto ad a e b e le uguagliamo a 0 .

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ io = 1 n (y io - (a x io + b)) x io = 0 - 2 ∑ io = 1 n ( y io - (a X io + b)) = 0 ⇔ un ∑ io = 1 n X io 2 + b ∑ io = 1 n X io = ∑ io = 1 n X io y io un ∑ io = 1 n X io + ∑ io = 1 n b = ∑ io = 1 n y io ⇔ un ∑ io = 1 n x io 2 + b ∑ io = 1 n x io = ∑ io = 1 n x io y io un ∑ io = 1 n x io + n b = ∑ io = 1 n y io

Per risolvere un sistema di equazioni, puoi utilizzare qualsiasi metodo, come la sostituzione o il metodo di Cramer. Di conseguenza, dovremmo ottenere formule che calcolano i coefficienti utilizzando il metodo dei minimi quadrati.

n ∑ io = 1 n X io y io - ∑ io = 1 n X io ∑ io = 1 n y io n ∑ io = 1 n - ∑ io = 1 n X io 2 b = ∑ io = 1 n y io - un ∑ io = 1 n x io n

Abbiamo calcolato i valori delle variabili per le quali la funzione
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 assumerà il valore minimo. Nel terzo paragrafo, dimostreremo perché è così.

Questa è l'applicazione pratica del metodo dei minimi quadrati. La sua formula, usata per trovare il parametro a , include ∑ i = 1 n x i , ∑ i = 1 n y i , ∑ i = 1 n x i y i , ∑ i = 1 n x i 2 , e il parametro
n - indica la quantità di dati sperimentali. Ti consigliamo di calcolare ogni importo separatamente. Il valore del coefficiente b viene calcolato immediatamente dopo a .

Torniamo all'esempio originale.

Esempio 1

Qui abbiamo n uguale a cinque. Per rendere più conveniente calcolare gli importi richiesti inclusi nelle formule dei coefficienti, compiliamo la tabella.

io = 1 io = 2 io = 3 io = 4 io = 5 ∑ io = 1 5
x io 0 1 2 4 5 12
si io 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x io y io 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x io 2 0 1 4 16 25 46

Soluzione

La quarta riga contiene i dati ottenuti moltiplicando i valori della seconda riga per i valori della terza per ogni individuo i. La quinta riga contiene i dati del secondo quadrato. L'ultima colonna mostra le somme dei valori delle singole righe.

Usiamo il metodo dei minimi quadrati per calcolare i coefficienti aeb di cui abbiamo bisogno. Per fare ciò, sostituisci i valori desiderati dall'ultima colonna e calcola le somme:

n ∑ io = 1 n X io y io - ∑ io = 1 n X io ∑ io = 1 n y io n ∑ io = 1 n - ∑ io = 1 n X io 2 b = ∑ io = 1 n y io - un ∑ io = 1 n X io n ⇒ a = 5 33 , 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Abbiamo ottenuto che la retta di approssimazione desiderata assomiglierà a y = 0 , 165 x + 2 , 184 . Ora dobbiamo determinare quale linea approssimi meglio i dati - g (x) = x + 1 3 + 1 o 0 , 165 x + 2 , 184 . Facciamo una stima usando il metodo dei minimi quadrati.

Per calcolare l'errore, dobbiamo trovare le somme delle deviazioni al quadrato dei dati dalle linee σ 1 = ∑ i = 1 n (y io - (a x io + b i)) 2 e σ 2 = ∑ io = 1 n (y io - g (x i)) 2 , il valore minimo corrisponderà ad una retta più opportuna.

σ 1 = ∑ io = 1 n (y io - (a X io + b io)) 2 = = ∑ io = 1 5 (y io - (0 , 165 x io + 2 , 184)) 2 ≈ 0 , 019 σ 2 = ∑ io = 1 n (y io - g (x io)) 2 = = ∑ io = 1 5 (y io - (x io + 1 3 + 1)) 2 ≈ 0 , 096

Risposta: poiché σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0 , 165 x + 2 , 184 .

Il metodo dei minimi quadrati è chiaramente mostrato nell'illustrazione grafica. La linea rossa segna la retta g (x) = x + 1 3 + 1, la linea blu segna y = 0, 165 x + 2, 184. I dati grezzi sono contrassegnati da punti rosa.

Spieghiamo perché sono necessarie esattamente approssimazioni di questo tipo.

Possono essere utilizzati in problemi che richiedono il livellamento dei dati, nonché in quelli in cui i dati devono essere interpolati o estrapolati. Ad esempio, nel problema discusso sopra, si potrebbe trovare il valore della quantità osservata y in x = 3 o in x = 6 . Abbiamo dedicato un articolo a parte a tali esempi.

Dimostrazione del metodo LSM

Affinché la funzione assuma il valore minimo quando si calcolano a e b, è necessario che in un dato punto la matrice della forma quadratica del differenziale della funzione della forma F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 essere definita positiva. Ti mostriamo come dovrebbe apparire.

Esempio 2

Abbiamo un differenziale di secondo ordine della seguente forma:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d un d b + δ 2 F (a ; b) δ b 2 d 2b

Soluzione

δ 2 F (a ; b) δ un 2 = δ δ F (a ; b) δ un δ a = = δ - 2 ∑ io = 1 n (y io - (a x io + b)) x io δ un = 2 ∑ io = 1 n (x i) 2 δ 2 F (a ; b) δ a δ b = δ δ F (a ; b) δ a δ b = = δ - 2 ∑ io = 1 n (y io - (a x io + b) ) x io δ b = 2 ∑ io = 1 n X io δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ io = 1 n (y io - (a x io + b)) δ b = 2 ∑ io = 1 n (1) = 2 n

In altre parole, può essere scritto come segue: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x io i = 1 n d a d b + (2 n) d 2 b .

Abbiamo ottenuto una matrice di forma quadratica M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

In questo caso, i valori dei singoli elementi non cambieranno a seconda di a e b . Questa matrice è definita positiva? Per rispondere a questa domanda, controlliamo se i suoi minori angolari sono positivi.

Calcola il minore angolare del primo ordine: 2 ∑ i = 1 n (x i) 2 > 0 . Poiché i punti x i non coincidono, la disuguaglianza è stretta. Lo terremo presente in ulteriori calcoli.

Calcoliamo il minore angolare di secondo ordine:

d e t (M) = 2 ∑ io = 1 n (x i) 2 2 ∑ io = 1 n x io 2 ∑ io = 1 n x io 2 n = 4 n ∑ io = 1 n (x io) 2 - ∑ io = 1 n x io 2

Dopodiché, procediamo alla dimostrazione della disuguaglianza n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 usando l'induzione matematica.

  1. Controlliamo se questa disuguaglianza è valida per n arbitrario. Prendiamo 2 e calcoliamo:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Abbiamo ottenuto l'uguaglianza corretta (se i valori x 1 e x 2 non corrispondono).

  1. Supponiamo che questa disuguaglianza sia vera per n , cioè n ∑ io = 1 n (x io) 2 - ∑ io = 1 n X io 2 > 0 – vero.
  2. Ora dimostriamo la validità per n + 1 , cioè che (n + 1) ∑ io = 1 n + 1 (x io) 2 - ∑ io = 1 n + 1 x io 2 > 0 se n ∑ io = 1 n (x io) 2 - ∑ io = 1 n X io 2 > 0 .

Calcoliamo:

(n + 1) ∑ io = 1 n + 1 (x io) 2 - ∑ io = 1 n + 1 x io 2 = = (n + 1) ∑ io = 1 n (x io) 2 + x n + 1 2 - ∑ io = 1 n x io + x n + 1 2 = = n ∑ io = 1 n (x io) 2 + n x n + 1 2 + ∑ io = 1 n (x io) 2 + x n + 1 2 - - ∑ io = 1 n x io 2 + 2 x n + 1 ∑ io = 1 n X io + x n + 1 2 = = ∑ io = 1 n (x io) 2 - ∑ io = 1 n x io 2 + n x n + 1 2 - x n + 1 ∑ io = 1 n x io + ∑ io = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ io = 1 n (x i) 2 - ∑ io = 1 n x io 2 + + (x n + 1 - x 1) 2 + (x n + 1) - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

L'espressione racchiusa tra parentesi graffe sarà maggiore di 0 (in base a quanto ipotizzato nel passaggio 2) e il resto dei termini sarà maggiore di 0 perché sono tutti quadrati di numeri. Abbiamo dimostrato la disuguaglianza.

Risposta: gli a e b trovati corrisponderanno al valore più piccolo della funzione F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, il che significa che sono i parametri richiesti del metodo dei minimi quadrati (LMS).

Se noti un errore nel testo, evidenzialo e premi Ctrl+Invio

Ha molti usi in quanto consente una rappresentazione approssimativa data funzione altri sono più semplici. LSM può essere estremamente utile nell'elaborazione di osservazioni e viene utilizzato attivamente per stimare alcune quantità dai risultati di misurazioni di altre contenenti errori casuali. In questo articolo imparerai come implementare i calcoli dei minimi quadrati in Excel.

Dichiarazione del problema su un esempio specifico

Supponiamo che ci siano due indicatori X e Y. Inoltre, Y dipende da X. Poiché OLS ci interessa dal punto di vista dell'analisi di regressione (in Excel, i suoi metodi sono implementati utilizzando funzioni integrate), dovremmo procedere immediatamente considerare un problema specifico.

Quindi, sia X l'area di vendita di un negozio di alimentari, misurata in metri quadrati e Y è il fatturato annuo, definito in milioni di rubli.

È necessario fare una previsione del fatturato (Y) del negozio se dispone di uno o un altro spazio di vendita al dettaglio. Ovviamente, la funzione Y = f (X) è crescente, poiché l'ipermercato vende più merce del banco.

Qualche parola sulla correttezza dei dati iniziali utilizzati per la previsione

Diciamo che abbiamo una tabella costruita con i dati per n negozi.

Secondo statistica matematica, i risultati saranno più o meno corretti se si esaminano i dati su almeno 5-6 oggetti. Inoltre, i risultati "anomali" non possono essere utilizzati. In particolare, una piccola boutique d'élite può avere un fatturato molte volte superiore al fatturato di una grande punti vendita Classe "Masmarket".

L'essenza del metodo

I dati della tabella possono essere visualizzati sul piano cartesiano come punti M 1 (x 1, y 1), ... M n (x n, y n). Ora la soluzione del problema si ridurrà alla selezione di una funzione di approssimazione y = f (x), che abbia un grafico passante il più vicino possibile ai punti M 1, M 2, .. M n .

Certo, puoi usare un polinomio di alto grado, ma questa opzione non è solo difficile da implementare, ma semplicemente errata, poiché non rifletterà la tendenza principale che deve essere rilevata. La soluzione più ragionevole è cercare una retta y = ax + b, che approssima al meglio i dati sperimentali e, più precisamente, i coefficienti - a e b.

Punteggio di precisione

Per qualsiasi approssimazione, la valutazione della sua accuratezza è di particolare importanza. Indichiamo con e io la differenza (deviazione) tra i valori funzionali e sperimentali per il punto x io , cioè e io = y io - f (x io).

Ovviamente, per valutare l'accuratezza dell'approssimazione, è possibile utilizzare la somma delle deviazioni, ovvero, quando si sceglie una retta per una rappresentazione approssimata della dipendenza di X da Y, si dovrebbe dare la preferenza a quella che ha il valore più piccolo di la somma e i in tutti i punti considerati. Tuttavia, non tutto è così semplice, poiché insieme alle deviazioni positive ce ne saranno praticamente di negative.

Puoi risolvere il problema usando i moduli di deviazione oi loro quadrati. Quest'ultimo metodo è il più utilizzato. Viene utilizzato in molte aree, inclusa l'analisi di regressione (in Excel, la sua implementazione viene eseguita utilizzando due funzioni integrate) e da tempo si è dimostrata efficace.

Metodo dei minimi quadrati

In Excel, come sai, esiste una funzione di somma automatica incorporata che ti consente di calcolare i valori di tutti i valori che si trovano nell'intervallo selezionato. Pertanto, nulla ci impedirà di calcolare il valore dell'espressione (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

In notazione matematica, questo assomiglia a:

Poiché inizialmente è stata presa la decisione di approssimare utilizzando una linea retta, abbiamo:

Pertanto, il compito di trovare una retta che descriva al meglio una relazione specifica tra X e Y equivale a calcolare il minimo di una funzione di due variabili:

Ciò richiede l'equazione di zero derivate parziali rispetto alle nuove variabili a e b, e la risoluzione di un sistema primitivo costituito da due equazioni con 2 incognite della forma:

Dopo semplici trasformazioni, inclusa la divisione per 2 e la manipolazione delle somme, otteniamo:

Risolvendolo, ad esempio, con il metodo di Cramer, otteniamo un punto stazionario con determinati coefficienti a * e b * . Questo è il minimo, cioè per prevedere quale fatturato avrà il negozio per una certa area, è adatta la retta y = a * x + b *, che è un modello di regressione per l'esempio in questione. Certo, non ti permetterà di trovare il risultato esatto, ma ti aiuterà a farti un'idea se l'acquisto di un negozio a credito per una determinata area sarà ripagato.

Come implementare il metodo dei minimi quadrati in Excel

Excel ha una funzione per calcolare il valore dei minimi quadrati. Ha la seguente forma: TREND (valori Y noti; valori X noti; nuovi valori X; costante). Applichiamo la formula per il calcolo dell'OLS in Excel alla nostra tabella.

Per fare ciò, nella cella in cui deve essere visualizzato il risultato del calcolo con il metodo dei minimi quadrati in Excel, inserire il segno “=” e selezionare la funzione “TENDENZA”. Nella finestra che si apre, compila gli appositi campi, evidenziando:

  • intervallo di valori noti per Y (in questo caso dati per fatturato commerciale);
  • intervallo x 1 , …x n , ovvero la dimensione dello spazio commerciale;
  • e valori noti e sconosciuti di x, per i quali è necessario scoprire l'entità del fatturato (per informazioni sulla loro posizione nel foglio di lavoro, vedere sotto).

Inoltre, nella formula è presente una variabile logica "Const". Se inserisci 1 nel campo corrispondente, ciò significa che i calcoli devono essere eseguiti, supponendo che b \u003d 0.

Se hai bisogno di conoscere la previsione per più di un valore x, dopo aver inserito la formula, non dovresti premere "Invio", ma devi digitare la combinazione "Maiusc" + "Controllo" + "Invio" ("Invio" ) sulla tastiera.

Alcune caratteristiche

Analisi di regressione accessibile anche ai manichini. La formula di Excel per prevedere il valore di un array di variabili sconosciute - "TREND" - può essere utilizzata anche da chi non ha mai sentito parlare del metodo dei minimi quadrati. Basta solo conoscere alcune caratteristiche del suo lavoro. In particolare:

  • Se si inserisce l'intervallo di valori noti della variabile y in una riga o colonna, ogni riga (colonna) con valori noti di x verrà percepita dal programma come una variabile separata.
  • Se l'intervallo con x noto non è specificato nella finestra TENDENZA, in caso di utilizzo della funzione in Excel, il programma lo considererà come un array costituito da numeri interi, il cui numero corrisponde all'intervallo con i valori indicati della variabile y.
  • Per emettere un array di valori "previsti", l'espressione di trend deve essere immessa come una formula di array.
  • Se non vengono specificati nuovi valori x, la funzione TREND li considera uguali a quelli noti. Se non sono specificati, l'array 1 viene preso come argomento; 2; 3; 4;…, che è commisurato all'intervallo con i parametri già dati y.
  • L'intervallo contenente i nuovi valori x deve essere costituito dallo stesso o Di più righe o colonne, come un intervallo con valori y dati. In altre parole, deve essere proporzionato alle variabili indipendenti.
  • Un array con valori x noti può contenere più variabili. Tuttavia, se noi stiamo parlando solo circa uno, quindi è necessario che gli intervalli con i valori dati di x e y siano commisurati. Nel caso di più variabili, è necessario che l'intervallo con i valori y dati rientri in una colonna o in una riga.

Funzione PREVISIONE

È implementato utilizzando diverse funzioni. Uno di questi si chiama "PREVISIONE". È simile a TREND, ovvero fornisce il risultato di calcoli utilizzando il metodo dei minimi quadrati. Tuttavia, solo per una X, per la quale il valore di Y è sconosciuto.

Ora conosci le formule di Excel per manichini che ti consentono di prevedere il valore del valore futuro di un indicatore secondo un trend lineare.

Metodo dei minimi quadrati viene utilizzato per stimare i parametri dell'equazione di regressione.
Numero di linee (dati iniziali)

Uno dei metodi per studiare le relazioni stocastiche tra caratteristiche è l'analisi di regressione.
L'analisi di regressione è la derivazione di un'equazione di regressione, che viene utilizzata per trovare valore medio una variabile casuale (feature-result), se è noto il valore di un'altra (o altre) variabili (feature-factors). Include i seguenti passaggi:

  1. scelta della forma di connessione (tipo di equazione di regressione analitica);
  2. stima dei parametri dell'equazione;
  3. valutazione della qualità dell'equazione di regressione analitica.
Molto spesso, viene utilizzata una forma lineare per descrivere la relazione statistica delle caratteristiche. L'attenzione a una relazione lineare si spiega con una chiara interpretazione economica dei suoi parametri, limitata dalla variazione delle variabili, e dal fatto che nella maggior parte dei casi le forme non lineari di una relazione vengono convertite (prendendo un logaritmo o cambiando variabili) in una forma lineare per eseguire calcoli.
Nel caso di una relazione di coppia lineare, l'equazione di regressione assumerà la forma: y i =a+b·x i +u i . I parametri di questa equazione a e b sono stimati dai dati dell'osservazione statistica x e y . Il risultato di tale valutazione è l'equazione: , dove , - stime dei parametri a e b , - il valore della caratteristica effettiva (variabile) ottenuta dall'equazione di regressione (valore calcolato).

Il più comunemente usato per la stima dei parametri è metodo dei minimi quadrati (LSM).
Il metodo dei minimi quadrati fornisce le stime migliori (consistenti, efficienti e imparziali) dei parametri dell'equazione di regressione. Ma solo se sono soddisfatte determinate ipotesi sul termine casuale (u) e sulla variabile indipendente (x) (vedi ipotesi OLS).

Il problema della stima dei parametri di un'equazione di coppia lineare con il metodo dei minimi quadrati consiste nel seguente: ottenere tali stime dei parametri , , in cui la somma delle deviazioni al quadrato dei valori effettivi della caratteristica effettiva - y i dai valori calcolati - è minima.
Formalmente Criterio OLS si può scrivere così: .

Classificazione dei metodi dei minimi quadrati

  1. Metodo dei minimi quadrati.
  2. Metodo della massima verosimiglianza (per un normale modello di regressione lineare classica, si postula la normalità dei residui di regressione).
  3. Il metodo dei minimi quadrati generalizzati di GLSM viene utilizzato nel caso di autocorrelazione degli errori e nel caso di eteroschedasticità.
  4. Minimi quadrati ponderati ( caso speciale GMS con residui eteroschedastici).

Illustrare l'essenza graficamente il metodo classico dei minimi quadrati. Per fare ciò, costruiremo un dot plot in base ai dati osservativi (x i , y i , i=1;n) in un sistema di coordinate rettangolari (tale dot plot è chiamato campo di correlazione). Proviamo a trovare una linea retta più vicina ai punti del campo di correlazione. Secondo il metodo dei minimi quadrati, la linea viene scelta in modo che la somma dei quadrati delle distanze verticali tra i punti del campo di correlazione e questa linea sia minima.

Notazione matematica di questo problema: .
I valori di y i e x i =1...n ci sono noti, questi sono dati osservativi. Nella funzione S sono costanti. Le variabili in questa funzione sono le stime richieste dei parametri - , . Per trovare il minimo di una funzione di 2 variabili, è necessario calcolare le derivate parziali di questa funzione rispetto a ciascuno dei parametri e equipararle a zero, cioè .
Di conseguenza, otteniamo un sistema di 2 normali equazioni lineari:
Risolvendo questo sistema, troviamo le stime dei parametri richiesti:

La correttezza del calcolo dei parametri dell'equazione di regressione può essere verificata confrontando le somme (è possibile una certa discrepanza a causa dell'arrotondamento dei calcoli).
Per calcolare le stime dei parametri , è possibile creare la Tabella 1.
Il segno del coefficiente di regressione b indica la direzione della relazione (se b > 0 la relazione è diretta, se b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Formalmente, il valore del parametro a è il valore medio di y per x uguale a zero. Se il fattore di segno non ha e non può avere un valore zero, allora l'interpretazione di cui sopra del parametro a non ha senso.

Valutazione della tenuta del rapporto tra le caratteristiche viene eseguito utilizzando il coefficiente di correlazione di coppia lineare - r x,y . Può essere calcolato utilizzando la formula: . Inoltre, il coefficiente di correlazione della coppia lineare può essere determinato in termini del coefficiente di regressione b: .
L'intervallo di valori ammissibili del coefficiente lineare di correlazione di coppia va da –1 a +1. Il segno del coefficiente di correlazione indica la direzione della relazione. Se r x, y >0, allora la connessione è diretta; se r x, y<0, то связь обратная.
Se questo coefficiente è vicino all'unità in modulo, allora la relazione tra le caratteristiche può essere interpretata come lineare abbastanza vicina. Se il suo modulo è uguale a uno ê r x , y ê =1, allora la relazione tra le caratteristiche è funzionale lineare. Se le caratteristiche x e y sono linearmente indipendenti, allora r x,y è vicino a 0.
La tabella 1 può essere utilizzata anche per calcolare r x,y.

Tabella 1

N osservazionix iosi iox io ∙ y io
1 x 1si 1x 1 y 1
2 x2y2x 2 y 2
...
nx ne nx n y n
Somma colonna∑x∑y∑x y
Significare
Per valutare la qualità dell'equazione di regressione ottenuta, viene calcolato il coefficiente teorico di determinazione - R 2 yx:

,
dove d 2 è la varianza y spiegata dall'equazione di regressione;
e 2 - varianza residua (non spiegata dall'equazione di regressione) y ;
s 2 y - varianza totale (totale) y .
Il coefficiente di determinazione caratterizza la quota di variazione (dispersione) della caratteristica risultante y, spiegata dalla regressione (e, di conseguenza, il fattore x), nella variazione totale (dispersione) y. Il coefficiente di determinazione R 2 yx assume valori da 0 a 1. Di conseguenza, il valore 1-R 2 yx caratterizza la proporzione di varianza y causata dall'influenza di altri fattori non presi in considerazione nel modello e dagli errori di specifica.
Con regressione lineare accoppiata R 2 yx =r 2 yx .

Se una quantità fisica dipende da un'altra quantità, allora questa dipendenza può essere studiata misurando y a diversi valori di x. Come risultato delle misurazioni, si ottiene una serie di valori:

X 1 , X 2 , ..., X io , ... , X n ;

y 1 , y 2 , ..., y io , ... , y n .

Sulla base dei dati di un tale esperimento, è possibile tracciare la dipendenza y = ƒ(x). La curva risultante permette di giudicare la forma della funzione ƒ(x). Tuttavia, i coefficienti costanti che entrano in questa funzione rimangono sconosciuti. Possono essere determinati utilizzando il metodo dei minimi quadrati. I punti sperimentali, di regola, non giacciono esattamente sulla curva. Il metodo dei minimi quadrati richiede che la somma dei quadrati delle deviazioni dei punti sperimentali dalla curva, cioè 2 era il più piccolo.

In pratica, questo metodo è più spesso (e più semplicemente) utilizzato nel caso di una relazione lineare, ad es. quando

y=kx o y = a + bx.

La dipendenza lineare è molto diffusa in fisica. E anche quando la dipendenza non è lineare, di solito cercano di costruire un grafico in modo tale da ottenere una linea retta. Ad esempio, se si assume che l'indice di rifrazione del vetro n sia correlato alla lunghezza d'onda λ dell'onda luminosa mediante la relazione n = a + b/λ 2 , allora la dipendenza di n da λ -2 viene tracciata sul grafico .

Considera la dipendenza y=kx(retta passante per l'origine). Componiamo il valore φ la somma dei quadrati delle deviazioni dei nostri punti dalla retta

Il valore di φ è sempre positivo e risulta essere tanto più piccolo quanto più i nostri punti sono vicini alla linea retta. Il metodo dei minimi quadrati afferma che per k si dovrebbe scegliere un tale valore in cui φ ha un minimo


o
(19)

Il calcolo mostra che l'errore quadratico medio nel determinare il valore di k è uguale a

, (20)
dove n è il numero di dimensioni.

Consideriamo ora un caso un po' più difficile, in cui i punti devono soddisfare la formula y = a + bx(una retta che non passa per l'origine).

Il compito è trovare i migliori valori di a e b dall'insieme di valori dato x io , y io .

Ancora una volta componiamo una forma quadratica φ uguale alla somma dei quadrati delle deviazioni dei punti x i , y i dalla retta

e trova i valori a e b per i quali φ ha un minimo

;

.

.

La soluzione congiunta di queste equazioni dà

(21)

Gli errori quadratici medi nella determinazione di a e b sono uguali

(23)

.  (24)

Quando si elaborano i risultati della misurazione con questo metodo, è conveniente riassumere tutti i dati in una tabella in cui vengono preliminarmente calcolati tutti gli importi inclusi nelle formule (19) (24). Le forme di queste tabelle sono mostrate negli esempi seguenti.

Esempio 1È stata studiata l'equazione di base della dinamica del moto rotatorio ε = M/J (una retta passante per l'origine). Per vari valori del momento M è stata misurata l'accelerazione angolare ε di un certo corpo. È necessario determinare il momento di inerzia di questo corpo. I risultati delle misurazioni del momento di forza e dell'accelerazione angolare sono elencati nella seconda e terza colonna tavole 5.

Tabella 5
n M, N m ε, s-1 M2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Con la formula (19) determiniamo:

.

Per determinare l'errore quadratico medio, utilizziamo la formula (20)

0.005775kg-uno · m -2 .

Per la formula (18) abbiamo

; .

SJ = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

Data l'affidabilità P = 0.95 , secondo la tabella dei coefficienti di Student per n = 5, troviamo t = 2.78 e determiniamo l'errore assoluto ΔJ = 2.78 0.05185 = 0.1441 ≈ 0.2 kg m2.

Scriviamo i risultati nella forma:

J = (3,0 ± 0,2) kg m2;


Esempio 2 Calcoliamo il coefficiente di temperatura della resistenza del metallo usando il metodo dei minimi quadrati. La resistenza dipende dalla temperatura secondo una legge lineare

R t \u003d R 0 (1 + α t °) \u003d R 0 + R 0 α t °.

Il termine libero determina la resistenza R 0 a una temperatura di 0 ° C e il coefficiente angolare è il prodotto del coefficiente di temperatura α e della resistenza R 0 .

I risultati delle misurazioni e dei calcoli sono riportati nella tabella ( vedi tabella 6).

Tabella 6
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r-bt-a (r - bt - a) 2,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Con le formule (21), (22) determiniamo

R 0 = ¯ R- α R 0 ¯ t = 1.4005 - 0.002645 85.83333 = 1.1735 Ohm.

Troviamo un errore nella definizione di α. Poiché , allora per la formula (18) abbiamo:

.

Usando le formule (23), (24) abbiamo

;

0.014126 Ohm.

Data l'affidabilità P = 0.95, secondo la tabella dei coefficienti di Student per n = 6, troviamo t = 2.57 e determiniamo l'errore assoluto Δα = 2.57 0.000132 = 0.000338 gradi -1.

α = (23 ± 4) 10 -4 salve-1 a P = 0,95.


Esempio 3È necessario determinare il raggio di curvatura dell'obiettivo dagli anelli di Newton. Sono stati misurati i raggi degli anelli di Newton rm e sono stati determinati i numeri di questi anelli m. I raggi degli anelli di Newton sono correlati al raggio di curvatura della lente R e al numero dell'anello dall'equazione

r 2 m = mλR - 2d 0 R,

dove d 0 lo spessore dello spazio tra la lente e la piastra piano-parallela (o deformazione della lente),

λ è la lunghezza d'onda della luce incidente.

λ = (600 ± 6) nm;
r2m = y;
m = x;
λR = b;
-2d 0 R = a,

quindi l'equazione assumerà la forma y = a + bx.

.

I risultati delle misurazioni e dei calcoli vengono inseriti tavola 7.

Tabella 7
n x = m y \u003d r 2, 10 -2 mm 2 mm (m-¯m) 2 (m-¯m)y y-bx-a, 10-4 (y - bx - a) 2, 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –