Cos'è la correlazione.  Cosa significa il concetto di correlazione in parole semplici

Cos'è la correlazione. Cosa significa il concetto di correlazione in parole semplici

Data di pubblicazione: 09/03/2017 13:01

Il termine "correlazione" è attivamente utilizzato in umanistiche, medicinale; spesso presenti nei media. Le correlazioni giocano un ruolo chiave in psicologia. In particolare, il calcolo delle correlazioni è pietra miliare implementazione della ricerca empirica durante la scrittura di un WRC in psicologia.

Le cose di correlazione sul web sono troppo scientifiche. È difficile per un non specialista capire le formule. Allo stesso tempo, per un marketer, un sociologo, un medico, uno psicologo è necessario comprendere il significato delle correlazioni: tutti coloro che conducono ricerche sulle persone.

In questo articolo, spiegheremo in un linguaggio semplice l'essenza della correlazione, i tipi di correlazioni, i metodi di calcolo, le caratteristiche dell'uso della correlazione nella ricerca psicologica, nonché quando si scrivono tesi in psicologia.

Contenuto

Cos'è la correlazione

La correlazione è comunicazione. Ma non nessuno. Qual è la sua particolarità? Diamo un'occhiata a un esempio.

Immagina di guidare un'auto. Premi il pedale dell'acceleratore: l'auto va più veloce. Rallenta il gas - l'auto rallenta. Anche una persona che non ha familiarità con il dispositivo di un'auto dirà: "C'è una relazione diretta tra il pedale dell'acceleratore e la velocità dell'auto: più si preme il pedale, maggiore è la velocità".

Questa dipendenza è funzionale: la velocità è una funzione diretta del pedale dell'acceleratore. Lo specialista spiegherà che il pedale controlla l'alimentazione di carburante ai cilindri, dove avviene la combustione della miscela, che porta ad un aumento della potenza all'albero, ecc. Questo collegamento è rigido, deterministico, non ammette eccezioni (ammesso che la macchina funzioni).

Ora immagina di essere il direttore di un'azienda i cui dipendenti vendono beni. Decidi di aumentare le vendite aumentando gli stipendi dei dipendenti. Aumenti lo stipendio del 10% e le vendite medie dell'azienda aumentano. Dopo un po', aumenti di un altro 10% e di nuovo cresci. Poi un altro 5%, e di nuovo c'è un effetto. La conclusione si suggerisce - c'è una relazione diretta tra le vendite dell'azienda e lo stipendio dei dipendenti - più alti sono gli stipendi, maggiori sono le vendite dell'organizzazione. È la stessa connessione che c'è tra il pedale dell'acceleratore e la velocità dell'auto? Qual è la differenza fondamentale?

Esatto, il rapporto tra stipendio e vendite non è rigido. Ciò significa che per alcuni dipendenti le vendite potrebbero addirittura diminuire, nonostante l'aumento dello stipendio. Qualcuno deve rimanere lo stesso. Ma in media le vendite sono cresciute in azienda, e diciamo che c'è una relazione tra vendite e stipendi dei dipendenti, ed è correlata.

Il collegamento funzionale (pedale del gas - velocità) si basa su una legge fisica. La base della correlazione (vendite - stipendio) è una semplice coerenza delle variazioni in due indicatori. Non c'è alcuna legge (nel senso fisico della parola) dietro la correlazione. Esiste solo una regolarità probabilistica (stocastica).

Espressione numerica della dipendenza dalla correlazione

Quindi, la correlazione riflette la dipendenza tra i fenomeni. Se questi fenomeni possono essere misurati, allora riceve un'espressione numerica.

Ad esempio, si sta studiando il ruolo della lettura nella vita delle persone. I ricercatori hanno preso un gruppo di 40 persone e hanno misurato due indicatori per ogni soggetto: 1) quanto tempo legge a settimana; 2) in che misura si ritiene di successo (su una scala da 1 a 10). I ricercatori hanno tracciato i dati in due colonne e hanno utilizzato un programma statistico per calcolare la correlazione tra lettura e benessere. Supponiamo che abbiano ottenuto il seguente risultato -0,76. Ma cosa significa questo numero? Come interpretarlo? Scopriamolo.

Il numero risultante è chiamato coefficiente di correlazione. Per una sua corretta interpretazione, è importante considerare quanto segue:

  1. Il segno "+" o "-" riflette la direzione della dipendenza.
  2. Il valore del coefficiente riflette la forza della dipendenza.

Diretto e inverso

Il segno più davanti al coefficiente indica che la relazione tra fenomeni o indicatori è diretta. Cioè, maggiore è un indicatore, maggiore è l'altro. Uno stipendio più alto significa vendite più alte. Tale correlazione è chiamata diretta o positiva.

Se il coefficiente ha un segno meno, la correlazione è inversa o negativa. In questo caso, più alto è un indicatore, più basso è l'altro. Nell'esempio della lettura e del benessere, abbiamo ottenuto -0,76, il che significa che, di più persone leggere, più basso è il loro livello di benessere.

Forte e debole

La correlazione in termini numerici è un numero compreso tra -1 e +1. Indicato dalla lettera "r". Più alto è il numero (ignorando il segno), più forte è la correlazione.

Minore è il valore numerico del coefficiente, minore è la relazione tra fenomeni e indicatori.

La forza di dipendenza massima possibile è 1 o -1. Come comprenderlo e presentarlo?

Considera un esempio. Hanno preso 10 studenti e misurato il loro livello di intelligenza (QI) e rendimento scolastico per il semestre. Organizzato questi dati in due colonne.

cavia

QI

Progresso (punti)

Osserva attentamente i dati nella tabella. Da 1 a 10 del soggetto del test, il livello di QI aumenta. Ma anche il livello di realizzazione è in aumento. Di due studenti qualsiasi, quello con il QI più alto avrà prestazioni migliori. E non ci saranno eccezioni a questa regola.

Davanti a noi c'è un esempio di cambiamento completo e coordinato al 100% in due indicatori in un gruppo. E questo è un esempio della massima relazione positiva possibile. Cioè, la correlazione tra intelligenza e prestazioni è 1.

Consideriamo un altro esempio. Gli stessi 10 studenti sono stati valutati con l'aiuto di un sondaggio in che misura si sentono riusciti a comunicare con il sesso opposto (su una scala da 1 a 10).

cavia

QI

Successo nella comunicazione con il sesso opposto (punti)

Osserviamo da vicino i dati nella tabella. Da 1 a 10 del soggetto del test, il livello di QI aumenta. Allo stesso tempo, il livello di successo nella comunicazione con il sesso opposto diminuisce costantemente nell'ultima colonna. Di due studenti qualsiasi, quello con il QI più basso avrà più successo nella comunicazione con il sesso opposto. E non ci saranno eccezioni a questa regola.

Questo è un esempio di completa coerenza nel cambiamento di due indicatori nel gruppo: la massima relazione negativa possibile. La correlazione tra QI e successo della comunicazione con il sesso opposto è -1.

E come capire il significato di una correlazione uguale a zero (0)? Ciò significa che non esiste alcuna relazione tra gli indicatori. Ancora una volta, torniamo ai nostri studenti e consideriamo un altro indicatore misurato da loro: la lunghezza del salto da un punto.

cavia

QI

Lunghezza salto in piedi (m)

Non c'è coerenza tra la variazione da persona a persona del QI e il salto in lungo. Ciò indica una mancanza di correlazione. Il coefficiente di correlazione del QI e della lunghezza del salto per gli studenti è 0.

Abbiamo esaminato casi estremi. Nelle misurazioni reali, i coefficienti sono raramente uguali esattamente a 1 o 0. In questo caso si adotta la seguente scala:

  • se il coefficiente è maggiore di 0,70 - la relazione tra gli indicatori è forte;
  • da 0,30 a 0,70 - la connessione è moderata,
  • meno di 0,30 - la connessione è debole.

Se valutiamo su questa scala la correlazione che abbiamo ottenuto sopra tra lettura e benessere, si scopre che questa dipendenza è forte e negativa -0,76. Cioè, c'è una forte relazione negativa tra erudizione e benessere. Il che conferma ancora una volta la saggezza biblica sul rapporto tra saggezza e dolore.

La gradazione data dà molto stime approssimative e in questa forma sono usati raramente nella ricerca.

Le gradazioni dei coefficienti in base ai livelli di significatività sono più spesso utilizzate. In questo caso, il coefficiente effettivo ottenuto può essere significativo o non significativo. Questo può essere determinato confrontando il suo valore con il valore critico del coefficiente di correlazione desunto da un'apposita tabella. Inoltre, questi valori critici dipendono dalla dimensione del campione (maggiore è il volume, minore è il valore critico).

Analisi di correlazione in psicologia

Il metodo di correlazione è uno dei principali nella ricerca psicologica. E questo non è casuale, perché la psicologia si sforza di essere una scienza esatta. Funziona?

Qual è la particolarità delle leggi nelle scienze esatte. Ad esempio, la legge di gravità in fisica opera senza eccezioni: maggiore è la massa di un corpo, più forte attrae altri corpi. Questa legge fisica riflette la relazione tra massa corporea e gravità.

In psicologia la situazione è diversa. Ad esempio, gli psicologi pubblicano dati sulla relazione delle relazioni calde nell'infanzia con i genitori e sul livello di creatività nell'età adulta. Questo significa che uno qualsiasi dei soggetti con molto relazioni cordiali con i genitori durante l'infanzia avrà molto alto Abilità creative? La risposta è inequivocabile: no. Non esiste una legge come quella fisica. Non esiste un meccanismo per l'influenza dell'esperienza dell'infanzia sulla creatività degli adulti. Queste sono le nostre fantasie! C'è coerenza dei dati (relazioni - creatività), ma non c'è una legge dietro. Ma c'è solo una correlazione. Gli psicologi spesso si riferiscono alle relazioni identificate come modelli psicologici, sottolineando la loro natura probabilistica, non la rigidità.

L'esempio di studio degli studenti della sezione precedente illustra bene l'uso delle correlazioni in psicologia:

  1. Analisi della relazione tra indicatori psicologici. Nel nostro esempio, il QI e il successo della comunicazione con il sesso opposto sono parametri psicologici. L'identificazione della correlazione tra loro espande le idee sull'organizzazione mentale di una persona, sulla relazione tra i vari aspetti della sua personalità - in questo caso tra l'intelletto e la sfera della comunicazione.
  2. L'analisi del rapporto del QI con il rendimento scolastico e il salto è un esempio del rapporto di un parametro psicologico con quelli non psicologici. I risultati ottenuti rivelano le caratteristiche dell'influenza dell'intelligenza sulle attività educative e sportive.

Ecco come potrebbe essere un riassunto dei risultati di uno studio fittizio sugli studenti:

  1. È stata rivelata una relazione positiva significativa tra l'intelligenza degli studenti e il loro rendimento scolastico.
  2. Esiste una relazione significativa negativa tra il QI e la comunicazione di successo con il sesso opposto.
  3. Non c'era alcuna connessione tra il QI degli studenti e la capacità di saltare da un posto.

Quindi, il livello di intelligenza degli studenti è fattore positivo loro rendimento scolastico, mentre allo stesso tempo incidono negativamente sulle relazioni con l'altro sesso e non hanno un impatto significativo sul successo sportivo, in particolare la capacità di saltare da un luogo.

Come puoi vedere, l'intelletto aiuta gli studenti ad imparare, ma impedisce loro di costruire relazioni con il sesso opposto. Ciò non pregiudica le loro prestazioni atletiche.

L'ambigua influenza dell'intelligenza sulla personalità e l'attività degli studenti riflette la complessità di questo fenomeno nella struttura dei tratti della personalità e l'importanza di continuare la ricerca in questa direzione. In particolare, sembra importante analizzare il rapporto dell'intelligenza con le caratteristiche psicologiche e le attività degli studenti, tenendo conto del loro genere.

Coefficienti di Pearson e Spearman

Consideriamo due metodi di calcolo.

Il coefficiente di Pearson è un metodo speciale per calcolare la relazione degli indicatori tra la gravità dei valori numerici in un gruppo. Molto semplificato, si riduce a questo:

  1. Vengono presi i valori di due parametri nel gruppo di soggetti (ad esempio aggressività e perfezionismo).
  2. Si trovano i valori medi di ogni parametro del gruppo.
  3. Si trovano le differenze tra i parametri di ciascun soggetto e il valore medio.
  4. Queste differenze sono sostituite in forma speciale per calcolare il coefficiente di Pearson.

Coefficiente correlazione di rango Spearman è calcolato in modo simile:

  1. Vengono presi i valori di due indicatori nel gruppo di soggetti.
  2. Vengono trovati i ranghi di ciascun fattore nel gruppo, ovvero il posto nell'elenco in ordine crescente.
  3. Le differenze di rango vengono trovate, al quadrato e sommate.
  4. Successivamente, le differenze di rango vengono sostituite in una forma speciale per calcolare il coefficiente di Spearman.

Nel caso di Pearson, il calcolo si basava sul valore medio. Pertanto, dati anomali casuali (differenza significativa dalla media), ad esempio, a causa di errori di elaborazione o risposte inaffidabili, possono distorcere significativamente il risultato.

Nel caso di Spearman, i valori assoluti dei dati non contano, poiché vengono presi in considerazione solo i loro valori. disposizione reciproca in relazione tra loro (ranghi). Cioè, dati anomali o altre imprecisioni non influiranno seriamente sul risultato finale.

Se i risultati del test sono corretti, le differenze tra i coefficienti di Pearson e Spearman sono insignificanti, mentre il coefficiente di Pearson mostra di più valore esatto relazioni di dati.

Come calcolare il coefficiente di correlazione

I coefficienti di Pearson e Spearman possono essere calcolati manualmente. Ciò può essere necessario per uno studio approfondito dei metodi statistici.

Tuttavia, nella maggior parte dei casi, quando si risolvono problemi applicati, anche in psicologia, è possibile eseguire calcoli utilizzando programmi speciali.

Calcolo utilizzando fogli di calcolo Microsoft Excel

Torniamo all'esempio degli studenti e osserviamo i dati sul loro livello di intelligenza e sulla lunghezza del salto da un luogo. Inseriamo questi dati (due colonne) in un foglio di calcolo Excel.

Dopo aver spostato il cursore su una cella vuota, premere l'opzione "Inserisci funzione" e selezionare "CORREL" dalla sezione "Statistica".

Il formato di questa funzione presuppone la selezione di due array di dati: CORREL(array 1; array"). Evidenziamo rispettivamente la colonna con il QI e la lunghezza dei salti.

A Tabelle Excel viene implementata la formula per il calcolo del solo coefficiente di Pearson.

Calcolo con il programma STATISTICA

Inseriamo i dati sull'intelligenza e la lunghezza del salto nel campo dei dati iniziali. Quindi, seleziona l'opzione "Criteri non parametrici", "Spearman". Seleziona i parametri per il calcolo e ottieni il seguente risultato.


Come puoi vedere, il calcolo ha dato un risultato di 0,024, che differisce dal risultato di Pearson - 0,038, ottenuto sopra con usando Excel. Tuttavia, le differenze sono minime.

Utilizzo dell'analisi di correlazione nelle tesi di psicologia (esempio)

La maggior parte degli argomenti dei lavori di qualificazione finale in psicologia (diplomi, tesine, master) implicano uno studio di correlazione (il resto è relativo all'identificazione delle differenze negli indicatori psicologici nei diversi gruppi).

Il termine stesso "correlazione" nei titoli degli argomenti suona raramente - è nascosto dietro la seguente formulazione:

  • "Il rapporto tra sentimenti soggettivi di solitudine e autorealizzazione nelle donne in età matura";
  • “Particolarità dell'influenza della resilienza dei manager sul successo della loro interazione con i clienti in situazioni di conflitto”;
  • "Fattori personali di resistenza allo stress dei dipendenti del Ministero delle situazioni di emergenza".

Pertanto, le parole "relazione", "influenza" e "fattori" - segni sicuri che il metodo di analisi dei dati in uno studio empirico dovrebbe essere l'analisi di correlazione.

Considera brevemente le fasi della sua attuazione durante la scrittura tesi in psicologia sul tema: "Il rapporto di ansia personale e aggressività negli adolescenti".

1. Per il calcolo sono richiesti i dati grezzi, che di solito sono i risultati dei test dei soggetti. Vengono inseriti in una tabella pivot e inseriti nell'applicazione. Questa tabella è strutturata come segue:

  • ogni riga contiene i dati per un soggetto;
  • ogni colonna contiene i punteggi su una scala per tutte le materie.

numero del soggetto

Ansia personale

Aggressività

2. È necessario decidere quale dei due tipi di coefficienti - Pearson o Spearman - verrà utilizzato. Ricordiamo che Pearson fornisce un risultato più accurato, ma è sensibile ai valori anomali nei dati.I coefficienti di Spearman possono essere utilizzati con qualsiasi dato (ad eccezione della scala nominativa), motivo per cui sono usati più spesso nei diplomi di psicologia.

3. Inseriamo la tabella dei dati grezzi nel programma statistico.

4. Calcolare il valore.



5. Il passo successivo è determinare se la relazione è significativa. Il programma statistico ha evidenziato i risultati in rosso, il che significa che le correlazioni sono statisticamente significative ad un livello di significatività di 0,05 (indicato sopra).

Tuttavia, è utile sapere come determinare manualmente il significato. Per fare ciò, è necessaria la tabella dei valori critici di Spearman.

Tabella dei valori critici dei coefficienti di Spearman

Livello di significatività statistica

Numero di soggetti di prova

p=0,05

p=0,01

p=0,001

0,88

0,96

0,99

0,81

0,92

0,97

0,75

0,88

0,95

0,71

0,83

0,93

0,67

0,63

0,77

0,87

0,74

0,85

0,58

0,71

0,82

0,55

0,68

0,53

0,66

0,78

0,51

0,64

0,76

Siamo interessati al livello di significatività di 0,05 e alla dimensione del nostro campione di 10 persone. All'intersezione di questi dati troviamo il valore dello Spearman critico: Rcr=0,63.

La regola è questa: se il valore empirico di Spearman ottenuto è maggiore o uguale al valore critico, allora è statisticamente significativo. Nel nostro caso: Remp (0,66) > Rcr (0,63), quindi, la relazione tra aggressività e ansia nel gruppo degli adolescenti è statisticamente significativa.

5. Nel testo della tesi è necessario inserire i dati in una tabella in formato word e non una tabella di un programma statistico. Sotto la tabella descriviamo il risultato ottenuto e lo interpretiamo.

Tabella 1

I coefficienti di aggressività e ansia di Spearman in un gruppo di adolescenti

Aggressività

Ansia personale

0,665*

* - statisticamente significativo (p0,05)

L'analisi dei dati presentati nella tabella 1 mostra che esiste una relazione positiva statisticamente significativa tra l'aggressività e l'ansia degli adolescenti. Ciò significa che maggiore è l'ansia personale degli adolescenti, maggiore è il livello della loro aggressività. Questo risultato suggerisce che l'aggressività per gli adolescenti è uno dei modi per alleviare l'ansia. Vivere insicurezza, ansia dovuta a minacce all'autostima, particolarmente sensibile adolescenza, usa spesso un adolescente comportamento aggressivo, in un modo così improduttivo per ridurre l'ansia.

6. È possibile parlare di influenza quando si interpretano le relazioni? Possiamo dire che l'ansia influisce sull'aggressività? A rigor di termini, no. Abbiamo mostrato sopra che la correlazione tra i fenomeni è di natura probabilistica e riflette solo la consistenza dei cambiamenti nelle caratteristiche in un gruppo. Allo stesso tempo, non si può dire che questa consistenza sia causata dal fatto che uno dei fenomeni è la causa dell'altro, lo colpisce. Cioè, la presenza di una correlazione tra parametri psicologici non dà motivo di parlare dell'esistenza di una relazione causale tra di loro. Tuttavia, la pratica mostra che il termine "influenza" viene spesso utilizzato nell'analisi dei risultati analisi di correlazione.

Nel nostro mondo, tutto è interconnesso, da qualche parte può essere visto ad occhio nudo e da qualche parte le persone non sospettano nemmeno l'esistenza di una tale relazione. Tuttavia, in statistica, quando significano dipendenza reciproca, viene spesso utilizzato il termine "correlazione". Si trova spesso nella letteratura economica. Proviamo insieme a capire qual è l'essenza di questo concetto, quali sono i coefficienti e come interpretare i valori ottenuti.

Allora, cos'è la correlazione? Di norma, questo termine si riferisce alla relazione statistica di due o più parametri. Se il valore di uno o più di essi cambia, ciò inevitabilmente incide sul valore degli altri. Per determinare matematicamente la forza di tale interdipendenza, è consuetudine utilizzare vari coefficienti. Va notato che nel caso in cui una modifica di un parametro non porti a una modifica regolare di un altro, ma influisca su alcune caratteristiche statistiche dato parametro, tale relazione non è correlazionale, ma semplicemente statistica.

Storia del termine

Per capire meglio cos'è la correlazione, tuffiamoci un po' nella storia. Questo termine apparve nel XVIII secolo grazie all'impegno di un paleontologo francese, il quale sviluppò la cosiddetta “legge di correlazione” di organi e parti di esseri viventi, che permise di ripristinare l'aspetto di un antico animale fossile, dotato di solo alcuni dei suoi resti. In statistica, questa parola è entrata in uso dal 1886 con la mano leggera di uno statistico e biologo inglese.Il nome stesso del termine contiene già la sua decodifica: non solo e non solo una connessione - "relazione", ma relazioni che hanno qualcosa in comune tra loro - "correlazione". Tuttavia, solo uno studente di Galton, il biologo e matematico K. Pearson (1857 - 1936) potrebbe spiegare chiaramente matematicamente cos'è una correlazione. Fu lui a dedurre per primo la formula esatta per calcolare i coefficienti corrispondenti.

Correlazione di coppia

Questo è il nome della relazione tra due quantità specifiche. Ad esempio, è stato dimostrato che la spesa pubblicitaria annuale negli Stati Uniti è strettamente correlata al valore del prodotto interno lordo. Si stima che tra questi valori nel periodo dal 1956 al 1977 fosse 0,9699. Un altro esempio è il numero di visite a un negozio online e il volume delle sue vendite. È stata trovata una stretta relazione tra quantità come la birra e la temperatura dell'aria, temperatura media mensile per un luogo specifico nell'anno in corso e precedente, ecc. Come interpretare il coefficiente di correlazione di coppia? Immediatamente notiamo che assume un valore da -1 a 1, con un numero negativo che indica una relazione inversa e un numero positivo che indica una relazione diretta. Maggiore è il modulo del risultato del calcolo, più i valori si influenzano a vicenda. Un valore zero indica l'assenza di dipendenza, un valore inferiore a 0,5 indica una relazione debole e, in caso contrario, pronunciata.

Correlazione di Pearson

A seconda della scala su cui vengono misurate le variabili, per i calcoli vengono utilizzati l'uno o l'altro Fechner, Spearman, Kendall, ecc.). Quando si esaminano i valori di intervallo, utilizzano molto spesso un indicatore inventato da

Questo coefficiente mostra il grado di relazione lineare tra i due parametri. Quando le persone parlano di correlazione, il più delle volte lo fanno sul serio. Questo indicatore è diventato così popolare che la sua formula è in Excel e, se lo desideri, puoi capire in pratica quale sia la correlazione senza entrare nella complessità di formule complesse. La sintassi per questa funzione è: PEARSON(array1, array2). Come il primo e il secondo array, gli intervalli di numeri corrispondenti vengono generalmente sostituiti.


Un saluto a tutti i lettori del portale Pamm-Trade! Mi chiamo Oleg Zolotarev. Sono uno studente e un trader di successo nel mercato delle opzioni binarie.

Correlazione: che cos'è? Grande nome - significato semplice!

Oggi voglio parlarvi di un termine molto interessante con un nome terribile "correlazione". In effetti, qui non c'è niente di terribile, perché la correlazione è solo il grado di dipendenza tra due fenomeni o oggetti.

Questo concetto è ampiamente utilizzato in matematica, biologia, economia, statistica, psicologia e semplicemente in Vita di ogni giorno. Ricordi la frase del cartone animato su Winnie the Pooh: "Sembra che stia per piovere"? Questo è un esempio elementare di correlazione. Quando guardiamo il cielo e vediamo nuvole dense, concludiamo che potrebbe piovere. Tuttavia, potrebbe non andare. Questo è il punto principale che distingue la correlazione dalle strette dipendenze lineari, come y = f (x).

La correlazione è dipendenza per la presenza di una serie di fattori casuali. Pertanto, è anche chiamata dipendenza statistica. Ad esempio, si può ipotizzare che la criminalità aumenti con la disoccupazione. Tuttavia, non si può essere sicuri al 100%. Dopotutto, il risultato finale in questo caso è influenzato anche dalla mentalità delle persone, dalla loro educazione, dall'ambiente, ecc. Pertanto, la correlazione fornisce una relazione approssimativa ma non esatta. esiste sempre fattori esterni, che può influenzare il risultato, il che significa - fare previsione accurata impossibile.

Quindi con concetto generale l'abbiamo capito, e ora parliamo di cosa e come si esprime questa relazione. La relazione tra i fenomeni è determinata dal coefficiente di correlazione. Può essere molto forte. Ad esempio, ognuno di noi può senza dubbio affermare che con l'aumento dei livelli di radiazioni, la nostra salute si sta deteriorando. In questo esempio, vediamo una relazione inversamente proporzionale: maggiore è la radiazione, peggiore è la salute umana. In questo caso, il coefficiente di correlazione tende al valore -1 e riflette una correlazione negativa.

Succede che fenomeni o oggetti non siano in alcun modo collegati, ad esempio il discorso di Capodanno del Presidente non è assolutamente influenzato da quante bottiglie di champagne hai bevuto il giorno prima. In questo caso, il coefficiente di correlazione è zero.

Se il coefficiente tende a un valore di +1, si osserva una correlazione positiva. Ad esempio, maggiore è l'ambizione di una persona e maggiore è il livello di intelligenza, maggiori sono le probabilità che assumano una posizione di leadership.

La traduzione diretta della parola "correlazione" suona come un rapporto. Come si relaziona un fenomeno con un altro? Il riscaldamento globale ha causato una serie di tornado negli Stati Uniti. La relazione tra questi eventi esiste certamente e ciò consente di avanzare un'ipotesi sui loro rapporti di causa ed effetto. Questo è possibile solo con oggetti correlati. Se non c'è relazione tra fenomeni e oggetti, allora non c'è nemmeno correlazione.

Ora vediamo come la correlazione può aiutare un investitore?

Correlazione degli asset di investimento: come funziona?

Quanti investitori utilizzano il principio di correlazione nel loro portafoglio di investimenti? Non credo. Tuttavia, il suo ruolo è stato molto sottovalutato. Del resto tutti sanno che è impossibile tenere le uova nello stesso paniere, in altre parole occorre diversificare i rischi. Allora perché non migliorare il risultato con l'aiuto della correlazione?

Ad esempio, hai deciso di utilizzare il metodo della diversificazione nelle tue attività di investimento e hai acquistato, oltre alle azioni di un grande emittente, anche le azioni di piccole imprese. Sapevi che i titoli delle imprese giganti e quelli delle piccole imprese hanno un coefficiente di correlazione di +0,79? Sebbene questa non sia un'unità, ha anche un valore abbastanza alto. E come già sappiamo, una correlazione positiva mostra una relazione diretta: se le azioni di una grande impresa cadono, allora c'è la possibilità di una diminuzione del prezzo dei titoli e delle piccole imprese. In questo caso, quando si diversifica, è meglio scegliere asset che non hanno correlazioni.

Ad esempio, azioni e obbligazioni o azioni e buoni del tesoro. Per quanto riguarda le obbligazioni, sono altamente correlate tra loro, proprio come le azioni. Il coefficiente in questo caso può raggiungere 0,9. Se non sai in che modo questi titoli differiscono l'uno dall'altro, ti consiglio di leggere l'articolo di Viktor Samoilov. In esso puoi trovare non solo interpretazioni accessibili di questi termini e le caratteristiche di ciascuno, ma anche la possibilità di guadagnare su questi titoli.

Oltre alle correlazioni tra titoli, esiste anche la dipendenza tra regioni. Più spesso di distanza più ravvicinata maggiore è la correlazione. Ad esempio, se prendiamo gli Stati Uniti e il Canada, il coefficiente di correlazione è di circa 0,9. All'aumentare della distanza, aumenta anche la relazione. Negli Stati Uniti e in Giappone, questo valore è già inferiore a 0,5. Pertanto, è possibile diversificare i rischi con l'aiuto di un asset, ad esempio le azioni, ma se vengono acquistati da emittenti da parti differenti Sveta.

Quali altre risorse e come sono correlate tra loro? Titoli e l'oro non ha quasi alcuna dipendenza (la correlazione è zero). Ma l'oro e l'argento sono due asset interdipendenti, quindi non ha senso usarli come diversificazione in un portafoglio. Cosa succede al dollaro USA quando l'euro si apprezza? Sta diventando più economico. Quindi la correlazione tra queste valute è negativa.

Quando faccio trading di opzioni binarie, utilizzo anche le correlazioni. Se non sei ancora riuscito a capire qual è la differenza tra opzioni binarie e opzioni di scambio ordinarie, allora ti consiglio di guardare questo video:

Molto spesso lavoro con coppie di valute. Qualsiasi trader con anche una piccola esperienza sa che le coppie di valute dipendono l'una dall'altra (correlate). Ad esempio, un calo della coppia EUR/USD può portare a una caduta della coppia GBP/USD. Allo stesso modo, la crescita della coppia USD/CHF può influenzare la crescita di USD/CAD. Se sei un principiante e non sai quali valute sono associate al dollaro o all'euro e come interagiscono tra loro, non importa. Victor Samoilov ha sviluppato una strategia speciale per questi scopi. Il principio in esso enunciato riflette solo le correlazioni. Se il sistema risolve un aumento del tasso della coppia EUR/USD, ti dà suggerimenti per un acquisto attivo per altre coppie che hanno un'elevata correlazione positiva con essa. Se la correlazione è negativa, il suggerimento sarà quello di vendere attivamente l'opzione. Come funziona in pratica, puoi vedere dal seguente video:

Da tutto ciò si può concludere che senza tener conto della correlazione è impossibile effettuare la corretta diversificazione. E questo influenzerà direttamente l'efficienza del portafoglio di investimenti. Per aumentare il capitale (per non parlare di come salvarlo), è necessario tenere conto di questo fattore. È anche molto importante che un trader di opzioni binarie tenga conto del coefficiente di correlazione, questo determinerà in gran parte l'accuratezza della previsione.

Oggi vi ho parlato di una strategia che è più rilevante per il nostro problema in questione. Tuttavia, nell'arsenale di Viktor Samoilov ce ne sono molti altri, non meno strategie efficaci. Semplicemente non ho l'opportunità di considerarli tutti nel quadro di questo articolo. Ma se hai voglia di non perdere Informazioni importanti(anche sulle strategie di trading), puoi iscriverti alla nostra newsletter utilizzando il modulo sottostante:

Ottenere istruzioni passo passo guadagni!

Una correlazione tra due quantità è una relazione statistica in cui un cambiamento in una delle quantità porta a un cambiamento sistematico nell'altra. Una misura quantitativa della correlazione è il coefficiente di correlazione lineare (chiamato anche coefficiente di correlazione di Pearson), calcolato dalla formula:

  • r xy è il coefficiente di correlazione dei valori di xey;
  • d x è la deviazione di un certo valore della serie x dal valore medio di questa serie;
  • d y è la deviazione di un valore della serie y dal valore medio di questa serie.

L'intervallo dei possibili valori del coefficiente di correlazione è compreso tra +1 e -1. In questo caso sono possibili le seguenti opzioni:

  • +1 - relazione diretta tra le quantità;
  • |rxy| > 0,7 – marcata dipendenza tra le grandezze;
  • 0.4 < |r xy| >0,7 - dipendenza moderatamente pronunciata tra i valori;
  • |rxy|< 0.4 – слабо выраженная зависимость между величинами;
  • -1 - relazione inversa tra i valori.

È importante notare che maggiore è il campione di valori, minore è il modulo del coefficiente di correlazione, possiamo dire che esiste una relazione tra x e y. Purtroppo c'è una trappola nella formula, che, in relazione agli strumenti finanziari, può fare uno scherzo crudele all'investitore. Nel numeratore, le deviazioni delle quantità possono avere sia lo stesso che segni diversi, quindi il prodotto può anche essere sia positivo che negativo. Al denominatore, le deviazioni sono al quadrato, il che garantisce la positività del denominatore. Per ora, ci presteremo solo attenzione e in seguito torneremo a ciò che può derivarne.

Il significato pratico del calcolo della correlazione tra strumenti finanziari è quello di ottenere importanti dati fondamentali necessari per prendere decisioni di trading. La reazione dei mercati al rilascio di importanti notizie economiche si esprime nel fatto che all'inizio si muovono i prezzi dei principali asset (oro, petrolio, futures per indici industriali), a volte la redditività. Di conseguenza, cambiano tassi di cambio e quotazioni di borsa. Tracciando la relazione dei singoli strumenti, nonché la relazione di causa ed effetto tra le variazioni di prezzo, puoi rivedere rapidamente i tuoi piani di trading e di investimento. Inoltre, l'analisi di correlazione è utilizzata nella gestione come parte obbligatoria.

È possibile visualizzare la correlazione di due grandezze sotto forma di grafico in coordinate tempo-ampiezza. Ad esempio, con una correlazione negativa, otteniamo un quadro simile:

La conoscenza della correlazione degli asset riduce il rischio di portafoglio


Lascia che, ad esempio, ci siano 2 risorse. Per semplicità, immaginiamo che i loro prezzi dipendano dal tempo secondo la legge di una sinusoide. Quindi, con una correlazione di +1, otterremo una sovrapposizione completa di onde e aprire accordi su entrambi gli asset equivarrà a raddoppiare le posizioni su uno di essi. Correlazione -1, al contrario, significa compensazione reciproca di guadagni e perdite di attività. Naturalmente, gli asset ben abbinati non si muovono generalmente intorno allo stesso livello, ma tendono a crescere nel tempo. Inoltre, con alcuni asset, la crescita in altri consente di ridurre al minimo il rischio totale del portafoglio:

Un processo chiamato ribilanciamento del portafoglio consente di generare reddito alternando la proporzione di attività in un portafoglio. Ciò si ottiene più facilmente con una pronunciata correlazione negativa. Supponiamo che inizialmente il portafoglio contenesse asset A e B con una correlazione inversa e un rapporto 1:1, per un importo totale di 1 milione di rubli. Entro sei mesi, il prezzo dell'attività A è diminuito del 20% e il suo valore dai 500 mila rubli iniziali è diventato 400 mila rubli. L'asset B, al contrario, è cresciuto del 20% e il suo valore è salito a 600 mila rubli. Il valore totale del portafoglio non è cambiato e ammonta ancora a 1 milione di rubli. Ora trasferiamo il 50% dell'asset B (300mila) ad A e il suo valore è ora 700mila e l'asset B è 300mila.

Nei sei mesi successivi si verifica il processo opposto: gli asset tornano al loro prezzo originario. Ora l'attività A costa 840 mila invece di 700 mila e l'attività B costa 240 mila invece di 300 mila Il valore totale del portafoglio, quindi, ammontava a 1 milione e 80 mila rubli, ad es. la sua redditività dovuta al ribilanciamento è dell'8% annuo. Senza il ribilanciamento, il rendimento del portafoglio sarebbe stato dello 0%. Le situazioni reali sono molto più complicate, perché le correlazioni della maggior parte degli strumenti sono comprese tra +0,5 e -0,5. Se consideriamo il grafico rischio-rendimento per i diversi rapporti di due strumenti con valori diversi correlazioni, otteniamo la seguente immagine:

Come si vede, minore è il valore del coefficiente di correlazione degli strumenti, maggiore è il possibile rendimento del portafoglio a parità di valore di rischio, ovvero minore è il rischio a parità di valore di rendimento.

Correlazione Forex

Una strategia comune basata sulla correlazione delle coppie di valute è che in caso di forte deviazione del coefficiente di correlazione dal valore corrente, si aprono transazioni nella direzione del ripristino di tale valore. Ad esempio, se le coppie EURUSD e GBPUSD a lungo spostato nella stessa direzione, quindi con una forte divergenza, ci si può aspettare una convergenza se la divergenza non è causata da divergenze a lungo termine (ad esempio, una variazione del tasso di sconto).

Inoltre, la correlazione delle coppie di valute viene utilizzata in una valutazione completa del mercato. Ad esempio, alla vigilia della crisi dei mutui del 2008-2009, quando i dollari australiani e neozelandesi, oltre alla sterlina britannica, avevano un tasso chiave elevato, è stata ampiamente sviluppata una strategia di trading chiamata carry trade. Consisteva nel fatto che durante gli eventi favorevoli per i mercati azionari, le coppie di queste valute con lo yen, che tradizionalmente ha un tasso molto basso, sono cresciute in modo particolarmente attivo e sono anche diminuite attivamente durante gli eventi avversi.

Nonostante nessuna correlazione possa influenzare assolutamente tutti gli intervalli di tempo e sono possibili movimenti multidirezionali delle valute, ma un movimento unidirezionale pronunciato, di regola, indica la presenza di un "driver" fondamentale comune. Questo rende più facile pianificare le offerte. In particolare, non ha senso cercare rollback e lavorare nell'arco della giornata se tutte le coppie chiaramente correlate vanno nella stessa direzione.

Puoi visualizzare la tabella di correlazione in tempo reale delle coppie di valute e di alcuni altri strumenti su myfxbook.com/forex-market/correlation. Questa tabella mostra che le coppie EURUSD e AUDCAD praticamente non sono correlate tra loro. In caso di apertura simultanea di transazioni su queste coppie, non puoi temere né la somma delle perdite né la sovrapposizione dei profitti per una coppia con una perdita per un'altra.

Questo grafico mostra come i dollari australiani e neozelandesi, che sono inversamente correlati alle valute rifugio, lo yen e il franco svizzero, siano cresciuti fortemente durante il periodo del più ampio differenziale del tasso di riferimento. Questa tendenza si è invertita dopo l'inizio di un periodo di tagli dei tassi con l'aggravarsi della crisi dei mutui.

Non ci sono effetti senza causa

La correlazione del prezzo delle attività è in qualche modo simile alle tendenze: più lungo è l'intervallo di tempo per il suo calcolo, più lenta cambia. Ma c'è qualcosa che distingue la correlazione da molti altri metodi. Può essere calcolato per coppie di asset non scambiati su nessuna borsa (petrolio-gas, petrolio-oro), il che consente di integrare l'arsenale dell'analista con informazioni preziose che consentono di "leggere il mercato tra i grafici".

Qualsiasi correlazione di due o più quantità ha sempre una relazione causale. Una delle quantità è determinante, da cui dipende l'altra (o altre). La correlazione nel mercato azionario non fa eccezione. Ad esempio, nella coppia petrolio-gas, le quotazioni del petrolio sono state decisive per molto tempo. Nel grafico sottostante, puoi vedere che l'espansione dello spread tra petrolio e gas dovuta a un forte aumento relativo del gas è stata sostituita da un altrettanto netto ritorno all'equilibrio relativo:

Allo stesso tempo, in un'altra coppia di asset, oro-petrolio, l'oro è già decisivo. Con un'espansione significativa (un forte aumento o calo del petrolio con oro più stabile), è il petrolio che ripristina l'equilibrio disturbato:

Tenendo traccia di questo comportamento degli asset "slave", puoi aprire accordi nella direzione del ripristino dell'equilibrio. A proposito, la correlazione si basa spesso sul legame di alcune valute alle attività delle materie prime. Si chiamano così: "monete merci". Ad esempio, il dollaro canadese e il rublo dipendono fortemente dal petrolio. In entrambi i casi la correlazione è diretta: più il petrolio è caro, maggiore è il tasso di queste valute rispetto al dollaro USA.

Nel caso del rublo, la correlazione del grafico è così chiara che può essere utilizzata in una strategia di trading. Considera l'inizio del 2014. Il petrolio viene scambiato intorno ai 110 dollari al barile, dopodiché sale leggermente al di sopra per un po'. Il rublo in questo momento, al contrario, da 33 al dollaro americano scende brevemente a 36. Ad un certo punto, la correlazione diventa quasi inversa, ma l'equilibrio viene rapidamente ripristinato e il rublo torna al tasso di 33 per dollaro, obbedientemente olio successivo. Ancora di più un ottimo esempio vediamo alla fine del 2014, quando c'è stato un forte indebolimento del rublo sullo sfondo di un petrolio in calo molto più dolce. E questa volta l'equilibrio perturbato è stato presto ripristinato grazie al rafforzamento del rublo. Nel tempo, la correlazione può subire forti cambiamenti e persino passare da diretta a inversa. Ciò era particolarmente evidente nel caso della correlazione tra il Dow Jones Industrial Average e l'RTS.

A fine 2007, quando negli Stati Uniti hanno cominciato a manifestarsi i primi segnali della crisi dei mutui, l'indice DJ ha ceduto, ma l'indice RTS, a causa dell'attiva crescita del prezzo del petrolio, si stava ancora avvicinando al massimo storico. Tuttavia, in futuro, un forte crollo di tutti gli indici azionari del mondo ha colpito anche il petrolio. Ciò ha portato al fatto che l'indice RTS in termini di tasso di declino era quasi 2 volte superiore a DJ. Oltre al petrolio, il deflusso complessivo di capitali dai mercati emergenti ha influito anche sul tasso di flessione dell'indice RTS.

Tuttavia, la crisi è stata di breve durata e già all'inizio del 2009 è stata sostituita dalla crescita economica. Fino all'aprile 2012 è stata osservata un'elevata correlazione tra DJ e RTS, segnata dall'esaurimento delle possibilità del modello delle materie prime per lo sviluppo dell'economia russa. A partire da quest'anno, anche il petrolio costoso non ha più fornito crescita economica. In futuro, la recessione economica in Russia è solo peggiorata sullo sfondo di un petrolio più conveniente, mentre l'economia americana ha ricevuto un ulteriore stimolo alla crescita. La correlazione tra e è diventata inversa.

Di per sé, la presenza di una correlazione tra gli asset non significa che su questo sia possibile costruire una strategia di trading o di investimento. Diciamo che siamo interessati alla correlazione delle azioni IBM negli ultimi 12 mesi (vedi Impactopia.com/correlation). Quindi, al 4° posto in termini di correlazione c'è Banco Santander (circa 0,43). Molto probabilmente, questa è solo una coincidenza o un difetto sistemico nel metodo di calcolo delle correlazioni.

trappola per la matematica

Come accennato in precedenza, la formula per calcolare il coefficiente di correlazione è molto sensibile ai segni di deviazioni dei valori dai loro valori medi. Se queste deviazioni hanno spesso gli stessi segni, si ottiene un valore elevato del coefficiente di correlazione. Ma avrà senso questo valore? La risposta non è affatto scontata. Ritenere esempio pratico. Supponiamo che sui grafici di due quantità contemporaneamente ci sia:

Quindi i nuovi valori di queste quantità appariranno sistematicamente sullo stesso lato dei loro valori medi. Ciò si tradurrà in un'elevata correlazione positiva. Sfortunatamente, queste informazioni non saranno di alcuna utilità, perché. fatta eccezione per la presenza di un divario, non c'è nulla in comune tra i grafici. È solo buon esempio il fatto che nel calcolare la correlazione sia consentito utilizzare solo serie stazionarie di valori, ad es. serie che non hanno una componente di tendenza. Ciò significa che il calcolo delle correlazioni nel mondo delle attività finanziarie porta inevitabilmente a una sopravvalutazione della significatività di fattori che in realtà sono di natura casuale. Comprendi correttamente: è importante non cercare questi fattori e introdurre correzioni speciali per loro, ma mostrare l'essenza stessa del fenomeno e non cercare un altro Graal dove non esiste.

Tuttavia, non tutto è così male. C'è un modo per aggirare l'influenza delle tendenze calcolando la correlazione non dei prezzi stessi, ma dei loro incrementi. Quindi il divario sopra menzionato si rivelerà un valore statistico anomalo, che praticamente non influisce sul risultato. Resta solo da aspettare che un tale approccio prevalga. Non è sempre possibile trovare nuovi dati sulla correlazione degli asset. In questi casi, possono essere calcolati utilizzando Microsoft Excel. Per fare ciò, le virgolette vengono scritte come due intervalli di celle, quindi in una delle celle libere viene scritta una funzione della forma seguente: =CORREL (array 1; array 2). Un array potrebbe avere questo aspetto, ad esempio: A1:A100. Per calcolare la correlazione per incrementi di prezzo, questo programma è doppiamente utile, perché sulla base dei prezzi di chiusura, devi prima calcolare gli incrementi stessi.

Riepilogo

La correlazione tra i prezzi delle attività è uno strumento importante sia per l'analisi dei dati che per la gestione del rischio negli investimenti di portafoglio. Ma, come tutti gli approcci statistici, non è privo di gravi inconvenienti:

  • la presenza di una marcata correlazione tra i dati nel passato non può garantirla in futuro;
  • Usato modello matematico ha grandi errori durante i periodi di tendenza.

L'applicazione dell'approccio di correlazione porterà massimo beneficio oltre ad altri metodi di analisi e gestione del denaro. Nei commenti, propongo di discutere di come guadagnare sulla correlazione di specifici asset. Ho fornito i miei esempi nell'articolo, sto aspettando il tuo per una discussione.

Tutto profitto!

06/06/2018 12 879 0 Igor

Psicologia e società

Tutto nel mondo è interconnesso. Ogni persona a livello di intuizione cerca di trovare la relazione tra i fenomeni per poterli influenzare e controllare. Il concetto che riflette questa relazione è chiamato correlazione. Cosa significa in parole semplici?

Contenuto:

Il concetto di correlazione

Correlazione (dal latino "correlatio" - ratio, relazione)è un termine matematico che indica una misura della relazione statistica probabilistica tra variabili casuali(variabili).



Esempio: Prendiamo due tipi di relazione:

  1. Il primo- una penna nella mano di una persona. In quale direzione si muove la mano, in quella direzione si muove la penna. Se la mano è ferma, la penna non scriverà. Se una persona preme un po 'più forte su di esso, il segno sulla carta sarà più ricco. Questo tipo di relazione riflette una rigida dipendenza e non è una correlazione. Questa relazione è funzionale.
  2. Secondo punto di vista- il rapporto tra il livello di istruzione di una persona e la lettura della letteratura. Non si sa in anticipo quale delle persone legga di più: istruzione superiore o senza di essa. Questa relazione è casuale o stocastica, è studiata dalla scienza statistica, che si occupa esclusivamente di fenomeni di massa. Se un calcolo statistico permette di provare una correlazione tra il livello di istruzione e la lettura della letteratura, allora questo permetterà di fare delle previsioni, di prevedere il verificarsi probabilistico degli eventi. In questo esempio, si può sostenere con un alto grado di probabilità che le persone con un'istruzione superiore, quelle più istruite, leggano più libri. Ma poiché la relazione tra questi parametri non è funzionale, possiamo sbagliare. È sempre possibile calcolare la probabilità di un tale errore, che sarà univocamente piccola ed è chiamata livello di significatività statistica (p).

Esempi della relazione tra fenomeni naturali sono: catena alimentare in natura, il corpo umano, che consiste di sistemi di organi interconnessi e funzionanti nel loro insieme.

Ogni giorno ci troviamo di fronte a una correlazione nella vita di tutti i giorni: tra meteo e buon umore, la corretta formulazione degli obiettivi e il loro raggiungimento, un atteggiamento positivo e fortunato, un senso di felicità e benessere finanziario. Ma cerchiamo connessioni basate non su calcoli matematici, ma su miti, intuizioni, superstizioni, oziose congetture. Questi fenomeni sono molto difficili da tradurre in linguaggio matematico, da esprimere in numeri, da misurare. Un'altra cosa è quando analizziamo i fenomeni che possono essere calcolati e presentati sotto forma di numeri. In questo caso, possiamo determinare la correlazione utilizzando il coefficiente di correlazione (r), che riflette la forza, il grado, la vicinanza e la direzione della correlazione tra variabili casuali.

Forte correlazione tra variabili casuali- evidenza della presenza di qualche relazione statistica specifica tra questi fenomeni, ma tale relazione non può essere trasferita agli stessi fenomeni, ma per una situazione diversa. Spesso i ricercatori, avendo ottenuto una correlazione significativa tra due variabili nei loro calcoli, sulla base della semplicità dell'analisi di correlazione, fanno false ipotesi intuitive sull'esistenza di relazioni causali tra le caratteristiche, dimenticando che il coefficiente di correlazione è probabilistico.

Esempio: il numero di persone ferite in condizioni di ghiaccio e il numero di incidenti stradali tra i veicoli. Queste quantità saranno correlate tra loro, sebbene non siano assolutamente interconnesse tra loro, ma abbiano solo una connessione con la causa comune di queste eventi casuali- ghiacciato. Se l'analisi non ha rivelato una relazione di correlazione tra i fenomeni, ciò non è ancora evidenza dell'assenza di una relazione tra di loro, che può essere complessa non lineare, non rivelata dai calcoli di correlazione.




I primi ad introdurre il concetto di correlazione nella circolazione scientifica furono i francesi il paleontologo Georges Cuvier. Nel 18° secolo dedusse la legge di correlazione di parti e organi degli organismi viventi, grazie alla quale divenne possibile ripristinare l'aspetto dell'intera creatura fossile, animale, dalle parti del corpo ritrovate (resti). In statistica, il termine correlazione fu usato per la prima volta nel 1886 da uno scienziato inglese Francesco Galton. Ma non riuscì a ricavare la formula esatta per calcolare il coefficiente di correlazione, ma il suo studente lo fece - famoso matematico e biologo Karl Pearson.

Tipi di correlazione

Per importanza- altamente significativo, significativo e insignificante.

tipi

cos'è r

altamente significativo

r corrisponde al livello di significatività statistica p<=0,01

significativo

r corrisponde p<=0,05

insignificante

r non raggiunge p>0,1

negativo(una diminuzione del valore di una variabile porta ad un aumento del livello di un'altra: più fobie ha una persona, meno è probabile che occupi una posizione di leadership) e positiva (se un aumento di un valore comporta un aumento il livello di un altro: più sei nervoso, più è probabile che ti ammali). Se non c'è relazione tra le variabili, allora tale correlazione è chiamata zero.

Lineare(quando un valore aumenta o diminuisce, anche il secondo aumenta o diminuisce) e non lineare (quando, quando un valore cambia, la natura del cambiamento nel secondo non può essere descritta utilizzando una dipendenza lineare, vengono applicate altre leggi matematiche - polinomiale, dipendenza iperbolica).

Per forza.

Probabilità




A seconda della scala di appartenenza delle variabili studiate, vengono calcolati diversi tipi di coefficienti di correlazione:

  1. Il coefficiente di correlazione di Pearson, il coefficiente di correlazione lineare a coppie o la correlazione del momento prodotto vengono calcolati per variabili con scale di misurazione di intervallo e quantitative.
  2. Coefficiente di correlazione del rango di Spearman o Kendall - quando almeno uno dei valori ha una scala ordinale o non è normalmente distribuito.
  3. Coefficiente di correlazione del punto a due serie (coefficiente di correlazione del segno di Fechner) - se uno dei due valori è dicotomico.
  4. Coefficiente di correlazione a quattro campi (coefficiente di correlazione di ranghi multipli (concordanza) - se le due variabili sono dicotomiche.

Il coefficiente di Pearson si riferisce a indicatori parametrici di correlazione, tutto il resto - a quelli non parametrici.

Il valore del coefficiente di correlazione è compreso tra -1 e +1. Con una correlazione completa positiva, r = +1, con una correlazione completamente negativa, r = -1.

Formula e calcolo





Esempi

È necessario determinare la relazione tra due variabili: il livello di sviluppo intellettuale (secondo i risultati dei test) e il numero di ritardi al mese (secondo le voci nel diario educativo) tra gli scolari.

I dati iniziali sono presentati nella tabella:

Dati QI (x)

Dati sul numero di arrivi in ​​ritardo (y)

Somma

1122

Media

112,2


Per dare una corretta interpretazione dell'indicatore ottenuto, è necessario analizzare il segno del coefficiente di correlazione (+ o -) e il suo valore assoluto (modulo).

In accordo con la tabella di classificazione del coefficiente di correlazione per forza, concludiamo che rxy = -0,827 è una forte correlazione negativa. Pertanto, il numero di scolari in ritardo dipende molto dal loro livello di sviluppo intellettuale. Possiamo dire che gli studenti con un QI alto hanno meno probabilità di arrivare in ritardo a lezione rispetto agli studenti con un QI basso.



Il coefficiente di correlazione può essere utilizzato sia dagli scienziati per confermare o confutare l'ipotesi sulla dipendenza di due quantità o fenomeni e misurarne la forza, il significato, sia dagli studenti per condurre ricerche empiriche e statistiche in vari argomenti. Va ricordato che questo indicatore non è uno strumento ideale, viene calcolato solo per misurare la forza di una relazione lineare e sarà sempre un valore probabilistico che presenta un certo errore.

L'analisi di correlazione viene applicata nelle seguenti aree:

  • scienze economiche;
  • astrofisica;
  • scienze sociali (sociologia, psicologia, pedagogia);
  • agrochimica;
  • scienza dei metalli;
  • industria (per il controllo della qualità);
  • idrobiologia;
  • biometria, ecc.

Ragioni per la popolarità del metodo di analisi di correlazione:

  1. La relativa semplicità di calcolo dei coefficienti di correlazione, questo non richiede una formazione matematica speciale.
  2. Consente di calcolare la relazione tra variabili casuali di massa, che sono oggetto di analisi della scienza statistica. A questo proposito, questo metodo si è diffuso nel campo della ricerca statistica.

Si spera che ora sarete in grado di distinguere tra una relazione funzionale e una correlazionale, e saprete che quando si sente in televisione o si legge sulla stampa di una correlazione, significa una relazione positiva e abbastanza significativa tra due fenomeni.