Concetti generali sulla correlazione per serie discrete di numeri

Da Wikiversità, l'apprendimento libero.
Jump to navigation Jump to search
lezione
Concetti generali sulla correlazione per serie discrete di numeri
Tipo di risorsa Tipo: lezione
Materia di appartenenza Materia: Sui processi di correlazione per serie discrete di numeri
Avanzamento Avanzamento: lezione completa al 100%.


Il concetto generale di correlazione è comune a tutte le scienze, perché in tutte le scienze si possono introdurre criteri statistici.

Correlazione è la dipendenza reciproca fra due grandezze e il fattore di correlazione ne è la misura quantitativa.

Si ha correlazione elevata quando a determinati valori di una grandezza corrispondono determinati valori dell'altra grandezza e correlazione nulla quando a determinati valori di una grandezza corrispondono valori qualsiasi dell'altra grandezza.

La interdipendenza potrà essere, nei casi più semplici, di proporzionalità diretta o inversa, ma anche assai più complessa.

Interdipendenza tra serie discrete di numeri[modifica]

Per stabilire una misura quantitativa della interdipendenza, cioè della correlazione fra le due grandezze, si parte dalla definizione matematica seguente.

Siano AO, Al, A2, ..,An i valori misurati discreti di una grandezza A (sia positiva che negativa) e BO, Bl, B2, ..,Bn i valori misurati discreti di un'altra grandezza B (sia positiva che negativa), dove il pedice numerico 0, 1, 2, 3, ecc. sta a significare valori corrispondenti delle due grandezze.

Si calcoli il valore medio della prima e della seconda grandezza:

Am =  (AO + Al + A2 + ...+ An )/(n+1)
                                     1.1)
Bm =  (BO + B1 + B2 + ...+ Bn )/(n+1)

Si calcoli ora per ogni valore della prima grandezza, A0,A1,.,An la deviazione del valore stesso dal valore medio (errore rispetto al valore medio) cioè:


a0 = AO-Am
a1 = Al-Am
a2 = A2-Am	1.2/a)
 ......
an = An-Am
 

Si calcoli anche per ogni valore della prima grandezza, B0,B1,.,Bn la deviazione del valore stesso dal valore medio (errore rispetto al valore medio) cioè:

b0 = BO-Bm
b1 = Bl-Bm
b2 = B2-Bm	1.2/b)
..........
bn = Bn-Bm


Si computi ora il valore medio C del prodotto dei valori corrispondenti degli errori delle due grandezze:

  C= [1/(n+1)] ( a0 x b0 + al x b 1 + a2 x b2 + ......	+ an x bn )	1.3)

tale valore medio è il fattore di correlazione delle due grandezze.

Se, ad esempio, tutte le volte che il valore della grandezza A è superiore al suo valore medio e lo stesso avviene per la grandezza B, il termine C sara positivo ed elevato, perchè tutti i suoi termini saranno positivi.

Se invece per ogni valore di A superiore al valore medio Am il valore di B è ora superiore ed ora inferiore al valore medio, i prodotti saranno ora positivi ora negativi e il valore C sara nullo o molto piccolo sia positivo che negativo.

Nel primo caso vi è ovviamente una interdipendenza elevata e nel secondo vi potrà essere una interdipendenza nulla o molto bassa.

Può verificarsi inoltre che tutte le volte che il valore della grandezza A e superiore al suo valore medio, il valore della grandezza B sia inferiore al suo valore medio; in questo caso il termine C sara negativo ed elevato perchè tutti i suoi termini saranno negativi.

Il coefficiente di correlazione tra due serie di grandezze può assumere pertanto valori positivi, valori negativi o valori nulli in base alla legge di interdipendenza tra le grandezze stesse.

Esempi esplicativi[modifica]

Un semplice esempio numerico servira a chiarire i concetti ora esposti:

Consideriamo tre coppie di numeri: in un primo caso appaiate secondo un evidente criterio di proporzionalita diretta secondo la tabella 1

TAB.	1)	
  A     B
A0=10	BO=3
A1=20	B1=6
A2=40	B2=12


in un secondo caso appaiate in modo casuale secondo la tabella 2

TAB.  2)	
 A     B
A0=10	BO= 3
A1=20	B1=12
A2=40	B2= 6

Eseguiamo il calcolo del coefficiente di correlazione nel caso di tabella 1:

Applichiamo le formule 1.1) per it calcolo delle medie:

Am = (A0+Al+A2) / 3 =   (10+20+40) / 3  = 23.333
Bm = (B0+Bl+B2) / 3 =   (3+6+12) / 3  = 7

Calcoliamo ora in base alle 1.2) le deviazioni dei valori stessi del valore medio:

a0 = A0-Am = 10-23.333 = —13.333 
al = Al-Am = 20-23.333 = — 3.333 
a2 = A2-Am = 40-23.333 = +16.667


b0 = BO-Bm = 3 - 7 = —4
bl = Bl-Bm = 6 - 7 = —1
b2 = B2-Bm = 12 - 7 = +5

Calcoliamo infine secondo la 1.3) it coefficiente di correlazione C1 nel caso di tabella 1:

C1= [1/(n+1)] x ( a0 x b0 + al x bl + a2 x b2 ) =
= (1/3) x [(-13.333) x (-4) + (-3.333) x (-1) + (+16.667) x (+5)] = 46.667


Ripetiamo il calcolo per i dati della tabella 2 in base alla 1)

Am = (A0+Al+A2) / 3 =   (10+20+40) / 3  = 23.333
Bm = (B0+Bl+B2) / 3 =   (3+6+12) / 3  = 7

in base alle 1.2) si ha: :

a0 = A0-Am = 10-23.333 = —13.333 
al = Al-Am = 20-23.333 = — 3.333 
a2 = A2-Am = 40-23.333 = +16.667
b0 = B0-Bm = 3-7 = —4
bl = B1-Bm = 12-7 = +5 
b2 = B2-Bm = 6-7 = —1

infine in base alla 1.3 calcoliamo it coefficiente di correlazione C2 nel caso di tabella 2:

C2 = [1/(n+1)] x (a0 x b0 + a1 x b 1 + a2 x b2 )

= (1/3) x [(-13.333) x (4) + (-3.333) x (+5) + (+16.667) x (-1)] = + 6.667


Da quanto abbiamo calcolato possiamo concludere:

Nel caso di tabella 1, dove il legame tra i valori di A e B e governato da una ben determinata legge lineare di interdipendenza (dove ad ogni raddoppiamento del valore di A si ha un corrispondente raddoppiamento del valore di B) si e trovato un valore elevato di correlazione: Cl = + 46.667

Nel caso invece di tabella 2, dove it legame tra i valori di A e B non è governato da nessuna legge, abbiamo trovato naturalmente un basso valore di correlazione: C2 = +6.667

Il fattore di correlazione normalizzato[modifica]

E' ora necessario, dopo aver definito il fattore di correlazione, introdurre alcuni concetti complementari che ci consentono di NORMALIZZARE [1] i valori di C calcolati in precedenza.

Dalle serie di grandezze AO,A1,A2,...,An e BO,B1,B2,....,Bn si possono determinare due importanti funzioni statistiche dette di DEVIAZIONE STANDARD; le funzioni indicate rispettivamente con sono date dalle seguenti espressioni:





Con queste due funzioni si calcola il valore del coefficiente di correlazione normalizzato CN secondo l'espressione

   x  

Se calcoliamo le deviazioni standard dei valori delle tabelle 1 e 2 otteniamo naturalmente che e di tabella 1 sono coincidenti con e di tabella 2, dato che le grandezze A e B che le compongono sono le stesse ma appaiate in modo diverso; abbiamo perciò :




da cui si calcolano immediatamente i valori normalizzati di C :

per C1 = 46.667 si ha :
CN1 = 46.667 / (12.472 x 3.742) = 1


per C2 = 6.667 si ha :
CN2 = 6.667 / (12.472 x 3.742) = 0.14

Generalmente in tutte le applicazioni dei processi di correlazione in ambito tecnico i valori di C sono sempre normalizzati in CN.

Risultati analoghi dei coefficienti di correlazione normalizzati si possono ottenere con l'impiego di un calcolatore scientifico.

Note[modifica]

  1. La normalizzazione tra valori assegna al più grande il livello 1, gli altri ne sono una conseguenza