Concetti generali sulla correlazione per serie discrete di numeri

Da Wikiversità, l'apprendimento libero.
lezione
lezione
Concetti generali sulla correlazione per serie discrete di numeri
Tipo di risorsa Tipo: lezione
Materia di appartenenza Materia: Sui processi di correlazione per serie discrete di numeri
Avanzamento Avanzamento: lezione completa al 100%


Il concetto generale di correlazione è comune a tutte le scienze, perché in tutte le scienze si possono introdurre criteri statistici.

Correlazione è la dipendenza reciproca fra due grandezze e il fattore di correlazione ne è la misura quantitativa.

Si ha correlazione elevata quando a determinati valori di una grandezza corrispondono determinati valori dell'altra grandezza e correlazione nulla quando a determinati valori di una grandezza corrispondono valori qualsiasi dell'altra grandezza.

La interdipendenza potrà essere, nei casi più semplici, di proporzionalità diretta o inversa, ma anche assai più complessa.

Interdipendenza tra serie discrete di numeri[modifica]

Per stabilire una misura quantitativa della interdipendenza, cioè della correlazione fra le due grandezze, si parte dalla definizione matematica seguente.

Siano AO, Al, A2, ..,An i valori misurati discreti di una grandezza A (sia positiva che negativa) e BO, Bl, B2, ..,Bn i valori misurati discreti di un'altra grandezza B (sia positiva che negativa), dove il pedice numerico 0, 1, 2, 3, ecc. sta a significare valori corrispondenti delle due grandezze.

Si calcoli il valore medio della prima e della seconda grandezza:

Am =  (AO + Al + A2 + ...+ An )/(n+1)
                                     1.1)
Bm =  (BO + B1 + B2 + ...+ Bn )/(n+1)

Si calcoli ora per ogni valore della prima grandezza, A0,A1,.,An la deviazione del valore stesso dal valore medio (errore rispetto al valore medio) cioè:


a0 = AO-Am
a1 = Al-Am
a2 = A2-Am	1.2/a)
 ......
an = An-Am
 

Si calcoli anche per ogni valore della prima grandezza, B0,B1,.,Bn la deviazione del valore stesso dal valore medio (errore rispetto al valore medio) cioè:

b0 = BO-Bm
b1 = Bl-Bm
b2 = B2-Bm	1.2/b)
..........
bn = Bn-Bm


Si computi ora il valore medio C del prodotto dei valori corrispondenti degli errori delle due grandezze:

  C= [1/(n+1)] ( a0 x b0 + al x b 1 + a2 x b2 + ......	+ an x bn )	1.3)

tale valore medio è il fattore di correlazione delle due grandezze.

Se, ad esempio, tutte le volte che il valore della grandezza A è superiore al suo valore medio e lo stesso avviene per la grandezza B, il termine C sara positivo ed elevato, perchè tutti i suoi termini saranno positivi.

Se invece per ogni valore di A superiore al valore medio Am il valore di B è ora superiore ed ora inferiore al valore medio, i prodotti saranno ora positivi ora negativi e il valore C sara nullo o molto piccolo sia positivo che negativo.

Nel primo caso vi è ovviamente una interdipendenza elevata e nel secondo vi potrà essere una interdipendenza nulla o molto bassa.

Può verificarsi inoltre che tutte le volte che il valore della grandezza A e superiore al suo valore medio, il valore della grandezza B sia inferiore al suo valore medio; in questo caso il termine C sara negativo ed elevato perchè tutti i suoi termini saranno negativi.

Il coefficiente di correlazione tra due serie di grandezze può assumere pertanto valori positivi, valori negativi o valori nulli in base alla legge di interdipendenza tra le grandezze stesse.

Esempi esplicativi[modifica]

Un semplice esempio numerico servira a chiarire i concetti ora esposti:

Consideriamo tre coppie di numeri: in un primo caso appaiate secondo un evidente criterio di proporzionalita diretta secondo la tabella 1

TAB.	1)	
  A     B
A0=10	BO=3
A1=20	B1=6
A2=40	B2=12


in un secondo caso appaiate in modo casuale secondo la tabella 2

TAB.  2)	
 A     B
A0=10	BO= 3
A1=20	B1=12
A2=40	B2= 6

Eseguiamo il calcolo del coefficiente di correlazione nel caso di tabella 1:

Applichiamo le formule 1.1) per it calcolo delle medie:

Am = (A0+Al+A2) / 3 =   (10+20+40) / 3  = 23.333
Bm = (B0+Bl+B2) / 3 =   (3+6+12) / 3  = 7

Calcoliamo ora in base alle 1.2) le deviazioni dei valori stessi del valore medio:

a0 = A0-Am = 10-23.333 = —13.333 
al = Al-Am = 20-23.333 = — 3.333 
a2 = A2-Am = 40-23.333 = +16.667


b0 = BO-Bm = 3 - 7 = —4
bl = Bl-Bm = 6 - 7 = —1
b2 = B2-Bm = 12 - 7 = +5

Calcoliamo infine secondo la 1.3) it coefficiente di correlazione C1 nel caso di tabella 1:

C1= [1/(n+1)] x ( a0 x b0 + al x bl + a2 x b2 ) =
= (1/3) x [(-13.333) x (-4) + (-3.333) x (-1) + (+16.667) x (+5)] = 46.667


Ripetiamo il calcolo per i dati della tabella 2 in base alla 1)

Am = (A0+Al+A2) / 3 =   (10+20+40) / 3  = 23.333
Bm = (B0+Bl+B2) / 3 =   (3+6+12) / 3  = 7

in base alle 1.2) si ha: :

a0 = A0-Am = 10-23.333 = —13.333 
al = Al-Am = 20-23.333 = — 3.333 
a2 = A2-Am = 40-23.333 = +16.667
b0 = B0-Bm = 3-7 = —4
bl = B1-Bm = 12-7 = +5 
b2 = B2-Bm = 6-7 = —1

infine in base alla 1.3 calcoliamo it coefficiente di correlazione C2 nel caso di tabella 2:

C2 = [1/(n+1)] x (a0 x b0 + a1 x b 1 + a2 x b2 )

= (1/3) x [(-13.333) x (4) + (-3.333) x (+5) + (+16.667) x (-1)] = + 6.667


Da quanto abbiamo calcolato possiamo concludere:

Nel caso di tabella 1, dove il legame tra i valori di A e B e governato da una ben determinata legge lineare di interdipendenza (dove ad ogni raddoppiamento del valore di A si ha un corrispondente raddoppiamento del valore di B) si e trovato un valore elevato di correlazione: Cl = + 46.667

Nel caso invece di tabella 2, dove it legame tra i valori di A e B non è governato da nessuna legge, abbiamo trovato naturalmente un basso valore di correlazione: C2 = +6.667

Il fattore di correlazione normalizzato[modifica]

E' ora necessario, dopo aver definito il fattore di correlazione, introdurre alcuni concetti complementari che ci consentono di NORMALIZZARE [1] i valori di C calcolati in precedenza.

Dalle serie di grandezze AO,A1,A2,...,An e BO,B1,B2,....,Bn si possono determinare due importanti funzioni statistiche dette di DEVIAZIONE STANDARD; le funzioni indicate rispettivamente con sono date dalle seguenti espressioni:





Con queste due funzioni si calcola il valore del coefficiente di correlazione normalizzato CN secondo l'espressione

   x  

Se calcoliamo le deviazioni standard dei valori delle tabelle 1 e 2 otteniamo naturalmente che e di tabella 1 sono coincidenti con e di tabella 2, dato che le grandezze A e B che le compongono sono le stesse ma appaiate in modo diverso; abbiamo perciò :




da cui si calcolano immediatamente i valori normalizzati di C :

per C1 = 46.667 si ha :
CN1 = 46.667 / (12.472 x 3.742) = 1


per C2 = 6.667 si ha :
CN2 = 6.667 / (12.472 x 3.742) = 0.14

Generalmente in tutte le applicazioni dei processi di correlazione in ambito tecnico i valori di C sono sempre normalizzati in CN.

Risultati analoghi dei coefficienti di correlazione normalizzati si possono ottenere con l'impiego di un calcolatore scientifico.

Note[modifica]

  1. La normalizzazione tra valori assegna al più grande il livello 1, gli altri ne sono una conseguenza

Bibliografia[modifica]

  • J. J. Faran Jr e R. Hills Jr, Correlators for signal reception, in Office of Naval Research (contract n5 ori-76 project order x technical memorandum no. 27), Cambridge, Massachusetts, Acoustics Research Laboratory Division of Applied Science Harvard University, 1952.


  • R. J. Urick, Principles of underwater sound, 3ª ed., Mc Graw – Hill, 1968.


  • C. Del Turco, La correlazione , Collana scientifica ed. Moderna La Spezia,1993


  • C. Del Turco, Principi ed applicazioni dei metodi di autocorrelazione "Rivista L'Antenna anno XXXII n° 6 1960".