Concetti generali sulla correlazione per serie discrete di numeri
Il concetto generale di correlazione è comune a tutte le scienze, perché in tutte le scienze si possono introdurre criteri statistici.
Correlazione è la dipendenza reciproca fra due grandezze e il fattore di correlazione ne è la misura quantitativa.
Si ha correlazione elevata quando a determinati valori di una grandezza corrispondono determinati valori dell'altra grandezza e correlazione nulla quando a determinati valori di una grandezza corrispondono valori qualsiasi dell'altra grandezza.
La interdipendenza potrà essere, nei casi più semplici, di proporzionalità diretta o inversa, ma anche assai più complessa.
Interdipendenza tra serie discrete di numeri
[modifica]Per stabilire una misura quantitativa della interdipendenza, cioè della correlazione fra le due grandezze, si parte dalla definizione matematica seguente.
Siano AO, Al, A2, ..,An i valori misurati discreti di una grandezza A (sia positiva che negativa) e BO, Bl, B2, ..,Bn i valori misurati discreti di un'altra grandezza B (sia positiva che negativa), dove il pedice numerico 0, 1, 2, 3, ecc. sta a significare valori corrispondenti delle due grandezze.
Si calcoli il valore medio della prima e della seconda grandezza:
Am = (AO + Al + A2 + ...+ An )/(n+1) 1.1) Bm = (BO + B1 + B2 + ...+ Bn )/(n+1)
Si calcoli ora per ogni valore della prima grandezza, A0,A1,.,An la deviazione del valore stesso dal valore medio (errore rispetto al valore medio) cioè:
a0 = AO-Am a1 = Al-Am a2 = A2-Am 1.2/a) ...... an = An-Am
Si calcoli anche per ogni valore della prima grandezza, B0,B1,.,Bn la deviazione del valore stesso dal valore medio (errore rispetto al valore medio) cioè:
b0 = BO-Bm b1 = Bl-Bm b2 = B2-Bm 1.2/b) .......... bn = Bn-Bm
Si computi ora il valore medio C del prodotto dei valori corrispondenti degli errori delle due grandezze:
C= [1/(n+1)] ( a0 x b0 + al x b 1 + a2 x b2 + ...... + an x bn ) 1.3)
tale valore medio è il fattore di correlazione delle due grandezze.
Se, ad esempio, tutte le volte che il valore della grandezza A è superiore al suo valore medio e lo stesso avviene per la grandezza B, il termine C sara positivo ed elevato, perchè tutti i suoi termini saranno positivi.
Se invece per ogni valore di A superiore al valore medio Am il valore di B è ora superiore ed ora inferiore al valore medio, i prodotti saranno ora positivi ora negativi e il valore C sara nullo o molto piccolo sia positivo che negativo.
Nel primo caso vi è ovviamente una interdipendenza elevata e nel secondo vi potrà essere una interdipendenza nulla o molto bassa.
Può verificarsi inoltre che tutte le volte che il valore della grandezza A e superiore al suo valore medio, il valore della grandezza B sia inferiore al suo valore medio; in questo caso il termine C sara negativo ed elevato perchè tutti i suoi termini saranno negativi.
Il coefficiente di correlazione tra due serie di grandezze può assumere pertanto valori positivi, valori negativi o valori nulli in base alla legge di interdipendenza tra le grandezze stesse.
Esempi esplicativi
[modifica]Un semplice esempio numerico servira a chiarire i concetti ora esposti:
Consideriamo tre coppie di numeri: in un primo caso appaiate secondo un evidente criterio di proporzionalita diretta secondo la tabella 1
TAB. 1)
A B A0=10 BO=3 A1=20 B1=6 A2=40 B2=12
in un secondo caso appaiate in modo casuale secondo la tabella 2
TAB. 2)
A B A0=10 BO= 3 A1=20 B1=12 A2=40 B2= 6
Eseguiamo il calcolo del coefficiente di correlazione nel caso di tabella 1:
Applichiamo le formule 1.1) per it calcolo delle medie:
Am = (A0+Al+A2) / 3 = (10+20+40) / 3 = 23.333
Bm = (B0+Bl+B2) / 3 = (3+6+12) / 3 = 7
Calcoliamo ora in base alle 1.2) le deviazioni dei valori stessi del valore medio:
a0 = A0-Am = 10-23.333 = —13.333
al = Al-Am = 20-23.333 = — 3.333
a2 = A2-Am = 40-23.333 = +16.667
b0 = BO-Bm = 3 - 7 = —4
bl = Bl-Bm = 6 - 7 = —1
b2 = B2-Bm = 12 - 7 = +5
Calcoliamo infine secondo la 1.3) it coefficiente di correlazione C1 nel caso di tabella 1:
C1= [1/(n+1)] x ( a0 x b0 + al x bl + a2 x b2 ) =
= (1/3) x [(-13.333) x (-4) + (-3.333) x (-1) + (+16.667) x (+5)] = 46.667
Ripetiamo il calcolo per i dati della tabella 2 in base alla 1)
Am = (A0+Al+A2) / 3 = (10+20+40) / 3 = 23.333
Bm = (B0+Bl+B2) / 3 = (3+6+12) / 3 = 7
in base alle 1.2) si ha: :
a0 = A0-Am = 10-23.333 = —13.333 al = Al-Am = 20-23.333 = — 3.333 a2 = A2-Am = 40-23.333 = +16.667 b0 = B0-Bm = 3-7 = —4 bl = B1-Bm = 12-7 = +5 b2 = B2-Bm = 6-7 = —1
infine in base alla 1.3 calcoliamo it coefficiente di correlazione C2 nel caso di tabella 2:
C2 = [1/(n+1)] x (a0 x b0 + a1 x b 1 + a2 x b2 )
= (1/3) x [(-13.333) x (4) + (-3.333) x (+5) + (+16.667) x (-1)] = + 6.667
Da quanto abbiamo calcolato possiamo concludere:
Nel caso di tabella 1, dove il legame tra i valori di A e B e governato da una ben determinata legge lineare di interdipendenza (dove ad ogni raddoppiamento del valore di A si ha un corrispondente raddoppiamento del valore di B) si e trovato un valore elevato di correlazione: Cl = + 46.667
Nel caso invece di tabella 2, dove it legame tra i valori di A e B non è governato da nessuna legge, abbiamo trovato naturalmente un basso valore di correlazione: C2 = +6.667
Il fattore di correlazione normalizzato
[modifica]E' ora necessario, dopo aver definito il fattore di correlazione, introdurre alcuni concetti complementari che ci consentono di NORMALIZZARE [1] i valori di C calcolati in precedenza.
Dalle serie di grandezze AO,A1,A2,...,An e BO,B1,B2,....,Bn si possono determinare due importanti funzioni statistiche dette di DEVIAZIONE STANDARD; le funzioni indicate rispettivamente con sono date dalle seguenti espressioni:
Con queste due funzioni si calcola il valore del coefficiente di correlazione normalizzato CN secondo l'espressione
x
Se calcoliamo le deviazioni standard dei valori delle tabelle 1 e 2 otteniamo naturalmente che e di tabella 1 sono coincidenti con e di tabella 2, dato che le grandezze A e B che le compongono sono le stesse ma appaiate in modo diverso; abbiamo perciò :
da cui si calcolano immediatamente i valori normalizzati di C :
per C1 = 46.667 si ha :
CN1 = 46.667 / (12.472 x 3.742) = 1
per C2 = 6.667 si ha :
CN2 = 6.667 / (12.472 x 3.742) = 0.14
Generalmente in tutte le applicazioni dei processi di correlazione in ambito tecnico i valori di C sono sempre normalizzati in CN.
Risultati analoghi dei coefficienti di correlazione normalizzati si possono ottenere con l'impiego di un calcolatore scientifico.
Note
[modifica]- ↑ La normalizzazione tra valori assegna al più grande il livello 1, gli altri ne sono una conseguenza
Bibliografia
[modifica]- J. J. Faran Jr e R. Hills Jr, Correlators for signal reception, in Office of Naval Research (contract n5 ori-76 project order x technical memorandum no. 27), Cambridge, Massachusetts, Acoustics Research Laboratory Division of Applied Science Harvard University, 1952.
- R. J. Urick, Principles of underwater sound, 3ª ed., Mc Graw – Hill, 1968.
- C. Del Turco, La correlazione , Collana scientifica ed. Moderna La Spezia,1993
- C. Del Turco, Principi ed applicazioni dei metodi di autocorrelazione "Rivista L'Antenna anno XXXII n° 6 1960".