Analisi della varianza
Cominciamo ipotizzando un esempio di dati da trattare: abbiamo cinque carichi di mele provenienti da cinque diverse coltivazioni, vogliamo sapere se le cinque coltivazioni si possono considerare tutte uguali, o se ce ne è una che produce mele più grosse o più piccole.
L'ipotesi nulla H0, quindi, è che la grandezza media reale ( μ ) sia uguale per tutte e cinque le coltivazioni; l'ipotesi alternativa H1 che almeno una coltivazione abbia un diametro medio reale μi diverso dalle altre.
Supponiamo di aver raccolto questi dati, misurando alcune mele campione da ogni carico (diametri in mm):
Coltivazioni | |||||
A | B | C | D | E | |
---|---|---|---|---|---|
76 | 75 | 87 | 83 | 76 | |
82 | 77 | 93 | 72 | 85 | |
75 | 79 | 101 | 70 | 77 | |
81 | 79 | 96 | 76 | 81 | |
89 | 83 | 85 | 74 | 75 | |
78 | 81 | 89 | 91 | 90 | |
82 | 80 | 93 | 73 | ||
85 | 80 | ||||
80,4 | 79,0 | 89,5 | 79,9 | 79,5 | |
81,9 |
dove è la media per ogni singola coltivazione, e la media calcolata su tutti i dati.
Potremmo applicare il test t di Student più volte, confrontando le coltivazioni a due a due; ma il rischio di commettere un errore sarebbe troppo alto: se α è la probabilità, per ogni test, di commettere un errore di primo tipo (cioè di trovare tra due gruppi di dati una differenza che in realtà è dovuta solo al caso), la probabilità di non fare nemmeno un errore è .
Nel nostro caso, se accettiamo per ogni singolo test una probabilità del 5%, la probabilità di sbagliarne almeno uno è del 22,6%.
Per ovviare a questo problema è stata introdotta l'analisi della varianza, o ANOVA (da ANalysis Of VAriance), che permette di confrontare più di due gruppi di dati senza aumentare la probabilità di errore.
Nell'analisi della varianza, ogni gruppo di dati (coltivazioni nel nostro caso) è chiamato trattamento (Fisher, l'ideatore dell'analisi della varianza, lavorava in una stazione sperimentale agraria, e i suoi studi riguardavano trattamenti sulle colture), e ogni dato all'interno dello stesso gruppo è una replica.
L'analisi della varianza si basa sul modello additivo, il quale ipotizza che ogni dato (diametro della mela) sia composto da una somma di fattori, in questo caso:
- la media reale generale ( che rappresenta il diametro medio di una mela qualsiasi );
- un fattore del trattamento, ( nel nostro caso, può rappresentare il fatto che in una coltivazione le mele sono più grandi che nelle altre );
- un fattore casuale , chiamato residuo o errore sperimentale che è lo scostamento di quel particolare dato dalla media del trattamento a cui appartiene ( nel nostro caso, la differenza tra il diametro di una particolare mela rispetto al diametro medio delle mele di quella coltivazione ).
Quindi, riassumendo, possiamo considerare il dato come
Se è valida l'ipotesi nulla, cioè se non c'è alcuna differenza reale tra i trattamenti, e le differenze nelle loro medie sono dovute solo al caso, dovremmo trovare la stessa variabilità sia all'interno dei trattamenti che tra un trattamento e l'altro.
Per controllare questa affermazione, l'analisi della varianza prevede di calcolare:
- la devianza totale;
- la devianza tra i trattamenti (between);
- la devianza all'interno dei trattamenti (within);
e i gradi di libertà di ognuna.
Le formule sono:
Devianza | Gradi di libertà | ||
---|---|---|---|
Formula euristica | Formula abbreviata | ||
Totale | |||
Tra i trattamenti | |||
Entro i trattamenti |
dove:
- è il numero totale di dati;
- il numero di dati all'interno dell' i-esimo trattamento;
- il numero di trattamenti;
la formula euristica è la formula di più facile comprensione, mentre la formula abbreviata porta allo steso risultato ma con calcoli meno complessi (anche se a vederle così non sembrerebbe).
Facendo i calcoli per il nostro esempio:
Devianza | Gradi di libertà | |
---|---|---|
Totale | 1834,75 | 35 |
Tra i trattamenti | 598,45 | 4 |
Entro i trattamenti | 1236,3 | 31 |
Si può notare che la somma delle ultime due devianze è uguale alla devianza totale, così come i gradi di libertà. Infatti, la devianza totale in questo test serve solamente a controllare che gli altri calcoli siano corretti.
Il passo successivo consiste nel trasformare le devianze tra e entro i trattamenti nelle rispettive varianze, dividendo per il loro numero di gradi di libertà.
Nel nostro esempio, le varianze sono:
- Varianza tra i trattamenti:
- Varianza entro i trattamenti:
Il passo finale è ricavare il rapporto tra le due varianze:
Se l'ipotesi nulla fosse vera, questo rapporto dovrebbe essere uguale a 1 (o risultare vicino a 1, visto che le analisi statistiche non sono mai perfette); se invece l'ipotesi nulla fosse falsa, in particolare se ci fosse almeno un trattamento con una media realmente diversa dalle altre, la varianza tra i trattamenti risulterebbe maggiore della varianza entro, e di conseguenza il rapporto sarebbe sensibilmente maggiore di 1.
Per determinare qual è il limite oltre il quale si può escludere l'ipotesi nulla, con una possibilità α di commettere un errore del primo tipo, si ricorre alla distribuzione F, che per ogni coppia di gradi di libertà (quelli delle due varianze) e per ogni probabilità α indica il valore limite oltre il quale si può escludere l'ipotesi nulla.
Ad esempio, nel nostro caso il rapporto vale
che è superiore al valore limite, riportato nelle tabelle qui sotto, sia per un rischio α del 5% sia del 2,5% (il valore si trova incrociando la colonna relativa ai gradi di libertà del numeratore con la riga relativa ai gradi di libertà del denominatore). Possiamo quindi affermare che l'ipotesi nulla è falsa, e che almeno una coltivazione produce mele di grandezza diversa dalle altre.
Tavola per valori critici al 95% (alfa=0.05)
[modifica]+-----+----------------------------------------------------------------------------------------------------------+ | \ g1| | | \ | 1 2 3 4 5 6 7 8 9 10 15 20 30 60 ∞ | |g2 \ | | +-----+----------------------------------------------------------------------------------------------------------+ | 1 | 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 241.88 245.95 248.01 250.10 252.20 254.31 | | 2 | 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.43 19.45 19.46 19.48 19.50 | | 3 | 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.70 8.66 8.62 8.57 8.53 | | 4 | 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.86 5.80 5.75 5.69 5.63 | | 5 | 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.62 4.56 4.50 4.43 4.36 | | 6 | 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 3.94 3.87 3.81 3.74 3.67 | | 7 | 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.51 3.44 3.38 3.30 3.23 | | 8 | 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.22 3.15 3.08 3.01 2.93 | | 9 | 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.01 2.94 2.86 2.79 2.71 | | 10 | 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.85 2.77 2.70 2.62 2.54 | | 11 | 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.72 2.65 2.57 2.49 2.40 | | 12 | 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.62 2.54 2.47 2.38 2.30 | | 13 | 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.53 2.46 2.38 2.30 2.21 | | 14 | 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.46 2.39 2.31 2.22 2.13 | | 15 | 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.40 2.33 2.25 2.16 2.07 | | 16 | 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.35 2.28 2.19 2.11 2.01 | | 17 | 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.31 2.23 2.15 2.06 1.96 | | 18 | 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.27 2.19 2.11 2.02 1.92 | | 19 | 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.23 2.16 2.07 1.98 1.88 | | 20 | 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.20 2.12 2.04 1.95 1.84 | | 25 | 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.09 2.01 1.92 1.82 1.71 | | 30 | 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.01 1.93 1.84 1.74 1.62 | | 60 | 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.84 1.75 1.65 1.53 1.39 | |100 | 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93 1.77 1.68 1.57 1.45 1.28 | | ∞ | 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.67 1.57 1.46 1.32 1.00 | +-----+----------------------------------------------------------------------------------------------------------+
Tavola per valori critici al 97,5%
[modifica]+-----+----------------------------------------------------------------------------------------------------------+ | \ g1| | | \ | 1 2 3 4 5 6 7 8 9 10 15 20 30 60 ∞ | |g2 \ | | +-----+----------------------------------------------------------------------------------------------------------+ | 1 | 647.79 799.50 864.16 899.58 921.85 937.11 948.22 956.66 963.28 968.63 984.87 993.10 1001.4 1009.8 1018.3 | | 2 | 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.43 39.45 39.46 39.48 39.50 | | 3 | 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.25 14.17 14.08 13.99 13.90 | | 4 | 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.66 8.56 8.46 8.36 8.26 | | 5 | 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.43 6.33 6.23 6.12 6.02 | | 6 | 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.27 5.17 5.07 4.96 4.85 | | 7 | 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.57 4.47 4.36 4.25 4.14 | | 8 | 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.10 4.00 3.89 3.78 3.67 | | 9 | 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.77 3.67 3.56 3.45 3.33 | | 10 | 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.52 3.42 3.31 3.20 3.08 | | 11 | 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.33 3.23 3.12 3.00 2.88 | | 12 | 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.18 3.07 2.96 2.85 2.72 | | 13 | 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.05 2.95 2.84 2.72 2.60 | | 14 | 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 2.95 2.84 2.73 2.61 2.49 | | 15 | 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 2.86 2.76 2.64 2.52 2.40 | | 16 | 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.79 2.68 2.57 2.45 2.32 | | 17 | 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.72 2.62 2.50 2.38 2.25 | | 18 | 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.67 2.56 2.44 2.32 2.19 | | 19 | 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.62 2.51 2.39 2.27 2.13 | | 20 | 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.57 2.46 2.35 2.22 2.09 | | 25 | 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 2.41 2.30 2.18 2.05 1.91 | | 30 | 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.31 2.20 2.07 1.94 1.79 | | 60 | 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 2.06 1.94 1.82 1.67 1.48 | |100 | 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18 1.97 1.85 1.71 1.56 1.35 | | ∞ | 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05 1.83 1.71 1.57 1.39 1.00 | +-----+----------------------------------------------------------------------------------------------------------+
Tavola per valori critici al 99%
[modifica]+-----+----------------------------------------------------------------------------------------------------------+ | \ g1| | | \ | 1 2 3 4 5 6 7 8 9 10 15 20 30 60 ∞ | |g2 \ | | +-----+----------------------------------------------------------------------------------------------------------+ | 1 | 4052.2 4999.5 5403.4 5624.6 5763.6 5859.0 5928.4 5981.1 6022.5 6055.8 6157.3 6208.7 6260.6 6313.0 6365.9 | | 2 | 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.43 99.45 99.47 99.48 99.50 | | 3 | 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 26.87 26.69 26.50 26.32 26.13 | | 4 | 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.20 14.02 13.84 13.65 13.46 | | 5 | 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.72 9.55 9.38 9.20 9.02 | | 6 | 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.56 7.40 7.23 7.06 6.88 | | 7 | 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.31 6.16 5.99 5.82 5.65 | | 8 | 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.52 5.36 5.20 5.03 4.86 | | 9 | 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 4.96 4.81 4.65 4.48 4.31 | | 10 | 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.56 4.41 4.25 4.08 3.91 | | 11 | 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.25 4.10 3.94 3.78 3.60 | | 12 | 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.01 3.86 3.70 3.54 3.36 | | 13 | 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.82 3.66 3.51 3.34 3.17 | | 14 | 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.66 3.51 3.35 3.18 3.00 | | 15 | 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.52 3.37 3.21 3.05 2.87 | | 16 | 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.41 3.26 3.10 2.93 2.75 | | 17 | 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.31 3.16 3.00 2.83 2.65 | | 18 | 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.23 3.08 2.92 2.75 2.57 | | 19 | 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.15 3.00 2.84 2.67 2.49 | | 20 | 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.09 2.94 2.78 2.61 2.42 | | 25 | 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.85 2.70 2.54 2.36 2.17 | | 30 | 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.70 2.55 2.39 2.21 2.01 | | 60 | 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.35 2.20 2.03 1.84 1.60 | |100 | 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.22 2.07 1.89 1.69 1.43 | | ∞ | 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.04 1.88 1.70 1.47 1.00 | +-----+----------------------------------------------------------------------------------------------------------+