il test ANOVA


Il test della ANalysis Of VAriance presuppone che i gruppi di dati provengano da una popolazione normale, in ipotesi di omoschedasticità (ossia, la varianza dei gruppi è la stessa di quella della popolazione). Il test accetta o rifuta l'ipotesi nulla che le medie dei gruppi siano uguali tra loro.

Partiamo da questo esempio (Bohrnstedt, Knoke: tassi di criminalità negli Stati Uniti d'America):



Calcoliamo per ogni gruppo la dimensione, la media e la deviazione standard. P
er il campione totale determiniamo anche la quantità dei gruppi.



Per ogni gruppo andiamo a determinare i "quadrati intergruppo", ossia:

dimensione gruppo * (media gruppo - media generale)^2

e sommiamo tra loro i risultati:



Per determinare i "quadrati intragruppo" consideriamo:

(dato - media gruppo)^2

e sommiamo tra loro i risultati:


Possiamo ora determinare anche la "somma totale dei quadrati" (non è strettamente necessario):



Determiniano i "Quadrati medi intergruppo" mediante la formula:

somma quadrati intergruppo / (numero gruppi - 1)

e determiniano i "Quadrati medi intragruppo" mediante la formula:

somma quadrati intragruppo / (dimensione generale - numero gruppi )




Il consuntivo del test ANOVA è dato dal rapporto:

quadrati medi intergruppo / quadrati medi intragruppo
 

Fissiamo ora il livello di attendibilità alfa, e determiniamo i gradi di libertà della distribuzione F:

gradi libertà numeratore = numero gruppi - 1

gradi libertà denominatore = dimensione generale - numero gruppi



ed il quantile F si determina con la funzione:

=INV.F( livello alfa ; gradi libertà numeratore ; gradi libertà denominatore )

Siccome in questo caso il consuntivo è maggiore del quantile, rifiuto l'ipotesi che le medie siano uguali tra loro, ossia vi è differenza altamente significativa tra le medie dei gruppi, ossia tra i tassi di criminalità nelle regioni degli Stati Uniti.

Allegati: un foglio di calcolo Excel, un foglio di calcolo Open Office, le istruzioni per il calcolo con R.