::biodata:: ::didattica:: ::in regalo:: ::utilità::

Facoltà di Medicina e Chirurgia a.a. 2008-2009
Corso di Laurea Magistrale in Biotecnologie Mediche
Corso Integrato di Innovazione Biotecnologica
Analisi Multivariata dei Dati Sperimentali (Borelli)



L'analisi della varianza ("Anova")
scegliere un modello per un outcome continuo normale vs. covariate di tipo factor
 
esercitazione guidata: scoprite quali sono i fattori , sport compreso, che influiscono sul peso :


detach(dataset)
rm( list = ls() )

www <- "http://www.dmi.units.it/~borelli/medici/studentiannoscorso.txt"
dataset <- read.table( www , header = TRUE )
attach(dataset)

guardiamo la normalità dei dati ( qqplot / shapiro.test)
guardiamo alla omoschedasticità ("sfericità dell'Anova": bartlett.test,  levene.test nella library car )


bartlett.test(peso ~ sport)
bartlett.test(peso ~ fumo)
bartlett.test(peso ~ genere)

realizziamo con aov la tavola Anova, indaghiamo sugli effetti con summary.lm e semplifichiamo il modello, usando eventualmente TukeyHSD . Diagnostichiamo infine il modello con plot .


esercitazione assistita: scoprite quali sono i fattori , sport compreso, che influiscono sul bmi :

bmi <- 10000 * peso / (statura ^2)




attenzione a non cadere in trappola





dati <- c(13, 22, 25, 17, 20, 18, 20, 14, 20, 18, 23, 15, 22, 18, 24, 23, 16, 19, 19, 23, 21, 18, 21, 19, 19, 18, 19, 14, 24, 13, 22, 23, 17, 19, 17, 16, 23, 18, 16, 18, 19, 18, 17, 19, 19, 18, 25, 19, 24, 23, 16, 19, 16, 16, 17, 23, 21, 15, 16, 21, 18, 17, 17, 18, 17, 17, 19, 17, 17, 18, 17, 18, 17, 16, 18, 21, 22, 20, 23, 22, 22, 22, 21, 21, 22, 23, 22, 22, 20, 22)

fattore <- c( rep(1, 30), rep(2,30), rep(3,30) )

# inganno: sembra che non ci sia differenza

summary.lm ( lm (dati ~ factor(fattore) ))
summary.aov ( lm(dati ~ factor(fattore) ))

modello <- aov (dati ~ factor(fattore))
TukeyHSD(modello)
plot(TukeyHSD(modello))

mean(dati[1:30])
mean(dati[31:60])
mean(dati[61:90])


# invece!!! la verità ..

par (mfrow = c(1,3))
hist(dati[1:30])
hist(dati[31:60])
hist(dati[61:90])

bartlett.test(dati ~ factor(fattore))