::biodata:: | ::didattica:: | ::in regalo:: | ::utilità:: | |
Facoltà di Medicina e Chirurgia a.a. 2008-2009 Corso di Laurea Magistrale in Biotecnologie Mediche Corso Integrato di Innovazione Biotecnologica Analisi Multivariata dei Dati Sperimentali (Borelli) L'analisi della varianza ("Anova") scegliere un modello per un outcome continuo normale vs. covariate di tipo factor esercitazione guidata: scoprite quali sono i fattori , sport compreso, che influiscono sul peso : detach(dataset) rm( list = ls() ) www <- "http://www.dmi.units.it/~borelli/medici/studentiannoscorso.txt" dataset <- read.table( www , header = TRUE ) attach(dataset) guardiamo alla omoschedasticità ("sfericità dell'Anova": bartlett.test, levene.test nella library car ) bartlett.test(peso ~ sport) bartlett.test(peso ~ fumo) bartlett.test(peso ~ genere) realizziamo con aov la tavola Anova, indaghiamo sugli effetti con summary.lm e semplifichiamo il modello, usando eventualmente TukeyHSD . Diagnostichiamo infine il modello con plot . esercitazione assistita: scoprite quali sono i fattori , sport compreso, che influiscono sul bmi : bmi <- 10000 * peso / (statura ^2) attenzione a non cadere in
trappola
dati <- c(13, 22, 25, 17, 20, 18, 20, 14, 20, 18, 23, 15, 22, 18, 24, 23, 16, 19, 19, 23, 21, 18, 21, 19, 19, 18, 19, 14, 24, 13, 22, 23, 17, 19, 17, 16, 23, 18, 16, 18, 19, 18, 17, 19, 19, 18, 25, 19, 24, 23, 16, 19, 16, 16, 17, 23, 21, 15, 16, 21, 18, 17, 17, 18, 17, 17, 19, 17, 17, 18, 17, 18, 17, 16, 18, 21, 22, 20, 23, 22, 22, 22, 21, 21, 22, 23, 22, 22, 20, 22) fattore <- c( rep(1, 30), rep(2,30), rep(3,30) ) # inganno: sembra che non ci sia differenza summary.lm ( lm (dati ~ factor(fattore) )) summary.aov ( lm(dati ~ factor(fattore) )) modello <- aov (dati ~ factor(fattore)) TukeyHSD(modello) plot(TukeyHSD(modello)) mean(dati[1:30]) mean(dati[31:60]) mean(dati[61:90]) # invece!!! la verità .. par (mfrow = c(1,3)) hist(dati[1:30]) hist(dati[31:60]) hist(dati[61:90]) bartlett.test(dati ~ factor(fattore)) |
||||