i dataset del corso



studentiannoscorso.txt

vaevt.txt

swelling.txt

tubi.txt








































bibliografia 





::biodata:: ::didattica:: ::in regalo:: ::utilità::

Facoltà di Medicina e Chirurgia a.a. 2009-2010
Corso di Laurea Magistrale in Biotecnologie Mediche
Corso Integrato di Innovazione Biotecnologica
Analisi Multivariata dei Dati Sperimentali



Ulteriori argomenti di statistica di base

  • cosa intendiamo con i termini di sensibilità, specificità e valori predittivi di un test diagnostico?
# esercitiamoci sui dataset:

library(ROCR)
www <- "http://www.dmi.units.it/~borelli/medici/studentiannoscorso.txt"

dataset <- read.table( www , header = TRUE )
attach(dataset)


par( mfrow = c(1,2) )
hist( statura [genere =="m"] , col = "lightblue", main = "m")
hist( statura [genere =="f"] , col = "pink" , main = "f")
par( mfrow = c(1,1) )


predizione <- prediction( statura, genere )
risultato <- performance( predizione , "sens", "spec")
plot( risultato , colorize=TRUE )

  • un esempio di funzione 

migliore_cut_off <- function(perf)
    { Posizione_cut_off <- which((risultato@x.values[[1]]-
           risultato@y.values[[1]])==min((risultato@x.values[[1]]-
           risultato@y.values[[1]])[risultato@x.values[[1]]-risultato@y.values[[1]]>0]))
           return(risultato@alpha.values[[1]][Posizione_cut_off])  }

migliore_cut_off(risultato)
 

  • controlliamo   
 xtabs( ~ genere + as.factor(statura<174) )

  • un'ulteriore possibilità: il plot della densità di probabilità condizionata
cdplot(genere ~ statura)



Primo "compito per casa" da inviarmi per posta.
Indicate nell'oggetto: Cognome  1  (es. Borelli 1)


Considerate il dataset vaevt.txt ed indagate se è possibile trovare dei cut-off su 
basaleventiquattro o quarantotto in modo tale da ottenere un predittore ragionevolmente affidabile per outcome (ricordando che ciò che si vuole evitare è l'evento infausto outcome == "0" ).


Analisi esplorativa dei dati e Data Quality Assessment
  • visualizzare i dataset
    • i comandi plot e pairs 
    • il conditioning plot
coplot( scarpe ~ statura | peso)
coplot( scarpe ~ statura | peso, panel = function(x,y,col, pch) panel.smooth(x,y,span = 1))


.dataset <-  statura
par(mfrow = c(2,2))
.time <- 1:length(.dataset)
plot( .time , .dataset)
.reg <-   lm(.dataset ~ .time)
abline (  .reg , lty = 3)
summary(.reg)$coefficients[8]
plot ( .dataset[-1] , .dataset[ - length(.dataset)])
abline(coef = c(0,1) , lty = 3)
hist ( .dataset )
qqnorm(.dataset)
qqline(.dataset)
par(mfrow = c(1,1))
rm(.dataset)

  • proviamo a visualizzare il "four plot"  usando dati simulati  runif,  rnorm, rbinom

detach(dataset)


  • relax: scoprite il meraviglioso mondo di GGobi