Statistica descrittiva

Utilizzo dei comandi del foglio elettronico: “media”, “mediana”, “max”, “min”, “var.pop”, "dev.st.pop”, “quartile”, “percentile”
Utilizzo dei comandi del foglio elettronico: “inserisci grafico” con le opportune opzioni
Esercizio A1.
Una squadra di pallacanestro composta da 10 giocatori ha l'obbligo di avere un'età media non superiore a 21 anni e al tempo stesso non può includere atleti che abbiano meno di 16 anni. In tale squadra sono già presenti 8 giocatori con le seguenti età:
 
17, 19 , 19, 20, 21, 24, 26, 27

E' possibile completare la squadra inserendo un giocatore di 24 anni più un altro a scelta? Come è possibile completare la squadra?

Esercizio A2.
Cosa possiamo affermare quando in un insieme di dati la media e la mediana coincidono?

Esercizio A3.
Che cos'è il 70-esimo percentile di un insieme di dati? Che cos'è il 50-esimo percentile? Se possediamo 3400 dati, quanti ce ne sono tra il 5° ed il 90° percentile?

Esercizio A4.
Assegnato l'insieme dei valori {16, 16, 18, 19, 22, 22, 23, 26, 26, 27}, calcolare la media,la mediana, il primo ed il terzo quartile. Calcolare la varianza e la deviazione standard (scarto quadratico medio).
Se ora al posto dell’ultimo valore 27 mettiamo il numero 40, cosa posso aspettarmi:
La media crescerà, diminuirà o resterà uguale?
La mediana crescerà, diminuirà o resterà uguale?
Il primo e il terzo quartile cresceranno, diminuiranno o resteranno uguali?
La deviazione standard crescerà, diminuirà o resterà uguale?

Esercizio A5.
Questa tabella riporta dati tratti da un campione di 500 giovani donne di età 18-21 di un college statunitense ed è relativa all’intervallo di tempo (in giorni) intercorrenti tra due successivi cicli mestruali.
valore
frequenza valore frequenza valore frequenza
24
5
29
96
34
7
25
10
30
63
35
3
26 28
31
24
36
2
27
64
32
9
37
1
28
185
33
2
38
1

Quale dato ha la massima frequenza assoluta?
Quale dato ha la massima frequenza relativa?
La distribuzione dei dati appare essere uniforme?
Quale tipo di grafico ritenete più opportuno per visualizzare questi dati?
Quali sono i valori outlier? Quali sono i valori al di sotto del 5° percentile e al di sopra del 95°?

Esercizio A6.
Quali di queste affermazioni relative agli istogrammi sono vere?
1) la larghezza delle colonne è proporzionale al numero degli elementi della classe
2) l'area delle colonne è proporzionale alla frequenza assoluta della classe
3) l'area delle colonne è proporzionale alla frequenza relativa della classe
4) l'area delle colonne è proporzionale alla densità di frequenza della classe

Esercizio A7.
Realizzare dei "veri istogrammi" con MS Excel non è possibile perché non si riesce a modificare le larghezze delle colonne a proprio piacere. Ci si deve perciņ accontentare di realizzare istogrammi con classi di ampiezza costante, facendo ad esempio uso del comando FREQUENZA(). Provate a far suddividere automaticamente i dati seguenti:
 
17, 19 , 19, 20, 21, 24, 26, 27

in quattro classi: "minorenni", "da 18 a 35 anni", "da 36 a 53 anni", "da 54 a 71", e realizzate di conseguenza l'istogramma (suggerimento).

Esercizio A8.
Cosa significa che il "tempo mediano di attesa" per un esame diagnostico è di 10 giorni?

Esercizio A9.
In relazione ad uno studio fisioterapico effettuato su un'articolazione (misurata in gradi), abbiamo i seguenti dati:
min = 5°, max = 90°, mediana = 72°, primo quartile = 54°, terzo quartile = 76°.
Quanti dati in percentuale sono compresi tra 5° e 72°?
Quanti invece sono compresi tra 72° e 76°?

Esercizio A10.
Questa tabella riporta la concentrazione in microgrammi/millilitro della MIC (minima concentrazione inibitrice) della penicillina G nell'urina per 74 pazienti affetti da N. gonorrhoeae:

concentrazione
frequenza concentrazione frequenza
0,03125
21
0,25
19
0,0625
6
0,5
17
0,125
8
1
3

calcolate il valor medio della concentrazione.
La media vi sembra un indice rappresentativo della distribuzione dei dati?
Calcolate il logaritmo delle concentrazioni, poi calcolate la media dei dati trasformati, e esponenziatela.
Cosa possiamo dire circa i due indici di centralità ottenuti?
La distribuzione dei dati vi sembra essenzialmente unimodale, bimodale, plurimodale?


Esercizio A11.
Interpretate il seguente istogramma relativo alla temperatura corporea di un campione di pazienti ricoverati in terapia intensiva, e realizzate "a mano" un boxplot (anche perché farlo con MS Excel è un'impresa titanica, o quasi) (suggerimento).
Esercizio A12.
Di un gruppo di bambini si conosce il boxplot relativo alla loro altezze:



Quali dei seguenti tre istogrammi descrive correttamente la distribuzione dei dati?



 
(suggerimento).