Sto analizzando i dati di un piccolo sondaggio che ho condotto tra i colleghi del mio ufficio riguardo alle loro abitudini di lettura. Ho calcolato la media dei libri letti all'anno, ma il risultato mi sembra strano perché è molto alto, quasi 22 libri a testa. Credo che un paio di colleghi che leggono tantissimo stiano spostando il risultato verso l'alto. Mi chiedo se in questo caso non sarebbe più rappresentativo usare un'altra misura, magari la mediana. Non so se il mio sospetto sia fondato o se sto solo complicando le cose.
|
Come si decide tra media e mediana in un sondaggio di lettura?
|
|
Mi sembra plausibile che la mediana sia una misura più robusta quando ci sono estremi. Se due persone leggono molti libri all anno la mediana potrebbe restare più bassa e rappresentare meglio la maggioranza.
Guarda che la mediana potrebbe raccontare una storia diversa dalla media e forse quella di 22 libri e un paio di super lettori non riflettere la norma. Mi piace l effetto di questa domanda e la tua intuizione.
Qualche volta si confonde mediana con il valore centrale della distribuzione. In realtà la mediana e il punto in cui la metà dei colleghi legge meno e l altra metà legge di piu. Quindi potrebbe cambiare l interpretazione.
Non è detto che la mediana sia la soluzione potrebbe non risolvere tutto e la media viene usata per una ragione.
La questione sembra chiedere se si debba cambiare prospettiva nel modo di riassumere i dati ma forse conviene osservare la forma della distribuzione e decidere se la mediana racconta meglio l andamento reale e cosa significa per l analisi.
Secondo me la mediana potrebbe essere utile ma serve anche guardare l intervallo interquartile e gli outlier.
Se vuoi una visione più robusta potresti considerare una media tagliata e la mediana. In pratica potresti tagliare gli estremi e vedere dove si posiziona la tendenza centrale. Ma resta aperta al fatto che la lettura sia distribuita in modo asimmetrico.
|
|
« Precedente | Successivo »
|

